현지화 산업 동향 - L10n Trend

Nimdzi - Language Technology Radar

LangShop 2024. 9. 11. 19:00

MT, Gen AI, LLM... 등 현지화 산업과 연관된 언어 기술 동향은 빠른 속도로 변하고 있습니다.

대형 현지화 기업 및 언어기술 스타트업 들의 과대 광고, 미디어에서의 과도한 리액션...

이와 관련된 내용을 누군가 정리해 주면 좋겠다 싶었는데, Nimdzi에서 업체 리스트와 함께 정리해서 발표했습니다.

 

주요 내용을 DeepL로 번역 후, 후편집해서 올립니다. 

---------------------------------------------------------------------------------------

https://www.nimdzi.com/language-technology-tracker

 

"While the vast majority of words are already translated by machines, automated captions and subtitles have become a commonplace on YouTube, and copilots are being deployed in various departments for productivity gains, human expertise and oversight is still a must for high-value, error-sensitive tasks. This, in combination of the explosion of content in our attention economy, is what drives the growth of the language industry, and the need for continuous innovation in the language technology space."

"이미 대부분의 단어가 기계에 의해 번역되고, 자동 캡션과 자막이 YouTube에서 보편화되었으며, 생산성 향상을 위해 다양한 부서에 코파일럿이 배치되고 있지만, 오류에 민감한 고가치 작업에는 여전히 인간의 전문성과 감독이 필수적입니다. 이는 주목 경제에서 콘텐츠의 폭발적인 증가와 함께 언어 산업의 성장을 이끄는 원동력이며 언어 기술 분야의 지속적인 혁신이 필요한 이유이기도 합니다."

 

"As LLMs and GenAI solutions multiply, the real challenge isn't whether to use them, but which one to choose. The paradox of choice in today's AI landscape isn't about abundance, but about discernment. Too many options can overwhelm us, making it harder to find the right fit for our specific needs."

"LLM과 GenAI 솔루션이 늘어남에 따라 진정한 과제는 이를 사용할지 여부가 아니라 어떤 솔루션을 선택해야 하는가입니다. 오늘날의 AI 환경에서 선택의 역설은 풍요로움이 아니라 분별력에 관한 것입니다. 너무 많은 옵션은 우리를 압도하여 특정 요구 사항에 적합한 것을 찾기가 더 어려워질 수 있습니다."

 

Categories of the Nimdzi Radar

Interpreting systems

Speech recognition solutions

Audiovisual translation tools

Integrators

Translation management systems

Translation business management systems

Marketplaces and platforms

Machine translation

Quality management

Large Language Models

 

The future outlook

* Machine translation post-editing

"We predict that more advanced quality assurance algorithms will emerge, capable of automatically detecting and correcting a wide range of issues that currently require human intervention. These solutions could handle many of the tasks traditionally associated with Machine translation post-editing (MTPE), such as error detection and correction. As MT and LLMs quality improves, linguists may shift their roles from post-editing to more strategic tasks like high-level oversight, content verification, and sanity checks. Their expertise will be used to ensure that the content in the target language aligns with the intended meaning, tone, ethical and cultural nuances, rather than correcting linguistic errors."

"현재 사람의 개입이 필요한 다양한 문제를 자동으로 감지하고 수정할 수 있는 더욱 발전된 품질 보증 알고리즘이 등장할 것으로 예상합니다. 이러한 솔루션은 오류 감지 및 수정과 같이 전통적으로 기계 번역 사후 편집(MTPE)과 관련된 많은 작업을 처리할 수 있습니다. MT 및 LLM의 품질이 향상됨에 따라 언어 전문가의 역할이 사후 편집에서 높은 수준의 감독, 콘텐츠 검증 및 건전성 검사와 같은 보다 전략적인 작업으로 전환될 수 있습니다. 언어 오류를 수정하기보다는 대상 언어의 콘텐츠가 의도한 의미, 어조, 윤리적, 문화적 뉘앙스에 부합하는지 확인하는 데 그들의 전문 지식이 사용될 것입니다."

 

* “AI, AI, AI”

"Major consultancy firms are pushing forward inflated estimates of the corporate profits that could arise from implementing generative AI with current state technology. These overly optimistic projections seem to be more effective at attracting investors than at convincing enterprises to adopt the technology. In reality, the early adopters have already embraced the tech; the late majority will take their time, especially due to concerns over data privacy and security (many without clear data governance frameworks), difficulties with adoption and resistance (unclear adoption plans that lack a holistic approach), and most importantly (especially now), fears surrounding regulatory compliance."

"주요 컨설팅 회사들은 현재의 기술로 제너레이티브 AI를 구현함으로써 얻을 수 있는 기업 이익에 대해 부풀려진 추정치를 제시하고 있습니다. 이러한 지나치게 낙관적인 예측은 기업이 기술을 채택하도록 설득하는 것보다 투자자를 유치하는 데 더 효과적인 것으로 보입니다. 실제로 얼리 어답터들은 이미 이 기술을 받아들였고, 후발 주자들은 데이터 프라이버시 및 보안에 대한 우려(대부분 명확한 데이터 거버넌스 프레임워크가 없음), 도입의 어려움과 저항(총체적인 접근 방식이 부족한 불분명한 도입 계획), 무엇보다도 (특히 지금은) 규제 준수에 대한 두려움으로 인해 시간이 걸릴 것"이라고 말합니다.

 

"Now that the hype around GPT translation features and AI assistants in TMS has cooled down, and prompt engineering did not prove to be as big a differentiator as anticipated, LLM fine-tuning has taken center stage. Many tech-enabled LSPs will smell an opportunity given the large open-source community driven by Meta, the relative ease of fine-tuning a model, and the numerous papers reporting that fine-tuned models outperform Amazon, Google, Microsoft, and closed GPT-4."

"이제 TMS의 GPT 번역 기능과 AI 어시스턴트에 대한 과대광고가 식고, 신속한 엔지니어링이 예상만큼 큰 차별화 요소가 되지 못하면서 LLM 미세 조정이 중심이 되고 있습니다. 메타가 주도하는 대규모 오픈 소스 커뮤니티, 모델 미세 조정의 상대적 용이성, 미세 조정된 모델이 Amazon, Google, Microsoft 및 폐쇄형 GPT-4보다 성능이 우수하다는 수많은 논문을 고려할 때 많은 기술 기반 LSP가 기회를 감지할 것입니다."

 

Language technology solutions and products will continue to evolve. We can also expect that once the AI hype cools down, the “AI” prefix in company names and value propositions, now considered obligatory, will be dropped — just as it happened before with many other developments (remember “big data” or “cloud”?).

언어 기술 솔루션과 제품은 계속 발전할 것입니다. 또한 AI에 대한 과대 광고가 식으면 다른 많은 발전에서 그랬던 것처럼('빅 데이터'나 '클라우드'를 기억하시나요?) 이제는 의무적으로 여겨지는 회사 이름과 가치 제안에 'AI'라는 접두사가 사라질 것으로 예상할 수 있습니다.

 

------------------------------------------------------------------------------------------------------------------------------------------

 

개인적으로 새로운 부분은

  • S2ST (Speech to Speech Translation)을 텍스트 기반이 아닌, spectrograms (소리의 스펙트럼을 시각화)으로 개발하고 있다는 내용입니다. '미래 사회에서는 누군가 할거야~' 했는데 하고 있네요.
  • the human-in-the-loop paradigm has overtaken the human-only approach in the language industry. In 2024, the vast majority of language work is already being facilitated by technologies helping human language talent (linguists, interpreters, transcribers, voice actors, etc.). Productivity-enhancing use cases include information retrieval, question answering, summarization, content drafting, creation and editing, sentiment and intent analysis, and multilingual customer support. > 언어 산업에서 사람만 투입되어 작업 하는 비중보다, 사람이 프로세스의 일부만 수행하는 비중이 더 커졌습니다. 2024년에는 이미 언어 작업의 대부분이 언어 전문가(언어학자, 통역사, 전사자, 성우 등)를 돕는 기술에 의해 촉진되고 있습니다. 생산성을 향상시키는 사용 사례에는 정보 검색, 질문 답변, 요약, 콘텐츠 초안 작성, 작성 및 편집, 감정 및 의도 분석, 다국어 고객 지원 등이 포함됩니다.

기사에서 맨 마지막 멘트가 매우 공감되는 부분입니다. 빅데이터나 클라우드와 같이 세상이 변할 것 같이 요동치다가, 어느 순간 이미 현업에 소리없이 스며들어 사용하고 있는데요. AI도 의도하던 의도하지 않던, 에이젼시 입장에서는 CAT에, Linguist의 보조 툴에 스며들어 MTPE라는 개념이 현업에 자연스럽게 스며드는 시점이 예상보다 빨리 오지 싶습니다.

 

대형 MLV 에서 수년을 들어 개발한 프로세스, 툴을 사용해서, 추가 매출 및 부가가치를 기대하고 있지만 실제 시장의 반응은 예상보다 낮은 수준으로 보입니다. 이는 현지화 관련 미디어에서 '과대 광고'라는 단어를 계속 언급되고 있다는 게 현실을 반영하고 있다고 봐야 할 것 같습니다.

 

중간 규모 SLV의 경우, MT 및 GEN AI, LLM 등에 본격적으로 투자를 하기 어려운 기업들의 경우 눈치만 보다가 시장의 흐름에 몸을 맡긴채 흘러가고 있을 수도 있겠습니다. 지금과 같은 시점에서 과감한 투자(라이선스 구입, 전담 인력 채용...)가 실제 어느 정도 효과(외부 매출, 내부 효율 개선...)를 볼지 알수 없으므로 투자가 위험성이 높을 수도 있습니다. 시장의 흐름을 계속 모니터링하고 내부 프로세스에 적용할 수 있는 부분은 과감히 시도해 보고, 빠르게 손절하는 것도 필요해 보입니다.

 

소규모 번역 에이젼시의 경우에는, 좋은 말로 Agile, 쉽게 얘기하면 이것 저것 다 큰 부담없이 시도해 볼 수 있는 것이 장점이 될 수 있겠습니다. 여러 Role (PM, Linguist, Engineer...)을 함께 하는 소규모 에이젼시의 특성상, 시도해보다 괜찮다 싶으면 바로 프로젝트 적용할 수도 있어보입니다...

 

개인적인 생각은, (깨어있는) 프리랜서나 소규모 에이젼시가 되려 기술 발전의 혜택을 큰 투자의 부담없이 가져가지 않을까 하는 생각입니다... 물론 개인적 소견입니다.