기계번역 도입 테스트 (PEMT)

  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기

구글번역을 비롯한 기계번역의 품질이 과거에 비해 크게 향상됨에 따라 기계번역을 번역 프로세스에 추가하려는 움직임이 대형 번역업체들을 중심으로 나타나고 있는 것 같습니다. 기계번역 도입을 통해 생산성을 높일 수 있다면 그만큼 고객에게 청구하는 번역료를 낮출 수 있고, 이는 경쟁력 향상으로 이어질 것입니다.

한편으로는 일부 번역가들이 기계번역을 무분별하게 사용하여 문제를 야기하는 경우도 있어 번역가들의 기계번역 사용을 금지하는 조항을 NDA에 추가하는 업체들도 많습니다("구글 번역 이용 시 주의 사항" 참조).

기계번역 도입 테스트

구글번역이 특정 분야에서는 비교적 만족스러운 품질을 제공하지만(그런 경우에도 반드시 Editing이 필요함), 전반적인 품질은 아직 기대 이하 같습니다. 그래서 구글번역 등의 기계번역 도입에 대해서는 아직은 시기상조가 아닐까 생각합니다.

기계번역 도입

기계번역을 번역 프로세스에 도입하려는 움직임은 거스를 수 없는 대세 같습니다. 지금은 과도기로 기계번역을 도입하는 업체와 기계번역을 배제하는 업체들이 혼재하지만 종국적으로 기계가 번역하는 방향으로 나아갈 것으로 보입니다. 단지 시간상의 문제이고, 지금은 기계번역을 신뢰할 수 없으므로 전문 번역가가 개입하는 포스트 에디팅(Post-Editing) 과정을 거치게 됩니다.

제가 거래하는 영국의 한 대형 번역업체는 몇 년 전에 기계번역을 도입하려고 시도했지만 기대한 만큼의 성과를 내지 못한 것 같습니다. 하지만 며칠 전에 한 다국적 기업 번역 프로젝트에 기계번역을 활용하기 위해 PEMT(Post-Editing Machine Translation)를 도입한다고 메일을 보내왔네요.

PEMT는 기계가 번역한 문서를 인간이 에디팅(검수)하는 작업입니다. 신경망 번역엔진이 기존에 번역한 문서를 기반하여 새로운 문서를 번역하면, 인간 번역가가 검수하면서 번역 품질을 (기계번역 도움 없이 전문 번역가가 제공하는 품질 수준으로) 높이게 됩니다. 기계번역엔진은 TM(번역 메모리)과 용어를 활용하므로 일반인이 사용하는 구글번역에 비해서는 번역 품질이 우수할 것이라고 추정할 수 있습니다만, 실제 품질은 직접 확인해 보아야 알 수 있을 것입니다.

The trial will stretch over any period of time during which we can post-edit a minimum of 3,000-5,000 words. At the end of the trial period, we are going to gather a set of metrics to objectively measure productivity improvements. We will assess your hourly output (number of words delivered without MT vs. number of words delivered with MT) as well as compare automated metric scores (BLEU, METEOR, TER) against past benchmarks.

PEMT를 도입하기 위해 먼저 전문 번역가가 기계번역기에 의해 번역된 문서(3,000~5,000단어 분량)를 검수하여, 기계번역 도움 없이 인간이 번역했을 때를 비교하여 시간당 얼마나 생산성이 높은지를 측정하게 됩니다. 즉, 시간당 평균 몇 단어 정도를 검수할 수 있는지를 체크하면 번역가에게 지급할 수 있는 번역료가 결정됩니다.

PEMT가 번역가에게 어떠한 영향을 미치는가?

PEMT를 몇 년 전부터 활용하는 업체들이 있지만, 완전히 자리를 잡기까지는 상당한 시간이 걸리지 않을까 생각됩니다. 개인적으로는 포스트 에디팅 작업을 무조건 거부하고 있습니다. 번역가들은 알겠지만, 이상하게 번역된 문서를 검수하는 작업은 처음부터 새로 작업하는 것보다 더 스트레스를 받고 시간이 더 많이 소요됩니다.

하지만 기계번역의 품질이 일정 수준 이상으로 높아진다면 울며 겨자 먹기식으로 포스트 에디팅 작업을 받을 수밖에 없을 것입니다. PEMT가 점점 활성화되면 번역료가 하락할 것이라는 것은 쉽게 예상할 수 있습니다.

특히, 영한번역은 조선인 번역가들과 일부 저가 덤핑 번역가들 때문에 다른 언어보다 더 가파르게 하락하는 것 같습니다. 실제로 한 글로벌 번역업체가 2년 전에 보내온 언어별 번역 단가를 보니 한국어가 동남아시아 언어보다 낮게 책정되어 있었습니다.ㅠ

기계번역 발전으로 인해 번역량도 줄어들 수 있습니다. 한편에서는 번역 단가가 하락하면 번역료 부담 때문에 번역을 고려하지 않은 문서들을 번역할 가능성이 있기 때문에 번역 물량이 많아질 것이라는 기대도 있지만, 번역가들에게 맡기지 않고 기계번역한 문서를 그대로 사용하는 글로벌 기업들이 늘고 있습니다. 예를 들어, 일부 마이크로소프트 사이트는 기계번역을 사용하여 번역되었습니다.

위의 마소 문서에서 기계번역에 대해 설명하고 있습니다. 이 문서를 살펴보면 어색한 부분이 많습니다.

기계 번역 기술 및 그것을 사용 하는 인터페이스의 뒤에 개념은 상대적으로 간단 하다, 그것의 뒤에 과학 그리고 기술은 극단적으로 복잡 하 몇몇 첨단 기술, 특히, 깊은 학문을 소집 한다 ( 인공 지능), 빅 데이터, 언어학, 클라우드 컴퓨팅 및 웹 api.

그래도 위안이 되는 것은 3년 전에 비해 지금의 마소 번역엔진의 품질이 그다지 향상된 것 같지 않다는 점입니다.ㅎ 기계번역의 품질을 만족스러운 수준으로 끌어올리는 것이 그리 쉽지 않은 것 같습니다.

마치며

기계번역이 인간번역을 대체하는 것은 시간상의 문제이지 가까운 미래에 이루어질 것입니다. 당분간은 기계번역과 인간번역이 공존하면서 점차 PEMT가 증가하게 될 것으로 보입니다.

AI 발전으로 인해 많은 직업이 위협을 받고 있습니다. 번역가는 아마 그 첫번째 희생양이 되지 않을까 생각됩니다. 실제로 딸아이가 미래에 사라질 직업 1순위가 번역가라고 하네요.ㅠ 번역가로 살아남기 위해서는 탁월한 번역 실력을 갖추거나 번역 단가를 낮추어 물량을 확보하는 전략으로 나가야 할 것 같습니다.

저는 실제로 지난 몇 년 사이 번역 단가 문제로 일부 업체와의 거래가 현저히 줄어들었습니다. 그래도 그런 업체에서 다른 번역가들이 처리하지 못하는 작업을 보내오곤 합니다. 그런 작업은 대부분 급하거나 난이도가 높은 편입니다. 그리고 의학번역 등 일부 번역 분야는 당분간 영향을 받지 않을 것으로 보입니다.

참고:

Categories 번역


댓글 남기기