기계번역 도입 테스트 (PEMT)

Last Updated: 2024년 01월 01일 | | 4개 댓글

구글번역을 비롯한 기계번역의 품질이 과거에 비해 크게 향상됨에 따라 기계번역을 번역 프로세스에 추가하려는 움직임이 대형 번역업체들을 중심으로 나타나고 있는 것 같습니다. 기계번역 도입을 통해 생산성을 높일 수 있다면 그만큼 고객에게 청구하는 번역료를 낮출 수 있고, 이는 경쟁력 향상으로 이어질 것입니다.

한편으로는 일부 번역가들이 기계번역을 무분별하게 사용하여 문제를 야기하는 경우도 있어 번역가들의 기계번역 사용을 금지하는 조항을 NDA에 추가하는 업체들도 많습니다("구글 번역 이용 시 주의 사항" 참조).

기계번역 도입 테스트

구글번역이 특정 분야에서는 비교적 만족스러운 품질을 제공하지만(그런 경우에도 반드시 Editing이 필요함), 전반적인 품질은 아직 기대 이하 같습니다. 그래서 구글번역 등의 기계번역 도입에 대해서는 아직은 시기상조가 아닐까 생각합니다.

기계번역 도입

기계번역을 번역 프로세스에 도입하려는 움직임은 거스를 수 없는 대세 같습니다. 지금은 과도기로 기계번역을 도입하는 업체와 기계번역을 배제하는 업체들이 혼재하지만 종국적으로 기계가 번역하는 방향으로 나아갈 것으로 보입니다. 단지 시간상의 문제이고, 지금은 기계번역을 신뢰할 수 없으므로 전문 번역가가 개입하는 포스트 에디팅(Post-Editing) 과정을 거치게 됩니다.

제가 거래하는 영국의 한 대형 번역업체는 몇 년 전에 기계번역을 도입하려고 시도했지만 기대한 만큼의 성과를 내지 못한 것 같습니다. 하지만 며칠 전에 한 다국적 기업 번역 프로젝트에 기계번역을 활용하기 위해 PEMT(Post-Editing Machine Translation)를 도입한다고 메일을 보내왔네요.

PEMT는 기계가 번역한 문서를 인간이 에디팅(검수)하는 작업입니다. 신경망 번역엔진이 기존에 번역한 문서를 기반하여 새로운 문서를 번역하면, 인간 번역가가 검수하면서 번역 품질을 (기계번역 도움 없이 전문 번역가가 제공하는 품질 수준으로) 높이게 됩니다. 기계번역엔진은 TM(번역 메모리)과 용어를 활용하므로 일반인이 사용하는 구글번역에 비해서는 번역 품질이 우수할 것이라고 추정할 수 있습니다만, 실제 품질은 직접 확인해 보아야 알 수 있을 것입니다.

The trial will stretch over any period of time during which we can post-edit a minimum of 3,000-5,000 words. At the end of the trial period, we are going to gather a set of metrics to objectively measure productivity improvements. We will assess your hourly output (number of words delivered without MT vs. number of words delivered with MT) as well as compare automated metric scores (BLEU, METEOR, TER) against past benchmarks.

PEMT를 도입하기 위해 먼저 전문 번역가가 기계번역기에 의해 번역된 문서(3,000~5,000단어 분량)를 검수하여, 기계번역 도움 없이 인간이 번역했을 때를 비교하여 시간당 얼마나 생산성이 높은지를 측정하게 됩니다. 즉, 시간당 평균 몇 단어 정도를 검수할 수 있는지를 체크하면 번역가에게 지급할 수 있는 번역료가 결정됩니다.

PEMT가 번역가에게 어떠한 영향을 미치는가?

PEMT를 몇 년 전부터 활용하는 업체들이 있지만, 완전히 자리를 잡기까지는 상당한 시간이 걸리지 않을까 생각됩니다. 개인적으로는 포스트 에디팅 작업을 무조건 거부하고 있습니다. 번역가들은 알겠지만, 이상하게 번역된 문서를 검수하는 작업은 처음부터 새로 작업하는 것보다 더 스트레스를 받고 시간이 더 많이 소요됩니다.

하지만 기계번역의 품질이 일정 수준 이상으로 높아진다면 울며 겨자 먹기식으로 포스트 에디팅 작업을 받을 수밖에 없을 것입니다. PEMT가 점점 활성화되면 번역료가 하락할 것이라는 것은 쉽게 예상할 수 있습니다.

특히, 영한번역은 조선인 번역가들과 일부 저가 덤핑 번역가들 때문에 다른 언어보다 더 가파르게 하락하는 것 같습니다. 실제로 한 글로벌 번역업체가 2년 전에 보내온 언어별 번역 단가를 보니 한국어가 동남아시아 언어보다 낮게 책정되어 있었습니다.ㅠ

기계번역 발전으로 인해 번역량도 줄어들 수 있습니다. 한편에서는 번역 단가가 하락하면 번역료 부담 때문에 번역을 고려하지 않은 문서들을 번역할 가능성이 있기 때문에 번역 물량이 많아질 것이라는 기대도 있지만, 번역가들에게 맡기지 않고 기계번역한 문서를 그대로 사용하는 글로벌 기업들이 늘고 있습니다. 예를 들어, 일부 마이크로소프트 사이트는 기계번역을 사용하여 번역되었습니다.

위의 마소 문서에서 기계번역에 대해 설명하고 있습니다. 이 문서를 살펴보면 어색한 부분이 많습니다.

기계 번역 기술 및 그것을 사용 하는 인터페이스의 뒤에 개념은 상대적으로 간단 하다, 그것의 뒤에 과학 그리고 기술은 극단적으로 복잡 하 몇몇 첨단 기술, 특히, 깊은 학문을 소집 한다 ( 인공 지능), 빅 데이터, 언어학, 클라우드 컴퓨팅 및 웹 api.

그래도 위안이 되는 것은 3년 전에 비해 지금의 마소 번역엔진의 품질이 그다지 향상된 것 같지 않다는 점입니다.ㅎ 기계번역의 품질을 만족스러운 수준으로 끌어올리는 것이 그리 쉽지 않은 것 같습니다.

마치며

기계번역이 인간번역을 대체하는 것은 시간상의 문제이지 가까운 미래에 이루어질 것입니다. 당분간은 기계번역과 인간번역이 공존하면서 점차 PEMT가 증가하게 될 것으로 보입니다.

AI 발전으로 인해 많은 직업이 위협을 받고 있습니다. 번역가는 아마 그 첫번째 희생양이 되지 않을까 생각됩니다. 실제로 딸아이가 미래에 사라질 직업 1순위가 번역가라고 하네요.ㅠ 번역가로 살아남기 위해서는 탁월한 번역 실력을 갖추거나 번역 단가를 낮추어 물량을 확보하는 전략으로 나가야 할 것 같습니다.

저는 실제로 지난 몇 년 사이 번역 단가 문제로 일부 업체와의 거래가 현저히 줄어들었습니다. 그래도 그런 업체에서 다른 번역가들이 처리하지 못하는 작업을 보내오곤 합니다. 그런 작업은 대부분 급하거나 난이도가 높은 편입니다. 그리고 의학번역 등 일부 번역 분야는 당분간 영향을 받지 않을 것으로 보입니다.

참고:


4 개 댓글

Leave a Comment

  1. 얼마 전 사이트에 올릴 글을 빠르게 번역하는 방법이 없을까 싶은 마음에 검색을 하다가 AI 속기 프로그램에 대해 알게 되었습니다.
    한국어를 비롯하여 몇 가지 언어를 지원한다고 안내되어 있습니다.
    기술 발전 가능성을 생각하면 두근대다가도 한편으로는 무엇을 잃어가고 있는 것은 아닌지 염려가 되기도 합니다.
    이곳에 흥미로운 주제의 글이 많네요.
    포스팅해 주셔서 감사합니다.

    그리고 어디에 이것을 전달해드려야 할지 몰라서 생각난 김에 댓글에 문의드립니다.
    워드프레스 비즈니스 플랜을 사용 중인데, 기본으로 깔려있는 플러그인에 대한 정보가 없어 오늘은 그걸 찾아보려 들어왔습니다.
    블로그 우측 상단에 돋보기를 눌러 검색하면 구글 검색이 표시는데, 혹시 이 블로그 안에서만 검색이 가능한 기능이 있는지 안내해 주실 수 있을까요?

    응답
    • 안녕하세요, 지수님.

      가입형 워드프레스의 비즈니스 플랜에서는 플러그인을 설치하여 사용할 수 있습니다. 하지만 일부 플러그인은 사용이 제한됩니다.

      예를 들어, 워드프레스닷컴에 이미 자체 캐싱 솔루션이 적용되어 있으므로 캐시 플러그인 (Cache Enabler, Comet Cache, Hyper Cache, Powered Cache, JCH Optimize, Quick Cache, W3 Total Cache, WP Cache, WP Fastest Cache, WP Speed Of Light, WP Super Cache, SG Optimizer, Fast Velocity Minify, Breeze — WordPress Cache Plugin 등)은 설치할 수 없습니다. 그리고 백업 플러그인과 SQL 작업이 많은 플러그인 등도 제한됩니다. 시간이 날 때 여기에 대해 한 번 정리해보겠습니다.

      이 블로그에서는 워드프레스 자체 검색 기능을 사용하지 않고 구글 맞춤 검색 (CSE) 기능을 사용하여 제가 운영하는 몇 개 블로그의 글을 동시에 검색하도록 되어 있습니다.

      https://www.thewordcracker.com/forum/resources 페이지에서 검색하시면 됩니다.

      응답
      • 저는 가입형 워드프레스의 프리미엄에 가입하여 사이트를 하나 운영하고 있는데, 속도가 빠른 편입니다. (프리미엄에서는 워드프레스닷컴에서 제공하는 테마만 사용하고 플러그인을 설치할 수 없기 때문에 속도가 빠른 것 같습니다.)

        가입형 워드프레스의 비즈니스 플랜의 경우 트래픽이 무제한이라서, 이 블로그의 트래픽을 감당할 수 없는 수준이 되면 비즈니스 플랜으로 이동하는 것도 고려하고 있습니다만, 그럴 정도로 방문자가 증가할 것 같지는 않습니다.ㅠㅠ

        가입형 워드프레스에서 설치가 제한되는 플러그인에 대해 가능하면 다음 달 초에 정리하여 하나 올려보겠습니다. 즐거운 한 주 보세요.