AI의 등장, 인문대의 위기? : 번역업계의 실상.

지난 20일(현지시간) 미국의 인공지능 업체 앤트로픽(Anthropic)이 개발한 대형 언어 모델 제품, 클로드(Claude)에서 새로운 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)’ 버전을 출시했다.

클로드 3.5 소네트는 뉘앙스, 유머, 복잡한 지침을 파악하는 능력이 현저히 향상됐다. 자연스럽고 공감할 수 있는 어조로 고품질 콘텐츠를 작성하는 데 탁월하다.

위 AI 모델은 출시 직후 많은 주목을 받았다. '지피티 4(GPT-4)'나 '제미나이 1.5 프로', '라마 3 400B' 등의 다른 AI 모델보다 뛰어난 성능을, 일반인이 사용 가능한 중간급 모델에서 구현했기 때문이다. 클로드 3.5 소네트의 대학원 수준 추론 능력(GPQA)은 59.4%로 GPT-4o(53.6%)를 크게 앞섰다. 코딩 능력(HumanEval) 또한92.0%로 GPT-4o(90.2%) 대비 1.8%포인트 높았다.

이러한 AI 모델의 발전은 삶을 더욱 편리하게 만든다는 밝은 면이 있지만 우려의 목소리 또한 있다. 특히 ‘번역가'라는 직업은 AI 발전에 영향을 크게 받는다는 인식이 있다.

실제 작년 한국언론진흥재단 미디어연구센터에서 진행한 연구에서 ‘AI에 대체될 가능성이 높은 직업'으로 번역업계 직업이 꼽혔다. 그 뿐만 아니라, 18넌도에 잡코리아와 알바몬이 진행한 조사에서도 사라질 것으로 예상되는 직업으로 조사인원의 31%가 번역가를 예측했다.

정말 AI의 발전은 번역업계의 종말을 가져올까? 외대알리는 데이터 라벨링 업계에서 일했던 김도윤씨와 한국외국어대학교 국제지역대학 프랑스학과 소속으로 실제 통번역 업계에 몸담고 있는 이향 교수를 만나보았다.

AI가 만드는 새로운 직업?...결국 대면하는 한계.

데이터 라벨링이란 인공지능 학습을 위해 이미지에 태그를 달거나, 다양한 언어를 번역하는 온라인 미세노동을 말한다. 김도윤씨는 현재 대학생으로, 데이터 라벨링에서도 해외 영상이나, 글들을 한국어로 번역해 데이터 라벨링을 진행했다.

김도윤씨는 “보통 우리가 AI라고 생각하면 데이터를 수용하는데 한계가 없다고 생각할 수도 있겠지만, raw 데이터를 기계가 읽을 수 있는 형식(언어)으로 가공하는 노동자들의 입장에서, 1차 가공 데이터는 유한하다"라고 말했다. 이어 “우리가 무한한 데이터의 AI를 생각하는 것은 무의미한 데이터를 포함해서 이야기하는 것이고, 유의미한 인풋(input) 데이터의 양은 유한하다.”고 자신의 생각을 밝혔다. 더불어 그는 “1차 가공 데이터는 3~5년 뒤면 한계점이 드러날 것"이라며, “인풋 데이터가 사라지면 자연스럽게 1차 가공 노동자들의 직업은 사라질 것이고, 번역업도 타격을 입을 가능성이 있다"고 했다.

보통 우리가 데이터의 양을 떠올리면 무한하다고 생각한다. 하지만 릴라 개틀린(Lila Gatlin)이 『정보 이론과 생명 시스템(Information Theory and the Living System)』에서 밝혔듯이, 정보의 절대적인 양에 의존하는 것이 아닌, 유의미한 정보를 판단하는 양의 한계를 생각해 본다면, 데이터라는 엔트로피의 절대적 최대치나 최소치에 의존하는 대신 다양성과 신뢰성이라는 요소를 통해 데이터를 '섬세하게 최적화' 한다면, 데이터의 양은 한계가 지어져있다는 것을 알 수 있다.

즉 데이터에 라벨링을 할 가치가 있는 정보와 그렇지 않은 정보들을 판별해보면, 데이터의 양은 무한하지 않고, 이에 더해 AI의 자가 학습 능력을 고려하면, 인간이 라벨링을 할 수 있는 작업의 양은 기하급수적으로 줄어든다. 이는 AI로 인해 다른 직업들과 일거리가 파생될 것이라는 주장을 정면에서 반박하는 것이다. 라벨링 할 가치가 있는 데이터의 소멸을 김도윤씨는 "어떤 전문가들은 3-5년일 것"이라고 말했다며 우려를 표했다.

그뿐만 아니라 김도윤씨는 “현재 수많은 데이터는 진보를 명목으로 저작권 상관없이 차출해서 쓰고 있는 것으로 알고있다"라며, “만약에 번역서와 원서를 노동자에게 제공하고, 단순히 일대일로 ‘대응어 내지 번역어 찾기'만 시킨다면 전체적인 번역업계의 쇠퇴가 일어날 수 있다"라고 말했다.

앞서 말한 대로 데이터의 양은 유한하다. 이에 더해 암암리에 진행되고 있는 AI 작업에서의 저작권 침해는 라벨링 되기 전의 데이터를 생산하는, 1차 원본을 제공하는 창작자의 노동의 질적인 측면에서도 타격을 입을 수 있으며, 이는 연쇄적으로 1차 원본을 가공하는 데이터 라벨링 노동자들의 양적인 측면의 축소까지 이어질 수 있다.

“AI는 번역자의 훌륭한 도구”... “작품번역은 인간에 의한 번역의 축적이 있어야 가능"

한국외대 이향 교수의 모습. 사진=한국외국어대학교 국제지역대학 프랑스학과.

한국외대 이향 교수는 지난 1학기 번역 수업을 진행하며, 딥엘(Deep L) 같은 번역기나, 챗 지피티의 사용을 권장했다. 이 교수는 “적극적으로 사용하는 방법을 알아야, 번역가로서 경쟁력이 생긴다"라며 “현재 AI 도구를 이용하지 못하면 취업도 힘들다”라고 말했다.

이 교수는 “AI와 인간의 대결구도로 생각하는 것은 적절하지 못할 수 있다"라며 “ 이전에는 모든 문장에 사람의 에너지를 사용해야 했지만, 기계적인 부분들은 이제 AI가 대체할 수 있다"라며 “오히려 더욱 중요한 번역어에 집중해, 질적으로 더 좋은 번역을 꿈꿀 수 있다"라고 밝혔다.

딥엘과 같은 번역기에 대해 “아직까지는 기계가 번역해주는 번역어에 대한 판단을 내려, 더 나은 번역어를 찾고, 완성도를 판단해 최종 수정을 해야하기 때문에, 번역자의 실력이 더욱 중요하다"라고 말했다. 아직 기계 번역은 “틀린 번역어는 아니지만, 어색한 부분이 아직 많기 때문에, 다시 한번 번역가의 검수작업이 필요하다"라고 했다.

특히 “영상 속에 나오는 비속어의 경우, 문화적 농도의 차이를 고려하여 알맞게 번역해야 하는데, 사람이 하지 않을 실수를 AI는 할 수 있다”라며, 오류를 잡아내는 포스트 에디팅(Post editing)의 중요성을 역설했다.

이러한 AI나 번역기 외에도, CAT(Computer-assisted translation) tool이라고 하는 컴퓨터 보조 번역 프로그램 또한 번역의 질적 향상에 도움이 된다고 말했다. CAT tool중 오메가 티(Omega T)의 경우 프로 번역가가 많이 사용하는 프로그램으로, 같은 단어의 번역어를 기억하고, 번역어 간 통일성과 편리성을 제공한다.

또한 현재 유럽의 몇몇 출판사나, 프랑스 르 몽드(Le monde) 신문사의 경우 AI를 적극적으로 사용하되, 명시하는 것을 권장하고 있다. 이 교수는 “번역가로써 반가운 소식은 아니지만, 사실들의 나열이 중요한 실용번역의 경우 번역가가 해고될 수 있다"고 밝혔다. 다만, “번역가라는 일이 사라질 것이라 생각하지는 않는다”라며, “AI보다 실력이 떨어지는 번역가의 자리는 줄어들겠지만, 경쟁력있게 AI의 번역을 수정할 수 있는 능력의 번역가는 더욱 일자리가 넓어질 것"이라고 말했다.

실제로 전성기 교수는 『번역.언어.기술. - 번역인문학과 인문 선 실천』에서, “‘자동번역기의 완성은 오로지 번역을 통해서만 도달할 수 있다는 역설’이 ‘발생’한다"라며, “‘인공지공이 보들레르의 작품을 학습하려면’ ‘번역된 보들레르의 작품을 입력해서 그 예를 반복해서 학습해야’”하는데, “맥락 조건들에 의거한 추론적 해석들은 AI번역이, 적어도 ‘딥 러닝’의 기반이 되는, 추론적 해석들의 다양한 다량의 작품번역 데이터들이 축적되어 있지 않은 현 단계에서는, 그리고 앞으로도 상당기간 동안은, 하기 어려운 작업이라고 생각된다”고 밝혔다.

그뿐만 아니라 『인간의 대지』, 『미래 사회 코드』, 『고독한 산책자의 몽상』 등을 번역한 한국외대 국제지역대학 프랑스학과 김모세 교수는 “논문을 작성할 때, AI 번역을 적절히 사용하고, ‘공동저자'로 투고하는 것도 고려해야 한다"라며, AI 번역은 거스를 수 없는 시대의 흐름임을 강조했다.

여전히 남아있는 AI의 과제.

클로드 3.5 소네트에게 번역과 각주 작업을 명령한 모습. 사진=박찬빈 기자.

실제로 클로드 3.5 소네트에게 프랑스 작가, 파스칼 키냐르의 글 일부분을 번역시켰을 때의 결과물이다.

여러 프로 번역가들도 특유의 문체와 파편적인 글쓰기 스타일로 인해서 번역하기 굉장히 까다롭다고 평가하는 작가지만, 각주의 내용 또한 제공하고 있다.

이러한 면만 보면, AI는 완벽에 가까운 도구인 것처럼 보인다. 하지만, 여전히 AI에게는 할루시네이션(Hallucination)이라는 문제점이 남아있다.

한편 기자가 모리스 블랑쇼의 한 단편 글을 번역시켰을 때, 글 속 나와있는 "rapace besoin d'envol"의 구절에 대한 정보 제공을 요청했다. 클로드는 “아르토의 시집 『Suppôts et Suppliciations』(1978)에 실린 ‘Cogne et Foutre’라는 시에 이 구절이 등장합니다”라고 말하며, 시의 원문을 인용했다. 하지만 『Suppôts et Suppliciations』는 아르토가 집필한 책이 맞지만, 같은 구절도, 클로드가 말한 시도 없었다.

이와 같이 거짓 정보를 제공하는 것을 할루시네이션이라고 부른다. 할루시네이션은 환각이나 환청을 뜻하는 정신의학 용어지만, AI가 급속도로 발전함에 따라 AI가 정보를 출력해내는 과정에서 발생하는 오류로, 의도적으로 생성되는 허위 정보를 마치 '사실'처럼 말하는 현상을 뜻하는 신조어다.

안타깝게도 AI에서 할루시네이션이 발생하는 원인은 아직도 완전히 파악되지 않았다. 어떤 데이터가 어떻게 상호 영향을 미쳤는지 인과 관계 또한 파악하기 어렵다.

현재 인공지능의 학습 수행력(Learning performance), 즉 문제 해결력이 높을수록, 그리고 설명 가능력(Explainability)이 낮을수록, 할루시네이션은 더욱 빈번히 발생하고 있다.

그러나 할루시네이션을 없애기 위해 문제 해결력을 낮추거나, 설명 가능력을 높일수록, 정보는 제한될 수 밖에 없고, 유용성은 감소된다. 따라서 이는 AI 연구의 발목을 잡는 지점이자, 번역의 질적 성장을 저해하는 요소이다.

번역업계의 미래… 무엇을 할 수 있을까?

김학현 교수는 “AI시대에도 기계는 기계이고 인간은 인간이다. 그러나 변혁에 알맞은 준비를 충분히 해야한다. 더욱 인간만이 가질 수 있는 인간다움이나 인격을 살려나가야 한다”라고 말했다. 이향 교수는 번역 수업을 위해 글쓰기 수업을 진행하고 있다고 밝혔다. 많은 단어를 알지 못해서, 프랑스어 능력이 부족해서 학생들이 번역하기 힘든 것이 아니라, 치열하게 반성하고 발전하는 논리적 사고의 능력이 번역을 할 때 중요하기 때문이다. “어휘와 문법에 맞춘 외국어 교육은, 물론 계속해야 하지만, 좁은 범위의 공부”라고 덧붙였다. 또한 이향 교수는 “절대적인 번역, 100% 대응어는 없으며, 70%에서 80%에서 문화에 적절하게 번역을 하는 능력"의 중요성을 이야기하며, “굉장히 많은 옵션 속에서 가장 적절한 것을 선택하는 것이 통번역의 본질"이라고 했다. 그러면서도, “오류를 잡아내는 것"이 번역사들의 미래가 될 수 있다며, 이전과는 다른 번역사들의 작업을 예상했다.

이전의 번역이 문법과 단어에 초점 맞추어진, 보다 기술적인 일대일 대응 작업에 가까웠다면, AI는 그러한 작업에 최적화 되어있기에, 번역업계의 위기라고 생각할 수 있다. 하지만, 번역 또한 시, 수필, 문학, 철학과 같은, 보다 ‘인문학적’인 영역에 포함되고 있는 것은 아닐까?

특히 문학 번역업의 경우, 작가의 심정을 이해하며, 그것을 문화에 맞게 번역해야 하는 작업은, 오히려 이전보다 더욱 복잡해진 작업이 된 듯하다. 물론 인간 번역에도 오류가 있으며, 어떤 경우에는 AI 번역보다도 많은 오류가 있을 수 있다. 하지만, 문화에 대한 이해와 그에 적절한 의역 능력을 AI가 학습하기에는 아직 많은 시간이 필요한 듯하다. 류재화 교수는 자신이 번역한 조에 부스케의 『달몰이』의 옮긴이 후기에서, 번역자 자신은 프랑스어 원문을 보면서 있는 그대로의 감동을 받았지만, 이를 한국어로 옮기면서 독자들에게 온전한 감동을 제공하지 못함에 아쉬운 감정을 표했다. 이에 더해 이향 교수는 “외국어를 배우는 경험은 개인을 바꾸는 경험으로, 새로운 체계에서, 마치 바깥에서 한국어를 바라 보는 경험은 세계 확장의 경험이며, 대체할 수 없는 가치를 지니고 있다"라고 말했다.

번역업계에 더해, 외국어 공부 또한, AI의 발전으로 설 자리를 잃는 것이 아닌, 나의 경험에 빗대어 언어 체계 속에서 보다 온전히 의미를 간직하기 위해 중요해 보인다. 그뿐만 아니라 ‘내 세계의 확장', 내지는 ‘개인을 바꾸는 경험'이라는 인문학적인 이유로 말미암아, 여전히 가치를 지니고 있는 것이 아닐까?

박찬빈 기자(chan.b2an@gmail.com)

Search