상단여백
HOME 뉴스·정책
AI 만난 구글 번역과 중간어의 의미




구글 번역은 올해 10주년을 맞았다. 방대한 데이터를 바탕으로 번역을 해왔지만 지난 9월부터는 일부 언어를 대상으로 번역 알고리즘을 바꿔 인공지능 신경망을 이용, 인간에 가까운 자연어 처리를 실시하는 GNMT(Google Neural Machine Translation)를 도입한 바 있다.

그런데 구글이 인공지능은 번역할 때 이용하는 중간 언어 같은 걸 자체로 내부에 만들어 아직 학습하지 않은 것도 언어 조합으로 일정 수준을 번역하는 능력 제로샷 번역(Zero-Shot Translation)을 지니고 있다는 걸 발표했다.





GNMT는 딥러닝을 이용해 방대한 말뭉치를 통해 학습을 하고 여러 언어에 걸쳐 자연스럽게 번역을 할 수 있다. 학습할 때에는 한 언어에서 다른 언어로 번역하는 걸 학습한다. 하지만 당연히 아직 학습하지 않은 언어 조합에 대해선 아무런 준비도 되어 있지 않은 것으로 생각한다. 그런데 구글 번역 AI를 개발하는 연구팀이 발표한 논문에 따르면 인공지능이 학습 과정에서 독자적인 언어를 처리하기 위한 중간 언어(interlingua)를 만들어내고 있다고 볼 수 있다. 이 중간어는 단어끼리 1:1로 연결하는 게 아니라 추상적 개념에 가까운 정보를 유지한다.

실제로 인공지능이 영어와 일본어, 한국어 번역을 하는 걸 보면 먼저 인공지능에 영어에서 한국어 번역을 학습시킨다. 반대로 한국어에서 영어로 번역하는 걸 학습한다. 그런 다음 영어에서 일본어 번역을 학습하고 마찬가지로 반대 방향 학습도 한다.

여기에서 구글 인공지능 연구팀은 일본어와 한국어 번역도 할 수 있을 것이라고 봤다. 실제로 번역을 해보면 정확도는 떨어지지만 나름대로 사리에 맞는 수준으로 번역하는 데 성공했다고 한다. 한국어와 일본어끼리 학습은 시키지 않았는데 가능했다는 것.





지금까지 구글 번역은 영어가 아닌 언어를 다른 언어로 번역하는 경우에는 일단 영어로 번역하는 구조였다. 말하자면 영어가 기존에는 중간어 역할을 했던 것이다. 하지만 GNMT는 영어를 통하지 않고 제로샷 번역을 한 것이다.

이 사건은 번역 시스템을 고민할 데 있어 큰 이정표라고 할 수 있다. 지금까지 기계번역에선 중심이 되는 특정 언어가 존재했다. 하지만 GNMT는 중심 언어를 영어나 일본어, 한국어도 아닌 뭔가로 내부적으로 유지하고 있는 것이다.

GNMT의 인공지능은 언어별 단어나 문장이 지닌 의미나 개념을 각각 가까운 장소에 존재하고 있다고 인식한다. 실제로 어떤 형식으로 구조가 실현되고 있는지는 아직 밝혀지지 않은 부분도 많지만 인공지능의 번역 능력은 지금까지보다 훨씬 인간의 뇌와 비슷해지고 있다고 생각할 수 있다. 관련 내용은 이곳, 논문은 여기에서 확인할 수 있다.

이석원 기자  lswcap@techholic.co.kr

<저작권자 © 테크홀릭, 무단 전재 및 재배포 금지>

이석원 기자의 다른기사 보기
인기기사
추천기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
여백
여백
재미있는 테크월드 세상
여백
여백
여백
여백
여백
여백
여백
Back to Top