전 세계 검색 엔진의 최강자, 구글은 선구적인 웹 서비스를 다양하게 시험해 구글 마니아들을 즐겁게 하고 있습니다. 물론 제 2의 마이크로소프트처럼 폭군이 될 수 있다는 우려도 적지 않습니다만, 적어도 웹 서비스면에서 다른 업체가 잘 시도하지 않았던 것을 빠르게 적용하는 점에서는 높은 평가를 할 수 밖에 없습니다.

구글이 우리나라에 R&D 센터(혹자는 엔지니어링 센터로 평가절하합니다만)를 세웠다는 점은 뉴스로서 잘 알려져 있습니다만, 이 곳에서 무엇을 하는지는 그리 알려진 바가 없습니다. 그런 한국 구글 R&D 센터에서 드디어 우리나라 사용자에게 맞는 전용 서비스를 내놓았습니다. 진짜 우리나라의 지역 통합을 위해 간절히 필요했던 서비스, 사투리 번역이 그것입니다. 전라도와 경상도, 제주도와 충청도, 그리고 강원도를 아우르는 언어의 통합, 구글이 어떤 멋진(?) 일을 해냈는지 한 번 보시겠습니까?^^


사투리는 도시 국가가 아닌 이상에는 어느 나라나 존재하는 법입니다만, 억양과 단어가 조금만 달라져도 알아 듣기 어려운 말의 특성상 한 나라 사람들이 서로 뜻이 통하기 어려워 사회 통합을 막는 요소가 됩니다. 더군다나 몇몇 사투리는 강자들의 놀림 거리로 전락하기까지 하여 더욱 지역 차별을 만들어 냅니다. 구글 한국 R&D 센터가 연구 끝에 개발한 사투리 번역 서비스는 사투리를 사용한 문서의 검색 효율성을 높이기 위해 만든 것입니다만, 사투리로 인한 의사 소통의 오해를 최소화하여 국론 분열을 막는 효과 역시 기대할 수 있습니다.



구글 사투리 번역 서비스의 최대의 기술적인 진보는 사투리를 사람이 번역하는 것이 아닌 철저한 데이터베이스화를 통해 완전히 컴퓨터화하는 데 성공했다는 점입니다. 사투리는 단순한 단어의 치환도 중요하지만 같은 단어라 할지라도 문맥에 따라서 뜻이 크게 달라집니다. 구글 R&D 센터는 국내의 여러 국문학 전문가의 협조를 얻어 사투리의 단어 및 자주 쓰이는 문맥의 표현을 전부 데이터베이스화하여 사투리의 뜻을 표준어로 번역했을 때도 최대한 그대로 전달될 수 있도록 했습니다.



예를 들어 각 지역의 사투리 가운데는 문장을 압축하여 몇 단어로 표현하는 경우가 많습니다. 예를 들어 경상도 사투리에서 '가가 가가?'라는 말은 단순히 번역하면 '걔가 걔야?'입니다만 실제 뜻은 '그 사람이 우리가 알고 있는 사람이 맞습니까?'라는 뜻입니다. 구글 사투리 번역은 단순한 단어 치환 대신 이러한 사투리의 차이를 이해하여 자주 사용하는 압축된 문구를 이해하기 쉬운 표준어로 번역합니다. 그 반대로 지나치게 긴 표준어를 짧은 사투리로 번역하여 사투리 사용자와의 의사 소통의 효율성을 높여주는 데 기여합니다.



또한 같은 단어가 여러 뜻을 갖고 있는 경우 해당 문맥을 파악하여 가장 적합한 단어로 변경하는 기능이 포함되어 있습니다. 전라도 사투리에서 '거시기'는 문맥에 따라서 다양한 뜻을 포함하는데, 구글 사투리 번역은 전후 문맥을 파악하여 가장 유사한 단어를 번역하여 제시합니다. 하지만 데이터베이스화한 데이터가 아무리 방대하다 할지라도 100% 번역은 불가능한데, 그에 대비하여 다른 번역 서비스처럼 원문 보기 서비스를 제공하여 사용자가 직접 문맥을 비교하여 올바른 단어를 찾을 수 있도록 하고 있습니다.



사투리 번역 서비스는 구글 검색 사이트, 구글토크, G메일의 세 가지 서비스로서 이뤄집니다. 구글 웹 사이트를 통해 이뤄지는 사투리 번역은 바벨피쉬 서비스처럼 웹 문서의 번역 서비스와 사투리 검색 서비스로 이뤄지며, 사투리를 검색하면 표준어 문서도 사투리로 번역하여 검색 결과에 보여줍니다. 구글토크는 상대방이 쓰는 사투리에 맞춰 자동 번역하여 서울 출신과 제주도 출신이 서로 메신저로 대화를 나눌 때 불편함이 없습니다. G메일은 사투리 번역을 이용하여 상대방이 보낸 사투리 문서를 표준어로 쉽게 바꿀 수 있습니다.

현재 제공되는 사투리 번역은 충청도, 경상도, 전라도, 강원도, 제주도로서 서울 또는 경기도만의 고유 사투리 및 북한 문화어는 베타 서비스에서는 제공되지 않습니다. 또한 구글측에서는 만주 지역 등 지역적으로 멀리 떨어진 곳의 언어 번역의 효율성을 높이기 위해 일단 표준어로 번역한 뒤 해당 언어로 재번역하는 간접 번역을 연구하고 있음을 밝힌 바 있습니다.

구글 사투리 번역 기능 소개 보기
구글 사투리 번역 개발자 인터뷰

이 포스트를 믿는 분들은...

2MB입니다!


댓글을 달아 주세요

  1. 2008.04.01 12:11

    쿨록
    어제 밤 늦게... 만우절 행사(?)로 구글에서 사투리 번역 글씨를 보고 '재밌네' 했었는데 -_-;
    오늘 이 글을 보고... 우어어어;;;
    진짜 생겼네? 그럼 만우절 거짓말이 아닌가 하면서...
    내려 갔었습니다.

    마지막 글을 보고... 좌절... ㅜㅜ;
    미워요!

    삭제 답글 댓글주소
  2. 2008.04.01 12:51

    참신한 기획이다라고 생각했다가 2MB됐네

    삭제 답글 댓글주소
  3. 2008.04.01 14:16

    구글도 보고 재미있었지만. 샨새교도 생겼더군요 ㅋ

    삭제 답글 댓글주소
  4. 2008.04.01 16:42

    상당히 치밀한 만우절 글이네요.
    구글에서는 어떤 오피셜 행사를 준비하고 있을지 기대됩니다.

    삭제 답글 댓글주소


FeedCount