•  


플리토 이정수 代表 `온디바이스 AI, LLM으로 데이터 重要性 커져`|동아일보

플리토 이정수 代表 "온디바이스 AI, LLM으로 데이터 重要性 커져"

  • 東亞닷컴
  • 入力 2024年 3月 4日 15時 34分


코멘트
“言語 飜譯은 專門家 領域이고, 飜譯 技術은 人工知能, 開發 領域이다. 大多數 LSP(言語 서비스 提供 企業)는 둘 中 하나를 强調하지만, 플리토는 機械 飜譯과 直接 飜譯의 接點을 바탕으로 技術과 사람이 共存하는 開發 環境을 만들고 있다”

이정수 플리토 代表 / 出處=IT東亞

이정수 플리토 代表(以下 이 代表)는 成長背景부터 言語와 가까웠다. 外國 駐在員인 아버지를 따라 쿠웨이트, 사우디아라비아는 勿論 美洲, 유럽 等地에서 國際 學校를 다니며 다양한 言語를 經驗했고, 대원외고와 고려대를 卒業한 以後에는 SKT에서 海外事業 提携 및 引受合倂 等의 일을 했다. 그러다 ‘스마트폰을 活用해 言語 데이터를 蒐集하면 言語 保存, 硏究 開發에 쓸 수 있겠다’라는 생각을 갖고 2012年 플리토를 創業했다.

李 代表는 ‘言語의 障壁을 무너뜨리자’는 一念 하나로 플리토를 全 世界 1400萬 名이 使用하는 參與型 飜譯 플랫폼을 만들었으며, AI 學習 및 大型言語모델(LLM)用 言語 데이터 需要가 크게 늘면서 플리토 亦是 言語 데이터 專門 企業으로 떠올랐다. 이정수 플리토 代表를 만나 사람과 機械 飜譯의 接點, 그리고 飜譯 技術의 世界를 直接 들어봤다.

“飜譯 넘어 言語 데이터 企業追求, GPT가 飜譯 業界 바꾸는 中”

플리토는 機械 飜譯과 集團知性 飜譯을 합친 形態의 서비스를 提供한다 / 出處=IT東亞

李 代表는 “只今은 누구나 데이터가 答이라고 하지만, 처음엔 아니었다. 하지만 2016年 딥러닝 技術이 떠오르고, 飜譯에 人工神經網이 導入되며 飜譯 技術이 한 段階 進化했다. 플리토가 1000萬 名을 넘은 건 2019年의 일”라면서, “市場이 생기며 17年에 本格的으로 데이터 賣出을 올렸고, 데이터 品質이 重要해질수록 더 顧客이 몰렸다. 現在 賣出은 데이터가 80%, 플랫폼이 20%”라고 말했다.

플랫폼은 人工神經網 基盤의 機械 飜譯과 使用者 參與型 飜譯, 그리고 機械 飜譯과 文脈에 맞춰 意譯을 더하는 ‘플리토 AI+’ 飜譯 等을 提供한다. 使用者는 言語 實力 向上을 위해 直接 集團知性 飜譯에 參與하거나 專門 飜譯 作業 等을 進行할 수 있다. 飜譯 業界의 强豪로 떠오른 ‘딥엘’, 傳統的인 飜譯 强者 ‘구글 飜譯’과의 差異點은 무엇일까.

플리토는 自體 飜譯 結果와 他社 飜譯 結果를 모두 보여주는 機能도 提供한다. 이정수 代表가 直接 플리토와 他社 飜譯 間의 差異를 說明하고 있다 / 出處=IT東亞

李 代表는 “딥엘은 元來 雙形語 辭典을 만드는 企業인데, 이 데이터를 바탕으로 만든 게 딥엘 飜譯이다. 딥엘은 GPT가 뜨기 前부터 GPT 모델을 適用해 飜譯 完成度를 높였고, 旣存 飜譯을 패러프레이징(뜻이 바뀌지 않는 線에서 意譯)韓 結果를 내놓는다. 구글 飜譯의 境遇 人工神經網과 莫大한 포털 蒐集 데이터로 正確度를 높이는데, 플리토 飜譯은 구글 飜譯 같은 機械 飜譯에 가깝다”라며 差異點을 說明했다.

이어서 ‘오늘 날씨가 흐린데, 高粱酒 한 盞 어때?’라는 文章을 플리토, 구글, 딥엘, 파파고로 各各 飜譯된 內容을 보여주었다. 그 結果 구글과 플리토의 結果는 正確하게 高粱酒를 固有名詞로 認識해 飜譯했고, 딥엘은 리큐르나 와인 等 理解가 쉬운 다른 用語로 바꿔 飜譯했다. 文章 理解의 難度는 딥엘이 좋았지만, 原文을 바꾸는 ‘패러프레이징’이 適用된 탓이다.

最近 플리토의 事例가 美國 CNN 인터내셔널에 生放送으로 報道되기도 했다 / 出處=CNN

이런 飜譯 特性 德分에 醫療觀光 等의 分野에서 呼應이 좋다고 한다. 李 代表는 “江南 TU齒科나 成形外科 等 外國人 比重이 높은 醫療 機關에서 플리토를 쓴다. 旣存의 飜譯機는 汎用 엔진이어서 專門 用語 等에 對한 飜譯 性能이 떨어지는데, 플리토 飜譯은 機械 飜譯의 正確性을 維持하면서, 狀況에 따라 놓치는 部分을 集團知性 및 專門 飜譯家의 結果物로 補完하는 게 强點이다”라고 말했다.

데이터 高度化 위한 플랫폼 構想 中··· 性能에도 繼續 投資

플리토는 飜譯 플랫폼을 통해 하루에 約 70萬 單語의 데이터를 蒐集하고, 텍스트뿐만 아니라 光學 文字 認識(OCR), 音聲 데이터도 모은다. 텍스트는 플리토 飜譯 플랫폼 全般에서 流入되고, 이미지나 목소리, 寫眞 等은 플랫폼 使用者가 提供한다. 또한 多國語 飜譯이 必要한 海外, 觀光 等의 分野를 對象으로 하는 메뉴 및 空間 飜譯 서비스 ‘플리토 플레이스’로 데이터 蒐集 自體를 收益 모델로 만들었다.

베트남 하노이의 有名 食堂 ‘꽌안응온’에서도 플리토 플레이스 基盤의 飜譯을 提供한다 / 出處=IT東亞

李 代表는 “플리토 플레이스는 메뉴板, 看板, 說明 等의 이미지를 傳達하면, 그 形態 그대로 飜譯 데이터를 合成해주는 서비스다. 韓國人 觀光客이 많은 베트남, 臺灣의 有名 食堂에서 우리 서비스를 쓰고 있고, 國內에서도 新世界百貨店, 더現代 서울, 롯데백화점까지 쓰고 있다”라면서, “淸溪川 및 光化門 一帶에 設置된 AI技術 基盤 實時間 通飜譯 對話나 메타 휴먼 基盤의 飜譯 應對 서비스도 注目받고 있다. 實時間 通飜譯 對話의 境遇 11個 國語를 支援한다”라고 말했다.

플리토는 機械와 사람의 混合飜譯을 넘어서, 超越飜譯의 領域까지 挑戰하고 있다. 最近 事前 테스트를 始作한 ‘데저트 폭스’ 서비스가 代表的이다. 李 代表는 “온라인上에서 使用者들이 주고받는 밈(Meme)을 機械 및 사람이 飜譯하는 플랫폼을 만들고 있다. 밈의 境遇 손글씨나 畫質 低下 等 OCR이 不可能한 境遇가 많고, 機械飜譯으로 職毒直譯하면 理解하기 어려운 뜻이 된다”라면서, “機械 飜譯과 使用者 飜譯이 함께하고, 댓글로 飜譯 結果를 多國語 使用者들이 評價한다. 서비스는 上半期 或은 그 以後에 計劃 中”이라고 말했다.

“온디바이스 AI, LLM, 플리토 事業에 直接 影響 준다”

이정수 代表는 온디바이스 AI로 高品質 言語 데이터의 重要性이 높아질 것으로 본다 / 出處=IT東亞

온디바이스 AI는 言語 事業에 어떤 影響을 미칠까. 온디바이스 AI는 서버와의 데이터 送受信 없이 機械 自體에서 AI를 處理하는 方式인데, 가장 먼저 消費者에게 紹介된 온디바이스 AI 技術 中 하나가 何必이면 實時間 飜譯 技術이다. 危機感을 느끼지 않는가 하는 質問이 李 代表는 그렇지 않다고 말했다.

李 代表는 “온디바이스 AI와 該當 技術 基盤의 飜譯이 登場한 것 自體가 歡迎할 일”이라면서, “하지만 아직 初期 段階여서 外國語에서 韓國語 飜譯은 잘 되나, 反對는 誤謬가 있는 便이다. 韓國語는 文脈을 考慮하는데 外國語는 AI가 이를 把握하기 어렵다. 正確度를 높이기 위해서는 플리토처럼 AI 言語 데이터에 韓國語 STT (Speech to Text), TTS(Text to Speech) 데이터를 꾸준히 學習시켜 나가야 한다”라고 덧붙였다.

言語의 障壁이 없는 世上이 플리토의 미션이다 / 出處=IT東亞

또한 온디바이스 AI를 위한 小型 言語 모델 開發이 加速되면 그만큼 플리토의 高品質 데이터가 受惠를 입을 것이라 말했다. 李 代表는 “온디바이스 AI로 媒介變數에 制約이 생기면서, 言語 모델의 데이터 羊 보다 品質이 더 重要해졌다. 적은 데이터로도 좋은 成果를 내기 위해서는 파인 튜닝(高度化)된 데이터가 必要하다”라면서, “LLM 말고도 온디바이스 AI에 搭載하는 小型 言語 모델도 必要해지면서 注目度가 높아지고 있다”라고 말했다.

“미션 變함없다··· 言語 障壁 없는 世上 만들 것”

마지막으로 이 代表는 플리토의 設立 目標를 다시 한番 말했다. 그는 “言語 障壁이 없는 世上을 만들자는 플리토의 미션은 變하지 않는다. 그 過程에서 賣出을 늘리고, 株主의 利益을 極大化하는 것도 包含이다. 이를 實現하기 위해서는 플랫폼을 高度化해 參與率을 높이고, 데이터의 品質을 높여야 한다”라면서, “便利하다고 느끼는 飜譯 서비스와 賣出의 極大化, 두 가지 모두 잡기 위해 努力할 것”이라고 말했다.

IT東亞 남시현 記者 (sh@itdonga.com)
  • 좋아요
    0
  • 슬퍼요
    0
  • 火나요
    0
  • 推薦해요

댓글 0

오늘의 推薦映像

只今 뜨는 뉴스

- "漢字路" 한글한자자동변환 서비스는 교육부 고전문헌국역지원사업의 지원으로 구축되었습니다.
- "漢字路" 한글한자자동변환 서비스는 전통문화연구회 "울산대학교한국어처리연구실 옥철영(IT융합전공)교수팀"에서 개발한 한글한자자동변환기를 바탕하여 지속적으로 공동 연구 개발하고 있는 서비스입니다.
- 현재 고유명사(인명, 지명등)을 비롯한 여러 변환오류가 있으며 이를 해결하고자 많은 연구 개발을 진행하고자 하고 있습니다. 이를 인지하시고 다른 곳에서 인용시 한자 변환 결과를 한번 더 검토하시고 사용해 주시기 바랍니다.
- 변환오류 및 건의,문의사항은 juntong@juntong.or.kr로 메일로 보내주시면 감사하겠습니다. .
Copyright ⓒ 2020 By '전통문화연구회(傳統文化硏究會)' All Rights reserved.
 한국   대만   중국   일본