[柳眉's 픽] "亂 빅스비와 사랑에 빠질까?"…감정 읽는 AI 祕書, 빅테크 新 激戰地됐다

장유미 記者 2024. 5. 26. 09:28
音聲再生 설정
飜譯 beta Translated by kaka i
글字크기 설정 파란원을 左右로 움직이시면 글字크기가 變更 됩니다.

이 글字크기로 變更됩니다.

(例示) 가장 빠른 뉴스가 있고 다양한 情報, 雙方向 疏通이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 國內外 主要이슈와 實時間 速報, 文化生活 및 다양한 分野의 뉴스를 立體的으로 傳達하고 있습니다.

生成型 AI 德에 10年 前 映畫 '허' 現實로…오픈AI 週도 속 아마존·애플·三星도 對應 奔走

(지디넷코리아=장유미 記者)"굿모닝, 테어도르. 5分 後에 會議野, 벌떡 좀 일어나 볼래요? 일어나!"

生成型 人工知能(AI)을 搭載한 'AI 祕書'가 最近 雨後竹筍 쏟아지면서 AI와 사랑에 빠진 男性의 이야기를 다룬 영화 '허(Her)'가 10餘年 만에 現實로 다가온 雰圍氣다. AI의 携帶型, 個人化 現象이 짙어진 탓에 'AI 祕書'와 關聯된 技術들이 빠른 速度로 開發되며 市場의 새로운 成長動力이 되고 있다는 評價다.

25日 業界에 따르면 오픈AI와 아마존, 애플, 구글, 三星電子 等 글로벌 企業들은 最近 生成型 AI를 搭載한 'AI 祕書'로 市場 내 主導權 잡기 競爭에 나섰다. 사람을 뛰어넘는 水準의 汎用人工知能(AGI) 開發에 天文學的 돈을 쏟아 붓고 있는 이들은 'AI 祕書'가 市場을 열어줄 마중물 役割을 할 것으로 期待하고 있다. 

호아킨 피닉스 主演의 映畫 '그女(Her)'의 한 場面. 호아킨 피닉스가 분한 主人公 테오도르와 畵面 속 人格型 AI 사만다의 모습. (寫眞=워너브라더스)

'AI 祕書' 市場에서 가장 注目 받는 곳은 '챗GPT'로 有名한 오픈AI다. 지난 13日 보고, 듣고, 사람과 實時間으로 對話할 수 있는 새 AI 巨大言語모델(LLM) 'GPT-4o'를  公開한 德分이다.  

GPT-4o는 텍스트를 통해 對話했던 旣存 챗GPT와 달리 利用者와 實時間 音聲 對話를 통해 質問을 받고 答辯을 내놓는다. 텍스트·音聲뿐 아니라 이미지 認識 機能까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 內容이나 보여주는 이미지를 卽刻 理解하고 그에 걸맞은 答을 할 수 있다. 새 모델名의 'o'는 '옴니(Omni·모든 것)'라는 意味에서 따왔다.

特히 빠른 應答 時間은 GPT-4o의 强點으로 꼽힌다. GPT-4o의 平均 應答 時間은 0.32秒로, 0.25秒가 所要되는 人間의 應答時間과 비슷하다. 사람과 對話하듯 實時間으로 弄談을 주고받고 對話를 할 수 있다는 뜻이다. 使用者가 中間에 말을 끊고 다른 말을 하는 것을 理解하는 것도 可能하다. 오픈AI는 이르면 6月에 陰性 AI 祕書 서비스를 내놓을 豫定이다.

미라 무라티 오픈AI 最高技術責任者(CTO)가 지난 13日(現地時間) 온라인 新製品 發表 行事에서 自社의 새 AI 모델 GPT-4o를 說明하고 있다. (寫眞=오픈AI)

'GPT-4o' 公開 하루 뒤 競爭社인 구글도 年例 開發者 會議(I/O)를 통해 새로운 生成型 AI 祕書 '프로젝트 아스트라'를 내놨다. 아스트라는 텍스트뿐만 아니라 이미지, 映像, 音聲 等을 한 番에 處理할 수 있는 未來型 AI 祕書 서비스로, 人間처럼 보고 듣고 배울 수 있다. 구글은 제미나이와 자연스럽게 對話할 수 있는 '제미나이 라이브'도 出市할 豫定이다.

마이크로소프트(MS)도 이에 맞서 對話型은 아니지만 'AI 祕書' 機能을 年例 開發者 會議 '빌드'를 通해 公開했다. MS의 모든 製品에 搭載된 '코파일럿'을 利用할 境遇 별다른 命令 없이 使用者의 이메일을 모니터링하고, 프로젝트의 다음 段階를 遂行하기 위해 必要한 데이터나 連絡網들을 빠르게 利用할 수 있도록 한 것이 特徵이다.

또 MS는 오픈AI의 GPT-4o를 클라우드 서비스 애저 AI 利用者들이 利用할 수 있도록 가장 빨리 適用해 不足함을 채웠다. 샘 올트먼 오픈AI 最高經營者(CEO)는 '빌드' 行事에 깜짝 登場해 "技術이 이렇게 意味있는 方式으로 빠르게 採擇되는 것을 본 적이 없다"며 "(AI)모델들이 앞으로 漸漸 더 똑똑해질 것"이라고 말했다.

빅테크들의 이 같은 움직임에 旣存 音聲 祕書 서비스를 提供하던 業體들의 움직임도 바빠졌다. 10年間 陰性 祕書 '알렉사'를 運營했던 아마존은 올해 末께 生成型 AI를 適用해 새롭게 선보일 豫定이다. 이를 위해 自體 開發한 LLM '타이탄'을 適用할 것으로 알려졌다. 技術開發 費用을 相殺하기 위해 月 購讀料를 賦課할 豫定으로, 金額은 아직 確定되지 않았다. 

自社 機器에 AI 機能 搭載를 推進 中인 애플도 來달 열리는 年例 世界開發者會議(WWDC)에서 生成型 AI를 搭載한 '시리'를 公開할 것으로 傳해졌다. '시리'는 애플이 지난 2011年 선보인 서비스로, 利用者 要請에 타이머나 알람 설정, 날씨 等을 音聲으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 兩方向 疏通은 不可能하다.

三星電子 陰性 祕書 '빅스비'도 오는 7月 LLM 基盤의 生成型 AI를 椄木해 變化를 試圖한다. '빅스비'는 지난 2017年 '갤럭시 S8' 스마트폰부터 適用했고 以後 스마트폰, TV, 家電 等에 搭載됐지만, 最近 出市된 陰性 AI 祕書들과 比較하면 機能이 多少 뒤처진다. 이에 삼성전자는 'DS 어시스턴트', '가우스포털' 等 自社가 만든 生成型 AI를 社內에서 使用 中으로, 이를 손질해 '빅스비'에 適用시켜 早晩間 家電, 스마트폰에도 椄木해 선보일 計劃이다. 

業界 關係者는 "알렉사, 시리, 빅스비 等 旣存 音聲 祕書 서비스들은 音聲을 텍스트로 바꿔서 認識하고 答辯도 텍스트로 먼저 만든 다음 音聲으로 合成하는 式이었다"며 "이제는 音聲을 陰性 그 自體로 認識해 處理 過程이 빨라진 데다 목소리에 담긴 感情이나 背景이 섞인 소리도 알아차릴 수 있게 됐다는 點에서 相當한 技術 差異가 있다"고 說明했다.

갤럭시폰에서 빅스비를 實行하는 모습 (寫眞=씨넷)

이처럼 生成型 AI를 活用한 音聲 祕書 市長에 빅테크들이 잇따라 뛰어들면서 關聯 市場에 對한 展望도 肯定的이다. 實際 日本 市場調査機關 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 使用하는 知能型 假想祕書(IVA)의 올해 市場 規模는 147億7千萬 달러(約 20兆1千億원)로 推定된다. 2023~2030年 年平均 成長率(CAGR)은 26.2%로 2030年 市場 規模는 474億 달러(藥 64兆6千億원)에 達할 것으로 展望된다.

業界 關係者는 "生成型 AI 陰性 祕書가 앞으로 돈이 될 것으로 보고 빅테크들을 中心으로 앞 다퉈 서비스를 내놓고 있는 雰圍氣"라며 "듣고 말하는 AI가 全 産業에 걸쳐 가져올 變化는 가늠하기 어려울 程度"라고 밝혔다.

이어 "向後 서비스가 高度化되고 規模의 經濟가 1位 業體에 몰릴 境遇 2等 以下는 業界에서 生存조차 가늠할 수 없을 것으로 보여 빅테크들의 初盤 主導權 잡기 競爭은 더 熾烈해지고 있다"며 "다만 AI祕書 開發을 위해서는 個人情報와 偏向性, 倫理的인 問題도 함께 考慮돼야 할 것"이라고 덧붙였다.

장유미 記者(sweet@zdnet.co.kr)

Copyright ⓒ 지디넷코리아. 無斷轉載 및 再配布 禁止.

이 記事에 對해 어떻게 생각하시나요?