•  


즐겁거나 或은 무섭거나 구글 포토의 世界|新東亞

즐겁거나 或은 무섭거나 구글 포토의 世界

  • 入力 2018-10-14 09:00:01

  • 글字크기 설정 닫기
    • 매우 똑똑하지만 무척 허술한 人工知能

    • 하얀 自動車와 흰 구름을 區別하지 못하는 自律走行車

    • 日就月將한 구글 포토의 새로운 挑戰

    • 人間의 偏見이 人工知能 世上에 미칠 影響

    2016年 5月 7日 일어난 일이다. 美國 플로리다州에서 道路를 달리던 테슬라의 高級 電氣 自動車 ‘모델 S’가 大型 트레일러트럭 옆面으로 突進하는 事故가 發生했다. 그런데 보면 볼수록 事故 狀況이 奇異했다. 옆面이 흰色으로 漆해진 大型 트레일러트럭은 테슬라 自動車 앞에서 左回轉하는 中이었다. 

    아무리 初步 運轉者라 하더라도 그 程度 크기의 트레일러트럭이 눈앞에 있다면 멀리서부터 브레이크를 밟았을 것이다. 하지만 테슬라 自動車는 速度를 줄이지 않고 左回轉하는 트레일러트럭 옆面으로 突進했다. 事故 當時의 剛한 衝擊으로 運轉者는 現場에서 死亡했다. 都大體 무슨 일이 있었던 걸까? 

    테슬라 自動車의 腎機能이 問題였다. 테슬라 自動車에는 ‘오토파일럿’ 機能이 있다. 世界 自動車, IT 企業에서 앞다퉈 開發 中인 自動車의 自律走行 機能을 테슬라 自動車에 얹은 것이다. 이날 死亡한 運轉者는 테슬라 自動車의 오토파일럿 機能을 켜놓고 딴짓을 하고 있었다. 오토파일럿 運行 中에도 핸들에 손을 얹고 非常 狀況에 對備하라는 規則도 어겼다. 

    그래도 疑問이 남는다. 自律走行하던 테슬라 自動車는 왜 大型 트레일러트럭을 感知하기는커녕 트럭에 突進했을까? 正確한 理由는 事故 當時 速度를 줄이지 않은 테슬라 自動車의 人工知能(AI)만 안다. 하지만 多數의 科學者는 테슬라 自動車가 흰色 트레일러를 맑은 하늘의 구름으로 誤認했을 可能性을 疑心한다. 自動車가 하늘의 구름을 避할 理由는 없으니까!

    치와와와 머핀 區分하기

    치와와와 머핀이 교묘하게 뒤섞인 사진. [트위터(@teenybiscuit) 캡처]

    치와와와 머핀이 巧妙하게 뒤섞인 寫眞. [트위터(@teenybiscuit) 캡처]

    어처구니없지만 眞實이 이렇다. 人工知能은 어떤 點에서는 人間보다 훨씬 똑똑하다. 수많은 데이터를 分析하고, 그 結果를 土臺로 定해진 패턴대로 한 가지 業務를 遂行하는 일에서 特히 뛰어나다. 2015年 3月, 바둑에서 이세돌 9段을 꺾은 구글 딥마인드의 人工知能 ‘알파고’가 가장 좋은 例다. 



    人工知能이 辯護士, 會計士, 醫師 같은 專門職을 어느 瞬間 代替할 可能性이 擡頭되는 것도 이 때문이다. 따지고 보면 그런 專門職 從事者는 수많은 데이터(例를 들어 法條文과 判例)를 머릿속에 담고서 定해진 패턴대로 주어진 業務를 遂行(判決)한다. 準備만 제대로 한다면 이런 일은 人工知能이 훨씬 더 잘할 수 있다. 

    하지만 이렇게 똑똑해 보이는 人工知能에 意外로 弱한 구석이 있다. 아이러니하게도 人工知能은 人間이 特別히 배우지 않아도 대수롭지 않게 해내는 일을 잘하지 못한다. 눈길 한 番에 對象이 무엇인지 把握하는 일이 그렇다. 例를 들어 세 살짜리 아이도 道路 위에 놓인 돌멩이와 종이 箱子를 쉽게 區分한다. 하지만 人工知能은 그 둘을 제대로 區分하지 못한다. 

    都大體 무슨 소리인지 感이 안 온다면 寫眞 한 張을 살펴보자. 구글에 ‘치와와(Chihuahua)’라는 單語와 ‘머핀(Muffin)’이라는 單語를 同時에 入力하면 눈을 동그랗게 뜬 치와와와 초콜릿 칩이 박힌 머핀 寫眞이 뒤섞인 이미지가 나온다. 이 글을 읽는 여러분은 勿論이거니와 세 살짜리 아이에게 이 寫眞에서 치와와만 골라보라고 하면 금세 正答을 내놓을 것이다. 

    하지만 人工知能은 이런 問題를 맞닥뜨리면 말 그대로 ‘大混亂’에 빠진다. 멀쩡한 치와와 寫眞을 초콜릿 칩이 박힌 머핀이라고 하거나, 或은 초콜릿 칩 머핀을 치와와라고 答한다. 그러다 到底히 正答을 모르겠으면 “나 몰랑~” 하고 시스템이 다운될 수도 있다. 이렇게 寫眞 區別에 人工知能은 젬병이다. 

    人工知能 歷史에서 이 問題는 深刻했다. 1990年代 들어 人工知能은 世界 체스 챔피언을 꺾을 程度의 實力을 誇示했지만, 한便으로는 如前히 개와 고양이를 區別하는 일처럼 한 살배기 아이가 하는 일도 따라 하지 못했다. 개와 고양이도 區別하지 못하는 人工知能 따위에게 어떻게 重要한 일을 맡길 수 있겠는가? 

    2011年 구글이 人工知能 企業으로 變身을 꾀할 때 狀況도 다르지 않았다. 구글은 科學者 여럿과 協業을 통해 人間 腦의 神經網을 模倣한 全혀 새로운 方式의 人工知能이 이런 답답한 狀況에 突破口를 마련할 수 있으리라고 가닥을 잡았다. 구글이 세운 첫 番째 目標가 바로 개와 고양이를 區別하는 人工知能을 만드는 것이었다. 

    人間 腦의 神經網을 模倣한 人工知能은 구글이 保有한 厖大한 데이터(例를 들어 유튜브 動映像의 停止 畵面)로 學習을 始作했다. 成果는 놀라웠다. 2011年 프로젝트를 始作한 지 1年 만에 개와 고양이를 區別하는 것 같은 事物 認識 시스템의 正確度가 열 倍나 높아졌다. 

    여기서 人間 腦의 神經網을 模倣한 人工知能이 고양이를 어떻게 認識하는지 簡單히 살펴보자. 通念과 달리 이 새로운 人工知能은 고양이에 對한 어떤 ‘正義(definition)’도 敎育받지 않는다. 고양이, 개, 장난감 自動車 等 수많은 寫眞을 人工知能에 入力한다. 그러고 나서 고양이 寫眞을 ‘고양이’라고 答할 때마다 “OK!” 信號를 준다. 이 過程을 數없이 反復한다(수백만 番). 그러다 보면 人工知能은 여러 種類의 고양이를 比較的 正確히 認識할 수 있게 된다. 

    勿論 이 過程이 順坦치만은 않았다. 고양이 알아보기에 成果를 보이던 人工知能은 뜬금없이 體育館의 啞鈴을 놓고 混亂에 빠졌다. 理由는 單純했다. 人工知能이 學習한 啞鈴 寫眞은 恒常 사람이 그것을 들고 運動하는 모습이다. 그 結果 人工知能은 사람 없는 啞鈴을 보면 바보가 됐다. 구글은 다시 啞鈴 寫眞만 여러 張을 찍어 人工知能을 敎育해야 했다.

    人工知能의 奇跡, 구글 포토의 登場

    2017년 5월 17일 순다르 피차이 구글 최고경영자가 미국 캘리포니아에서 구글 렌즈에 대해 설명하고 있다. [AP=뉴시스]

    2017年 5月 17日 순다르 피차이 구글 最高經營者가 美國 캘리포니아에서 구글 렌즈에 對해 說明하고 있다. [AP=뉴시스]

    아무튼 구글은 2012年 이런 至難한 過程을 통해 얻은 成果를 흔히 ‘캣 페이퍼(Cat Paper)’라고 하는 有名한 論文(原題 Building High-level Features Using Large Scale Unsupervised Learning)으로 發表했다. 그러고 나서 구글은 새로운 서비스를 準備했다. 自身의 人工知能 硏究 成果를 適用한 이미지 서비스, 바로 ‘구글 포토(Google Photos)’를 선보인 것이다. 

    2015年 5月, 구글은 野心滿滿하게 ‘구글 포토’를 선보였다. 이미 寫眞을 비롯한 이미지를 認識하는 데 相當한 水準에 오른 人工知能 力量을 蓄積한 구글은 새로운 서비스에 여러 가지 ‘必殺機’를 넣었다. 無料로 모든 寫眞을 백업하고, 포토 北(Photo books)에 寫眞을 印刷하는 機能 外에도 人工知能만 할 수 있는 機能을 선보인 것이다. 

    구글 포토 서비스 가운데 가장 눈에 띄는 것은 얼굴 認識이다. 于先 구글 포토에 自身의 스마트폰에 있는 수많은 寫眞을 백업해놓자. 그러면 구글 포토가 그 寫眞에 登場한 여러 人物의 얼굴 寫眞을 보여준다. 萬若 當身이 아들이나 딸 或은 男子 親舊나 女子 親舊 寫眞을 클릭하면 구글 포토는 그 人物이 들어 있는 모든 寫眞만 따로 整列한다. 

    그러고 나서 이렇게 묻는다. “이 사람은 누구입니까(Who is this)?” 萬若에 ‘영희’라고 入力해놓으면 이제 그 人物 폴더에는 鬼神같이 ‘영희’가 찍힌 寫眞만 모인다. 얼마나 正確할까? 내가 일곱 살배기 아들 寫眞 數百 張으로 直接 實驗해봤다. 태어나자마자 찍은 寫眞부터 最近 寫眞까지 全部 구글 포토에 백업했다. 구글 포토는 태어난 지 서너 時間 뒤에 찍은 첫 寫眞부터 最近에 찍은 萬 여섯 살 生日 파티 寫眞까지 正確하게 모아 보여줬다. 아이가 얼마나 빨리 자라고 또 그에 따라 身體 變化가 얼마나 큰지를 헤아리면 놀라운 일이다. 구글 포토는 그런 身體 變化 따위에 相關없이 正確하게 똑같은 사람을 捕捉했다. 

    고양이나 개 같은 伴侶動物도 마찬가지다. 집에서 키우는 고양이나 개 寫眞을 選擇해 ‘야옹이’ 또는 ‘멍멍이’라고 이름을 入力해놓으면 구글 포토는 그 고양이나 개 寫眞만 正確히 區別해 보여준다. 自己 집 고양이나 개는 主人만 正確히 區別할 수 있다고 했던가? 아니다. 이제 구글 捕討道 아무개 집 고양이나 개가 무엇인지 正確하게 안다. 

    이뿐만이 아니다. 萬若 寫眞에 撮影 場所 태그가 붙어 있거나 구글 포토가 識別 可能한 觀光地에서 撮影한 것이라면, 구글 포토는 알아서 該當 場所 寫眞만 따로 分類한다. 게다가 구글 포토는 특별한 이벤트도 알아서 認識한다. 例를 들어 구글 포토의 人工知能은 아이, 케이크, 洋초 또 ‘BIRTHDAY’ 같은 文句 等이 包含된 寫眞을 보고 ‘生日 파티’ 이벤트임을 알아차리고 分類한다. 

    甚至於 구글 포토는 어떤 場所에서 같은 時間에 찍은 여러 張의 寫眞을 내키는 대로 자르고 붙여서 시키지 않았는데도 콜라주 앨범 或은 動映像이나 애니메이션을 만든다. 구글 포토는 自己가 生日 파티로 認識한 이벤트의 寫眞 여러 張을 利用해 알아서 콜라주 앨범을 만들거나 動映像이나 다양한 效果를 넣은 애니메이션을 만들고 使用者에게 보내 “어때요?” 하고 묻는다. 

    오랫동안 愛之重之 키우던 개를 떠나보낸 知人은 이런 經驗을 한 적이 있다. 늙고 병들어 世上을 떠난 개 ‘바둑이’ 때문에 傷心하고 있던 어느 날, 갑자기 구글 포토가 ‘바둑이와의 즐거웠던 한때’라는 動映像을 編輯해 보여준 것이다. 生前의 바둑이가 愛嬌 부리던 場面이 고스란히 들어 있는 動映像을 보고서 그 知人은 하염없이 눈물을 흘렸단다. 

    스티븐 스필버그 監督이 演出하고 톰 크루즈가 主演한 2002年 映畫 ‘마이너리티 리포트’를 或是 記憶하는가? 그 映畫를 보면 딸을 잃은 主人公(톰 크루즈 分)李 딸의 生前 모습이 담긴 動映像을 보면서 하염없이 눈물 흘리는 場面이 나온다. 萬若 未來 어느 時點에 비슷한 狀況이 再現된다면, 그 動映像 製作者는 구글 포토의 人工知能日 蓋然性이 높다. 

    告白하건대 나도 가끔 구글 포토가 提供하는, 아이가 才弄 떠는 場面이 담긴 動映像을 멍하니 보면서 아빠 微笑를 짓곤 한다. 이 대목에서 한 가지 잊지 말아야 할 일이 있다. 그렇게 내가 아빠 微笑를 짓는 동안 구글 포토의 人工知能은 내가 (아무런 代價 없이) 自進해서 올린 수많은 아이 寫眞으로 只今 이 瞬間도 더 나은 人工知能이 되고자 學習하고 있다.

    사람 울리는 人工知能

    구글 포토는 서비스 始作 2年 만에 世界에서 2億 名 以上이 使用하는 成果를 올렸다. 구글은 이제 구글 포토로 蓄積한 成果를 土臺로 本格的으로 돈 벌 窮理를 하고 있다. 그 가운데 눈에 띄는 일이 바로 헬스 케어 分野다. 例를 들어 구글은 2016年 11月 29日 人工知能으로 糖尿病 患者 網膜의 血管 損傷 程度를 眼科 專門醫 水準으로 把握할 수 있다고 發表했다. 

    糖尿病 患者는 網膜 血管이 損傷돼 자칫하면 視力을 잃을 수 있다. 이런 最惡의 狀況을 豫防하려면 眼科 專門醫가 眼球 안쪽을 寫眞으로 찍어 進行 程度를 判讀해야 했다. 그런데 구글 人工知能은 眼科 專門醫와 비슷한 水準으로 正確하게 寫眞을 判讀했다. 人工知能과 實力을 겨룬 眼科 專門醫가 平均 以上의 優秀한 醫師였다는 事實을 念頭에 두면 놀라운 일이다. 

    알파고를 만든 구글 딥마인드는 女性의 가슴 엑스레이 寫眞을 活用해 乳房癌을 診斷하는 프로그램을 開發하고 있다. 醫師와 人工知能이 同時에 가슴 寫眞을 判讀한다면 乳房癌을 잡아내는 데 正確度를 훨씬 높일 수 있으리라는 것이다. 女性 가슴의 組織 緻密度에 따라 醫師가 乳房癌을 捕捉하지 못하는 境遇가 있다는 事實을 勘案하면 솔깃한 提案이다. 

    勿論 구글 포토가 밝은 面만 있는 것은 아니다. 2015年 여름, 구글 포토 서비스 草創期에 있던 일이다. 한 美國人이 親舊와 함께 콘서트에 놀러 가서 찍은 寫眞을 구글 포토에 올렸다. 여느 때처럼 구글 포토는 自動으로 寫眞을 認識해 整理했다. 그런데 이 사람은 깜짝 놀랄 事實을 確認했다. 구글 포토가 親舊를 動物 폴더에 넣은 것이다. 

    구글 側은 곧바로 서비스 初期에 일어날 수 있는 誤謬라고 解明하고 謝過했다. 하지만 그 親舊가 아프리카系 美國人 卽 ‘黑人’이고 그 動物이 ‘고릴라’라는 事實을 念頭에 두면 狀況이 좀 더 複雜해진다. 多數의 科學者는 구글 포토의 人工知能이 偏見에 汚染된 結果일 수도 있다고 指摘한다.

    구글 捕討道 틀린다

    구글은 구글 포토가 아프리카계 미국인을 '고릴라' 폴더에 분류한 사실이 드러나자 즉각 사과했다. 이 사실을 보도한 CNN 홈페이지. [인터넷 캡처]

    구글은 구글 포토가 아프리카系 美國人을 '고릴라' 폴더에 分類한 事實이 드러나자 卽刻 謝過했다. 이 事實을 報道한 CNN 홈페이지. [인터넷 캡처]

    實際로 구글의 人工知能은 以前에도 人種差別처럼 美國 社會에 蔓延한 偏見을 그대로 學習해서 行動한 탓에 口舌에 오른 적이 있다. 한때 구글에 아프리카系 美國人이 자주 쓰는 이름을 넣어서 檢索하면 犯罪者 情報를 찾아주는 會社 廣告가 떴다. 또 같은 時點에 求職 活動을 하던 女性은 똑같은 狀況의 男性보다 給與가 적은 ‘맞춤型’ 일자리 廣告에 露出됐다. 

    現實에서 女性은 男性과 比較할 때 低賃金 勞動에 從事할 可能性이 크다. 現實의 데이터로 學習한 구글 人工知能은 ‘高賃金은 男性, 低賃金은 女性’이라는 偏見을 習得한다. 이제 男性보다 能力 面에서 뒤지지 않는 女性이 구글 檢索 結果 때문에 自身이 마땅히 일할 수 있는 좀 더 나은 일자리 情報를 遮斷당한다. 그 結果, 男女 間의 賃金 隔差는 더욱 커진다. 

    무슨 이야기인지 아직 感이 안 온다면 2016年 開催된 한 美人大會에서 있었던 일도 살펴보자. 主催 側은 美人大會의 特別 이벤트 가운데 하나로 人工知能을 利用해 世界 各國 美人의 美貌를 ‘客觀的’으로 評價해보기로 했다. 100個國에서 參加者 6000名이 보내온 寫眞을 人工知能에 보여줬다. 

    審査 結果는 어땠을까. 受賞者 44名 大部分이 白人이었으며, 東洋人 몇 名을 빼놓고 黑人은 딱 1名에 不過했다. 이 人工知能이 美人을 判斷하고자 學習한 寫眞 속 主人公은 大部分 白人이었다. 美人의 基準이 白人에게 맞춰지면서 다른 美貌와 魅力을 가진 黃人種, 黑人種 美女가 判斷에서 排除된 것이다. 人工知能이 自身도 모르게 人種差別을 한 셈이다. 

    구글 포토가 수많은 이미지 데이터를 놓고 學習하는 過程에서도 이런 偏見이 隱然中에 들어갈 수 있다. 例를 들어 事務室에서 正裝을 입은 男女가 일하는 寫眞을 보고서 구글의 人工知能은 ‘職場 上司와 함께 있는 女性’이라고 學習할 수 있다. 왜냐하면 結局 데이터를 提供하고 처음에 가이드라인을 提示하는 것은 偏見에 찌든 人間이니까. 萬若 이런 偏見을 일부러 除去하지 않는 以上 구글은 以後 男子와 女子가 함께 있는 寫眞을 學習할 때마다 男子는 上司, 女子는 部下 職員이라고 認識한다. 蔓延한 社會的 偏見이 厖大한 데이터를 통해 구글 포토에 刻印된 것이다. 더 나아가 구글 포토에 새겨진 이런 社會的 偏見은 意圖하지 않은 致命的인 副作用을 낳을 수 있다. 

    世界 各國 警察은 얼굴 認識 人工知能을 活用한 犯罪 豫防 追跡 시스템을 製作하기를 꿈꾼다. 萬若 얼굴 認識 人工知能이 ‘犯罪者는 有色人種’이라는 偏見을 그대로 學習하고 있다면 어떻게 될까? 犯罪 現場에서 實際 犯人은 白人 男性인데도 그 자리에 있던 엉뚱한 黑人 男性이 容疑者로 ‘태깅(tagging)’돼 自身의 潔白함을 解明해야 하는 어처구니없는 狀況이 벌어질 수 있다. 

    구글 포토의 人工知能은 只今 갈림길에 서 있다. 할 수 있는 일이 無窮無盡하기 때문이다. 구글 포토의 人工知能은 인터넷을 통해 擴散해 當事者에게 被害를 주는 私生活 이미지나 動映像을 찾아내는 役割을 할 수 있다. 航空寫眞을 報告書 滅種 危機 生物 種이 棲息하는지 與否를 把握하는 일도 可能하다. 

    反面 이런 일도 있을 수 있다. 앞으로는 集會에 參席할 때 얼굴을 가리는 게 必須가 될지도 모른다. 어떤 政府의 人權 彈壓에 反對하는 集會에 參席했다고 하자. 그렇다면 該當 政府는 그 集會 寫眞이나 動映像을 分析해 수많은 얼굴 데이터를 利用해 忌避 人物 데이터베이스를 만들 수 있다. 人工知能은 그 데이터베이스에 따라 어떤 사람의 入國을 拒否할 수 있다. 

    種種 구글 포토를 놓고 知人과 이야기를 나눌 때가 있다. 그때마다 “구글 포토를 아직도 안 써?”라며 구글 포토를 勸하곤 한다. 구글 포토가 해내는 여러 가지 일이 놀랍고 즐겁기 때문이다. 그러다 때로는 갑자기 뒷덜미가 서늘해진다. 구글 포토가 가져올 未來가 恒常 즐겁기만 할까? 즐겁거나 무섭거나. 구글 포토는 둘 다다.



    댓글 0
    닫기

    매거진東亞

    • youtube
    • youtube
    • youtube

    에디터 推薦記事

    - "漢字路" 한글한자자동변환 서비스는 교육부 고전문헌국역지원사업의 지원으로 구축되었습니다.
    - "漢字路" 한글한자자동변환 서비스는 전통문화연구회 "울산대학교한국어처리연구실 옥철영(IT융합전공)교수팀"에서 개발한 한글한자자동변환기를 바탕하여 지속적으로 공동 연구 개발하고 있는 서비스입니다.
    - 현재 고유명사(인명, 지명등)을 비롯한 여러 변환오류가 있으며 이를 해결하고자 많은 연구 개발을 진행하고자 하고 있습니다. 이를 인지하시고 다른 곳에서 인용시 한자 변환 결과를 한번 더 검토하시고 사용해 주시기 바랍니다.
    - 변환오류 및 건의,문의사항은 juntong@juntong.or.kr로 메일로 보내주시면 감사하겠습니다. .
    Copyright ⓒ 2020 By '전통문화연구회(傳統文化硏究會)' All Rights reserved.
     한국   대만   중국   일본