•  


루머와 情報 玉石을 가려라|주간동아

週刊東亞 985

..

루머와 情報 玉石을 가려라

國內 硏究팀이 밝혀낸 루머 擴散의 時間的, 構造的, 言語的 特性

  • 김진호 서울科學綜合大學院 빅데이터 MBA 主任敎授 jhkim6@assist.ac.kr

    入力 2015-04-27 11:50:00

  • 글字크기 설정 닫기
    소셜미디어에서는 다양한 콘텐츠가 아주 빠르게 擴散한다. 이런 特性 때문에 利用者는 글로벌한 或은 特定 地域의 人氣 있는 主題를 쉽게 알 수 있다. 또한 소셜미디어의 빅데이터는 企業에서 發生하는 빅데이터에 比해 相對的으로 接近이 容易하다. 더욱이 그 콘텐츠 속에는 個人의 率直한 생각이 고스란히 담겨 있어 企業들이 社會 트렌드 變化나 顧客 마음을 읽는 데 或은 입所聞 마케팅에 매우 有用하게 活用하고 있다.

    하지만 傳統 미디어와 달리 소셜미디어에서는 쏟아지는 情報를 檢證하는 게 어렵고 別途의 檢證 節次도 없다는 短點이 있다. 따라서 檢證되지 않은 잘못된 情報가 大規模로 迅速하게 擴散해 社會에 커다란 해를 끼칠 可能性이 常存한다. 例를 들면 2009年 3月 新種 인플루엔자A(H1N1·新種플루)가 멕시코와 美國 等地에서 發生한 뒤 全 世界 40個國으로 퍼져 確診患者가 9830名에 達하고 死亡者도 數百 名에 達한 적이 있다. 그 當時 소셜네트워크서비스(SNS) 트위터를 통해 돼지고기를 먹으면 신종플루에 感染될 수 있다는 잘못된 情報가 數百萬 名의 使用者에게 傳播됐고, 이로 因해 소셜미디어의 前 네트워크에 걸쳐 패닉이 發生했다.

    소셜미디어 人氣가 높아지고 擴散의 潛在力이 커지면서 소셜미디어에서 傳播되는 루머와 眞짜 情報를 區別하는 것이 더욱 重要해졌다. 그런데 2013年 末 차미영 KAIST(韓國科學技術院) 敎授 硏究팀은 ‘소셜 미디어에서 루머 傳播의 重要한 特徵’이라는 題目의 論文에서 트위터 等 SNS에 나도는 루머를 90% 以上 正確하게 가려낼 수 있는 方法을 提示해 世界的인 注目을 받았다. 이番 글에서는 이 硏究의 主要 內容을 紹介한다.

    루머와 정보 옥석을 가려라
    루머의 傳播는 週期的 急騰

    只今까지 루머 擴散에 關한 硏究는 主로 주어진 情報의 信賴度를 計量化하거나 루머의 發生을 探知하려는 側面에 重點을 둬왔다. 하지만 車 敎授 硏究팀은 루머를 確認하기 위한 새로운 接近法을 提示했는데 그것은 루머 擴散의 時間的, 構造的, 言語的 特性을 分析하는 것이었다. 分析에 使用된 데이터는 트위터가 始作된 2006年 3月부터 2009年 9月까지 3年 半 동안의 資料였다. 그中 最小限 60個 以上 포스트가 붙은 102個 主題를 選定해 使用者 5400萬 名의 트위트 17億 個와 그들 사이 폴로 링크 19億 個를 分析했다. 이 102個 主題 中 루머는 47個, 眞짜 情報는 55個였는데 루머 特徵은 다음과 같았다.



    먼저 루머 擴散의 時間的 特性은 60日間의 時系列 分析 結果 ‘그래프’와 같았다. 各 그래프에서 x軸은 날짜(days), y軸은 그 主題에 對한 트위트 數를 나타낸다. 루머의 時系列 패턴은 윗줄 그래프(그래프1)에, 眞짜 情報의 時系列 패턴은 아랫줄(그래프2)에 提示됐다. ‘그래프1’에서 쉽게 볼 수 있듯이 루머의 傳播는 여러 個의 週期的인 急騰(spikes)을 나타내는데, 이는 所聞을 퍼뜨리는 사람들이 機會를 노려 루머를 또다시 傳播하려는 行動을 反復하기 때문이었다. 反面 眞짜 情報의 傳播는 單 한 個의 두드러진 急騰만 나타냈는데, 이는 情報를 傳達한 後에는 이미 情報 傳達의 目的이 達成됐으므로 다른 後續 行動이 없음을 의미했다.

    다음으로 루머와 眞짜 情報가 構造的으로 어떻게 다르게 擴散하는지를 나타내면 오른쪽 그림과 같다.

    루머와 정보 옥석을 가려라
    그림에서 ‘A’는 빅풋(Bigfoot) 追跡子들이 빅풋 死體를 發見했다는 루머의 擴散 네트워크인데, 빅풋은 美國과 캐나다 로키산맥 一帶에서 目擊된다는 ‘털이 많은 巨人’이다. ‘B’는 情報技術(IT) 企業인 鉏미즈(Summize)를 트위터가 引受한다는 眞짜 情報의 擴散 네트워크다. 그림에서 볼 수 있듯 루머는 單獨으로 傳播되는 比率, 卽 트위트가 다른 사람들에 依해 言及되거나 리트위트되지 않는 比率이 높았는데 이는 大部分의 境遇 폴로어들이 그 메시지를 無視한다는 것을 의미했다. 또한 루머는 影響力이 낮은 사람에게서 影響力이 높은 사람에게 傳播되는 比率이 높았는데, 이는 루머를 퍼뜨리는 사람들이 다른 사람들의 注意를 끌려고 하기 때문이었다.

    ‘안 돼, 아니, 絶對로’가 자주 쓰이면 루머

    루머와 眞짜 情報의 言語的 特性을 보면 먼저 루머는 使用者가 文章 속에서 ‘안 돼, 아니, 絶對로(no, not, never)’ 等과 같은 否定的 單語나 ‘그러나, ~없이, 除外하다(but, without, exclude)’ 같은 排他的 單語를 使用할 可能性이 훨씬 높았다. 反面 眞짜 情報는 ‘사랑, 親切한, 달콤한(love, nice, sweet)’ 等과 같이 肯定的인 感情을 나타내는 單語를 많이 包含했다. 또한 使用者는 루머와 關聯한 內容에 對해 ‘아마도, 推測건대, 어쩌면(maybe, guess, perhaps)’ 같은 暫定的 表現이나 ‘생각하다, 알다, 考慮하다(think, know, consider)’ 같은 認知的인 行動을 取할 可能性이 높았다. 反面 眞짜 情報와 關聯한 內容에 對해서는 ‘觀點, 봤다, 보다(view, saw, see)’ 같은 確認的인 行動을 할 可能性이 높았다.

    소셜미디어 分析의 價値는 多樣한 콘텐츠가 아주 빠르게 擴散하는 가운데서 트렌드 變化를 나타내는 ‘事實(fact)’을 찾아내는 것이다. 하지만 많은 境遇 이 事實이 루머와 섞여 檢證도 되지 않은 채 迅速하게 擴散되기도 한다. 車 敎授팀의 硏究는 소셜미디어의 連續的인 데이터를 分析해 루머 擴散의 根本的인 過程을 硏究한 最初의 論文으로서 意義가 크다.

    特히 構造的이고 言語的인 特徵에 追加해 時間的 特性도 考慮함으로써 루머 硏究의 새로운 接近 方法을 提示했다. 一般的으로 소셜미디어의 時間的 特性은 構造的 或은 言語的 特性보다 더 쉽게 分析 可能하다. 또한 車 敎授 硏究팀은 이러한 세 가지 特徵을 基盤으로 주어진 情報가 루머인지 眞짜 情報인지를 豫測하는 確率 모델을 開發했다. 이 모델은 루머와 眞짜 情報를 가려내는 正確度가 約 90%에 達했는데 이는 旣存 硏究보다 훨씬 높은 的中率이었다.



    댓글 0
    닫기
    - "漢字路" 한글한자자동변환 서비스는 교육부 고전문헌국역지원사업의 지원으로 구축되었습니다.
    - "漢字路" 한글한자자동변환 서비스는 전통문화연구회 "울산대학교한국어처리연구실 옥철영(IT융합전공)교수팀"에서 개발한 한글한자자동변환기를 바탕하여 지속적으로 공동 연구 개발하고 있는 서비스입니다.
    - 현재 고유명사(인명, 지명등)을 비롯한 여러 변환오류가 있으며 이를 해결하고자 많은 연구 개발을 진행하고자 하고 있습니다. 이를 인지하시고 다른 곳에서 인용시 한자 변환 결과를 한번 더 검토하시고 사용해 주시기 바랍니다.
    - 변환오류 및 건의,문의사항은 juntong@juntong.or.kr로 메일로 보내주시면 감사하겠습니다. .
    Copyright ⓒ 2020 By '전통문화연구회(傳統文化硏究會)' All Rights reserved.
     한국   대만   중국   일본