한국   대만   중국   일본 
生物情報學 - 위키百科, 우리 모두의 百科事典 本文으로 移動

生物情報學

위키百科, 우리 모두의 百科事典.

生物情報學 (生物情報學), 흔히 바이오인포매틱스 (bioinformatics)는 生物學 的인 問題를 應用數學 , 情報科學 , 統計學 , 컴퓨터 科學 , 人工知能 , 化學 , 生化學 等을 利用하여 主로 分子 水準에서 다루는 學問이다. 電算生物學의 硏究分野는 시스템즈 生物學科 重複되기도 한다. 株 硏究分野는 序列整列 , 遺傳子 檢索 , 遺傳子 組合, 蛋白質 救助 整列, 蛋白質 構造 豫測, 遺傳子發現의 豫測, 蛋白質 間 相互作用, 進化모델 等 多樣하다.

發生 背景 [ 編輯 ]

1950年代 英國 케임브리지의 앨런 튜링 (Alan Mathison Turing) 博士가 自然發生的인 生物學的 패턴에 關한 論文이 生物情報學의 最初의 論文으로 認識된다. 그 뒤, 英國 케임브리지의 MRC 센터의 막스 퍼루츠와 존 켄드류博士가 헤모글로빈의 3次元 蛋白質 構造를 밝혀 내면서, 그 때까지 손으로 計算器를 利用하던 것에서, 컴퓨터를 가지고 모델을 만들기 始作한 것이 構造生物情報學(structural bioinformatics)의 始作이다. 그 뒤 같은 MRC 센터의 퍼루츠의 硏究院이된 프란시스 크릭(Francis Crick)李 시드니 브래너 (Sydney Brenner)와 같이 코돈(codon)이란 말을 만들면서, 生物學의 核心인 DNA 螺旋構造와 情報 複寫라는 槪念을 더 確固히 하게 되었다. 그 때, 같은 MRC 센터의 생어 博士가 最初의 인슐린 蛋白質 序列을 解讀해 내면서, MRC 센터 內에 序列硏究의 重要性과 基盤이 만들어졌다. 그 뒤 생어 博士가 두 番째 노벨賞을 타게되는 DNA 序列을 쉽게 읽는 2 가지의 方法을 考案하면서, 많은 量의 DNA 情報가 쏟아지게 되었다. 이때, MRC 센터는 이미, 最初의 3次元 蛋白質을 컴퓨터로 그리기 始作했으며, 最初의 DNA 게놈 構造比較, 最初의 DNA序列 整列法, 最初의 DNA 整列 패키지 等을 만들게 되었다. 몇몇의 物理學者 및 數學者 出身들이 直接 컴퓨터 프로그래밍을 통해 無料로 알고리즘을 配布하기 始作하면서, 生物情報學의 完成된 모습들이 美國에 影響을 주기 始作한다. 特히, 1960年와 1970年代에는 美國에서 수많은 포스트닥터와 硏究者들이 케임브리지의 MRC 센터에서 生物理學, 生化學, 生物情報學을 傳授하여 갔다. 1970年代, 最初의 蛋白質 아틀라스 發刊, 遺傳子 情報 銀行, 니들만 원쉬 알고리즘 等의 美國 硏究者들의 寄與가 增加하고, 인터넷이 急激히 普及되는 1995年에, 生物情報學은 只今의 硏究者들이 理解하는 形態로 되었다. 그 前까지는 生物情報學에 對한 定義나, 歷史에 對한 知識이 一部 200名 남짓하는 少數 專門家들에게만 알려졌었다. 인터넷을 통한 자유로운 情報交換은, 따라서 生情報學의 가장 重要한 哲學的 背景을 가지고 있으며, 그 뿌리는 모든 情報를 無料로 配布한 케임브리지의 MRC 센터의 文化에서 起因한다. 그에 反해, 美國은 실리콘밸리와 하버드 및 예일에서의 東部 地域을 主軸으로 한 조금 더 競爭的이고 閉鎖的인 情報交換이 進行되다, 美國 NCBI가 本格的으로 運行되면서, 莫大한 量의 生物學 情報들이 全 世界的으로 普及되는 契機를 90年代에 만들게 되었다. 只今은 1970年代 英國 케임브리지 생어의 DNA 序列 分析 方法의 發達에 따라 現在 수많은 種의 戰場 게놈 序列이 밝혀져 있으며, 이런 情報가 生物情報學의 核心 컨텐츠이다. 特히 게놈은 生物情報學의 誕生부터 가장 核心되는 分野로서, 게놈學科 生物情報學은 密接하다. 결론적으로 生物體로부터 얻어진 大量의 데이터로부터 有用한 知識을 얻어내기 위한 理論物理/電算/統計/數學的인 道具를 利用하여 生命現象을 硏究하는 分野를 生情報學(bioinformatics) 或은 生命情報學, 生物情報學으로 쓰이고 있으며, 電算生物學(computational biology)이라는 用語 또한 흔히 같은 뜻으로 쓰이고 있다. 그러나, 電算 生物學은 生物學에서 컴퓨터를 쓴다는 生物學에 包含된 正義로 理解할 수 있다. 最近 生命現象을 보는 視角이 擴大되면서, 旣存의 Bio+Logie의 뜻과 같으나, 單純한 附屬의 合이 아니란 趣旨의, 시스템 全體에 對한 分析 및 數理的인 모델링(mathematical modeling)을 强調하는 用語인 시스템 生物學(systems biology)도 生情報學科 相當部分 겹치는 用語이다.

2010年을 起點으로 게놈解讀技術이 急激하게 發展하면서, 게놈뿐만 아니라, 發現體 ( 轉寫體 , 蛋白質 , 臺詞體 , 外遊全體 )의 害毒과 分析이 容易하게 되면서, 이런 체(ome)의 總稱인 오믹스( 體學 )의 多樣性이 늘어났다. 이 다양한 體學의 데이터를 多重오믹스 或은 多中體情報라고 부른다. 多重오믹스(multiomics)는 現在 生命情報學의 빅데이터의 核心이다. 特히, 게놈爲主의 體學에서, 多重오믹스間의 有機的 關係性을 人工知能(AI)로 解釋을 하는 試圖들이 늘어나서, 癌뿐만 아니라, 心臟病까지도 多重오믹스敵으로 그 原因遺傳子 分析을 하게 되었다. 心臟病은 癌과 같이 遺傳疾患으로 認識이 안되는 慢性 成人病임에도 不拘하고, 多重오믹스의 分析파워의 增加에 따라, 遺傳子와 發現體情報의 活用에 힘입어, 早期 診斷 및 治療에까지 生情報學의 領域이 擴大되고 있고, 이것은 生情報學科 醫療情報學의 重複性을 잘 보여준다.

關聯 分野 [ 編輯 ]

  • 生物學
  • 컴퓨터 科學  : 大容量의 데이터 處理 및 加工, 變形에 컴퓨터 科學이 必須的으로 必要하다.
  • 統計學  : 厖大한 資料에서 意味있는 情報를 얻어낼 때 主로 統計的 處理가 必要하다.
  • 數學  : 生物學的 資料의 厖大함으로 因해, 現在의 컴퓨터 計算 能力(computing power)으로도 適當한 時間 안에 資料를 處理할 수 없는 境遇, 또는, 새로운 方法으로 資料를 解釋해야 하는 境遇, 數學的인 方法論이 必要하다.

下位 分野 [ 編輯 ]

關聯 機關 [ 編輯 ]

關聯 저널 [ 編輯 ]

같이 보기 [ 編輯 ]

外部 링크 [ 編輯 ]