한국   대만   중국   일본 
KEGG - Wikipedia, a enciclopedia libre Saltar ao contido

KEGG

Na Galipedia, a Wikipedia en galego.

KEGG ( Kyoto Encyclopedia of Genes and Genomes , Enciclopedia de Xenes e Xenomas de Kyoto) e unha coleccion de bases de datos sobre xenomas , vias bioloxicas , doenzas , farmacos , e substancias quimicas . KEGG utilizase para a investigacion bioinformatica e educacion, incluindo as analises de datos en xenomica , metaxenomica , metabolomica e outros estudos omicos , modelaxe e simulacion en bioloxia de sistemas , e investigacion traducional no desenvolvemento de farmacos .

Introducion [ editar | editar a fonte ]

O proxecto da base de datos KEGG iniciouno en 1995 Minoru Kanehisa, profesor do Instituto para a Investigacion Quimica da Universidade de Kyoto , baixo o enton en marcha Programa Xenoma Humano xapones. [ 1 ] [ 2 ] Antecipando a necesidade dun recurso computerizado que se puidese utilizar para a interpretacion bioloxica de datos de secuencias xenomicas , este profesor empezou a desenvolver a base de datos KEGG PATHWAY. E unha coleccion de mapas de vias KEGG debuxadas manualmente que representan o conecemento experimental sobre metabolismo e outras varias funcions da celula e o organismo. Todos os mapas de vias contenen unha rede de interaccions moleculares e reaccions e desenouse para ligar os xenes do xenoma cos produtos xenicos (principalmente proteinas ) da via. Isto permitiu a analise chamada mapado de vias KEGG, no cal o contido de xenes no xenoma se compara coa base e datos KEGG PATHWAY para examinar cales son as vias e funcions que estan probablemente codificadas no xenoma.

Segundo os seus desenvolvedores, KEGG e unha "representacion en computador" do sistema bioloxico. [ 3 ] Integra bloques de construcion e esquemas electricos (como os das redes electricas) do sistema, mais especificamente, bloques de construcion de xenes e proteinas, bloques de construcion quimicos de pequenas moleculas e reaccions, e esquemas electricos de redes de reaccions e interaccions moleculares. Este concepto levase a cabo nas seguintes bases de datos de KEGG, que se categorizan en informacion de sistemas, de xenomica, de quimica e sobre saude. [ 4 ]

  • Sistemas de informacion
    • PATHWAY ? mapas de vias de funcions celulares e de organismo
    • MODULE ? modulos ou unidades funcionais de xenes
    • BRITE ? clasificacions xerarquicas de entidades bioloxicas
  • Informacion xenomica
    • GENOME ? xenomas completos
    • GENES ? xenes e proteinas nos xenomas completos
    • ORTHOLOGY ? grupos ortologos de xenes nos xenomas completos
  • Informacion quimica
  • Informacion sobre saude
    • DISEASE ? doenzas humanas
    • DRUG ? farmacos aprobados para o seu uso
    • ENVIRON ? farmacos "crus" (naturais non refinados) e substancias relacionadas coa saude

Bases de datos [ editar | editar a fonte ]

Informacion de sistemas [ editar | editar a fonte ]

A base de datos KEGG PATHWAY, a base de esquemas electricos, e o nucleo do recurso KEGG. E unha coleccion de mapas de vias que integra moitas entidades como xenes, proteinas, ARNs , compostos quimicos, glicanos, e reaccions quimicas, xunto con xenes causantes de enfermidades e dianas de drogas, os cales estan almacenados como entradas individuais noutras bases de datos de KEGG. Os mapas de vias clasificanse nas seguintes seccions:

A seccion de metabolismo conten mapas globais debuxados esteticamente que mostran unha imaxe global do metabolismo, ademais de mapas das vias metabolicas normais. Os mapas globais de baixa resolucion poden utilizarse, por exemplo, para comparar as capacidades metabolicas de diferentes organismos en estudos xenomicos e diferentes mostras ambientais en estudos metaxenomicos. En contraste, os modulos KEGG da base de datos KEGG MODULE son de maior resolucion, con esquemas electricos localizados, que representan unidades funcionais mais concretas nun mapa de via, como as subvias conservadas entre grupos de organismos especificos e complexos moleculares. Os modulos KEGG definense como conxuntos de xenes caracteristicos que poden ser ligados con capacidades metabolicas especificas e outras funcions fenotipicas , para que poidan utilizarse para a interpretacion automatica de datos do xenoma e metaxenoma.

Outra base de datos que suplementa a KEGG PATHWAY e a base de datos KEGG BRITE. E unha base de datos de ontoloxia que conten clasificacions xerarquicas de varias entidades como xenes, proteinas, organismos, doenzas, farmacos, e compostos quimicos. Ainda que KEGG PATHWAY esta limitada a interaccions moleculares e reaccions desas entidades, KEGG BRITE incorpora ademais moitos tipos distintos de relacions.

Informacion xenomica [ editar | editar a fonte ]

Varios meses despois de que se iniciase o proxecto KEGG en 1995, publicouse o primeiro informe sobre un xenoma bacteriano completamente secuenciado. [ 5 ] Desde enton, todos os xenomas completos secuenciados acumulanse en KEGG tanto de eucariotas coma de procariotas . A base de datos KEGG GENES conten informacion ao nivel de xene/proteina e a base de datos KEGG GENOME conten informacion a nivel de organismo para estes xenomas. A base de datos KEGG GENES consta de conxuntos de xenes de xenomas completos, e aos xenes de cada conxunto danselles anotacions en forma de correspondencias establecidas cos esquemas electricos dos mapas de vias KEGG, modulos KEGG, e xerarquias BRITE.

Estas correspondencias estan feitas usando o concepto de ortologos . Os mapas de vias KEGG debuxanse baseandose en evidencias experimentais de organismos especificos, pero estan desenados para ser aplicables tamen a outros organismos, porque diferentes organismos, como poden ser un rato e un humano, comparten a miudo vias identicas que constan de xenes funcionalmente identicos, chamados xenes ortologos ou ortologos. Todos os xenes na base de datos KEGG GENES estan sendo agrupados en ditos ortologos na base de datos KEGG ORTHOLOGY (KO). Como aos nodos (produtos xenicos) dos mapas de vias KEGG e aos modulos KEGG e xerarquias BRITE se lles dan identificadores KO, as correspondencias establecense unha vez que os xenes do xenoma son anotados con identificadores KO polo procedemento de anotacion xenomica de KEGG. [ 4 ]

Informacion quimica [ editar | editar a fonte ]

Os mapas de vias metabolicas KEGG debuxanse para representar os aspectos duais da rede metabolica: a rede xenomica do modo en que os encimas codificados no xenoma estan conectados para catalizar reaccions consecutivas e a rede quimica do modo en que as estruturas quimicas de substratos e produtos son transformados por estas reaccions. [ 6 ] Un conxunto de xenes encimaticos no xenoma identifican as redes de relacions encimaticas cando se superponen nos mapas de vias KEGG, que a sua vez caracterizan as redes de transformacions de estruturas quimicas, o que permite a interpretacion de potenciais biosinteticos e de biodegradacion dos organismos. Alternativamente, un conxunto de metabolitos identificado no metaboloma serve para comprender as vias encimaticas e xenes de encimas implicados.

As bases de datos na categoria de informacion quimica, que en conxunto se chaman KEGG LIGAND, estan organizadas por conecementos tomados da rede quimica. Ao principio do proxecto KEGG, KEGG LIGAND constaba de tres bases de datos: KEGG COMPOUND para compostos quimicos, KEGG REACTION para reaccions quimicas, e KEGG ENZYME para reaccions na nomenclatura encimatica. [ 7 ] Actualmente, hai bases de datos adicionais: KEGG GLYCAN para os glicanos [ 8 ] e duas bases de datos auxiliares para reaccions chamada RPAIR ( reactant pair alignments , alinamentos do par reactivo) e RCLASS (clase de reaccion). [ 9 ] KEGG COMPOUND foi tamen ampliado para que contena varios tipos de compostos como os xenobioticos , ademais dos metabolitos.

Informacion sobre saude [ editar | editar a fonte ]

En KEGG, as doenzas son consideradas como estados perturbados do sistema bioloxico causados por perturbantes de factores xeneticos e ambientais, e os farmacos consideranse como diferentes tipos de perturbantes. [ 10 ] A base de datos KEGG PATHWAY inclue non so os estados normais senon tamen os estados perturbados dos sistemas bioloxicos. Poren, os mapas de vias da maioria das doenzas non se poden debuxar porque os seus mecanismos moleculares non se conecen ben. Na base de datos KEGG DISEASE adoptase unha aproximacion alternativa, que simplemente cataloga os factores xeneticos e ambientais conecidos das doenzas. Estes catalogos poden finalmente levar a elaborar esquemas electricos de doenzas mais completos.

A base de datos KEGG DRUG conten ingredientes activos de farmacos aprobados en Europa, Estados Unidos e o Xapon. Distinguense polas estruturas quimicas e/ou os componentes quimicos e son asociados con moleculas diana, encimas metabolizantes, e outras informacions de redes de interaccions moleculares nos mapas de vias KEGG e as xerarquias BRITE. Isto permite unha analise integrada de interaccions de farmacos con informacion xenomica. Os chamados farmacos "crus" e outras substancias relacionadas coa saude, que quedan fora da categoria dos farmacos aprobados, son almacenados na base de datos KEGG ENVIRON. A base de datos na categoria de informacion sobre a saude denominanse en conxunto KEGG MEDICUS, que tamen inclue prospectos de todos os farmacos comercializados no Xapon.

Modelo de subscricion [ editar | editar a fonte ]

En 2011 KEGG introduciu un modelo de subscricion para a descarga FTP debido a un significativo recorte dO financiamento gobernamental. KEGG continua estando disponible libremente por medio da sua paxina web, pero o modelo de subscricion suscitou discusions sobre a sostibilidade das bases de datos bioinformaticas . [ 11 ] [ 12 ]

Notas [ editar | editar a fonte ]

  1. Kanehisa M, Goto S (2000). "KEGG: Kyoto Encyclopedia of Genes and Genomes" . Nucleic Acids Res 28 (1): 27?30. PMC   102409 . PMID   10592173 . doi : 10.1093/nar/28.1.27 .  
  2. Kanehisa M (1997). "A database for post-genome analysis" . Trends Genet 13 (9): 375?6. PMID   9287494 . doi : 10.1016/S0168-9525(97)01223-7 .  
  3. Kanehisa M, Goto S, Hattori M, Aoki-Kinoshita KF, Itoh M, Kawashima S, Katayama T, Araki M, Hirakawa M (2006). "From genomics to chemical genomics: new developments in KEGG" . Nucleic Acids Res 34 (Database issue): D354?7. PMC   1347464 . PMID   16381885 . doi : 10.1093/nar/gkj102 .  
  4. 4,0 4,1 Kanehisa M, Goto S, Sato Y, Kawashima M, Furumichi M, Tanabe M (2014). "Data, information, knowledge and principle: back to metabolism in KEGG" . Nucleic Acids Res 42 (Database issue): D199?205. PMC   3965122 . PMID   24214961 . doi : 10.1093/nar/gkt1076 .  
  5. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM; et al. (1995). "Whole-genome random sequencing and assembly of Haemophilus influenzae Rd". Science 269 (5223): 496?512. PMID   7542800 . doi : 10.1126/science.7542800 .  
  6. Kanehisa M (2013). "Chemical and genomic evolution of enzyme-catalyzed reaction networks". FEBS Lett 587 (17): 2731?7. PMID   23816707 . doi : 10.1016/j.febslet.2013.06.026 .  
  7. Goto S, Nishioka T, Kanehisa M (1999). "LIGAND database for enzymes, compounds and reactions" . Nucleic Acids Res 27 (1): 377?9. PMC   148189 . PMID   9847234 . doi : 10.1093/nar/27.1.377 .  
  8. Hashimoto K, Goto S, Kawano S, Aoki-Kinoshita KF, Ueda N, Hamajima M, Kawasaki T, Kanehisa M (2006). "KEGG as a glycome informatics resource". Glycobiology 16 (5): 63R?70R. PMID   16014746 . doi : 10.1093/glycob/cwj010 .  
  9. Muto A, Kotera M, Tokimatsu T, Nakagawa Z, Goto S, Kanehisa M (2013). "Modular architecture of metabolic pathways revealed by conserved sequences of reactions" . J Chem Inf Model 53 (3): 613?22. PMC   3632090 . PMID   23384306 . doi : 10.1021/ci3005379 .  
  10. Kanehisa M, Goto S, Furumichi M, Tanabe M, Hirakawa M (2010). "KEGG for representation and analysis of molecular networks involving diseases and drugs" . Nucleic Acids Res 38 (Database issue): D355?60. PMC   2808910 . PMID   19880382 . doi : 10.1093/nar/gkp896 .  
  11. Galperin MY, Fernandez-Suarez XM (2012). "The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection" . Nucleic Acids Res 40 (Database issue): D1?8. PMC   3245068 . PMID   22144685 . doi : 10.1093/nar/gkr1196 .  
  12. Hayden, EC. "Popular plant database set to charge users" .  

Vexase tamen [ editar | editar a fonte ]

Outros artigos [ editar | editar a fonte ]

Ligazons externas [ editar | editar a fonte ]