KEGG
(
Kyoto Encyclopedia of Genes and Genomes
, Enciclopedia de Xenes e Xenomas de Kyoto) e unha coleccion de
bases de datos
sobre
xenomas
,
vias bioloxicas
,
doenzas
,
farmacos
, e
substancias quimicas
. KEGG utilizase para a investigacion
bioinformatica
e educacion, incluindo as analises de datos en
xenomica
,
metaxenomica
,
metabolomica
e outros estudos
omicos
, modelaxe e simulacion en
bioloxia de sistemas
, e
investigacion traducional
no
desenvolvemento de farmacos
.
O proxecto da base de datos KEGG iniciouno en 1995 Minoru Kanehisa, profesor do Instituto para a Investigacion Quimica da
Universidade de Kyoto
, baixo o enton en marcha
Programa Xenoma Humano
xapones.
[
1
]
[
2
]
Antecipando a necesidade dun recurso computerizado que se puidese utilizar para a interpretacion bioloxica de
datos de secuencias xenomicas
, este profesor empezou a desenvolver a base de datos KEGG PATHWAY. E unha coleccion de mapas de vias KEGG debuxadas manualmente que representan o conecemento experimental sobre
metabolismo
e outras varias funcions da
celula
e o organismo. Todos os mapas de vias contenen unha rede de interaccions moleculares e reaccions e desenouse para ligar os
xenes
do xenoma cos
produtos xenicos
(principalmente
proteinas
) da via. Isto permitiu a analise chamada mapado de vias KEGG, no cal o contido de xenes no xenoma se compara coa base e datos KEGG PATHWAY para examinar cales son as vias e funcions que estan probablemente codificadas no xenoma.
Segundo os seus desenvolvedores, KEGG e unha "representacion en computador" do sistema bioloxico.
[
3
]
Integra bloques de construcion e
esquemas electricos
(como os das redes electricas) do sistema, mais especificamente, bloques de construcion de xenes e proteinas, bloques de construcion quimicos de
pequenas moleculas
e reaccions, e esquemas electricos de redes de reaccions e interaccions moleculares. Este concepto levase a cabo nas seguintes bases de datos de KEGG, que se categorizan en informacion de sistemas, de xenomica, de quimica e sobre saude.
[
4
]
- Sistemas de informacion
- PATHWAY ? mapas de vias de funcions celulares e de organismo
- MODULE ? modulos ou unidades funcionais de xenes
- BRITE ? clasificacions xerarquicas de entidades bioloxicas
- Informacion xenomica
- GENOME ? xenomas completos
- GENES ? xenes e proteinas nos xenomas completos
- ORTHOLOGY ? grupos
ortologos
de xenes nos xenomas completos
- Informacion quimica
- Informacion sobre saude
- DISEASE ? doenzas humanas
- DRUG ? farmacos aprobados para o seu uso
- ENVIRON ?
farmacos "crus"
(naturais non refinados) e substancias relacionadas coa saude
A base de datos KEGG PATHWAY, a base de esquemas electricos, e o nucleo do recurso KEGG. E unha coleccion de mapas de vias que integra moitas entidades como xenes, proteinas,
ARNs
, compostos quimicos, glicanos, e reaccions quimicas, xunto con xenes causantes de enfermidades e dianas de drogas, os cales estan almacenados como entradas individuais noutras bases de datos de KEGG. Os mapas de vias clasificanse nas seguintes seccions:
A seccion de metabolismo conten mapas globais debuxados esteticamente que mostran unha imaxe global do metabolismo, ademais de mapas das vias metabolicas normais. Os mapas globais de baixa resolucion poden utilizarse, por exemplo, para comparar as capacidades metabolicas de diferentes organismos en estudos xenomicos e diferentes mostras ambientais en estudos metaxenomicos. En contraste, os modulos KEGG da base de datos KEGG MODULE son de maior resolucion, con esquemas electricos localizados, que representan unidades funcionais mais concretas nun mapa de via, como as subvias conservadas entre grupos de organismos especificos e complexos moleculares. Os modulos KEGG definense como conxuntos de xenes caracteristicos que poden ser ligados con capacidades metabolicas especificas e outras funcions
fenotipicas
, para que poidan utilizarse para a interpretacion automatica de datos do xenoma e metaxenoma.
Outra base de datos que suplementa a KEGG PATHWAY e a base de datos KEGG BRITE. E unha base de datos de
ontoloxia
que conten clasificacions xerarquicas de varias entidades como xenes, proteinas, organismos, doenzas, farmacos, e compostos quimicos. Ainda que KEGG PATHWAY esta limitada a interaccions moleculares e reaccions desas entidades, KEGG BRITE incorpora ademais moitos tipos distintos de relacions.
Varios meses despois de que se iniciase o proxecto KEGG en 1995, publicouse o primeiro informe sobre un xenoma bacteriano completamente secuenciado.
[
5
]
Desde enton, todos os xenomas completos secuenciados acumulanse en KEGG tanto de
eucariotas
coma de
procariotas
. A base de datos KEGG GENES conten informacion ao nivel de xene/proteina e a base de datos KEGG GENOME conten informacion a nivel de organismo para estes xenomas. A base de datos KEGG GENES consta de conxuntos de xenes de xenomas completos, e aos xenes de cada conxunto danselles
anotacions
en forma de correspondencias establecidas cos esquemas electricos dos mapas de vias KEGG, modulos KEGG, e xerarquias BRITE.
Estas correspondencias estan feitas usando o concepto de
ortologos
. Os mapas de vias KEGG debuxanse baseandose en evidencias experimentais de organismos especificos, pero estan desenados para ser aplicables tamen a outros organismos, porque diferentes organismos, como poden ser un rato e un humano, comparten a miudo vias identicas que constan de xenes funcionalmente identicos, chamados xenes ortologos ou ortologos. Todos os xenes na base de datos KEGG GENES estan sendo agrupados en ditos ortologos na base de datos KEGG ORTHOLOGY (KO). Como aos nodos (produtos xenicos) dos mapas de vias KEGG e aos modulos KEGG e xerarquias BRITE se lles dan identificadores KO, as correspondencias establecense unha vez que os xenes do xenoma son anotados con identificadores KO polo procedemento de anotacion xenomica de KEGG.
[
4
]
Os mapas de vias metabolicas KEGG debuxanse para representar os aspectos duais da rede metabolica: a rede xenomica do modo en que os
encimas
codificados no xenoma estan conectados para catalizar reaccions consecutivas e a rede quimica do modo en que as estruturas quimicas de
substratos
e
produtos
son transformados por estas reaccions.
[
6
]
Un conxunto de xenes encimaticos no xenoma identifican as redes de relacions encimaticas cando se superponen nos mapas de vias KEGG, que a sua vez caracterizan as redes de transformacions de estruturas quimicas, o que permite a interpretacion de potenciais
biosinteticos
e de
biodegradacion
dos organismos. Alternativamente, un conxunto de
metabolitos
identificado no metaboloma serve para comprender as vias encimaticas e xenes de encimas implicados.
As bases de datos na categoria de informacion quimica, que en conxunto se chaman KEGG LIGAND, estan organizadas por conecementos tomados da rede quimica. Ao principio do proxecto KEGG, KEGG LIGAND constaba de tres bases de datos: KEGG COMPOUND para compostos quimicos, KEGG REACTION para reaccions quimicas, e KEGG ENZYME para reaccions na nomenclatura encimatica.
[
7
]
Actualmente, hai bases de datos adicionais: KEGG GLYCAN para os
glicanos
[
8
]
e duas bases de datos auxiliares para reaccions chamada RPAIR (
reactant pair alignments
, alinamentos do par reactivo) e RCLASS (clase de reaccion).
[
9
]
KEGG COMPOUND foi tamen ampliado para que contena varios tipos de compostos como os
xenobioticos
, ademais dos metabolitos.
En KEGG, as doenzas son consideradas como estados perturbados do sistema bioloxico causados por perturbantes de factores xeneticos e ambientais, e os farmacos consideranse como diferentes tipos de perturbantes.
[
10
]
A base de datos KEGG PATHWAY inclue non so os estados normais senon tamen os estados perturbados dos sistemas bioloxicos. Poren, os mapas de vias da maioria das doenzas non se poden debuxar porque os seus mecanismos moleculares non se conecen ben. Na base de datos KEGG DISEASE adoptase unha aproximacion alternativa, que simplemente cataloga os factores xeneticos e ambientais conecidos das doenzas. Estes catalogos poden finalmente levar a elaborar esquemas electricos de doenzas mais completos.
A base de datos KEGG DRUG conten
ingredientes activos
de
farmacos aprobados
en Europa, Estados Unidos e o Xapon. Distinguense polas estruturas quimicas e/ou os componentes quimicos e son asociados con moleculas diana, encimas metabolizantes, e outras informacions de redes de interaccions moleculares nos mapas de vias KEGG e as xerarquias BRITE. Isto permite unha analise integrada de interaccions de farmacos con informacion xenomica. Os chamados
farmacos "crus"
e outras substancias relacionadas coa saude, que quedan fora da categoria dos farmacos aprobados, son almacenados na base de datos KEGG ENVIRON. A base de datos na categoria de informacion sobre a saude denominanse en conxunto KEGG MEDICUS, que tamen inclue
prospectos
de todos os farmacos comercializados no Xapon.
En 2011 KEGG introduciu un modelo de subscricion para a descarga FTP debido a un significativo recorte dO financiamento gobernamental. KEGG continua estando disponible libremente por medio da sua paxina web, pero o modelo de subscricion suscitou discusions sobre a sostibilidade das bases de datos
bioinformaticas
.
[
11
]
[
12
]
- ↑
Kanehisa M, Goto S (2000).
"KEGG: Kyoto Encyclopedia of Genes and Genomes"
.
Nucleic Acids Res
28
(1): 27?30.
PMC
102409
.
PMID
10592173
.
doi
:
10.1093/nar/28.1.27
.
- ↑
Kanehisa M (1997).
"A database for post-genome analysis"
.
Trends Genet
13
(9): 375?6.
PMID
9287494
.
doi
:
10.1016/S0168-9525(97)01223-7
.
- ↑
Kanehisa M, Goto S, Hattori M, Aoki-Kinoshita KF, Itoh M, Kawashima S, Katayama T, Araki M, Hirakawa M (2006).
"From genomics to chemical genomics: new developments in KEGG"
.
Nucleic Acids Res
34
(Database issue): D354?7.
PMC
1347464
.
PMID
16381885
.
doi
:
10.1093/nar/gkj102
.
- ↑
4,0
4,1
Kanehisa M, Goto S, Sato Y, Kawashima M, Furumichi M, Tanabe M (2014).
"Data, information, knowledge and principle: back to metabolism in KEGG"
.
Nucleic Acids Res
42
(Database issue): D199?205.
PMC
3965122
.
PMID
24214961
.
doi
:
10.1093/nar/gkt1076
.
- ↑
Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM; et al. (1995). "Whole-genome random sequencing and assembly of Haemophilus influenzae Rd".
Science
269
(5223): 496?512.
PMID
7542800
.
doi
:
10.1126/science.7542800
.
- ↑
Kanehisa M (2013). "Chemical and genomic evolution of enzyme-catalyzed reaction networks".
FEBS Lett
587
(17): 2731?7.
PMID
23816707
.
doi
:
10.1016/j.febslet.2013.06.026
.
- ↑
Goto S, Nishioka T, Kanehisa M (1999).
"LIGAND database for enzymes, compounds and reactions"
.
Nucleic Acids Res
27
(1): 377?9.
PMC
148189
.
PMID
9847234
.
doi
:
10.1093/nar/27.1.377
.
- ↑
Hashimoto K, Goto S, Kawano S, Aoki-Kinoshita KF, Ueda N, Hamajima M, Kawasaki T, Kanehisa M (2006). "KEGG as a glycome informatics resource".
Glycobiology
16
(5): 63R?70R.
PMID
16014746
.
doi
:
10.1093/glycob/cwj010
.
- ↑
Muto A, Kotera M, Tokimatsu T, Nakagawa Z, Goto S, Kanehisa M (2013).
"Modular architecture of metabolic pathways revealed by conserved sequences of reactions"
.
J Chem Inf Model
53
(3): 613?22.
PMC
3632090
.
PMID
23384306
.
doi
:
10.1021/ci3005379
.
- ↑
Kanehisa M, Goto S, Furumichi M, Tanabe M, Hirakawa M (2010).
"KEGG for representation and analysis of molecular networks involving diseases and drugs"
.
Nucleic Acids Res
38
(Database issue): D355?60.
PMC
2808910
.
PMID
19880382
.
doi
:
10.1093/nar/gkp896
.
- ↑
Galperin MY, Fernandez-Suarez XM (2012).
"The 2012 Nucleic Acids Research Database Issue and the online Molecular Biology Database Collection"
.
Nucleic Acids Res
40
(Database issue): D1?8.
PMC
3245068
.
PMID
22144685
.
doi
:
10.1093/nar/gkr1196
.
- ↑
Hayden, EC.
"Popular plant database set to charge users"
.