Na el comun
uso
, un
dato
es un individual
valor
na un coleccion de maga dato. Ta referi
maga dato
a un coleccion de maga discreto o continuo valor que ta transmiti con
informacion
, describiendo con el
cantidad
, el
cualidad
, maga
hecho
, maga
estadistica
, otro maga basico unidad de
significado
, o simplemente maga secuencia de maga
simbolo
que puede
interpretao formalmente
.
Usualmente organizao el maga dato na maga
estructura
como maga
tabla
que ta provee con adicional contexto y significado, y que usable ansina mismo como maga dato na maga mas grande estructura.
Usable
el maga dato como maga
estadistico variable
na un
computacional
proceso. Puede un dato representa con maga
abstracto
idea
o maga
concreto
medicion
. Comunmente usao el maga dato na el
cientifico metodo
, el
economia
y na practicamente cualquier otro forma de humano organizacional actividad.
Ta inclui maga ejemplo de maga
conjunto de maga dato
con maga indice de maga precio (como el
indice de maga precio al consumidor
), maga
tasa de desempleo
, maga tasa de
alfabetizacion
y maga dato de un
censo
. Na este contexto, ta representa el maga dato con el maga crudo maga hecho y maga cifra del que extraible util informacion.
Ta ocurri el
recopilacion de maga dato
usando con maga tecnica como el
medicion
, el
observacion
, el
encuesta
o el
analisis
. Mientras tanto, tipicamente ta ocurri el
representacion
de maga dato
como maga
numero
o maga
caracter
que puede sujeto a mas
procesamiento
. El
maga dato de campo
son maga dato recopilao na un hinde controlado
in situ
medio ambiente. El
maga experimental dato
son maga dato generao na el curso de un controlao
cientifico
experimento
. Ta involucra el
analisis de maga dato
con tal maga tecnica como el
cuenta
, el
razon
(
amiento
), el
discusion
, el
presentacion
, el
visualizacion de maga dato
u otro maga modo de pos-analisis. Antes del analisis, tipicamente
limpiao
el
maga dato na bruto
(o hinde procesao). Removio el maga
atipico valor
y corregio maga obvio error de instrumento o de entrada de maga dato.
Considerable el dato como el mas chico unidad de factual informacion usable como base para el calculo, el razonamiento o el discusion. Puede el maga dato varia desde maga abstracto idea hasta concreto medicion, incluio, entre otro maga, el
estadistica
. Considerable el maga tematicamente conectao dato presentado na algun relevante contexto como
informacion
. Entonces descriptible maga contextualmente conectao pieza de informacion como
conocimiento
o
inteligencia
. Entonces descriptible el acervo de conocimiento e inteligencia, que ta acumula a lo largo del tiempo como resultao del sintesis de maga dato na informacion, como
entendimiento
. Segun si Joris Toonders Yonego, el maga dato "el nuevo
petroleo
del digital
economia
" (English:
the new oil of the digital economy
). Ta referi el palabra
dato
, como un general concepto, el hecho de que
representao
o
codificao
algun existente informacion o conocimiento na algun modo adecuado para un mejor uso o para el
procesamiento
.
Ya llega maga avances na
informatico
tecnologia
al advenimiento del
maga macrodato
, que usualmenta ta referi a maga muy gran cantidad de maga dato, generalmente a escala de maga
petabyte
. Utilizando tradicional metodo de analisis de maga dato y computacion, dificil (hasta imposible) el trabajo con maga
conjunto de maga dato
tan grande (y creciente). (Teoricamente hablando, ta produci maga
infinito
dato con infinito informacion, ansina que imposible el extraccion de conocimiento o inteligencia.) Na respuesta, ta usa el relativamente nuevo campo de
ciencia de maga dato
con
automatico aprendizaje
(y otro maga metodo del
artificial inteligencia
) que ta permiti con maga eficiente aplicacion del maga analitico metodo al maga macrodato.
El
latin
palabra
data
es el plural de
datum
"(cosa) que ya dale", neutro pasado participio de
dare
"dale". De aqui ta proveni el
espanol
y chavacano
dato
.
El maga dato, el
informacion
, el
conocimiento
y el
sabiduria
son maga estrechamente relacionao concepto, pero ta tene cada uno con el de suyo papel con respecto al otro, y ta tene cada termino con un especifico significao. De acuerdo con un comun opinion, recopilao y analizao el maga dato, y solo cuando analizao de algun modo ta queda el maga dato informacion adecuao para el toma de maga decision. Puede deci que ta depende el grado na que informativo un conjunto de maga dato del extento al que inesperao ele por aquel persona. Caracterizable el cantidad de informacion contenio na un flujo de maga dato por el de suyo
entropia de si Shannon
.
El
conocimiento
es el conciencia del de suyo entorno que ta posee algun entidad, mientras que meramente ta comunica el maga dato con aquel conocimiento. Por ejemplo, en entrada na un
base de maga dato
que ta especifica con el altura del
Monte Everest
es un dato que ta comunica con un valor medido con precision. (Bueno, preciso el valor na el momento del medicion, kay ta segui Everest creciendo. Ta ilustra tambien tal ejemplo que tiene vez
transeunte
un dato.) Puede incluio este medicion na un libro, junto con otro maga dato sobre el Monte Everest, para describi con el montana de un modo util para quien ta desea decidi con el mejor metodo para escala conele. El conciencia del maga caracteristica representao por este maga dato es el conocimiento.
Usualmente asumio que el dato el menos abstracto concepto, seguio por el informacion, con el conocimiento como el mas abstracto. Na este vista, ta queda el maga dato informacion por interpretacion, p.ej. por lo general, el altura de Monte Everest es "un dato", un libro sobre el maga geologico caracteristica del Monte Everest es "informacion", y un guia para maga escalador que ta contene con practico informacion sobre el mejor modo de llega al cima del Monte Everest es "conocimiento". Ta lleva "informacion" con un diversidad de maga significao, desde el cotidiano uso hasta el tecnico uso, masquen segun este vista, invertio paquemodo ta emerge el maga dato del informacion, y el informacion del conocimiento. Por lo general, estrechamente relacionao el concepto de informacion al maga nocion de el restriccion, el
comunicacion
, el control, el maga dato, el forma, el instruccion, el conocimiento, el significao, el mental estimulo, el
patron
, el
percepcion
y el representacion. Ta usa si Beynon-Davies con el concepto de un
signo
para diferencia entre maga dato e informacion: el maga dato un serie de maga
simbolo
, mientras que ta ocurri informacion cuando usao el maga simbolo para referi a algo.
Antes del desarrollo del maga informatico dispositivo y maga maquina, ya tene el gente que recopila con maga dato manualmente e imponer con maga patron na ellos. Desde el desarrollo del maga informatico dispositivo y maga maquina, tambien puede este maga dispositivo recopila con maga dato. Na el de kanaton tiempo, ampliamente usao el maga
computadora
na manada campo para recopila, clasifica, ordena y procesa con maga dato, na manada disciplina del cientifico investigacion, desde el
mercadotecnia
hasta el analisis del uso de
maga social servicio
por el maga ciudadano. Considerao este maga patron de maga dato como informacion utilizable para extrae con conocimiento. Interpretable este maga patron como el "
verdad
" (masquen puede el "verdad" un
subjetivo
concepto) y autorizable como maga estetico y etico criterio na algun maga disciplina o maga
cultura
. Mediante maga dato, trazable maga evento que ta deja con maga perceptible fisico o virtual resto. Hinde considerao ya maga marca como maga dato, una vez que roto el vinculo entre el marca y el observacion.
Clasificao el maga mecanico informatico dispositivo segun paquemodo ta representa ellos con el maga dato. Ta representa un
analogico computadora
con un dato como un voltaje, distancia, posicion u otro fisico cantidad. Ta representa un
digital computadora
con un dato como un secuencia de simbolo extraio de un fijo
alfabeto
. Ta usa el maga mas comun digital computadora con un
binario
alfabeto, es deci, un alfabeto de dos maga caracter tipicamente denotao "0" y "1". Entonces construio maga mas familiar representacion, como maga
numero
o maga
letra
. Distinguio algun maga especial forma de maga dato. Un
informatico programa
un coleccion de maga dato, interpretable como maga instruccion. Ta distingui el mayoria del maga
lenguaje de programacion
entre el maga programa y el maga dato sobre ellos que ta opera el maga programa, pero na algun maga lenguaje, notablemente
Lisp
y maga similar lenguaje, esencialmente nuay ningun distincion entre el programa mismo y el maga dato. Tambien util distingui con el
maga metadato
, es deci, un descripcion de otro maga dato. Un similar (pero anterior) termino para el maga metadato es "maga auxiliar dato" (English:
ancillary data
). El prototipico ejemplo de maga metadato es el catalogo de un
biblioteca
, que es un descripcion del contenio del maga
libro
.
Cuandoquiera hay que registra con maga dato, ta existi este maga dato na el forma de un
documento
de maga dato. Entre otro maga tipo de tal maga documento hay:
Indexao algun maga documento de maga dato (maga repositorio, estudio y conjunto de maga dato, ademas de software) na maga
Data Citation Index
, mientras que indexao el maga papel de maga dato na maga tradicional bibliografico base de dato, p.ej.
Science Citation Index Expanded
.
Acontecible el recopilacion de maga dato mediante un
primario fuente
(el investigador el primer persona na obtene con el maga dato) o un
secundario fuente
(ta obtene el investigador con el maga dato ya recogio por otro maga fuente, como el maga dato difundio na un cientifico revista). Ta varia el maga metodologia de
analisis de maga dato
y ta inclui ellos con el triangulacion y el percolacion de maga dato. Ta ofrece el segundo con un articulao metodo para recopila, clasifica y analiza con maga dato utilizando cinco maga posible angulo de analisis (por lo menos tres) para maximiza con el objetividad del investigacion y permiti con un comprension, tan completo como posible, del maga fenomeno investigao: (1) maga cualitativo y cuantitativo metodo, (2) maga bibliografico revision (incluio maga academico articulo), (3) maga entrevista con maga experto y (4)
simulacion
por computadora. Entonces (5) "percolao" el maga dato mediante un serie de maga predeterminao etapa para extrae con el mas relevante informacion.
Longevidad y accesibilidad del maga dato
[
revisa
|
revisa codigo
]
Un importante campo na el
ciencia del computacion
, el
tecnologia
y el
maga biblioteca y maga ciencia del informacion
es el longevidad del maga dato. Ta genera el cientifico
investigacion
con maga enorme cantidad de maga dato, na especial na el
genomica
y el
astronomia
, pero ademas na el
maga medico ciencia
, p.ej. na el
medico imagen
. Na el pasao, publicao el maga cientifico dato na
maga papel y maga libro
, almacenao na maga
biblioteca
, pero mas recientemente almacenao practicamente todo el maga dato na maga
unidad de duro disco
o maga
optico disco
. Sin embargo, a diferencia de papel, puede este maga dispositivo de almacenamiento queda ilegible despues de cuanto decada. Ta lucha el maga cientifico editorial y el maga biblioteca con este problema durante cuanto decada, y nuay pa ningun satisfactorio solucion para el almacenamiento a largo plazo de maga dato durante maga siglo o incluso para el eternidad.
Accesibilidad de maga dato
? Otro problema es que mucho maga cientifico dato nunca publicao ni depositao na maga repositorio de maga dato como maga
base de maga dato
. Na un reciente encuesta, solicitao maga dato de 516 maga estudio publicao entre 2 y 22 maga ano antes, pero menos de uno de cada cinco de este maga estudio capaz o dispuesto de proporciona con el maga dato solicitao. Na general, ya reduci el probabilidad de recupera con maga dato na un 17% cada ano despues del publicacion. De similar modo, ya incuntra un encuesta de 100 maga
conjunto de maga dato
na
Dryad
que ya carece mas del mitad del maga detalle para reproduci con el maga resultao del investigacion de este maga estudio. Ta demostra esto con el desesperao situacion de acceso a maga cientifico dato hinde publicao o careciendo de maga detalle suficiente para permiti con un reproduccion.
Un solucion al problema de reproducibilidad es el intento de exigi con
maga FAIR dato
, es deci, maga dato
L
ocalizable,
A
ccesible,
I
nteroperable y
R
eutilizable (English:
Findable, Accessible, Interoperable, and Reusable
). (Por casualidad, LAIR ?na chavacano, "guarida"? tambien un palabra na ingles.) Si ta cumpli maga dato con este maga requisito (si FAIR el maga dato), entonces utilizable ellos na maga subsiguiente investigacion, avanzando ansina con el progreso del ciencia y del tecnologia.
Masquen cada vez mas usao maga dato na otro maga campo, sugerio que puede el altamente interpretativo caracter de ellos entra na conflicto con el ethos del maga dato como "cierto". Ya introduci si
Peter Checkland
con el termino
capta
(del latin
capere
, "toma", cognao con "captura") para distingui entre un inmenso numero de maga posible dato y un
subconjunto
de ellos, al que orientao el
atencion
. Ya argui si
Johanna Drucker
que debio a que ta afirma el
maga humanidad
con el produccion de conocimiento como "situao, parcial y constitutivo" (English:
situated, partial, and constitutive
), puede el uso de
maga dato
introduci con maga contraproducente supuesto, por ejemplo que discreto, o independiente del observador, maga
fenomeno
. Ofrecio el termino
capta
, que ta enfatiza con el acto de observacion como constitutivo, como alternativo a
maga dato
para el maga visual representacion na el maga humanidad. (
Capta
es el pasao participio de
capere
. Neutro plural este palabra, para alinea conele con el ingles
data
"maga dato".)
El termino
impulsao por maga dato
(
Plantilla:Lang-es
, English:
data-driven
) es un
neologismo
aplicao a un actividad principalmente guiao o motivao por maga dato sobre todo otro maga factor.
[
cita requerida
]
Ta inclui tal maga actividad con el
programacion impulsao por maga dato
y el
periodismo de maga dato
.