デ?タ
(英:
data
)は、個?の
事?
?
?値
、
情報
、
統計
、
??
の項目である
[1]
。より?密には、デ?タとは1人または複?の人や物や事象に?する
定性的
または
定量的
な値の集まりである
[1]
。dataの??形の
デ?タム
(英:
datum
)は、ある事?、情報、??の?一の?値または非?値である
[2]
。
?要
[
編集
]
「デ?タ」と「情報」は同じ意味で使われることがあるが、これらの用語には明確な意味がある。一般の出版物では、デ?タは文脈?において表示または分析するときに情報に?換される、と言われることがある
[3]
。しかし、?術的な扱いでは、主題のデ?タは?なる情報の一群とされる。デ?タの用途は、
科??究
、??管理(例: 販?、?益、利益、
株?
)、
金融
、統治(例:
犯罪率
(
英語版
)
、
失業率
、
識字率
)、および事?上あらゆる形態の人間の組織活動(例:
NPO
による
ホ?ムレス
の?の調査)におよぶ。
一般に、デ?タは意思決定の要素である。推論、議論、計算の基礎として使用できる事?情報の最小?位である。デ?タは、抽象的なアイデアから具?的な測定値、さらには統計に至るまで多岐にわたる。デ?タは
測定
??集?
報告
(
英語版
)
?
分析
され、グラフ?表??像などの
デ?タ視?化
のために使われる。一般的な
?念
としてのデ?タは、?存の
情報
や
知識
が、より適切な用途や?理に適した形で
表現
?
コ?ド化
されていることを指す。
生デ?タ
(
英語版
)
(未?理デ?タ)とは、?究者によって洗??修正される前の?値や文字の集まりのことである。
外れ値
や明らかな機器またはデ?タ入力のエラ?(例えば、北極?の屋外に置かれた?度計が、熱?の??を記?している)を除去するためには、生デ?タを修正する必要がある。デ?タ?理は一般に、段階的に行われ、ある段階の「加工デ?タ」は次の段階の「生デ?タ」と見なされることがある。
?地デ?タ
は、制御されていない現場の(
in situ
)環境で?集された生デ?タである。
??デ?タ~
(
英語版
)
とは、
科?
的調査の活動?で、?察と記?によって生成されるデ?タである。
デ?タは「
デジタル??
(
英語版
)
の新しい
石油
」と呼ばれている
[4]
[5]
。
意味
[
編集
]
デ?タ、
情報
、
知識
、
知?
は密接に?連した?念であるが、それぞれに役割があり、それぞれの用語には意味がある。一般的な見方では、デ?タは?集され、分析される。デ?タは何らかの形で分析されて初めて意思決定を行うのに適した情報となる
[6]
。つまり、あるデ?タ集合が誰かにとって有益であるかどうかは、その人がどの程度予期していたかによる。デ?タストリ?ムに含まれる情報量は、その
シャノンエントロピ?
によって特?付けられることがある。
知識とは、ある主題に?する情報を扱った、豊富な??に基づく理解のことである。たとえば、
エベレスト
の高さは、一般にデ?タとみなされる。その高さは
高度計
で正確に測定し、デ?タベ?スに入力することができる。このデ?タを、エベレストに?する他のデ?タと一?に本に?載することで、エベレストに登るための最適な方法を決めたい人に役立つように、山を?明することができる。エベレスト山頂に到達するための方法をアドバイスできるような登山??に基づいた理解も「知識」と見なせるかもしれない。そして、この知識に基づいたエベレスト山頂への?際の登山は「知?」と見ることができる。言い換えれば、知?とは、人が持っている知識を、良い結果が得られるような?況で??することである。このように知?は、「デ?タ」「情報」「知識」という抽象化された一連の?念を補完し、完結させるものである。
デ?タは最も抽象度が低い?念で、情報はその次に抽象度が高く、知識は最も抽象的な?念とされることが多い
[7]
。この見方では、デ?タは解?を加えることによって情報に?わる。たとえば、エベレストの高さは一般に「デ?タ」とされ、エベレストの地質?的特?に?する書籍は「情報」とされ、エベレスト山頂に到達するための最適な方法に?する?用的な情報を含む登山ガイドブックは「知識」と見なされる。「情報」とは、日常的な使用から?門的な使用まで、さまざまな意味を持っている。しかし、こうした見方は、「デ?タ」が「情報」が作られ、「情報」から「知識」が作られることを逆手に取った主張とも言える
[8]
。一般的に言えば、情報という?念は、制約、コミュニケ?ション、制御、デ?タ、形式、指示、知識、意味、精神的刺激、パタ?ン、知?、および表現の?念と密接に?係している。
バイノン?デイヴィス
(
英語版
)
はデ?タと情報を?別するために
記?
の?念を用いている。デ?タは一連の記?であるが、情報はその記?が何かを?照するために使われたときに生まれる
[9]
[10]
。
計算?置や機械が開?される以前は、人?は手作業でデ?タを?集し、それにパタ?ンを?てはめる必要があった。しかし、計算?置や機械が?達し、これらのデバイスがデ?タを?集できるようになった。2010年代には、
マ?ケティング
や市民による
社?福祉
の利用?況の分析、科??究に至るまで、さまざまな分野でデ?タを?集し、分類や加工するためにコンピュ?タが?く使われている。デ?タ上におけるこうしたパタ?ンは、知識を高めるための情報と見なされている。これらのパタ?ンは「
?理
」として解?されることもあり(ただし「?理」は主?的な?念となることもある)、一部の分野や文化では美的および倫理的基準として承認されることもある。知?可能な物理的または?想的な標識を?す出?事は、デ?タを通して遡ることができる。標識と?察との間の?係が切れると、標識はもはやデ?タとはみなされなくなる
[11]
。
アナログ計算機
は、デ?タを電?、距離、位置、または他の物理量として表現する。デジタルコンピュ?タは、固定された
アルファベット
から取った記?の?びとしてデ?タを表現する。最も一般的な
デジタルコンピュ?タ
は、二進?アルファベット、つまり、通常「0」と「1」で表される2文字のアルファベットを使用する。次に、?字や文字などの身近な表現は、この二進?アルファベットから構築される。デ?タの中には特殊な形式もあって?別される。
コンピュ?タプログラム
はデ?タの集まりであり、命令として解?することができる。ほとんどのコンピュ?タ言語では、プログラムと、プログラムが操作する他のデ?タとを?別しているが、
Lisp
やそれに類する言語では、プログラムは他のデ?タと本質的に?別できない。また、
メタデ?タ
、すなわち他のデ?タの?明も?別することも有用である。メタデ?タに類似した、以前の用語は、補助デ?タ(ancillary data)である。メタデ?タの原型の例は、書籍の?容の?明である?書館目?である。
デ?タドキュメント
[
編集
]
デ?タを登?する必要がある場合は必ず、デ?タドキュメント(
data documents
)という形式のデ?タが存在する。デ?タドキュメントには次のような種類がある。
これらのデ?タドキュメントの一部(デ?タリポジトリ、デ?タスタディ、デ?タセット、ソフトウェア)はデ?タ?
サイテ?ション?インデックス
に、デ?タペ?パ?は??の書誌デ?タベ?ス、たとえば
サイエンス?サイテ?ション?インデックス
に索引付けされている
[12]
。
デ?タの?集と分析
[
編集
]
デ?タの?集は、一次資料(?究者が最初にデ?タを入手する)または二次資料(科??誌で?表されたデ?タなど、他の資料によって?に?集されているデ?タを?究者が入手する)を通じて行うことができる。デ?タ分析の方法論はさまざまで、デ?タ?トライアンギュレ?ションやデ?タ?パ?コレ?ションが含まれる
[13]
。前者は、?究の客?性を最大化し、調査?象の現象をできるだけ完全に理解するために、定性的および定量的方法、文?レビュ?(?術論文を含む)、?門家へのインタビュ?、コンピュ?タシミュレ?ションの5つの分析角度(少なくとも3つ)からデ?タを?集、分類、分析する方法を明確にしたものである。その後、後者は、最も?連性の高い情報を抽出するために、あらかじめ決められた一連のステップでデ?タを「浸透」させます。
コンピュ?ティング分野では
[
編集
]
規格上の定義
[
編集
]
?際標準化機構
の「ISO/IEC 2382-1」および
日本工業規格
の「X0001 情報?理用語-基本用語」において、「デ?タ」の用語定義は "A reinterpretable representation of information in a formalized manner suitable for communication, interpretation, or processing."「情報の表現であって、?達、解?または?理に適するように形式化され、再度情報として解?できるもの」とされている。
電子デ?タ
[
編集
]
電子デ?タ
は、
コンピュ?タ
?にあるか、コンピュ?タに取り?める形になったデ?タである。例えば、?なる印刷物上の文字デ?タと?別して、
文字コ?ド
に?換された文字デ?タ、?なる印刷物上の?像デ?タと?別して、
ビットマップ
デ?タや
JPEG
方式の?像に?換された?像デ?タなどをいう。コンピュ?タ?部の情報?理の場合は、わざわざ電子デ?タと?することはほとんどない。
日本では刑法?文などで用いられている法律用語の「
電磁的記?
」は電子デ?タおよび磁?デ?タとほぼ同じ意味である。
ネットワ?クを介して
CPU
やハ?ドディスクなどに流れ?む整理されているデ?タや整理されていないデ?タの幅?く性質の異なる?動性、速度、量で、企業はそれをビジネスアドバイスに?換する
[14]
。
磁?デ?タ
[
編集
]
磁?デ?タ
は、
磁?記?
されているデ?タである。
磁?テ?プ
、
磁?ディスク
などのコンピュ?タ用の媒?や、
ビデオテ?プ
、定期券などの
磁?ストライプ
に蓄えられる。近くに?力な磁石があると影響を受けて?化することがある。
モデリング
[
編集
]
デ?タは、?連するものがひとまとまりにされ、整理されて保管されることが多い。これを
デ?タ保管
とよぶ。そこで保管されたデ?タの集まりを
ファイル
と呼ぶ。
デ?タの流れは、
デ?タフロ?
と呼ばれ、
デ?タフロ?ダイアグラム
などを用いて記述される。
?理の?象にされるデ?タの集合のことを、
デ?タベ?ス
とよぶ。
?理系
[
編集
]
コンピュ?タ
の場合には、デ?タは
プログラム
以外のものをさし、その形態は、文書、映像、音?など??である。直接スイッチなどを使ってメモリ上に書き?む場合も有るが、大抵はプログラムによって出力され、他のプログラムなどで?み?み使われる。コンパイラなどの?理ではプログラムを
インタプリタ
や
コンパイラ
のデ?タとして扱う場合もある。またデ?タの中にプログラムを含むことも可能。
x86
などではプログラムとデ?タは同一のメモリ?空間に配置され、設計者の意?によって?別される。
デ?タは、
レジストリ
や
ファイル
や
デ?タベ?ス
、などに?めることができる。
議論
[
編集
]
他の分野でもデ?タの活用が進んでいるが、その高度な?明的な性質は、デ?タを「?えられたもの」とする倫理?と?立する可能性が指摘されている。
ピ?タ??チェックランド
(
英語版
)
は、膨大な?の可能なデ?タと、注意を向けているそれらのサブセットを?別するために、
capta
(ラテン語の
capere
、「取る」に由?)という用語を導入した
[15]
。
ヨハンナ?ドラッカ?
(
英語版
)
は、人文科?が知識の生産を「立場的、部分的、構成的」なものと?言している以上、
data
を用いることは、たとえば現象が離散的であるとか?察者に依存しないといった逆?果となる臆?を?めかねないと論じている
[16]
。人文科?における視?的表現のための
data
に代わるものとして、?察という行?を構成的なものとして?調する
capta
という用語が提案されている。
語源と用語
[
編集
]
英語で初めて「
data
」という?語が使われたのは1640年代である。1946年に「デ?タ」という言葉が「?達可能で保存可能なコンピュ?タ情報」という意味で初めて使われた。「デ?タ?理」(
data processing
)という表現が初めて使われたのは1954年である
[17]
。英語の「
data
」は、「
datum
」の複?形で、ラテン語?イタリア語の
dare
(ダ?レ、「?える」)を語源とする
[17]
。英語の
data
はこの意味で複?名詞として使われることがあり、特に20世紀や21世紀の多くでは、自然科?、生命科?、社?科?に携わる作家は
datum
を??形で、
data
を複?形で使っている(たとえば、
APAスタイル
(第7版)ではまだ
data
は複?形が要求されている
[18]
)。しかし、日常?話、
ソフトウェア開?
、
コンピュ?タサイエンス
の世界では、
data
は不可算名詞として??形で使われることがほとんどである。
ビッグデ?タ
という用語は??形をとっている。
中?語では「
資料
(ツ?リャオ)」または「
數據
(シュ?チ?)」ともいう。
脚注
[
編集
]
- ^
a
b
『
OECD Glossary of Statistical Terms
』OECD、2008年、119頁。
ISBN
978-92-64-025561
。
https://stats.oecd.org/glossary/detail.asp?ID=532
。
- ^
“
Statistical Language - What are Data?
”.
Australian Bureau of Statistics
(2013年7月13日). 2019年4月19日時点の
オリジナル
よりア?カイブ。
2020年3月9日
??。
- ^
“
Data vs Information - Difference and Comparison | Diffen
” (英語).
www.diffen.com
.
2018年12月11日
??。
- ^
Yonego, Joris Toonders (July 23, 2014).
“Data Is the New Oil of the Digital Economy”
.
Wired
.
https://www.wired.com/insights/2014/07/data-new-oil-digital-economy/
.
- ^
“
Data is the new oil
” (2018年7月16日). 2021年10月27日時点の
オリジナル
よりア?カイブ。
2022年4月3日
??。
- ^
“
Joint Publication 2-0, Joint Intelligence
”.
Joint Chiefs of Staff, Joint Doctrine Publications
. Department of Defense. pp. I-1 (2013年10月23日).
2018年7月17日
??。
- ^
Akash Mitra (2011年). “
Classifying data for successful modeling
”. 2017年11月7日時点の
オリジナル
よりア?カイブ。
2017年11月5日
??。
- ^
Tuomi, Ilkka (2000). “Data is more than knowledge”.
Journal of Management Information Systems
6
(3): 103?117.
doi
:
10.1080/07421222.1999.11518258
.
- ^
P. Beynon-Davies (2002).
Information Systems: An introduction to informatics in organisations
. Basingstoke, UK:
Palgrave Macmillan
.
ISBN
0-333-96390-3
- ^
P. Beynon-Davies (2009).
Business information systems
. Basingstoke, UK: Palgrave.
ISBN
978-0-230-20368-6
- ^
Sharon Daniel.
The Database: An Aesthetics of Dignity
- ^
Schopfel et al. 2020. "Data Documents".
ISKO Encyclopedia of Knowledge Organization
https://www.isko.org/cyclo/data_documents
- ^
Mesly, Olivier (2015).
Creating Models in Psychological Research.
Etats-Unis : Springer Psychology : 126 pages.
ISBN
978-3-319-15752-8
- ^
Stallings, William (2016).
Foundations of modern networking : SDN, NFV, QoE, IoT, and Cloud
. Florence Agboma, Sofiene Jelassi. Indianapolis, Indiana.
ISBN
978-0-13-417547-8
.
OCLC
927715441
.
https://www.worldcat.org/oclc/927715441
- ^
P. Checkland and S. Holwell (1998).
Information, Systems, and Information Systems: Making Sense of the Field.
. Chichester, West Sussex: John Wiley & Sons. pp. 86?89.
ISBN
0-471-95820-4
- ^
Johanna Drucker (2011).
“Humanities Approaches to Graphical Display”
.
Digital Humanities Quarterly
005
(1)
.
http://www.digitalhumanities.org/dhq/vol/5/1/000091/000091.html
.
- ^
a
b
“
data | Origin and meaning of data by Online Etymology Dictionary
”.
www.etymonline.com
.
2022年4月3日
??。
- ^
American Psychological Association (2020). “6.11”.
Publication Manual of the American Psychological Association: the official guide to APA style
. American Psychological Association.
ISBN
9781433832161
?連項目
[
編集
]
外部リンク
[
編集
]
ウィキメディア?コモンズには、
デ?タ
に?連するカテゴリがあります。