CSV
形式의 텍스트 파일을 나타낸 그림 아이콘
텍스트 파일
(
英語
:
text file
,
文化語
:
本文파일)은
컴퓨터 파일 시스템
에서
컴퓨터 파일
의 一種이다.
一般 文字列이 들어가는 파일이지만 貯藏 情報의 解釋 方式, 運營 體制와 連結되는 프로그램의 方式에 따라
李瑱 파일
과 區分한다.
[1]
텍스트 파일은 사람이 認知할 수 있는
文字列 集合
으로부터
文字列
로만 이루어진다. 잘 알려진 文字列 集合으로는
ASCII
文字列 集合果
유니코드
文字列 集合이 있다.
인코딩
[
編輯
]
ASCII 文字 集合
이 英語 텍스트 파일의 가장 普遍的인 포맷이며, 수많은 狀況에서 一般的으로 基本 파일 포맷으로 看做할 수 있다. 强勢가 있는 文字와 其他 非 ASCII 文字의 境遇 文字 인코딩을 選擇할 必要가 있다. 수많은 시스템에서는 컴퓨터에서 읽기 위해 쓰이는 基本
로캘
設定에 기초하여 選擇된다. 수많은 유럽 言語에서 普遍的인 文字 인코딩은
ISO 8859-1
을 包含한다.
수많은 인코딩들이 制限된 文字列들만을 保有하고 있기 때문에 制限된 下位 集合의 人間 言語로 텍스트를 表現할 때에만 種種 有用하다.
유니코드
는 알려진 모든 言語를 代表하기 위한 共通 標準을 만드는 試圖로 볼 수 있으며, 알려진 大部分의 文字 集合들이 매우 큰 유니코드 文字 集合의 下位 集合에 屬해있다. 유니코드를 위한 複數의 文字 인코딩이 있지만, 가장 흔한 것은
UTF-8
이며, ASCII와 下位 互換된다는 長點이 있다. 卽, 비슷한 意味로 모든 ASCII 텍스트 파일은 UTF-8 텍스트 파일이기도 하다.
포맷
[
編輯
]
수많은 運營 體制에서 텍스트 파일은 棲息(굵게 또는 기울임 等과 같은)이 없는
플레인 텍스트
內容만 許容하는 파일 포맷을 가리킨다. 이러한 파일들은
텍스트 터미널
이나 單純
文書 編輯機
를 통해 確認, 編輯이 可能하다. 텍스트 파일들은 普通
MIME
텍스트/플레인을 가지며, 인코딩을 가리키는 追加的인 情報가 包含되는 것이 普通이다.
윈도우 텍스트 파일
[
編輯
]
MS-DOS와 윈도우는 同一한 텍스트 파일 포맷을 使用하며, 各 텍스트 줄은 2個의 文字 組合으로 區分된다:
캐리지 리턴
(CR),
라인 피드
(LF)
유닉스 텍스트 파일
[
編輯
]
유닉스 系列
運營 體制에서 텍스트 파일 포맷은 正確하게 記述되어 있다:
POSIX
는 텍스트 파일을 0個 以上의 줄로 組織된 文字들을 包含하는 파일로 定義하고 있으며
[2]
여기에서 줄들은 0個 以上의 새줄이 아닌 文字들 및 普通 LF를 가리키는 宗團 새줄 文字로 이루어진다.
[3]
같이 보기
[
編輯
]
各州
[
編輯
]
外部 링크
[
編輯
]