ISO/IEC 8859
는 컴퓨터에서 8비트로 文字를 나타내기 위한
ISO
와
IEC
의 共同 標準이다. ISO/IEC 8859-1, ISO/IEC 8859-2 等의 細部 標準이 提案되어 있다.
ISO/IEC 8859 파트 1, 2, 3, 4는 元來
Ecma 인터내셔널
標準
ECMA-94
이었다.
紹介
[
編輯
]
ASCII
에 包含된 95者의 印刷 領域은 현대
英語
로 情報를 表現하는 데 充分하다. 하지만
로마 文字
를 쓰는 다른 言語에는 ASCII로 處理할 수 없는 追加的인 記號를 包含하고 있다. 例를 들면
ß
(
獨逸語
),
n
(
에스파냐語
),
a
(
스웨덴語
와 北유럽 言語) 等이다. ISO 8859는 8비트로 構成된
바이트
의 8番째 비트를 利用하여 128者의 追加的인 文字를 割當하여 이 問題를 處理하기 위해 提案되었다. 하지만 한 種類의 文字 集合만으로는 必要로 하는 모든 文字를 處理할 수 없어 여러 가지 매핑이 開發되었다.
ISO 8859-
n
符號化는 印刷 可能한 文字만을 包含한다. 文字가 對應되지 않은 곳은
制御 文字
로 活用된다.
IANA
는
ISO/IEC 646
에 定義된 C0 領域(0-31)과
ISO 6429
에 定義된 C1 領域(127-159)을 制御 文字로 使用한다. 이 文字 集合 이름은
MIME
이름으로도 活用된다.
構成
[
編輯
]
ISO/IEC 8859는 다음 文字 集合으로 이루어져 있다.
- ISO/IEC 8859-1
-
- 라틴-1
西유럽
- 가장 널리 쓰이며 大部分의 西유럽 言語를 支援한다.
네덜란드語
(一部
[* 1]
),
노르웨이語
,
덴마크語
,
獨逸語
,
로만슈어
,
스웨덴語
스코틀랜드 게일어
,
아이슬란드語
,
아일랜드語
,
에스파냐語
,
英語
,
이탈리아語
,
페로어
,
포르투갈語
,
프랑스語
(一部
[* 2]
),
핀란드어
(一部
[* 2]
), 東유럽의
알바니아語
, 아프라카의
스와힐리어
,
아프리칸스語
.
유로
記號(€)와 大文字 "?"는 改訂版人 ISO 8859-15에 追加되었다. IANA의 文字 集合 ISO-8859-1에 對應하며,
HTML
文書의 基本 인코딩이다.
- ISO/IEC 8859-2
-
- ISO/IEC 8859-3
-
- ISO/IEC 8859-4
-
- ISO/IEC 8859-5
-
- ISO/IEC 8859-6
-
- 라틴/아랍
- 아랍語
를 支援한다.
아랍 文字
를 쓰는 다른 言語는 支援하지 않는다. 表示를 위해서는 兩方向 文字와 文字 結合을 處理해줘야 한다.
- ISO/IEC 8859-7
-
- 라틴/그리스
- 現代
그리스어
를 支援한다. 文字 改革 以前의 古典 그리스어(polytonic orthography)는 유니코드에서 支援한다.
- ISO/IEC 8859-8
-
- 라틴/히브리
- 이스라엘에서 쓰이는 現代
히브리어
를 支援한다. 左에서 右, 또는 右에서 座 두가지 方向의 인코딩이 모두 存在한다.
- ISO/IEC 8859-9
-
- 라틴-5
터키
- ISO 8859-1와 거의 비슷하다. 거의 쓰이지 않는
아이슬란드語
文字 代身
튀르키예어
文字를 追加했다.
쿠르드語
表記에도 使用된다.
- ISO/IEC 8859-10
-
- 라틴-6
노르딕
- 라틴-4의 文字를 再配列했다. 노르딕 言語의 表記에 더 적합하다. 발트 言語에게는 라틴-4街 더 便利하다.
- ISO/IEC 8859-11
-
ISO/IEC 8859-12
-
- ISO/IEC 8859-13
-
- 라틴-7
발트 海 沿岸
- 라틴-4와 라틴-6에 빠진 발트 言語의 文字를 追加했다.
- ISO/IEC 8859-14
-
- ISO/IEC 8859-15
-
- 라틴-9
- 8859-1에서 쓰이지 않는 記號를 除去하고,
유로
記號
€
와
?
,
?
,
?
,
?
,
Œ
,
œ
,
?
文字를 追加했다.
프랑스語
,
핀란드어
,
에스토니아語
를 完全하게 支援한다.
- ISO/IEC 8859-16
-
- 라틴-10
南東유럽
- 루마니아語
,
슬로베니아語
,
알바니아語
,
이탈리아語
,
크로아티아어
,
폴란드語
,
헝가리語
를 비롯
獨逸語
,
아일랜드語
(新綴字法),
프랑스語
,
핀란드어
를 支援한다. 記號보다는 文字에 焦點이 맞춰져 있으며, 여러 通話 畿湖가 빠지고
유로
記號가 追加되었다.
- ↑
네덜란드語에서 쓰이는
IJ:*IJ/ij
文字가 빠졌으며, 로마 文字 IJ로 使用된다.
- ↑
가
나
빠진 글字는 ISO 8859-15에 追加되었다.
- ↑
1991年 우크라이나語에 再導入된 ?/? 文字가 빠져있다.
- 0xA0位置에는
NBSP
(non breaking space) 文字가, 0xAD에는 大槪
소프트 하이픈
(soft hyphen) 文字가 놓여있다. 다른 빈 자리는
割當되지 않은 領域
이거나 現在 使用者 시스템이 標示할 수 없는 글字이다.
- ISO/IEC 8859-7:2003과 ISO/IEC 8859-8:1999에서
새로 追加된 領域
이 있다. LRM은 左에서 郵票視(U+200E), RLM은 右에서 座 標示(U+200F)에 對應한다.
|
---|
|
1
~
9999
| |
---|
10000
~
19999
| |
---|
20000+
| |
---|
|