JIS X 0213

出典: フリ?百科事典『ウィキペディア(Wikipedia)』
オイラ?? (JIS X 0208、JIS X 0212、JIS X 0213等の漢字集合)

JIS X 0213 は、 JIS X 0208 :1997を?張した 日本語 用の 符?化文字集合 を規定する 日本産業規格 (JIS) である。規格名?は「 7ビット及び8ビットの2バイト情報交換用符?化?張漢字集合 」である [1]

2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された [1] 。2000年に制定されたJIS X 0213:2000は通?「 JIS2000 」と呼ばれている。2004年に改正されたJIS X 0213:2004は通?「 JIS2004 」と呼ばれている。

JIS X 0208を?張した規格で、JIS X 0208が規定する6879字の ?形文字 の集合に?して、日本語の文字コ?ドで運用する必要性の高い4354字が追加され、計1万1233字の?形文字を規定する。JIS X 0208を?張する点において JIS X 0212 :1990と同目的であるが、JIS X 0212とJIS X 0213との間に 互換性 はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに?し、JIS X 0213はJIS X 0208を包含し更に第三?第四水準漢字などを加えた 上位集合 である。

特? [ 編集 ]

JIS X 0212 (補助漢字)が頻度調査を中心に追加文字を選定し、典?用例などは 諸橋大漢和 への?照情報を付加した程度だったのに?し、JIS X 0213ではJIS X 0208:1997 (JIS97) においてJIS X 0208の?載字?の用例?典?を徹底して調べ上げ、同定したのと同?の手法で一般に使われる字(?義の 字? 。以後「字」は?義の「字?」を指す)でJIS X 0208に??されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では??されていてもJIS X 0213では 包? 規準を使って特に?やさなかった字がある。

?張にあたっては、JIS X 0208の1997年改正で保留領域とされた部分に字を?やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。??では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一 とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が?更された。

第二面は第一面と同じく94?94点で構成されているが、そのうち文字の存在する符?領域は1, 3?5, 8, 12?15, 78?94?に限られる。この奇妙な配置は JIS X 0212 補助漢字の存在する場所を避けた結果である。これにより EUC エンコ?ドされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに?方を用いることも原理的には可能である(ただし、その規格は存在しない)。

しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、??各社によって外字領域として使用されていた部分であり、?態としては?に使われている領域であった。ここに新たに文字を配置した規格案に?し??各社側より意見があり、最終審査において各種符?化方式が「?考」(規格本?ではない)とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていた UNIX 系ソフトウェアでは??が比較的容易であり、複?の??が存在する。

JIS X 0208に?して追加された文字の?略 [ 編集 ]

文字の表記方法 [ 編集 ]

JIS X 0213ではJIS X 0208まで用いられていた「?点」に「 」を加え「面?点」となり、「面-?-点」でコ?ド表記を行う。例えば1面3?33点の「A」は「1-3-33」とあらわす。

符?化方式 [ 編集 ]

JISベ?スの文字コ?ド [ 編集 ]

符?化方式 は、 ISO/IEC 2022 にそった形のみ「規定」としてあり、 ISO-2022-JP-2004 Shift_JIS-2004 EUC-JIS-2004 は「?考」として記述がある。これらのコ?ド名は今のところ IANA が登?していないので、 MIME 等では "X-" で始まる私用の名?として用いる必要があることになる。 Shift_JIS-2004は、 macOS Java 7 などでは?に??しているが、Windowsでは??のシフトJIS( コ?ドペ?ジ932 )と互換性がないことを理由に??していないため、?く利用することができない。

Unicodeとの?? [ 編集 ]

JIS X 0213制定?時はいくつかの文字に??する Unicode 符?が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符?化にあたり注意点がある。

サロゲ?トペア [ 編集 ]

  • 漢字の? CJK互換漢字 領域に追加されたものを除くと 基本多言語面 (BMP) 外の CJK統合漢字?張B に追加されることとなった。該?する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、 UTF-8 では4バイト長コ?ドに、 UTF-16 では サロゲ?トペア(代用?) に??する必要がある。 UTF-32 に??している場合はそのまま使用可能である。
    • 例えば1面14?2点の点の付いた「 𠀋 」はU+2000Bに割り?てられた。

合成文字 [ 編集 ]

  • 非漢字の?半濁点付き?名、アクセント付き ?際音?記? で??のUnicodeに??の符?としてないもの、 ?調の上昇調、下降調を示す記? は二つのUnicode符?を組み合わせて表すこととなった。該?する文字は全部で25字ある。これらを OpenType で使用するには、オペレ?ティングシステムやアプリケ?ションが、OpenTypeのグリフ置換機能に??する必要がある(この場合グリフ置換のうち、複?の隣り合うグリフをある一つのグリフに置換する機能を使用)。
    • 例えば1面4?87点の 半濁点 付き「 か? 」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。
    • 1面11?69点の?調記?上昇調および1面11?70点?調記?下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記?のうち複?が隣り合うと、上下の?調?化を示す記?ができるというものである。
˩˥ (U+02E9 U+02E5)、 ˥˩ (U+02E5 U+02E9)

CJK互換漢字の正規化 [ 編集 ]

  • JIS X 0213とUnicodeでは 包? 規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字?)を?別するために、一部の文字をUnicodeでは CJK互換漢字 として??している。CJK互換漢字は、 Unicode正規化 によりCJK統合漢字に分解(?換)される。この??として互換漢字用の 異?字セレクタ (SVS)を使用して?換前の情報を維持する必要がある。また、CJK統合漢字と 字形選?子 英語版 の組み合わせを1文字として?理する必要もある。SVS??フォントとしては IPAexフォント 、モリサワのAP版書?などがある。
    • 例えば、 KS X 1001 由?のCJK互換漢字が誤って入力された場合に、入力エラ?とせずUnicode正規化?理で??する方式(CJK統合漢字のみに?換)を採用すると、CJK互換漢字に??されている人名用漢字が入力された場合に意?せず?換されてしまう。 [3] [4]
    • 例えば、 (U+FA19)をUnicode正規化すると (U+795E)となる。これをSVSを使って 神︀ (U+795E U+FE00)とすることで元のCJK互換漢字(の情報、字形)を維持する(SVSの ?値文字?照 に??しない??環境では表示が異なることに注意が必要 [3] )。

CJK互換漢字のIVS?? [ 編集 ]

  • CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と 字形選?子補助 英語版 の組み合わせ(IVS/IVD??)により異?字(Unicodeでは包?されるが、JIS X 0213として別の字?)を表現する場合、JIS X 0213の文字をこの組み合わせに?換する方法(複?あるため1つの方法を選んで?換)と、組み合わせを?理および表現(IVS??フォントの導入)する必要がある。 異?字セレクタ#?? も?照。
    • 例えば、IVSとして Adobe-Japan1 コレクションを使用すると (U+FA19)は 神󠄀 (U+795E U+E0100)となる。( 游書? ヒラギノ 花園フォント などのIVS??フォントが必要である)
    • 例えば、IVSとして文字情報基盤整備事業のMoji_Johoコレクションを使用すると (U+FA19)は 神󠄃 (U+795E U+E0103)となる。( IPAmj明朝 花園フォント などのIVS??フォントが必要である)

各OSでの???況 [ 編集 ]

なお、 Windows Vista 以降や macOS ではこれらに??している。 Windows XP ではサロゲ?トペア(代用?)に??しており、Service Pack 2以上を適用することによってグリフ置換にも??する。 Windows 2000 はサロゲ?トペアに??しているものの初期設定では無?化されておりレジストリの設定が必要である( Help:特殊文字#古代文字と人工文字 ?照)。またグリフ置換には未??である。

アプリケ?ション側の??も必要である。 Microsoft Office のXP以降のバ?ジョンやWindows Vistaに付?する Internet Explorer 7.0、Windows XP以降に付?するメモ帳やワ?ドパッドなどでは???みである。

ほかの??方法 [ 編集 ]

  • JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が??されていなかったため、 外字 領域に文字を定義して使用することが多く行われていた。いくつかの フリ? フォントではそのような??が行われている [※ 1]
  • 日本のデ?タ放送 などで使用される ARIB STD-B24 では、 ARIBの文字符?化方法 の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符?化方式の中には「?際符?化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」で全てを表現できるようにJIS X 0213での「 追加漢字面 」の文字を「 基本多言語面 」の 外字 領域にマッピングしなおした文字セットが別に使用可能とされている。
  • JAVA 7では通常のShift_JIS-2004形式の??(x-SJIS_0213)のほかShift_JIS-2004に Microsoftコ?ドペ?ジ932 を上書きした符?化方式(x-MS932_0213)に??している。

先行??との互換性 [ 編集 ]

JIS X 0213の第1面13?には NEC特殊文字 が、一部を除き同じ面?点番?で登?されている。NEC特殊文字は PC-9801 やWindowsで幅?く使われていたにもかかわらず、 機種依存文字 であった。

JIS X 0213:2004の改正 [ 編集 ]

表1: JIS X 0213:2004 により?更された文字
?更のあった文字
逢芦飴溢茨?淫迂??餌?迦牙廻恢晦 葛?釜翰翫徽
祇汲灸?卿饗僅?櫛屑?祁隙倦捲牽鍵諺巷梗 鵠甑叉
?薩鯖?鮫餐杓灼酋楯薯藷哨?杖蝕訊逗摺撰煎煽穿箭
詮?遡?遜腿??樽歎註??槌鎚?挺鄭擢溺兎堵屠賭
瀞遁謎灘楢?牌這秤駁箸叛挽誹?稗逼謬豹廟瀕斧蔽瞥
蔑篇娩鞭?蓬??儲??爺?愈猷漣煉簾?
??咬嘲
?徘扁 橙狡 甦疼 ? ?筵?腱?芒虔蜃蠅訝 ?騙鴉
字?の?更前後の比較( GIFアニメ
JIS X 0213の字体の変更前後の比較

例示字形の?更 [ 編集 ]

JIS X 0213:2004は、JIS X 0213:2000の例示字形を?更している。?更があったのは表1の通りである。

全部で168字あり、おおむね、 ?張新字? から、いわゆる 康熙字典? 型へ?更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「?」を離した)や「?」(出を小さくした)などのように 違いが分かりにくいもの もある。

この?更は、 ?語審議? の答申「 表外漢字字?表 」に示されている字?に合わせるものである。ただし、文字コ?ド規格とは文字の符?化表現を定めるものであり、例示字形は何ら規範的な役割を持たないことを謳っていながら、こうした?更を行うことに?して批判的な意見が公開レビュ?などで寄せられた。

追加された10文字 [ 編集 ]

表2: JIS X 0213:2004 で追加された文字
追加された10文字
俱剝𠮟?噓姸屛幷瘦繫
??の文字
??叱呑??????

第3水準に追加された10字は表2の通りである。Unicodeで別の符?が?えられていたために追加されたものである。これらは表の下に示した??の文字に?する異?字である。

フォントの?? [ 編集 ]

上記??によりほぼ全てのOSにおいてJIS X 0213:2004の字形が標準で使用可能となった。

JIS X 0213:2004では、JIS X 0213:2004で規定されている全ての文字種が含まれていて、各文字がJIS X 0213:2004での包?基準に?っており、JIS X 0213:2004で規定されているそれぞれの文字の?別がつけることができる(たとえばJIS X 0213:2004での異?字?係となる「神(片?名の「ネ」の字形に似た 示偏 )」と「 (漢字の「示」の字形の示偏)」が違う字形となっている)ことが求められているだけであり、例示字形と完全に同一の字形であることが求められているわけではないので、JIS X 0213:2004の包?基準範??で自由に字形を選?してもJIS X 0213:2004に?った字形(たとえば「?」が二点之繞でなくてもJIS X 0213に?った字形)ということができる。ただし、一般的にJIS X 0213:2004に?った字形のフォントとして??されているフォントは、二点之繞や食偏なども含めてJIS X 0213:2004の例示字形に沿った字形を選?しているフォントがほとんどである。

JIS X 0213:2012の改正 [ 編集 ]

2010年 (平成22年) 11月30日 常用漢字表 改定に??して、引用例の?更、附?書12の追加がなされた [1]

注? [ 編集 ]

  1. ^ [新漢字則 (JIS X 0213:2004)] にあるイオが作成した「Windows 9x/NT を JIS X 0213 ??にするパッチ」はそのような??が行われている例である。
  2. ^ メイリオ 」、「 MS ゴシック 3書?(MS ゴシック、MS Pゴシック、MS UI Gothic)」および「 MS 明朝 2書?(MS 明朝、MS P明朝)」がJIS X 0213:2004??フォントである。
  3. ^ 2007年10月に公開したIPAフォントVer.2からJIS X0213:2004に準?した。詳細は IPA フォント新シリ?ズの公開 ( PDF ) (2010年3月7日時点の ア?カイブ )を?照。

出典 [ 編集 ]

?考文? [ 編集 ]

  • 『JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符?化?張漢字集合』日本規格協?、東京、2000年1月。   (2000年1月20日制定)
  • 芝野耕司 「JIS X 0213(7ビット及び8ビットの2バイト情報交換用符?化?張漢字集合)の制定」『標準化ジャ?ナル』第30?第3?、日本規格協?、東京、2000年3月、pp.3-7。  
  • 安岡孝一 安岡素子 「JIS X 0212とJIS X 0213」『京都大?大型計算機センタ??究セミナ?報告』第64回、京都大?大型計算機センタ?、京都、2000年3月、pp.19-46。   2000年 3月24日
  • 安岡孝一「JIS X 0213の符?化表現」『人文?と情報?理』第26?、勉誠出版、東京、2000年4月、pp.9-17。  
  • 芳賀進 「JIS符?化文字集合の現在??非漢字(記?類)について」『人文?と情報?理』第26?、勉誠出版、東京、2000年4月、pp.18-22。  
  • 芝野耕司(編著)『?補改訂 JIS漢字字典』日本規格協?、2002年5月。 ISBN   4-542-20129-5  
  • 『JIS X 0213:2004 7ビット及び8ビットの2バイト情報交換用符?化?張漢字集合(追補1)』日本規格協?、東京、2004年2月。   2004年 2月20日 改正)
  • 佐藤敬幸 「JIS X 0213(7ビット及び8ビットの2バイト情報交換用符?化?張漢字集合)の改正について」『標準化ジャ?ナル』第34?第4?、日本規格協?、東京、2004年4月、pp.8-12。  
  • 「人名用漢字の文字符?に?する規格?討?報告」『標準化ジャ?ナル』第34?第11?、日本規格協?、東京、2004年11月、pp.10-11。  

?連項目 [ 編集 ]

外部リンク [ 編集 ]