한국   대만   중국   일본 
MPEG-4 ALS - Wikipedia コンテンツにスキップ

MPEG-4 ALS

出典: フリ?百科事典『ウィキペディア(Wikipedia)』
Audio Lossless Coding
開?者 ISO
種別 オ?ディオコ?デック 音?ファイルフォ?マット
包含先 MP4
?際標準 ISO/IEC 14496-3

MPEG-4 ALS ( MPEG-4 Audio Lossless Coding ) は MPEG-4 オ?ディオ (MPEG-4 Part 3) の一部として規格化された ロスレス?縮 方式で、スタジオ編集などでも使える高音質のマルチチャネルオ?ディオ信?を扱うことができる。

MPEG-4 ALSは、インタ?ネットでの音?配信、携?ミュ?ジックプレ?ヤ、音?ア?カイブシステムやスタジオ編集などさまざまな用途への?用が考えられており、 FFmpeg などさまざまなソフトウェアでサポ?トされている [1]

?要 [ 編集 ]

MPEG-4 ALSは MPEG-4 オ?ディオで定義された ロスレス オ?ディオ符?化ツ?ル ( lossless audio coding tools ) の1つで、 MP3 AAC Vorbis などの 非可逆?縮 方式と異なり、オリジナルのオ?ディオ信?をそのまま復元することができる。MPEG-4 ALSの規格は MPEG-4 オ?ディオ (MPEG-4 Part 3) の一部として ISO / IEC 14496-3 Subpart 11で定義されている [2] [3]

MPEG-4 ALSは、スタジオ編集にも使用できる量子化ビット?32ビット長の PCM 信?を扱うことができ、 CD より高い サンプリング周波? にも??できる。また、5.1チャネル?7.2チャネル?22.2チャネル サラウンド を含むマルチチャネルのオ?ディオ入力を扱うことができる。

?縮率は同じ ロスレス?縮 を行う FLAC より優れており [4] 、また Monkey's Audio OptimFROG と比べると同じ?縮率での?理時間が短い [5]

MPEG-4 ALSのアルゴリズムは FLAC Direct Stream Transfer など他の ロスレス?縮 と同?、 線形予測 エントロピ?符?化 を組み合わせたものである。

MPEG-4 ALSの特?は以下の通りで [5] 、柔軟性が高い。

  • 量子化ビット?32ビットまでの PCM に??、 IEEE 754 32ビット浮動小?点形式も使用可
  • 任意の サンプリング周波? (192 kHzで試??、384 kHz以上の高サンプリング周波?にも??可能)
  • マルチチャネル/マルチトラック??、扱えるチャネル?は最大65536チャネル
  • 再生時のランダムアクセスが可能
  • MP4 ファイルフォ?マットを使い映像デ?タとの組み合わせが可能
  • ??可能な入力フォ?マットはRaw、 WAV AIFF BWF 、Sony Wave64、BWF with RF64など

MPEG-4オ?ディオでの位置づけ [ 編集 ]

MPEG-4 オ?ディオは多くのツ?ルの組み合わせからなり、MPEG-4 ALSはオ?ディオ符?化ツ?ル ( audio coding tools ) の1つである ロスレス オ?ディオ符?化ツ?ル ( lossless audio coding tools ) に分類される [3]

同じカテゴリのツ?ルとして、 ス?パ?オ?ディオCD での ロスレス?縮 方式として使われている MPEG-4 DST ( direct stream transfer ) や、 MPEG-4 AAC などの汎用オ?ディオ符?化ツ?ル ( general audio coding tools ) と組み合わせて使う MPEG-4 SLS ( scalable lossless coding ) がある [3] 。それぞれは符?化方式が異なる。

アルゴリズム [ 編集 ]

MPEG-4 ALSの符?化?理は、フレ?ム/ブロック分割、短期予測( 線形予測 )、長期予測、マルチチャネル符?化、 エントロピ?符?化 の5つの?理からなる [4] [6]

線形予測 や長期予測により情報の?縮を行う考え方は、 CELP など 音?符?化 での基本的な考え方と?わらない。多くの ロスレス?縮 では、何らかの形で予測可能な成分は少?の予測係?として表現し、予測できなかった?差部分を エントロピ?符?化 を使って?率よく符?化することで、元の信?が持つ情報を維持しながらデ?タの?縮を行う。MPEG-4 ALSも同?の考え方にもとづく。

フレ?ム/ブロック分割 [ 編集 ]

フレ?ム分割では入力信?を基本的な?理?位であるフレ?ムに分割する。1フレ?ムのサンプル?は サンプリング周波? により異なり、48 kHzでは2048サンプル、96 kHzでは4096サンプルで、おおよそ43 msの長さになる。オプションとして、?化の激しい信?を?率よく符?化するため、入力信?の?容に?じて1フレ?ムを複?のブロックに分けることもできる。

線形予測 [ 編集 ]

?く短期予測では 線形予測 フィルタ?を用い、線形予測の?差信?を求める。フレ?ム?の各サンプル間には 相? があるため過去のサンプル値からある程度予測ができる。 線形予測 はそのような信?を?率的に表現するための手法で、予測可能な成分を少?の 線形予測 係?で表現する。予測しきれなかった?差成分のみを別に符?化することで、情報の?縮を行う。

線形予測係?はより 量子化 特性にすぐれたPARCOR係?( 偏自己相?係? )に?換された後に量子化と符?化が行われる。

MPEG-4 ALSでの線形予測の次?は0(予測しない)から1023までで、入力信?の性質に?じて適?的に?化する [6]

長期予測 [ 編集 ]

多くの音?には、?器などの基本周波?(ピッチ周波?)によって決まる繰り返し成分や ハ?モニック 成分が含まれている。長期予測 (Long-Term Prediction) を追加し、短期予測の?差成分に?るこのような繰り返し成分を係?化することで?差成分の振幅を減少させ、情報の?縮を行うことができる。

長期予測の係?としては元の信?に?する複?の?延時間と重み係?の組み合わせが使われる。?差について、過去のサンプル値から現在のサンプル値を最もよく近似できる?延時間と重み係?の組み合わせが計算され、係?を ゴロム?ライス符? で符?化する。

マルチチャネル符?化 [ 編集 ]

MPEG-4 ALSはマルチチャネルの信?を扱うことができ、チャネル間の 相? を利用してさらに?縮率の向上を行うことができる。

まず最初にチャネル間で最も相?の高い組合せ(親子?係)を探索する。?いて親チャネルの?差信?に?して、長期予測と同?の方法で複?の?延時間と重み係?の組み合わせによる予測係?を求め、 ゴロム?ライス符? で符?化する。

エントロピ?符?化 [ 編集 ]

入力信?からさまざまな予測成分を取り除いた?差成分に?し エントロピ?符?化 を行う。

符?化方式として、比較的演算量が少ない ライス符? と、より複?だが?縮?率が高いBGMC(Block Gilbert-Moore Code、ブロック ギルバ?ト?ム?ア符?)と呼ばれる方法のいずれかを選ぶことができる。

これらの符?は小さい振幅値に短いコ?ドを割り?てるため、それまでのさまざまな予測により振幅が小さくなった?差信?を?率的に?縮できる [6]

復? [ 編集 ]

復?はこれらの?理を逆に行う。 エントロピ?符?化 結果から?差信?を復元し、マルチチャネル符?化の各係?、長期予測の係?、線形予測係?により計算した予測成分を使って新しい?差成分を順次計算していくことで、1フレ?ム分の最終的なサンプル値を計算する。

符?化時の予測計算の方法と復?時の予測計算方法が同じであれば、符?化時の入力信?とまったく同じ信?を復?することができる。

その他の?理 [ 編集 ]

MPEG-4 ALSはプロの ミキシング などに用いられる IEEE 754 32ビット浮動小?点形式の入力信?が扱える。浮動小?点形式で表現された信?は見た目のサンプル値が 無相? になり?縮がうまく行えず [6] 、また 丸め誤差 の扱いの違いにより入力信?と同じ信?を復?できない可能性があり、整?入力の場合と異なる手法が用いられる。

入力信?を整?部分と余りの誤差部分に分割し、整?部分については??と同じ方法で符?化を行い、余りの部分は ?書式?縮 の一種の Lempel-Ziv法 を修正したマスクLempel-Ziv符?化と呼ばれる方法で?縮する。

ソフトウェア [ 編集 ]

MPEG-4 ALSのリファレンス??は ベルリン工科大? のMPEG-4 ALSのウェブペ?ジ [1] で入手できる。また、 ISO / IEC 14496-5:2001/Amd.10:2007でも定義されている [7] [8]

MPEG-4 ALSをサポ?トしている代表的ソフトウェアとして、以下のものがある [1]

?史 [ 編集 ]

2002年6月から始まった Moving Picture Experts Group による ロスレス オ?ディオ符?化方式の提案要求に?し [9] [10] 、2002年12月に ベルリン工科大? (ドイツ)、 NTT (日本)、リアルネットワ?クス社(アメリカ)、インフォコム?究所(シンガポ?ル)、 フラウンホ?ファ? IIS(ドイツ)、 マイクロソフト (アメリカ)、 サムスン電子 (韓?)の7社から基本要求を?たすコ?デックの提案があり、?縮?率、必要な演算量、柔軟性についての評?が行われた。提案には 可逆?縮 のみを行う方式(その後のMPEG-4 ALS)と、非可逆/可逆?縮のハイブリッド方式(その後の MPEG-4 SLS )とが含まれていた。

Moving Picture Experts Group は?方の方式をサポ?トすることを決定し、2003年6月に可逆?縮のみを行う方式として?縮?率が優れていた ベルリン工科大? の提案をリファレンスモデルとして採用した [4] 。これをベ?スとし、 ベルリン工科大? NTT 、リアルネットワ?クス社、インフォコム?究所が協力して [6] ?縮性能や柔軟性の向上と演算量の低減を行い、現在のMPEG-4 ALSの最終案を2005年12月にまとめ、最初の規格 ISO / IEC 14496-3:2005/Amd 2:2006が2006年3月に出版された [11]

脚注 [ 編集 ]

  1. ^ a b c Communication Systems Group (2010年6月22日). “ MPEG-4 Audio Lossless Coding (ALS) ”. Technische Universitat Berlin. 2010年8月26日 ??。
  2. ^ ISO / IEC (2009年). “ ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio ”. ISO. 2010年8月15日 ??。
  3. ^ a b c ISO / IEC (2009) (PDF), ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio , ISO , http://webstore.iec.ch/preview/info_isoiec14496-3%7Bed4.0%7Den.pdf 2010年8月15日 ??。  
  4. ^ a b c T. Liebchen, T. Moriya, N. Harada, Y. Kamamoto, Y. Reznik. (2005年8月). “ The MPEG-4 Audio Lossless Coding (ALS) Standard - Technology and Applications ” (PDF). Technical Universifty of Berlin. 2010年8月26日 ??。
  5. ^ a b 原田 登, 守谷 健弘, 鎌本 優 (2008年2月). “ MPEG-4 ALSの性能??用と?連する標準化活動 ” (PDF). NTT . 2010年8月26日 ??。
  6. ^ a b c d e 鎌本 優, 守谷 健弘, 原田 登, Csaba Kos (2008年2月). “ ロスレス?オ?ディオ符?化MPEG-4 ALSの高性能化 ” (PDF). NTT . 2010年8月26日 ??。
  7. ^ ISO / IEC (2007) (ZIP), ISO/IEC 14496-5:2001/Amd.10:2007 - Information technology -- Coding of audio-visual objects -- Part 5: Reference software -- Amendment 10: SSC, DST, ALS and SLS reference software , ISO , http://standards.iso.org/ittf/PubliclyAvailableStandards/c043465_ISO_IEC_14496-5_2001_Amd_10_2007_Reference_Software.zip 2010年8月15日 ??。  
  8. ^ ISO / IEC (2007), ISO/IEC 14496-5:2001/Amd.10:2007 - SSC, DST, ALS and SLS reference software , ISO , http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=43465 2010年8月15日 ??。  
  9. ^ ISO / IEC JTC1/SC29/WG11 ( MPEG ), Call for Proposals on MPEG-4 Lossless Audio Coding, N5040, Klagenfurt, Austria, July 2002.
  10. ^ ISO / IEC JTC1/SC29/WG11 ( MPEG ), Final Call for Proposals on MPEG-4 Lossless Audio Coding, N5208, Shanghai, China, October 2002.
  11. ^ ISO (2006年). “ Audio Lossless Coding (ALS), new audio profiles and BSAC extensions - ISO/IEC 14496-3:2005/Amd 2:2006 ”. ISO. 2010年8月15日 ??。

?考文? [ 編集 ]

  • Andreas Spanias, Ted Painter, Venkatraman Atti (ed). Audio signal processing and coding . Wiley-Interscience, John Wiley & Sons, Inc., 2006. ISBN 978-0471791478 .
  • ISO/IEC. Information technology ? Coding of audio-visual objects ? Part 3:Audio . ISO/IEC 14496-3:2009, Fourth edition, 2009.

?連項目 [ 編集 ]

外部リンク [ 編集 ]