MPEG-4 ALS
(
MPEG-4 Audio Lossless Coding
) は
MPEG-4
オ?ディオ (MPEG-4 Part 3) の一部として規格化された
ロスレス?縮
方式で、スタジオ編集などでも使える高音質のマルチチャネルオ?ディオ信?を扱うことができる。
MPEG-4 ALSは、インタ?ネットでの音?配信、携?ミュ?ジックプレ?ヤ、音?ア?カイブシステムやスタジオ編集などさまざまな用途への?用が考えられており、
FFmpeg
などさまざまなソフトウェアでサポ?トされている
[1]
。
?要
[
編集
]
MPEG-4 ALSは
MPEG-4
オ?ディオで定義された
ロスレス
オ?ディオ符?化ツ?ル (
lossless audio coding tools
) の1つで、
MP3
や
AAC
、
Vorbis
などの
非可逆?縮
方式と異なり、オリジナルのオ?ディオ信?をそのまま復元することができる。MPEG-4 ALSの規格は
MPEG-4
オ?ディオ (MPEG-4 Part 3) の一部として
ISO
/
IEC
14496-3 Subpart 11で定義されている
[2]
[3]
。
MPEG-4 ALSは、スタジオ編集にも使用できる量子化ビット?32ビット長の
PCM
信?を扱うことができ、
CD
より高い
サンプリング周波?
にも??できる。また、5.1チャネル?7.2チャネル?22.2チャネル
サラウンド
を含むマルチチャネルのオ?ディオ入力を扱うことができる。
?縮率は同じ
ロスレス?縮
を行う
FLAC
より優れており
[4]
、また
Monkey's Audio
や
OptimFROG
と比べると同じ?縮率での?理時間が短い
[5]
。
MPEG-4 ALSのアルゴリズムは
FLAC
や
Direct Stream Transfer
など他の
ロスレス?縮
と同?、
線形予測
と
エントロピ?符?化
を組み合わせたものである。
MPEG-4 ALSの特?は以下の通りで
[5]
、柔軟性が高い。
- 量子化ビット?32ビットまでの
PCM
に??、
IEEE 754
32ビット浮動小?点形式も使用可
- 任意の
サンプリング周波?
(192 kHzで試??、384 kHz以上の高サンプリング周波?にも??可能)
- マルチチャネル/マルチトラック??、扱えるチャネル?は最大65536チャネル
- 再生時のランダムアクセスが可能
- MP4
ファイルフォ?マットを使い映像デ?タとの組み合わせが可能
- ??可能な入力フォ?マットはRaw、
WAV
、
AIFF
、
BWF
、Sony Wave64、BWF with RF64など
MPEG-4オ?ディオでの位置づけ
[
編集
]
MPEG-4
オ?ディオは多くのツ?ルの組み合わせからなり、MPEG-4 ALSはオ?ディオ符?化ツ?ル (
audio coding tools
) の1つである
ロスレス
オ?ディオ符?化ツ?ル (
lossless audio coding tools
) に分類される
[3]
。
同じカテゴリのツ?ルとして、
ス?パ?オ?ディオCD
での
ロスレス?縮
方式として使われている
MPEG-4 DST
(
direct stream transfer
) や、
MPEG-4 AAC
などの汎用オ?ディオ符?化ツ?ル (
general audio coding tools
) と組み合わせて使う
MPEG-4 SLS
(
scalable lossless coding
) がある
[3]
。それぞれは符?化方式が異なる。
アルゴリズム
[
編集
]
MPEG-4 ALSの符?化?理は、フレ?ム/ブロック分割、短期予測(
線形予測
)、長期予測、マルチチャネル符?化、
エントロピ?符?化
の5つの?理からなる
[4]
[6]
。
線形予測
や長期予測により情報の?縮を行う考え方は、
CELP
など
音?符?化
での基本的な考え方と?わらない。多くの
ロスレス?縮
では、何らかの形で予測可能な成分は少?の予測係?として表現し、予測できなかった?差部分を
エントロピ?符?化
を使って?率よく符?化することで、元の信?が持つ情報を維持しながらデ?タの?縮を行う。MPEG-4 ALSも同?の考え方にもとづく。
フレ?ム/ブロック分割
[
編集
]
フレ?ム分割では入力信?を基本的な?理?位であるフレ?ムに分割する。1フレ?ムのサンプル?は
サンプリング周波?
により異なり、48 kHzでは2048サンプル、96 kHzでは4096サンプルで、おおよそ43 msの長さになる。オプションとして、?化の激しい信?を?率よく符?化するため、入力信?の?容に?じて1フレ?ムを複?のブロックに分けることもできる。
線形予測
[
編集
]
?く短期予測では
線形予測
フィルタ?を用い、線形予測の?差信?を求める。フレ?ム?の各サンプル間には
相?
があるため過去のサンプル値からある程度予測ができる。
線形予測
はそのような信?を?率的に表現するための手法で、予測可能な成分を少?の
線形予測
係?で表現する。予測しきれなかった?差成分のみを別に符?化することで、情報の?縮を行う。
線形予測係?はより
量子化
特性にすぐれたPARCOR係?(
偏自己相?係?
)に?換された後に量子化と符?化が行われる。
MPEG-4 ALSでの線形予測の次?は0(予測しない)から1023までで、入力信?の性質に?じて適?的に?化する
[6]
。
長期予測
[
編集
]
多くの音?には、?器などの基本周波?(ピッチ周波?)によって決まる繰り返し成分や
ハ?モニック
成分が含まれている。長期予測 (Long-Term Prediction) を追加し、短期予測の?差成分に?るこのような繰り返し成分を係?化することで?差成分の振幅を減少させ、情報の?縮を行うことができる。
長期予測の係?としては元の信?に?する複?の?延時間と重み係?の組み合わせが使われる。?差について、過去のサンプル値から現在のサンプル値を最もよく近似できる?延時間と重み係?の組み合わせが計算され、係?を
ゴロム?ライス符?
で符?化する。
マルチチャネル符?化
[
編集
]
MPEG-4 ALSはマルチチャネルの信?を扱うことができ、チャネル間の
相?
を利用してさらに?縮率の向上を行うことができる。
まず最初にチャネル間で最も相?の高い組合せ(親子?係)を探索する。?いて親チャネルの?差信?に?して、長期予測と同?の方法で複?の?延時間と重み係?の組み合わせによる予測係?を求め、
ゴロム?ライス符?
で符?化する。
エントロピ?符?化
[
編集
]
入力信?からさまざまな予測成分を取り除いた?差成分に?し
エントロピ?符?化
を行う。
符?化方式として、比較的演算量が少ない
ライス符?
と、より複?だが?縮?率が高いBGMC(Block Gilbert-Moore Code、ブロック ギルバ?ト?ム?ア符?)と呼ばれる方法のいずれかを選ぶことができる。
これらの符?は小さい振幅値に短いコ?ドを割り?てるため、それまでのさまざまな予測により振幅が小さくなった?差信?を?率的に?縮できる
[6]
。
復?
[
編集
]
復?はこれらの?理を逆に行う。
エントロピ?符?化
結果から?差信?を復元し、マルチチャネル符?化の各係?、長期予測の係?、線形予測係?により計算した予測成分を使って新しい?差成分を順次計算していくことで、1フレ?ム分の最終的なサンプル値を計算する。
符?化時の予測計算の方法と復?時の予測計算方法が同じであれば、符?化時の入力信?とまったく同じ信?を復?することができる。
その他の?理
[
編集
]
MPEG-4 ALSはプロの
ミキシング
などに用いられる
IEEE 754
32ビット浮動小?点形式の入力信?が扱える。浮動小?点形式で表現された信?は見た目のサンプル値が
無相?
になり?縮がうまく行えず
[6]
、また
丸め誤差
の扱いの違いにより入力信?と同じ信?を復?できない可能性があり、整?入力の場合と異なる手法が用いられる。
入力信?を整?部分と余りの誤差部分に分割し、整?部分については??と同じ方法で符?化を行い、余りの部分は
?書式?縮
の一種の
Lempel-Ziv法
を修正したマスクLempel-Ziv符?化と呼ばれる方法で?縮する。
ソフトウェア
[
編集
]
MPEG-4 ALSのリファレンス??は
ベルリン工科大?
のMPEG-4 ALSのウェブペ?ジ
[1]
で入手できる。また、
ISO
/
IEC
14496-5:2001/Amd.10:2007でも定義されている
[7]
[8]
。
MPEG-4 ALSをサポ?トしている代表的ソフトウェアとして、以下のものがある
[1]
。
?史
[
編集
]
2002年6月から始まった
Moving Picture Experts Group
による
ロスレス
オ?ディオ符?化方式の提案要求に?し
[9]
[10]
、2002年12月に
ベルリン工科大?
(ドイツ)、
NTT
(日本)、リアルネットワ?クス社(アメリカ)、インフォコム?究所(シンガポ?ル)、
フラウンホ?ファ?
IIS(ドイツ)、
マイクロソフト
(アメリカ)、
サムスン電子
(韓?)の7社から基本要求を?たすコ?デックの提案があり、?縮?率、必要な演算量、柔軟性についての評?が行われた。提案には
可逆?縮
のみを行う方式(その後のMPEG-4 ALS)と、非可逆/可逆?縮のハイブリッド方式(その後の
MPEG-4 SLS
)とが含まれていた。
Moving Picture Experts Group
は?方の方式をサポ?トすることを決定し、2003年6月に可逆?縮のみを行う方式として?縮?率が優れていた
ベルリン工科大?
の提案をリファレンスモデルとして採用した
[4]
。これをベ?スとし、
ベルリン工科大?
、
NTT
、リアルネットワ?クス社、インフォコム?究所が協力して
[6]
?縮性能や柔軟性の向上と演算量の低減を行い、現在のMPEG-4 ALSの最終案を2005年12月にまとめ、最初の規格
ISO
/
IEC
14496-3:2005/Amd 2:2006が2006年3月に出版された
[11]
。
脚注
[
編集
]
- ^
a
b
c
Communication Systems Group (2010年6月22日). “
MPEG-4 Audio Lossless Coding (ALS)
”. Technische Universitat Berlin.
2010年8月26日
??。
- ^
ISO
/
IEC
(2009年). “
ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio
”. ISO.
2010年8月15日
??。
- ^
a
b
c
ISO
/
IEC
(2009) (PDF),
ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio
, ISO
,
http://webstore.iec.ch/preview/info_isoiec14496-3%7Bed4.0%7Den.pdf
2010年8月15日
??。
- ^
a
b
c
T. Liebchen, T. Moriya, N. Harada, Y. Kamamoto, Y. Reznik. (2005年8月). “
The MPEG-4 Audio Lossless Coding (ALS) Standard - Technology and Applications
” (PDF). Technical Universifty of Berlin.
2010年8月26日
??。
- ^
a
b
原田 登, 守谷 健弘, 鎌本 優 (2008年2月). “
MPEG-4 ALSの性能??用と?連する標準化活動
” (PDF).
NTT
.
2010年8月26日
??。
- ^
a
b
c
d
e
鎌本 優, 守谷 健弘, 原田 登, Csaba Kos (2008年2月). “
ロスレス?オ?ディオ符?化MPEG-4 ALSの高性能化
” (PDF).
NTT
.
2010年8月26日
??。
- ^
ISO
/
IEC
(2007) (ZIP),
ISO/IEC 14496-5:2001/Amd.10:2007 - Information technology -- Coding of audio-visual objects -- Part 5: Reference software -- Amendment 10: SSC, DST, ALS and SLS reference software
, ISO
,
http://standards.iso.org/ittf/PubliclyAvailableStandards/c043465_ISO_IEC_14496-5_2001_Amd_10_2007_Reference_Software.zip
2010年8月15日
??。
- ^
ISO
/
IEC
(2007),
ISO/IEC 14496-5:2001/Amd.10:2007 - SSC, DST, ALS and SLS reference software
, ISO
,
http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=43465
2010年8月15日
??。
- ^
ISO
/
IEC
JTC1/SC29/WG11 (
MPEG
),
Call for Proposals on MPEG-4 Lossless Audio Coding,
N5040, Klagenfurt, Austria, July 2002.
- ^
ISO
/
IEC
JTC1/SC29/WG11 (
MPEG
),
Final Call for Proposals on MPEG-4 Lossless Audio Coding,
N5208, Shanghai, China, October 2002.
- ^
ISO
(2006年). “
Audio Lossless Coding (ALS), new audio profiles and BSAC extensions - ISO/IEC 14496-3:2005/Amd 2:2006
”. ISO.
2010年8月15日
??。
?考文?
[
編集
]
- Andreas Spanias, Ted Painter, Venkatraman Atti (ed).
Audio signal processing and coding
. Wiley-Interscience, John Wiley & Sons, Inc., 2006.
ISBN 978-0471791478
.
- ISO/IEC.
Information technology ? Coding of audio-visual objects ? Part 3:Audio
. ISO/IEC 14496-3:2009, Fourth edition, 2009.
?連項目
[
編集
]
外部リンク
[
編集
]