한국   대만   중국   일본 
?据?? - ?基百科,自由的百科全?

?据??

使用比原始表示更少的位來編碼信息的過程
(重定向自 資料壓縮

?算机科? 信息? 中, ?据?? 或者 源?? 是按照特定的??机制用比未???少的?据 位元 (或者其?信息相?的?位)表示信息的?程。例如,若?「compression」???「comp」,??篇文章可以用?少的?据 位元 表示。常見的例子是 ZIP文件格式 ,此格式不??提供??功能,?可作? ??工具 (Archiver),能???多文件存?到同一?文件中。

可利用資料的一致性(可用 信息? ,entropy來表示),規則性,與可預測性去實現資料壓縮。人類最先發展的壓縮技術實? 自然語言 ,一般來說,若可以用比較精簡的 自然語言 來描述一樣事物,那?也就越能?對這樣事物做壓縮。資料越一致,亦代表其統計特性越集中。以影像壓縮?例,其集中代表有 傅立葉變換 時域 頻域 直方圖 特徵?

?要 ??

?据??能???是因?多???世界的?据都有 ??冗余 。例如,字母「e」在英?中比字母「z」更加常用,字母「q」后面是「z」的可能性非常小。 非破壞性資料壓縮 通常利用了??冗余,??就能更加??地、但仍然是完整地表示?送方的?据。

非破壞性資料壓縮的壓縮率不足以處理龐大體積的音視頻數據,但如果允?一定程度的 保?度 ?失,那??可以???一步的??。例如,人?看??或者???面的?候可能?不?注意到一些???不完善。同?,??音??音采?序列可能?起?一?,但??上?不完全一?。 破壞性資料壓縮 在可以接受或無法察覺的情況下使用?少的位?表示?像、??或者音?。

然而,?常有一些文件不能被破壞性資料壓縮??,??上?于不含可以辨??式的?据任何??算法都不能??。?外,????已?????的?据通常得到的?果??上是增加?据。

??上,破壞性資料壓縮也?最??到不能工作的地步。例如一個?端的例子:??算法每次去掉文件最后一?字?,那?????算法不?的??直至文件?空,??算法?不能??工作。

由于可以?助?少如 硬? 空???接 ?? ??的???源的消耗,所以??非常重要,然而??需要消耗信息?理?源,?也可能是?用??的。所以?据??机制的??需要在??能力、失?度、所需?算?源以及其?需要考?的不同因素之??行折衷。

?于任何形式的通信??,只有? 信息 ?送方 和接受方都能?理解??机制的?候???据通信才能?工作。例如,只有?接受方知道?篇文章需要用??字符解?的?候?篇文章才有意?。同?,只有?接受方知道??方法的?候他才能?理解???据。

?用 ??

一?非常??的??方法是 行程?度?? ,??方法使用?据及?据?度????的??代替同?的???据,?是无??据??的一??例。??方法?常用于?公?算机以更好地利用磁?空?、或者更好地利用 ?算机?? 中的??。?于?子表格、文本、 可?行文件 等??的符??据??,无?是一?非常??的要求,因?除了一些有限的情?,大多?情?下?使是一??据位的?化都是无法接受的。

?于??和音??据,只要不?失?据的重要部分一定程度的?量下降是可以接受的。通?利用人?感知系?的局限,能?大幅度的??存?空??且得到的?果?量?原始?据?量相比??有明?的差?。?些有??据??方法通常需要在??速度、???据大小以及?量?失?三者之??行折衷。

有? ?像?? 用于 ??相机 中,大幅度地提高了存?能力,同??像?量?乎?有降低。用于 DVD 的有? MPEG-2 ?解? ???? 也??了?似的功能。

在有? 音??? 中, 心理?? 的方法用?去除 信? 中?不?或者????的成分。人??音的???常使用更加??的技?,因此人?有?也將“ ?音?? ”或者“?音??”作?一??立的?究?域?“音???”?分??。不同的音?和?音???准都?于 音??解? 范?。例如?音??用于 因特??? ,而音???被用于CD???且使用 MP3 播放器解?。

理? ??

??的理?(?? 算法信息? 密切相?)以及 率失?理? ,???域的?究工作主要是由美國學者 克?德·香? (Claude Elwood Shannon)奠定的,他在二十世?四十年代末期及五十年代早期?表了?方面的基?性的?文。Doyle和Carlson在2000年?到?据??“是所有的工程?域最??、最?美的??理?之一”。 密?? ? ??理? 也是密切相?的?科,?据??的思想???推?也有?深的?源。

?多无??据??系?都可以看作是四步模型,有??据??系?通常包含更多的步?,例如?包括??、?率??以及量化。

Lempel-Ziv(LZ)??方法是流行的无?存?算法之一。 DEFLATE 是LZ的一???,???解?速度???率?行了?化,?然?的??速度可能非常?慢, PKZIP gzip 以及 PNG 都在使用DEFLATE。 LZW (Lempel-Ziv-Welch)是 Unisys ?利 ,直到2003年6月?利到期限,??方法用于 GIF ?像。?外?得一提的是LZR (LZ-Renau) 方法,?是Zip方法的基?。LZ方法使用基于表格的??模型,其中表格中的?目用重?的?据串替?。?于大多?的LZ方法??,??表格是?最初的?入?据??生成的。??表格?常采用 ?夫曼?? ??(例如SHRI、LZX)。 目前一?性能良好基于LZ的??机制是 LZX ,?用于微?公司的 CAB 格式。

最好的??工具??率模型???果用于 算??? 。算???由芬蘭信息理論學家Jorma Rissanen?明,?且由Witten、Neal以及Cleary????成一??用的方法。??方法能???比?人皆知的哈夫曼算法更好的??,?且?本身非常适合于自适??据??,自适??据??的???上下文密切相?。算???已?用于 二??像 ???准 JBIG 、文????准 DejaVu 。文本?入系? Dasher 是一?逆算???器。

?? ??

?据???? ??

??算法 ??

无??据?? ??

有??据?? ??

???例 ??

  • DEFLATE (LZ77?哈夫曼??的?合)??爲ZIP、gzip、zlib?PN文件所使用
  • LZMA 7-Zip ? StuffiX 英? StuffitX 使用
  • LZO (非常快速的LZ??,??速度要求)
  • Unix compress工具(.Z文件格式)、以及GIF使用LZW
  • bzip2 (Burrows-Wheeler???哈夫曼??的?合)
  • PAQ 英? PAQ (一?基于 上下文混合 英? context mixing 的超高??率的算法,但是?度?慢,是最高??比??中的??者。)
  • JPEG (使用?散余弦??、量化、哈夫曼??的 ?像??
  • MPEG (?泛使用的音?及?????准族,????使用 ?散余弦?? 以及??????)
  • MP3 MPEG-1 ?准中用于?音及音???的部分,使用子?、 MDCT 、感知模型、量化以及哈夫曼??)
  • WMA WMV 音????范中的一部分,使用 MDCT 、感知模型、低位元率量化、量化以及哈夫曼??)
  • Vorbis (?似于AAC的基于DCT的音??解?,?了避免?利??而??)
  • JPEG 2000 (使用小波、量化、???的?像??)
  • TTA (使用 ?性???? ,用于无?音???)
  • FLAC (用于无?音???的 ?性????
  • ATRAC (Adaptive Transform Acoustic Coding,自適應聽覺轉換編碼)? SONY 公司於1992年所開發之音訊 有損數據壓縮 技術,也是相關技術名詞之總稱。

外部?接 ??