此條目
?有列出任何
?考或?源
。
(
2020年9月24日
)
維基百科所有的內容都應該
可供?證
。??助補充
可??源
以
改善?篇?目
。无法??的內容可能會因?異議提出而被移除。
|
在
?算机科?
和
信息?
中,
?据??
或者
源??
是按照特定的??机制用比未???少的?据
位元
(或者其?信息相?的?位)表示信息的?程。例如,若?「compression」???「comp」,??篇文章可以用?少的?据
位元
表示。常見的例子是
ZIP文件格式
,此格式不??提供??功能,?可作?
??工具
(Archiver),能???多文件存?到同一?文件中。
可利用資料的一致性(可用
信息?
,entropy來表示),規則性,與可預測性去實現資料壓縮。人類最先發展的壓縮技術實?
自然語言
,一般來說,若可以用比較精簡的
自然語言
來描述一樣事物,那?也就越能?對這樣事物做壓縮。資料越一致,亦代表其統計特性越集中。以影像壓縮?例,其集中代表有
傅立葉變換
的
時域
及
頻域
,
直方圖
,
特徵?
。
?据??能???是因?多???世界的?据都有
??冗余
。例如,字母「e」在英?中比字母「z」更加常用,字母「q」后面是「z」的可能性非常小。
非破壞性資料壓縮
通常利用了??冗余,??就能更加??地、但仍然是完整地表示?送方的?据。
非破壞性資料壓縮的壓縮率不足以處理龐大體積的音視頻數據,但如果允?一定程度的
保?度
?失,那??可以???一步的??。例如,人?看??或者???面的?候可能?不?注意到一些???不完善。同?,??音??音采?序列可能?起?一?,但??上?不完全一?。
破壞性資料壓縮
在可以接受或無法察覺的情況下使用?少的位?表示?像、??或者音?。
然而,?常有一些文件不能被破壞性資料壓縮??,??上?于不含可以辨??式的?据任何??算法都不能??。?外,????已?????的?据通常得到的?果??上是增加?据。
??上,破壞性資料壓縮也?最??到不能工作的地步。例如一個?端的例子:??算法每次去掉文件最后一?字?,那?????算法不?的??直至文件?空,??算法?不能??工作。
由于可以?助?少如
硬?
空???接
??
??的???源的消耗,所以??非常重要,然而??需要消耗信息?理?源,?也可能是?用??的。所以?据??机制的??需要在??能力、失?度、所需?算?源以及其?需要考?的不同因素之??行折衷。
?于任何形式的通信??,只有?
信息
的
?送方
和接受方都能?理解??机制的?候???据通信才能?工作。例如,只有?接受方知道?篇文章需要用??字符解?的?候?篇文章才有意?。同?,只有?接受方知道??方法的?候他才能?理解???据。
一?非常??的??方法是
行程?度??
,??方法使用?据及?据?度????的??代替同?的???据,?是无??据??的一??例。??方法?常用于?公?算机以更好地利用磁?空?、或者更好地利用
?算机??
中的??。?于?子表格、文本、
可?行文件
等??的符??据??,无?是一?非常??的要求,因?除了一些有限的情?,大多?情?下?使是一??据位的?化都是无法接受的。
?于??和音??据,只要不?失?据的重要部分一定程度的?量下降是可以接受的。通?利用人?感知系?的局限,能?大幅度的??存?空??且得到的?果?量?原始?据?量相比??有明?的差?。?些有??据??方法通常需要在??速度、???据大小以及?量?失?三者之??行折衷。
有?
?像??
用于
??相机
中,大幅度地提高了存?能力,同??像?量?乎?有降低。用于
DVD
的有?
MPEG-2
?解?
????
也??了?似的功能。
在有?
音???
中,
心理??
的方法用?去除
信?
中?不?或者????的成分。人??音的???常使用更加??的技?,因此人?有?也將“
?音??
”或者“?音??”作?一??立的?究?域?“音???”?分??。不同的音?和?音???准都?于
音??解?
范?。例如?音??用于
因特???
,而音???被用于CD???且使用
MP3
播放器解?。
??的理?(??
算法信息?
密切相?)以及
率失?理?
,???域的?究工作主要是由美國學者
克?德·香?
(Claude Elwood Shannon)奠定的,他在二十世?四十年代末期及五十年代早期?表了?方面的基?性的?文。Doyle和Carlson在2000年?到?据??“是所有的工程?域最??、最?美的??理?之一”。
密??
?
??理?
也是密切相?的?科,?据??的思想???推?也有?深的?源。
?多无??据??系?都可以看作是四步模型,有??据??系?通常包含更多的步?,例如?包括??、?率??以及量化。
Lempel-Ziv(LZ)??方法是流行的无?存?算法之一。
DEFLATE
是LZ的一???,???解?速度???率?行了?化,?然?的??速度可能非常?慢,
PKZIP
、
gzip
以及
PNG
都在使用DEFLATE。
LZW
(Lempel-Ziv-Welch)是
Unisys
的
?利
,直到2003年6月?利到期限,??方法用于
GIF
?像。?外?得一提的是LZR (LZ-Renau) 方法,?是Zip方法的基?。LZ方法使用基于表格的??模型,其中表格中的?目用重?的?据串替?。?于大多?的LZ方法??,??表格是?最初的?入?据??生成的。??表格?常采用
?夫曼??
??(例如SHRI、LZX)。
目前一?性能良好基于LZ的??机制是
LZX
,?用于微?公司的
CAB
格式。
最好的??工具??率模型???果用于
算???
。算???由芬蘭信息理論學家Jorma Rissanen?明,?且由Witten、Neal以及Cleary????成一??用的方法。??方法能???比?人皆知的哈夫曼算法更好的??,?且?本身非常适合于自适??据??,自适??据??的???上下文密切相?。算???已?用于
二??像
???准
JBIG
、文????准
DejaVu
。文本?入系?
Dasher
是一?逆算???器。
外部?接
??