經(jīng)過壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進(jìn)制代碼壓縮,就是把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間.
二進(jìn)制與ASCII編碼
電腦里基本的存儲單位是字節(jié)。ASCII碼是一種以字節(jié)為單位對常用符號進(jìn)行編碼的方案,因其合理性而較為流行。因為一個字節(jié)有8位,所以ASCII最多可對2^8=256個字符進(jìn)行編碼,其中前128個稱為標(biāo)準(zhǔn)ASCII碼(二進(jìn)制編號00000000-01111111),后128個稱為擴(kuò)展ASCII碼(二進(jìn)制編號10000000-11111111),電腦里的漢字就是利用兩個擴(kuò)展ASCII碼的組合來實現(xiàn)的(GB2312漢字編碼方案)。比如漢字“王”占用的兩個ASCII編碼分別是205和245,十六進(jìn)制表示是CD和F5,化為二進(jìn)制就是11001101和11110101。也就是說,在電腦處理“王”這個漢字時,電腦里的信息是“1100110111110101”這樣一串?dāng)?shù)字。再如大寫的英文字母“A”的ASCII編碼是65,十六進(jìn)制表示是41,在電腦里的信息實際上是“01000001”。
【縮位壓縮】
知道了上述原理后,我們來介紹“縮位壓縮”的原理。“縮位”,就是縮減編碼里沒有必要使用的“位”。例如文件里一個漢字也沒有,也就是說內(nèi)容中沒有使用擴(kuò)展ASCII碼,這樣所有字符編碼的第七位(最前面那一位)將都會是0。利用這一點我們就可以縮掉這一位,假設(shè)文件內(nèi)容是ABCDEFGH。
文件內(nèi)容: ABCDEFGH
二進(jìn)制內(nèi)容:01000001 01000010 01000011 01000100 01000101 01000110 01000111 01001000
壓縮后文件內(nèi)容: [該內(nèi)容中文狀態(tài)下顯示是亂碼,故無法寫出]
二進(jìn)制內(nèi)容:10000011 00001010 00011100 01001000 10110001 10100011 11001000
這個壓縮過程就是將原來頂頭的0全部去掉后每8位重排,這樣原來占用8個字節(jié)的文件就只占用了7個字節(jié)。只要解壓時再加上第七位的0,文件就可以恢復(fù)原樣。這一壓縮技術(shù)特別適用于對數(shù)字的壓縮。因為0~9這十個阿拉件數(shù)字占用的ASCII編碼是從00110000-00111001,其前四位全部都是“0011”。
壓縮文件的基本原理是查找文件內(nèi)的重復(fù)字節(jié),并建立一個相同字節(jié)的"詞典"文件,并用一個代碼表示,比如在文件里有幾處有一個相同的詞"中華人民共和國"用一個代碼表示并寫入"詞典"文件,這樣就可以達(dá)到縮小文件的目的.
由于計算機(jī)處理的信息是以二進(jìn)制數(shù)的形式表示的,因此壓縮軟件就是把二進(jìn)制信息中相同的字符串以特殊字符標(biāo)記來達(dá)到壓縮的目的。為了有助于理解文件壓縮,請您在腦海里想象一幅藍(lán)天白云的圖片。對于成千上萬單調(diào)重復(fù)的藍(lán)色像點而言,與其一個一個定義“藍(lán)、藍(lán)、藍(lán)……”長長的一串顏色,還不如告訴電腦:“從這個位置開始存儲1117個藍(lán)色像點”來得簡潔,而且還能大大節(jié)約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機(jī)文件歸根結(jié)底都是以“1”和“0”的形式存儲的,和藍(lán)色像點一樣,只要通過合理的數(shù)學(xué)計算公式,文件的體積都能夠被大大壓縮以達(dá)到“數(shù)據(jù)無損稠密”的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數(shù)據(jù)不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應(yīng)用于動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式j(luò)pg。但是更多情況下壓縮數(shù)據(jù)必須準(zhǔn)確無誤,人們便設(shè)計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數(shù)據(jù)的工具,壓縮后所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當(dāng)然,壓縮包已經(jīng)是另一種文件格式了,如果你想使用其中的數(shù)據(jù),首先得用壓縮軟件把數(shù)據(jù)還原,這個過程稱作解壓縮。常見的壓縮軟件有winzip、winrar等。
有兩種形式的重復(fù)存在于計算機(jī)數(shù)據(jù)中,zip就是對這兩種重復(fù)進(jìn)行了壓縮。
一種是短語形式的重復(fù),即三個字節(jié)以上的重復(fù),對于這種重復(fù),zip用兩個數(shù)字:1.重復(fù)位置距當(dāng)前壓縮位置的距離;2.重復(fù)的長度,來表示這個重復(fù),假設(shè)這兩個數(shù)字各占一個字節(jié),于是數(shù)據(jù)便得到了壓縮,這很容易理解。
一個字節(jié)有 0 - 255 共 256 種可能的取值,三個字節(jié)有 256 * 256 * 256 共一千六百多萬種可能的情況,更長的短語取值的可能情況以指數(shù)方式增長,出現(xiàn)重復(fù)的概率似乎極低,實則不然,各種類型的數(shù)據(jù)都有出現(xiàn)重復(fù)的傾向,一篇論文中,為數(shù)不多的術(shù)語傾向于重復(fù)出現(xiàn);一篇小說,人名和地名會重復(fù)出現(xiàn);一張上下漸變的背景圖片,水平方向上的像素會重復(fù)出現(xiàn);程序的源文件中,語法關(guān)鍵字會重復(fù)出現(xiàn)(我們寫程序時,多少次前后copy、paste?),以幾十 K 為單位的非壓縮格式的數(shù)據(jù)中,傾向于大量出現(xiàn)短語式的重復(fù)。經(jīng)過上面提到的方式進(jìn)行壓縮后,短語式重復(fù)的傾向被完全破壞,所以在壓縮的結(jié)果上進(jìn)行第二次短語式壓縮一般是沒有效果的。
第二種重復(fù)為單字節(jié)的重復(fù),一個字節(jié)只有256種可能的取值,所以這種重復(fù)是必然的。其中,某些字節(jié)出現(xiàn)次數(shù)可能較多,另一些則較少,在統(tǒng)計上有分布不均勻的傾向,這是容易理解的,比如一個 ASCII 文本文件中,某些符號可能很少用到,而字母和數(shù)字則使用較多,各字母的使用頻率也是不一樣的,據(jù)說字母 e 的使用概率最高;許多圖片呈現(xiàn)深色調(diào)或淺色調(diào),深色(或淺色)的像素使用較多(這里順便提一下:png 圖片格式是一種無損壓縮,其核心算法就是 zip 算法,它和 zip 格式的文件的主要區(qū)別在于:作為一種圖片格式,它在文件頭處存放了圖片的大小、使用的顏色數(shù)等信息);上面提到的短語式壓縮的結(jié)果也有這種傾向:重復(fù)傾向于出現(xiàn)在離當(dāng)前壓縮位置較近的地方,重復(fù)長度傾向于比較短(20字節(jié)以內(nèi))。這樣,就有了壓縮的可能:給 256 種字節(jié)取值重新編碼,使出現(xiàn)較多的字節(jié)使用較短的編碼,出現(xiàn)較少的字節(jié)使用較長的編碼,這樣一來,變短的字節(jié)相對于變長的字節(jié)更多,文件的總長度就會減少,并且,字節(jié)使用比例越不均勻,壓縮比例就越大。
那樣看你是有損壓縮還是無損壓縮咯~
一般的視頻壓縮或者說全部的視頻是有損壓縮,否則數(shù)據(jù)兩將大的驚人,里面關(guān)系到壓縮算法等,這里不贅述~而你常用的壓縮如用rar等能還原的稱為無損壓縮,壓縮比的大小直接關(guān)系到壓縮后的體積,
至于LZ發(fā)問的音質(zhì)與效果當(dāng)然會有影響~不過在一定范圍內(nèi),你肉眼不會覺察出來,但體積上卻不及原來的幾十分之一甚至^^^音頻的話如MP3格式的音頻最常見吧,除了壓縮外還把頻率很高和很低的(人耳不能覺察出來的部分刪除),所以效果很好~
當(dāng)然有損壓縮有個度,超過范圍就會造成破音,模糊不清等情況了~
LZ ,這是我認(rèn)真回答的,選我額~~~
壓縮的原理:計算機(jī)處理信息是以二進(jìn)制數(shù)(0和1)的形式標(biāo)示的,壓縮軟件把二進(jìn)制信息中相同的字符串以特殊字符標(biāo)記起來壓縮的,從而實現(xiàn)縮小文件大小的。
文件的壓縮比則根據(jù)文件的類型不同有所不同,比如文檔類的文件壓縮比很大(一個字或者一個詞在同一個文件會反復(fù)出現(xiàn)),而圖形圖像的壓縮比則比較小(每一個像素點的色素不同是常有的,不同顏色和顏色深淺、對比度的不同、亮度不同等的對應(yīng)二進(jìn)制代碼是不同的)。 如果原文件被刪掉了,只要將壓縮文件解壓就可以。
回答者。
下面以winrar為例給你說明一下:
我們使用計算機(jī)所做的事情大多都是對文件進(jìn)行處理。每個文件都會占用一定的磁盤空間,我們希望一些文件,尤其是暫時不用但又比較重要不能刪除的文件(如備份文件,有點像雞肋呀),盡可能少的占用磁盤空間。但是,許多文件的存儲格式是比較松散的,這樣就浪費了一些寶貴的計算機(jī)存儲資源。這時,我們可以借助壓縮工具解決這個問題,通過對原來的文件進(jìn)行壓縮處理,使之用更少的磁盤空間保存起來,當(dāng)需要使用時再進(jìn)行解壓縮操作,這樣就大大節(jié)省了磁盤空間。當(dāng)你要拷貝許多小文件時,通過壓縮處理可以提高執(zhí)行效率。如果小文件很多,操作系統(tǒng)要執(zhí)行頻繁的文件定位操作,需要花費很多的時間。如果先把這些小文件壓縮,變成一個壓縮文件后,再拷貝時就很方便了。由于計算機(jī)處理的信息是以二進(jìn)制數(shù)的形式表示的,因此壓縮軟件就是把二進(jìn)制信息中相同的字符串以特殊字符標(biāo)記來達(dá)到壓縮的目的。為了有助于理解文件壓縮,請您在腦海里想象一幅藍(lán)天白云的圖片。對于成千上萬單調(diào)重復(fù)的藍(lán)色像點而言,與其一個一個定義“藍(lán)、藍(lán)、藍(lán)……”長長的一串顏色,還不如告訴電腦:“從這個位置開始存儲1117個藍(lán)色像點”來得簡潔,而且還能大大節(jié)約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機(jī)文件歸根結(jié)底都是以“1”和“0”的形式存儲的,和藍(lán)色像點一樣,只要通過合理的數(shù)學(xué)計算公式,文件的體積都能夠被大大壓縮以達(dá)到“數(shù)據(jù)無損稠密”的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數(shù)據(jù)不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應(yīng)用于動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式j(luò)pg。但是更多情況下壓縮數(shù)據(jù)必須準(zhǔn)確無誤,人們便設(shè)計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數(shù)據(jù)的工具,壓縮后所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當(dāng)然,壓縮包已經(jīng)是另一種文件格式了,如果你想使用其中的數(shù)據(jù),首先得用壓縮軟件把數(shù)據(jù)還原,這個過程稱作解壓縮。常見的壓縮軟件有winzip、winrar等。
什么是壓縮文件?
簡單的說,就是經(jīng)過壓縮軟件壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進(jìn)制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。
■怎么壓縮文件?
首先要安裝壓縮軟件,現(xiàn)在比較流行的是WinRAR「一種高效快速的文件壓縮軟件(中文版)」。
其次是建立一個壓縮包:選擇你要制作成壓縮包的文件或文件夾,當(dāng)然你也可也多選,方法同資源管理器,也就是按住Ctrl或Shift再選擇文件(文件夾)。 選取完畢之后,就可以單擊工具欄上的“壓縮”按鈕,在這里你可以選擇壓縮格式:RAR和ZIP。 如果你想得到較大的壓縮率,建議選擇RAR格式。
各個選項選擇好以后,單擊確定按鈕就開始制作壓縮包了,非常方便。
有時候大家會遇到這個問題,就是你在一個論壇里要上傳一些文件壓縮包,壓縮包大小有3M,但是論壇限制會員上傳大小只有2M,怎么辦呢?
其實辦法很簡單,就是在你壓縮這個文件時,分成幾個帶分卷壓縮包,分卷包大小設(shè)置為2M即可,比如:原來文件名為123.rar(3M),壓縮成分卷包后為123.part1.rar(2M)與123.part2.rar(1M)兩個文件,這樣你就可以上傳了。
具體方法如下:
1、在要壓縮的文件上點右鍵
2、添加到壓縮文件。.
3、選常規(guī)
4、壓縮方式選最好
5、批定壓縮分卷大小(按字節(jié)計算),1M = 1024K,1K = 1024字節(jié),填寫數(shù)字即可
當(dāng)你下載了帶有分卷的壓縮包后,如何解壓文件呢?
具體方法如下:
1、把所有的壓縮分卷全部下載完整
2、所有分卷必須在同一個文件夾內(nèi)
3、然后雙擊解壓第一個分卷,即可
注:分卷解壓的文件必須是連續(xù)的,若分卷未下載完整,則解壓時自然會提示需要下一壓縮分卷
壓縮原理需要專業(yè)人士來解釋,我只了解一點:
(1)多媒體文件(視頻文件、音頻文件、MP3等),絕大多數(shù)已是經(jīng)過壓縮或高度壓縮處理過的,無法再作進(jìn)一步的壓縮或者根本無法壓縮,就目前的壓縮技術(shù)來看,即使可以再進(jìn)一步壓縮,必定會以犧牲視頻文件、音頻文件的畫質(zhì)、音質(zhì)為代價;
(2)壓縮比大的文件,多半是指那些文本文件或一些數(shù)據(jù)表格文件,這些文件中重復(fù)的數(shù)據(jù)、文字信息比較多,壓縮軟件可以通過其算法,把重復(fù)的信息全部歸納一個信息處理,盡可能縮小文件的大小,解壓時再將重復(fù)的信息通過處理回歸原位。對于這些文本文件,你不可能為縮小大小,而事先刪除那些重復(fù)的數(shù)據(jù)或文字,如果這樣,你恐怕根本就無法使用了。所以,只要文件內(nèi)部重復(fù)的數(shù)據(jù)、文字信息越多,其壓縮比就會越高
聲明:本網(wǎng)站尊重并保護(hù)知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時間:2.684秒