Žinios Discovery
/ Knowledge Discovery >> Žinios Discovery >> Technika >> kompiuteris >> kompiuterių programinė įranga >>

Kaip failų suspaudimo Works

quot; gali padaryti už jus. " Programa yra vykdoma tokiu būdu, įlaipinami visi pasikartojantys informacijos bitus ir tada apskaičiuoti, kuri modelius ji turėtų rašyti į žodyną. Šis gebėjimas perrašyti Žodynas " prisitaikanti " dalis LZ prisitaikanti žodyno pagrindu algoritmas. Kelias programa iš tiesų tai yra gana sudėtinga, kaip jūs galite pamatyti, esančiais ant Data-Compression.com diskusijose.

Nesvarbu, koks konkretus metodas jūs naudojate, tai nuodugniai paieška sistema leidžia suspausti failą daug efektyviau, nei galėtumėte tiesiog skinti žodžius. Naudojant modelius mes pasirinkome pirmiau, ir pridedant " __ " erdvėse, mes sugalvoti šį didesnių žodyne:

  1. ask__
  2. what__
  3. Jūs
  4. r__country
  5. __ can__do__for__you

    Ir tai mažesnis sakinys: " 1not__2345 __ - __ 12354 "

    sakinys užima 18 vienetų atminties, ir mūsų žodyno užima 41 vienetų. Taigi mes suspaustas bendrą failo dydis nuo 79 vienetų 59 vienetų! Tai tik vienas iš būdų suspaudžiant frazę, ir nebūtinai pats efektyviausias vienas. (Žr jeigu jūs galite rasti geresnį būdą!)

    Taigi, kaip gera yra ši sistema? Failas mažinimo santykis priklauso nuo daugelio veiksnių, įskaitant failo tipą, failo dydis ir Suspaudimo skaičius.

    Daugelyje pasaulio kalbų, tam tikros raidės ir žodžiai dažnai pasirodo kartu to paties modelio. Dėl šios dideliu greičiu atleidimo iš darbo, tekstinius failus suspausti labai gerai. Iš 50 ar daugiau procentų sumažinimas yra tipiškas gero dydžio tekstinį failą. Dauguma programavimo kalbų taip pat yra labai nereikalingas, nes jie naudoja santykinai mažą kolekciją komandas, kurios dažnai eiti kartu per nustatytą modelį. Failai, kurie apima unikalių daug informacijos, pavyzdžiui, grafikos ar MP3 failus, negali būti suspausta daug su šia sistema, nes jie neturi kartoti daug modelių (daugiau apie tai kitame skyriuje).

    Jei failas turi pasikartojančių modelių daug, sumažinimo norma paprastai didėja failo dydis. Jūs galite pamatyti tai tik pažvelgus mūsų pavyzdyje - jei mes turėjome daugiau Kennedy kalbą, mes galėtų dažniau kreiptis į modelių mūsų žodyne, ir taip gauti daugiau iš kiekvieno įrašo failų erdvėje. Be to, daugiau plintančių modeliai gali atsirasti per ilgesnį darbo, leidžia mums sukurti efektyvesnį žodyną.

    Šis veiksmingumas taip pat priklauso nuo konkretaus algoritmo naudojamo suspaudimo programa. Kai kurios programos yra ypač tinka

    Page [1] [2] [3] [4] [5]