neprihlásený Piatok, 26. apríla 2024, dnes má meniny Jaroslava
Skomprimujte najlepšie 100 MB a vyhrajte 50 tisíc eúr

DSL.sk, 14.8.2006


Zaujímavú súťaž o maximálne 50 tisíc eúr vyhlásil Marcus Hutter, ktorý ponúka výhru tomu, kto dokáže lepšie skomprimovať cca 100 MB textov.

Potrebné je skomprimovať konkrétny textový súbor o veľkosti presne 100,000,000 bytov získaných exportom z anglickej verzie Wikipedie. Časť ceny získa každý, kto dokáže postupne zlepšiť aktuálny rekord.

Vytvoriť je potrebné samorozbaľovací archív pre Linux alebo Windows, ktorý vytvorí súbor zhodný so súborom publikovaným vyhlasovateľom, nevyužíva žiadne externé dáta ani súbory nenachádzajúce sa v štandardnej inštalácii týchto operačných systémov.

Meria sa veľkosť výsledného archívu v bytoch, súťaž začína s hodnotou 18,324,887 bytov, ktorá bola dosiahnutá v súčasnosti najlepším dostupným komprimátorom paq8f. Pre porovnanie podľa našich testov WinRAR 3.60 Beta 4 skomprimuje pri úrovni kompresie "Best" tento súbor na samorozbaľovací archív o veľkosti 24,854,009 bytov.

Každý užívateľ, ktorý prekoná aktuálny rekord, získa takú percentuálnu časť odmeny 50,000 eúr, o koľko percent zlepšil predchádzajúci rekord. Nárok na odmenu ale vzniká len pri zlepšení aspoň o 1%.

Motiváciou k vyhláseniu súťaže je Hutterova teória, podľa ktorej schopnosť dobre komprimovať je úzko spätá s umelou inteligenciou, keď obe sú založené na vyhľadávaní podobností. Cieľom je podporiť všeobecné komprimačné programy efektívne komprimujúce ľudský jazyk, pravidlá ale nezabraňujú optimalizácii pre čo najlepší výsledok na súťažný 100 MB súbor.

Bližšie pravidlá súťaže a samotný súbor na stiahnutie je možné nájsť na stránke prize.hutter1.net.


      Zdieľaj na Twitteri



Najnovšie články:

Vydané Ubuntu 24.04 s dlhou podporou
Uvedený notebook používajúci nový formát menších pamäťových modulov CAMM2
Nová verzia Windows 11 bude vyžadovať CPU s podporou ďalších inštrukcií, nepobeží na starších CPU
Google opäť odložil vypnutie cookies tretích strán v Chrome
HDD zdražia, Western Digital a Seagate to už oznámili veľkým zákazníkom
Po oprave zariadení v EÚ sa predĺži záruka a výrobcovia budú povinní opravovať aj po záruke
Japonská sonda nebola skonštruovaná aby prežila noc na Mesiaci, funguje aj po tretej
Železnice opäť aktualizujú systémy, v noci nebude fungovať internetový predaj lístkov - aktualizácia 1
Vydaná Fedora 40
Samsung spustil výrobu takmer 300-vrstvovej flash pamäte


Diskusia:
                               
 

no tak to asi len velmi tazko niekto pride k tym 50 tacom
Odpovedať Hodnotiť:
 

Staci to do zajtra ? :D
Odpovedať Hodnotiť:
 

Ked ma naseru, tak ja si ten text zapamatam a bude mat 0 bytov.
Odpovedať Hodnotiť:
 

A ked ma naseru uplne, tak ho vytlacim a bude zaberat 1 byt, alebo 2 garzonky. To uz potom podla potreby.
Odpovedať Hodnotiť:
 

:))
Odpovedať Hodnotiť:
 

Ja som to dal na 19,548,129
Odpovedať Hodnotiť:
 

to je sutaž pre vývojárov algoritmov a nie pre používateľov
Odpovedať Hodnotiť:
 

ty debil :D tak takto som sa este nepobavil :D:D:D
Odpovedať Hodnotiť:
 

sa poser
Odpovedať Hodnotiť:
 

Ja som to dal len na 26,135,153 ... Asi skusim WinZIP ....



LOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOLLL
Odpovedať Hodnotiť:
 

Skusal som ako to zbali 7-zip, zbalil to na 23,7 MB a pritom bral do 682 MB RAM. :)

Odpovedať Hodnotiť:
 

ta idem na to ... ked to nezbalim pod 15MB, tak koncim s programovanim ;) ...
Odpovedať Hodnotiť:
 

Tak toto prehlasenie je o nicom, skoncit vie kazdy (vacsinou..), lepsie by bolo od teba "prechadzam na linux" :-).
Co je zaujimava vec, ze 100mega nie je problem nahrat do ramky, takze si mozes dovolit veci, ktore sa vo vseobecnosti nerobia...
Odpovedať Hodnotiť:
 

tak na linux by som radsej neprechadzal s takym chabymi znalostami v programovani :) ...

ta velkost textu je fakt dobra ... moj algoritmus vyzaduje dvojnasobok, cize 200MB, co je uplne brnkacka ... len som zvedavy, ci dosiahnem aj v praxi rovnaky vysledok ako pri mojich teoretickych odhadoch :) ... ten text je totiz dost poprepletany aj "skaredymi" znakmi a postupnostami znakov :( ...
Odpovedať Hodnotiť:
 

No to hej, je to prepletene XMLko a kadejaky sajrajt, ale aj tak, skoda, ze nemam cas, zaujimava vyzva, od rana ma napadlo uz tolko veci.
Odpovedať Hodnotiť:
 

Jeden maly detail.100 MB textu nie 100,000,000 bytov. To by ste sakra v redakcii uz mohli vediet ze, 1 MB nie je 1000 bytov,ale 1024. Ste obycajni trapkovia.
Odpovedať Hodnotiť:
 

citaj lepsie, vsimol si si to "cca"???
Odpovedať Hodnotiť:
 

Co ? Ja tam vidim napisane ze PRESNE :D
Odpovedať Hodnotiť:
 

a ja tam vidm napisane ze cca 100 MB, tak sa uvedom chlapce
Odpovedať Hodnotiť:
 

Cca je napisane pri 100MB.
Ta velkost 100,000,000b je tam preto, aby si PC-analfabeti vedeli predstavit, o com je rec. Keby to bolo 104,857,600b, vsetci by na to pozerali jak na Veselu Kravu.
Odpovedať Hodnotiť:
 

Ten súbor má presne 100,000,000 bytov ako sa uvádza v článku. Na ostatných miestach sa uvádza cca 100 MB pre stručnosť.

A inak, čo sa týka veľkosti súborov a diskovej kapacity, hoci autori na DSL.sk nepoužívajú takéto jednotky, ako pravdepodobne viete, výrobcovia diskov skutočne označujú 1 MB = 1,000,000 bytov.
Odpovedať Hodnotiť:
 

fakt? :)
Odpovedať Hodnotiť:
 

Snazia sa pisat mB (teda nie MB) aby sa mohli pred zakonom vyhovorit, ze mega je milion a Mega je 1048576.
Hajzli.
Odpovedať Hodnotiť:
 

nuz ale ked napisu mB a nie MB tak potom im nemame co vytknut
Odpovedať Hodnotiť:
 

POdla nejakej sustavy jednotiek je 1 megabajt skutocne 1000 Kilobajtov a zaviedla sa nova jednotka mebibajt, ktora je skutocne 1024 kibibajtov atd. Fakt.
Odpovedať Hodnotiť:
 

a nie je nahodou mB milibajt?
Odpovedať Hodnotiť:
 

tak bajt ma 8 bitov a uz mensie ako bit neni. Jedine ze to mili by bola jedna osmina a jeden milibajt by bol vlastne 1 bit :)
Odpovedať Hodnotiť:
 

Táto diskusia to je sila, to je ako keď stará baba p..u vytasila.
Odpovedať Hodnotiť:
 

vyrobcovia ma nezaujimaju...to su ojebavaci. Ale v IT clankoch by sme sa mohli vyjadrovat exaktne.
Odpovedať Hodnotiť:
 

Zaujímalo by ma, na koľko by to dokázal skomprimovať KGB kompresor... Vyskúšajte to niekto.
Odpovedať Hodnotiť:
 

keby som mal este aspon 1.5GB RAM tak by som oproboval...
Odpovedať Hodnotiť:
 

skusim ... som zvedavy, ako rychlo to spravi a kolko to bude mat ;) ...
Odpovedať Hodnotiť:
 

takze vysledok je trapnych viac nez 18,6MiB :o) ...
Odpovedať Hodnotiť:
 

co tu riesite? to akoze ked ma ten subor 100 000 000B mali dalej pisat namiesto cca 100MB 95,367431640625MB ? alebo vo co vam go
Odpovedať Hodnotiť:
 

si si isty ze 100MB = 95,367431640625MB ??
Odpovedať Hodnotiť:
 

aaa sorrac, zle som ta poxopil. Vsetko beriem spat.
Odpovedať Hodnotiť:
 

Peniaze mozes nechat.
Odpovedať Hodnotiť:
 

neviem, co tu trapkujete vsetci ... v SI sustave plati:

100 MB = 100 000 000 B
100 MiB = 104 857 600 B

zrejme ste vyliezli zo skoly odchovani na starych jednotkach a nevsimli ste si, ze medzicasom sa stanovil standard, ktory rozlisuje megabajt a mebibajt ;) ...
Odpovedať Hodnotiť:
 

Zaujimalo by ma, ako sa tomu sialencovi podaril ten rekord, co je tam teraz... pouzil som paq8f presne ako on a urobilo mi az 20 MB, UHARC/GUI urobil 24 MB a WinRAR 33 MB. Toto vyhra len niekto s naozaj poriadnym softom a compom...
Odpovedať Hodnotiť:
 

no sak ide o to ten soft si vytvorit...a ked sa vytvori dobre tak ani nie je treba dobry comp.Pocul som o dvoch typkoch ktori robili nejaku simulaciu v OpenGL...obaja spravili to iste,akurat prvemu to islo aj na P2 366MHz a tomu druhemu to sekalo na P4 2GHz...
Odpovedať Hodnotiť:
 

a ten prvy mal aj dobru grafiku a dost pamate a ten druhy mal pustene xpcka na 64 mb pamate a k tomu mu to fachalo na s3 512kb grafike
Odpovedať Hodnotiť:
 

Ja som to vyriesil: Ten prvy mal urcite vacsi disk!
Odpovedať Hodnotiť:
 

Neviete si nastavit winrar, nedalo mi to, tak som to skusil a dal to presne na 23 656 206 bytov (sfx), mozno by to slo aj menej, ale len o par bytov. WinRar ma totiz taku zalozku, ze advanced/compression, kde sa obcas oplati skusit nieco pomenit.
Odpovedať Hodnotiť:
 

ty si teda mudry:D si myslis ze tuto sutaz davali nato ze kto si lepsie nastavy Winrar?:D:D
Odpovedať Hodnotiť:
 

Mne je celkom jasne o co v tejto sutazi ide, ja som to pisal redaktorom dsl.sk a vsetkym ostatnym, co sa snazia usetrit kazdy bajt (len aby bolo jasne, keby niekto nepochopil, myslel som, ze je).
Zato ty si asi moc mudrosti nepochytil: nastavI - sloveso, pred 'ze' sa pise vacsinou ciarka.

Odpovedať Hodnotiť:
 

Tak som tvoj príspevok preťukol gmail spellingom.
http://img219.imageshack.us/my.php?image=schrnka02sj2.gif
Odpovedať Hodnotiť:
 

No sa poser, pisem bez diakritiky, lebo je to rychlejsie, ale ak ta zdrzuje pisat gramaticky spravne, tak sa vrat do skoly.
Odpovedať Hodnotiť:
 

A nepomohlo by keby sa ten text najprv len zmenšil na uplne male pismo a nejake jednoduche a potom sa to skomprimovalo ? :-)
Odpovedať Hodnotiť:
 

nie, velkost a ani druh fontu nehra rolu. Co pismeno - to byte...Ide len o vhodny algoritmus. Ak mas napr. 00000000 tak komprimacia prebieha asi takto: 8x0... ale da sa to urcite este aj mnoha inymi sposobmi..
Odpovedať Hodnotiť:
 

Vies co je toto: :-) ?
Odpovedať Hodnotiť:
 

Skomprimovany SMILE :-)
Odpovedať Hodnotiť:
 

A nepomohlo by keby sa ten text najprv len zmenšil na uplne male pismo a nejake jednoduche a potom sa to skomprimovalo ? :-)
Odpovedať Hodnotiť:
 

Ty si nedas pokoj!? :D
Odpovedať Hodnotiť:
 

OK. Skomprimoval som to. Ale čo teraz s tým? Kam to mám poslať?
Odpovedať Hodnotiť:
 

Ja dom to dokazal skoprimovat na 102MB .exe, kam to mam poslat?
Odpovedať Hodnotiť:
 

posli to do /dev/null :D ...
Odpovedať Hodnotiť:
 

ja mam zatial softik ktory to urobi na14MB
Odpovedať Hodnotiť:

Pridať komentár