neprihlásený Štvrtok, 25. decembra 2025, dnes je Prvý sviatok vianočný
Google denne spracúva približne 15 PB dát

DSL.sk, 9.1.2008


Servery spoločnosti Google denne v septembri 2007 spracovávali minimálne približne 15 petabajtov dát, teda 15 miliónov gigabajtov dát.

Tieto čísla odhalil článok zamestnancov Google o algoritme MapReduce, ktorý bude súčasťou januárového ACM.

Daný objem predstavuje množstvo dát spracovávané len univerzálnym algoritmom Google MapReduce na vlastné spracovanie rozličných dát a nezahŕňa napríklad dáta priamo zasielané webovými servermi služieb. Celkové množstvo opakujúcich sa dát, ktoré vygenerejú respektíve pretečie servermi Google, je tak ešte výrazne vyššie.

V septembri 2007 servery Google spracovali celkovo 2.217 miliónov úloh v rámci MapReduce, na jednej úlohe pracovalo priemerne 394 počítačov.

Vstupné dáta do algoritmu MapReduce mali v septembri celkovú veľkosť 403 152 TB, výstupné dáta z map funkcií 34 774 TB dát a výstupné dáta z reduce funkcií 14 018 TB. To dáva celkovo 451 944 TB dát respektíve 15 PB spracovaných dát na jeden deň.

Rast Google a množstva spracovávaných dát dokumentuje aj rozdiel oproti marcu 2006, kedy bol MapReduce už nasadený na väčšinu interných algoritmov spoločnosti. Vtedy denne servery Google spracovávali MapReduce algoritmom priemerne 2 PB dát.

MapReduce je jednoduchý základný algoritmus, ktorý dovoľuje jednoduchým princípom s dodanou mapovacou a redukčnou funkciou spracovávať efektívne paralelne veľké množstvo dát uložených distribuovane na veľkom počte serverov Google. V súčasnosti je používaný aj na najdôležitejšiu činnosť v Google, vytváranie hlavného vyhľadávacieho indexu ale tiež na spracovávanie satelitných obrázkov, na vytváranie databáz štatistikých jazykových prekladačov Google a na mnohé ďalšie činnosti.



Najnovšie články:

Príjemné prežitie vianočných sviatkov
USA zakázali všetky nové zahraničné drony, vrátane DJI
Boj o HBO pokračuje, Paramount oznámil ďalšiu ponuku
Jeden nemecký štát ušetrí prechodom na open source ročne 15 miliónov
Google kupuje Intersect, staviteľa dátových centier a energetickej infraštruktúry
V tretine nových smartfónov je CPU od MediaTeku
Majetok Elona Muska prekročil 700 miliárd
Najpresnejší zdroj času bol nepresný, kvôli výpadku napájania
Vozidlo Perseverance vydrží prejsť na Marse ešte ďalších 60 km
Kuriózny problém samojazdiacich áut, taxíky Waymo kvôli výpadku elektriny zablokovali premávku


Diskusia:
                               
 

musia mat celkom vela pocitacov :) a tak isto aj linku dost silnu by som povedal :D
Odpovedať Hodnotiť:
 

primitivne
Odpovedať Hodnotiť:
 

primitivne
Odpovedať Hodnotiť:
 

ved to aj rapidshare viac spracuje
Odpovedať Známka: 7.1 Hodnotiť:
 

na to si prisiel kde? zas niekdo robi zo seba mudreho.. rapidshare ma servery o velkosti 4PB, aj keby sa prenesie stvornasobok jeho kapacity tak to ani zdaleka nema na google
Odpovedať Známka: -7.1 Hodnotiť:
 

kkt... 4x4 je 16
Odpovedať Známka: 0.0 Hodnotiť:
 

krista, ty si mudry! nechces byt premierom?
Odpovedať Hodnotiť:
 

to mas pravdu ale to by bola celkova kapacita ale google to spracuje za den ak nevies citat!!
Odpovedať Známka: 7.1 Hodnotiť:
 

A ty robis tiez mudreho... Povies mi ako prenesie 16 PB za den cez 200 Gbps konektivitu? 200/8*3600*24 = 2.1 PB.

Takito sa mi pacia najviac, na<>uju ze niekto robi mudreho a pritom sami su ...i.
Odpovedať Známka: -7.1 Hodnotiť:
 

rofl, robis zo seba dobreho idiota, vies citat? odpovedal som na toho predomnou ktory tvrdil ze rapid prenesie viac, citaj debile
Odpovedať Známka: -7.1 Hodnotiť:
 

a z toho je 19.9 porna :-)
Odpovedať Hodnotiť:
 

nie je, a nie je to ani vtipne, a ani trocha
Odpovedať Známka: -7.1 Hodnotiť:
 

pormo mas v galotach
Odpovedať Známka: 5.0 Hodnotiť:
 

dik za clanok. Pre mna dost prekvapujuce udaje. uz len dodat: wow
Odpovedať Hodnotiť:
 

WOW!





Staci?
Odpovedať Známka: -5.0 Hodnotiť:
 

Co do toho pletiete World of Warcraft, tam sa tolko dat nespracuje :D
Odpovedať Hodnotiť:
 

tie ich pocitace chladi rieka a su napojene priamo z elektrarne , ved to ste sa mohli docitat z clanku na dsl-ku
Odpovedať Známka: -5.0 Hodnotiť:
 

:D :D :D :D :D









Odpovedať Hodnotiť:
 

"Tieto čísla odhalil článok zamestnancov Google o algoritme MapReduce, ktorý bude súčasťou januárového ACM."

A co je to januarovy ACM? Januarovy "Association for Computing Machinery"? Este je to v tom odkaze aj napisane, to je taky problem si to precitat?

Akoze tie clanky uz skutocne maju uroven skolskeho casopisu na nejakej ZS...
Odpovedať Známka: -5.0 Hodnotiť:
 

A este zaujimavejsie:

Clanok:
"Google denne spracúva približne 15 PB dát"

Klik na "Pridat komentar" a abrakadabra:
"Google denne spracúva približne 20 PB dát"


No myslim ze som tomu skolskemu casopisu ukrivdil...
Odpovedať Známka: -5.0 Hodnotiť:
 

lol fakt
Odpovedať Známka: 7.1 Hodnotiť:
 

lol ! Tak to je pecka !
Odpovedať Hodnotiť:
 

to boli servery microsoftu a projekt este ani nie je zrealizovany
Odpovedať Hodnotiť:
 

servery Micro$hitu? tak to sa ani nečudujem, že to ešte nie je zrealizované, ani tak skoro nebude, lebo tam používajú M$ a stále to ne nejakom tom pc vyhodí BSoD.
Odpovedať Hodnotiť:
 

Jebnuti admini dsl.sk
Odpovedať Známka: -7.1 Hodnotiť:
 

Jebnuti admini dsl.sk
Odpovedať Známka: 2.0 Hodnotiť:
 

Jebnuti admini dsl.sk
Odpovedať Známka: -7.1 Hodnotiť:
 

Jebnuti admini dsl.sk
Odpovedať Hodnotiť:
 

Jebnuti admini dsl.sk
Odpovedať Známka: 7.1 Hodnotiť:

Pridať komentár