neprihlásený Piatok, 17. mája 2024, dnes má meniny Gizela
Google vysvetlil príčinu problémov Gmailu s doručovaním

DSL.sk, 25.9.2013


Príčinou rozsiahleho oneskoreného doručovania emailov užívateľom webmailovej služby Gmail v noci z pondelka na utorok boli dva nezávislé výpadky dvoch redundantných sieťových ciest.

Spoločnosť Google to tvrdí v stanovisku publikovanom v noci na dnes.

V noci z pondelka na utorok stredoeurópskeho času zaznamenal Gmail jeden z najrozsiahlejších problémov vo svojej histórii. Hoci samotná služba fungovala, veľkému percentu užívateľov doručovala emaily s oneskorením a to aj viachodinovým, aj po doručení sa vyskytovali problémy s otváraním príloh a problémy trvali celkovo takmer dvanásť hodín.

Zároveň sa problémy dotýkali ako individuálnych užívateľov tak účtov služby Google Apps využívanej firmami a ďalšími organizáciami ako cloudové outsourcingové riešenie emailu. Niekoľkohodinové oneskorenie doručovania emailov navyše s následnými problémami pri otváraní príloh predstavuje samozrejme výrazné obmedzenie pri práci a užívatelia boli predpokladane často nútení hľadať alternatívne spôsoby komunikácie a zasielania súborov.

Problémy odštartovali pred 15:00 výpadkom dvoch nezávislých sieťových ciest, čím sa znížila kapacita Gmail systémov na doručovanie prijatých emailov na Gmail účty. O 14:54 sa začal vytvárať front nedoručených správ, pričom všetky oneskorené správy boli následne po vyriešení problémov doručené až v utorok o 1:00.

Oneskoreným doručením bolo postihnutých 29% všetkých správ prijatých v čase problémov, Google o prípadnej strate emailov neinformuje. Medián oneskorenia síce dosahoval iba 2.6 sekundy, teda polovica oneskorených emailov bola oneskorená o maximálne 2.6 sekundy, až 1.5% všetkých prijatých správ malo ale oneskorenie dlhšie ako dve hodiny.

Navyše okrem oneskorenia sa pri oneskorene doručených správach vyskytovali problémy so sťahovaním veľkých príloh, ktoré končilo chybou.

Vzhľadom na odhadovaný počet užívateľov Gmailu okolo pol miliardy a jeho bežnom permanentnom využívaní na Android zariadeniach sa oneskorenie dotklo zrejme mnohých desiatok až niekoľkých stoviek miliónov ľudí a výrazné oneskorenie pravdepodobne viacerých jednotiek alebo niekoľkých desiatok miliónov.

Google v oznámení avizuje, že realizuje kroky na zaistenie dostatku sieťovej kapacity pre Gmail aj v prípade dvojnásobného výpadku, plánuje spraviť doručovanie správ na Gmail účty odolnejšie proti sieťovým problémom a aktualizuje svoje praktiky, aby na podobné problémy dokázal reagovať rýchlejšie.


      Zdieľaj na Twitteri



Najnovšie články:

V Česku sa DSL zrýchli zrejme až na 500 Mbps / 100 Mbps
Sci-fi seriál 3 Body Problem bol predĺžený
Hokej pomohol vytvoriť ďalší rýchlostný rekord slovenského Internetu
Raspberry Pi ide na burzu
Nové .sk domény budú opäť dočasne lacnejšie


inzercia



Diskusia:
                               
 

Data sa "zasekli" v NSA kde mali vypadok a nestihali spracovavat udaje.
Odpovedať Známka: 8.6 Hodnotiť:
 

právě jsem chtěl tuto fašistickou činnost fašistické a země a agresora zmínit taky...
Odpovedať Známka: 1.7 Hodnotiť:
 

Čo je zlé na fašistoch?
Si porovnaj životnú úroveň Nemeckého dôchodcu (ktorý "prehral" vojnu) a Ruského dôchodcu (ktorý "vyhral" vojnu).
Odpovedať Známka: 5.4 Hodnotiť:
 

No to by si musel zacat najprv tym, ze si zistis, co je to fasizmus a kto je to fasista a v akych kontextoch sa tieto vyrazy pouzivaju. Maly hint Nemec - obcan nemecka, nieje implicitne fasista.
Odpovedať Známka: 8.2 Hodnotiť:
 

A predovsetkym nemci boli nacisti, taliani fasisti
Odpovedať Známka: 8.8 Hodnotiť:
 

nemecký dôchodca viac ako 86r. = fašista
Odpovedať Známka: 1.4 Hodnotiť:
 

a aký je rozdiel medzi Nazi a Fascist
Nazi sa skrývajú v argentíne a Fascist sa skrívajú v Nemecku

Odpovedať Známka: -7.1 Hodnotiť:
 

Nacista čo prehral vojnu je lepši ako komunista čo vyhral vojnu.
Odpovedať Hodnotiť:
 

a ja som sa skoro rozviedol s manželkou, že nevie mi zaslať obyčajný mail.
Odpovedať Známka: 9.6 Hodnotiť:
 

napodobne, a potom sa musi clovek, kvoli googlu priznat, ze aj zena moze mat pravdu.
Odpovedať Známka: 9.5 Hodnotiť:
 

výjimky samo potvrzují pravidlo, na to třeba nezapomínat!
Odpovedať Známka: 8.8 Hodnotiť:
 

V klastri mozu byt aj 3-4 stroje (ci aj 5-6), nielen 2. Navyse klaster nemusi byt totalny mirror (t.j. vsetko 4-5-6 krat), ale po vzore RAIDu 5. T.j. napr. mam v klastri 4 servery a mam subory 1,2,3 ...... 16 s vysokou dostupnostou.

- na serveri 1 budu subory 1,2,3,4,5,6,7,8,9,10,11,12
- na serveri 2 budu subory 5,6,7,8,9,10,11,12,13,14,15,16
- na serveri 3 budu subory 9,10,11,12,13,14,15,16,1,2,3,4
- na serveri 4 budu subory 13,14,15,16,1,2,3,4,5,6,7,8

po vypadnuti (jedneho) KTOREHOKOLVEK clena klastra, mam vsetko este na dalsich dvoch :), resp. s tromi servermi po vypadnuti ktorehokolvek vsetko aspon na jednom

Podobne aj po vzore RAIDu 6, ked vypadnu ktorekolvek 2 servery ...
Odpovedať Známka: 7.3 Hodnotiť:
 

to je sice pravda, ale ako to suvisi s temou?

"dva nezávislé výpadky dvoch redundantných sieťových ciest"
Odpovedať Známka: 10.0 Hodnotiť:
 

Aj ked je klaster totalny mirror, t.j. vsetky udaje a sluzby tu uplna kopia, nic nebrani tomu aby boli v klastri servery 3-4-5 a vsetky zabezpecovali s 3-4-5-nasobnou redundanciou sluzbu.
Odpovedať Známka: 3.3 Hodnotiť:
 

Na druhej strane je neskonalym zvykon zabezpecovat redundanciou 2-clennym klastrom, to je pravda (ak su servery totalne rovnocenne z pohladu dat ci poskytovanych sluzieb). Iba sialenec by vyrabal 5-6 clenny klaster s uplne rovnocennymi servermi.
Odpovedať Hodnotiť:
 

hm, na co si mozno pozabudol je narastajuca poziadavka na vykon jednej nody v pripade, ze tri zo styroch zdochnu ( no route to host ). ak bezia vsetky, v zmysle clustra je load roz-distribuovany medzi jednotlive nody podla nejakej "metriky" . ked to zdoche, isto chvilu trva, kym sa zmena v topologii vykryje a zvysne nody musia nejak stratu pribuzneho vykompenzovat tak, ze prihodia do kachiel aby si podrzali pozadovany vykon ako cluster. ak by ta posledna load nezvladla, tak proste google useri by ju DDoSlova poslali dole.( uz len napr. udrzat data na tak velkom distr. filesysteme "up to date" je celkom pekna rezia - a zase to musi letiet cez nejake ine AS, aby bol sync aj ked zdochne kdesi peering do Internetov. (konektivita vs. interkonektivita lebo potom zloba z informaciami, co ostali kdesi v bufferoch alebo po ceste stratene - a pri google to asi nebude 1-2 MB ;] ) .. atd. na RAID-e sa to pekne demonstruje, ale je to velmi povrchna metafora. si myslim .. ;]

Odpovedať Hodnotiť:
 

Ale o dovodoch vypadku O2 nie je potrebne informovat.
Odpovedať Známka: 6.9 Hodnotiť:
 

nevsimol som si vypadok u O2. cely den mi nikto nevolal.
Odpovedať Známka: 9.3 Hodnotiť:

Pridať komentár