neprihlásený Piatok, 19. októbra 2018, dnes má meniny Kristián   DonaskaKvetov.sk - donáška kvetov v SR a zahraničí Pošli kvety
Nvidia uviedla prvý 12-nm výkonný Volta GPU, zatiaľ pre umelú inteligenciu a výpočty

Značky: GPUNvidia

DSL.sk, 11.5.2017


Spoločnosť Nvidia, spolu s AMD jeden z dvojice výrobcov výkonných grafických procesorov, v stredu na svojej konferencii GPU Technology Conference predstavila novú generáciu svojich GPU, grafických procesorov, Volta.

Spoločnosť okrem predstavenia základných parametrov architektúry predstavila zatiaľ len jeden model Volta GPU s označením GV100, ktorý je optimalizovaný pre výpočtové akcelerátory a špecificky umelú inteligenciu. Grafické karty postavené na GPU novej generácie spoločnosť zatiaľ nepredstavila.

GV100 je zaujímavý pre dve zásadné inovácie. Potom ako sa štyri roky nemenil výrobný proces GPU a tieto boli vyrábané 28-nm procesom, v minulom roku prešla Nvidia u predchádzajúcej architektúry Pascal na 16-nm proces. Po roku u GV100 opäť prešla na nový výrobný proces, 12-nm výrobný proces spoločnosti TSMC označený FFN.

Druhou inováciou je popri známych jadrách architektúry CUDA zahrnutie aj úplne nových jadier označovaných ako tzv. Tensor jadrá. Tie sú efektívne pri násobení matíc a určené na akceleráciu trénovania neurónových sietí, čoraz dôležitejšiu oblasť IT.

Okrem toho sa v novom GPU zvýšil počet jadier, keď má 84 oproti 60 SM, Streaming Multiprocesorov, a až 5376 jadier CUDA oproti 3840. Tensor jadier je prítomných 672, L2 cache má 6 MB a pamäť je opäť typu HBM2, High Bandwidth Memory 2, s rozhraním šírky 4096 bitov.

GV100 je najväčším GPU Nvidie doteraz, má až 21.1 miliárd tranzistorov, plochu 812 mm2 a maximálnu TDP spotrebu 300 Wattov.


Akcelerátor Tesla V100, kliknite pre zväčšenie (obrázok: Nvidia)



Prvým produktom, v ktorom je GV100 použitý, je akcelerátor Tesla V100. Kvôli efektivite výroby takto veľkého čipu a použitiu aj čipov s malým počtom chýb je počet aktívnych CUDA jadier 5120 a Tensor jadier 640. Maximálny takt dosahuje 1455 MHz, rýchlosť prepojenia s pamäťou 900 GB/s a kapacita pamäte 16 GB. Zrýchlil aj prepoj NVLink použitý v novej verzii NVLink 2.

V100 má výkon pri 64-bitových výpočtoch na úrovni 7.5 teraflopov / s, pri 32-bitových 15 a pri 16-bitových výpočtoch 30 teraflopov / s. U P100 to bolo 5.3, 10.6 a 21.2 teraflopov / s.

Pri trénovaní neurónových sietí pomocou Tensor jadier dosahuje výkon až 120 teraflopov / s.

Tesla V100 bude dostupný v Q3 najskôr v podobe výpočtových serverov DGX-1, pričom v konfigurácii s ôsmimi GPU má stáť tento server podľa dostupných informácií 149 tisíc dolárov. Samostatné akcelerátory budú v predaji v Q4, s externým rozhraním PCI Express alebo NVLink.


      Zdieľaj na Twitteri



Najnovšie články:

Vydané Ubuntu 18.10, na 32-bitovú verziu už nejde ani upgradovať
Vedci dokázali, že kvantové počítače budú výkonnejšie ako klasické
Macy majú čoskoro prejsť na vlastné ARM procesory
Štátne elektronické služby majú vyzerať rovnako, štát vydal dizajn manuál
Výmena hlavného kľúča Internetu zrejme spôsobila jeden vážny incident
Samsung chystá viaceré QLC a 96-vrstvové SSD
Čínske mesto chce zabezpečiť nočné osvetlenie satelitom
Výrazný pokrok vo výrobe čipov, nasadenie extrémneho ultrafialového svetla
Monitor s pomerom 32 : 9 a 1440p rozlíšením
Certifikáty na eID si hneď od začiatku viac ľudí aktivuje cez Internet


Diskusia:
                               
 

Samé čipsy. Kto to má furt žrať.

Onedlho bude celý PC len kus kremíka...
Odpovedať Známka: -3.3 Hodnotiť:
 

No nebude to krásne :)
Odpovedať Známka: 8.5 Hodnotiť:
 

Ale hlavne ze konecne nebude trebat kresanim kamenov ohen zakladat ako kdesi v praveku, ale pekne po pansky v kancelarii.
Odpovedať Známka: 3.3 Hodnotiť:
 

Na akú hru proti človeku to bude použité tentokrát ?
Odpovedať Známka: 6.5 Hodnotiť:
 

Ruskú ruletu
Odpovedať Známka: 7.6 Hodnotiť:
 

Tolko povyku ... sak v SP32 to nema ani 2-nasobny vykon jak roky stare 28 nm (este raz pre istotu zopakujem: 28 nm !!!) AMD FuryX (8,5 TFLOPS) ... vypocetna karta kraluje akurat v DP64 a este to ma FP16 alebo 8.

AMD zachvilku vyda desktopovu hrascku grafiku (Vega) s vykonom 10-11 TFLOPS v max. konfiguracii 12,5 TFLOPS v SP32 co bude superit s OC 1080 Ti ... cely Polaris 4XX a refresh 5XX bolo len zahrievacie kolo 14/16 nm, pretoze z 28 nm to bol velky skok. Aj 28 nm ba poli desktopovych dedikovanych grafik kralovalo 5-6 rokov a zacinalo skromne: 512-640-768-896 SP, neskor 1024-1280-1536-2048-2304-2560 az nakoniec Fury 3584 a 4096 SP. Aj 14/16 nm u AMD zacinalo skromne, Polarisom, ktory mal 1/2 vykonu FuryX, ale dakedy v 2022 moze 14/16 nm u AMD koncit na 5-nasobku vykonu Fury X (40 TFLOPS s SP32). Kolko SP akeho vylepsenia GCN architektury a na akej frekvencii k tomu bude potrebnych je uz druha vec (mozno 5120, mozno 6144, mozno 7168, mozno 8192) ...
Odpovedať Známka: -3.8 Hodnotiť:
 

hoo prrrrr... precitaj si DDho clanok o Volta, a ked on uznal, ze je to pecka, tak to je proste pecka :)
Odpovedať Známka: 3.3 Hodnotiť:
 

Prečo sem ťaháš hráčsky segment? Tento produkt má iné zameranie. Pointa je zrejme "Pri trénovaní neurónových sietí pomocou Tensor jadier dosahuje výkon až 120 teraflopov / s", koľko TFLOPs dosiahne tá Vega/Fury pri trénovaní neurónových sietí?
Odpovedať Známka: 10.0 Hodnotiť:
 

sak pise... 40 tflops/s... o 5 rokov ;)
Odpovedať Známka: 10.0 Hodnotiť:
 

Kedze z hladiska hustoty 12 nm TSMC je to iste ako 14 nm GF ci Intelu a 16 nm (u kohokolvek) boli prve pionierske pokusy po velkom prechode z 28 nm a miernej uprave na marketingovych 20 nm (ale ako vieme desktopove dedikovane 20 nm grafiky neexistovali), tak vsetko 16-15-14-12 nm by som osobne hodil do jedneho vreca (vyroba CPU, APU, GPU, DRAM, NAND ...) zvlast ked rozdiely v hustote su iba zopar %... aj 10 nm TSCM by som tam hodil, pretoze z hladiska hustoty to bude opat na nerozoznanie od 16-14-12 nm. Jedina vynimka bude snad 10 nm Intelu. GF 10 nm preskakuje a prejde rovno na 7 nm. Dufam ze ked budu marketingove nanometre 1-cifrne, bude to ozaj riadne novy vyrobny proces aspon s 2-2,5-nasobnou hustotu oproti 16-15-14-12 nm, nielen kozmeticke vylepsenia ako 28-20 nm a 16-15-14-12 nm s minimalnym narastom hustoty. Obavam sa ale, ze to tak asi uz nebude.
Odpovedať Známka: -6.7 Hodnotiť:
 

nV 1080Ti ma 11,8 TFLOPS v SP32, hracska AMD Vega ma planovynych az 12,5 TFLOPS v SP32, takze to mozu byt vyrovnani superi.

Vypoctova Vega ma/bude mat 22 TFLOPS v SP32 (a nie trapnych 15) , ale zas nie tensor units ... bez zapojenia tensor units ma ale vypoctova Volta "iba" 15 TFLOPS ... holt v AMD budu musiet vydat vypoctovu Navi s obdobou tensor units pre AI a strojove ucenie.

nVidia je na poli GPU a vypoctovych GPU nieco ako Intel na poli CPU. Jednotkova cena za vykon je x-nasobna oproti konkurencii a predsa sa to preda ... proste znacka musi byt, musi to byt cpu intel, gpu nvidia, alebo pc apple ... proste ide o znacku

https://en.wikipedia.org/wiki/Sheeple
Odpovedať Známka: -6.0 Hodnotiť:
 

preto, ze k teslam existuje soft, k fire pro pomenej resp. su slabsie. Dalsi dovod je, ze nvidia je zabehnuta znacka, preco kupovat nieco ine, ked toto funguje dobre.. preto sa aj ryzen tak skoro nepresadi...
Odpovedať Známka: 0.0 Hodnotiť:
 

V profi segmente ide aj o podporu a tam sa AMD so svojimi polotovarmi nechyta.

Aj na pripade game grafik je jasne, ze TFLOPS nie su vsetko, ide o celu tu bizuteriu dookola, ktorej vysledkom je daleko vyssi realny vykon napriek nizsiemu TFLOPS papierovemu.

Firmy idu na istotu, to iste aj zakaznici, ktori nemaju chut vec zaplatit a potom este konat dorob si sam doma, preto ma AMD pred sebou este dlhu cestu kym sa vyhrabe z mizerie.
Odpovedať Známka: 2.0 Hodnotiť:
 

blbost, zakaznici su sprosti
Odpovedať Známka: 0.0 Hodnotiť:
 

Súhlas s Walthero. Síce papierový výkon je pekný, ale z tých AMD grafík to nik za rozumnú cenu nedostane.

V top 500 je momentálne jediný superpočítač, ktorý používa ako akcelerátory grafiky od AMD, a nejedná sa o náhodu. Dostupnosť vývojových nástrojov, tutoriálov a dokumentácie CUDA frameworku je tak v predu oproti akémukoľvek riešeniu od AMD, že tento priepastný rozdiel bude veľmi ťažké premostiť.

Podobne AMD chýbajú produkty (akcelerátory) pre IoT a automobilový priemysel. Oblasť GPGPU v AMD proste podcenili a zaspali.

Nesúhlasím s tým, že ide len o značku. V poli výpočtov je to skrátka viac o použiteľnosti, nie len o hrubom výkone.
Odpovedať Známka: 2.5 Hodnotiť:
 

Su v top 500 aj take, ktore pouzivaju grafiky od AMD a _jedna_ sa o nahodu?
Odpovedať Známka: -3.3 Hodnotiť:
 

A co by mal taky akcelerator pre IoT asi tak akcelerovat? Co by nedalo hociake ARM-ove udelatko?
Odpovedať Hodnotiť:
 

Dnes typicky moderné evaluácie neurónových sietí. Kamery s detekciou tvárí (osôb) napríklad.
Odpovedať Hodnotiť:
 

neco na tom mozno bude
Odpovedať Známka: -3.3 Hodnotiť:
 

A ešte donedávna tvrdiť, že AMD disponovalo procesormi ktoré výkonovo dosahovali na Intel, resp. majú dobrý pomer výkon / spotreba, bolo, prinajmenšom, odvážne, a čakal by som viac objektivity.

Dnes je situácia našťastie lepšia, ale objektívne tvrdiť, že ľudia sú ovce je prehnané.

Čo sa týka superpočítačov, Intel tiež dominuje AMD, aj keď si za to pýta nemálo peňazí, v softvérovej podpore. Disponuje svojím kompilátorom, slušnou dokumentáciou a podporuje vzdelanie v oblasti svojich produktov. Tiež lobuje financiami, ale to je zas na inokedy...
Odpovedať Známka: 4.3 Hodnotiť:
 

Mozno by si sa mal zamysliet, preco sa Nvidia predava.

1070/1080 vysli pred rokom.

1080Ti vysla pred 3 mesiacmi.


AMD ide po roku vydat nieco na trh, co dorovna, co mame na trhu uz rok. Cize asi tak.
Odpovedať Známka: 10.0 Hodnotiť:
 

Pjetro, zbytočne si tu „honíš“ čísielka a „teraFLOPy“...

Nvidia má CUDA. Vieš, čo to je?
Lebo z toho, ako píšeš, mám pocit, akoby si o tom nemal ani potuchy.

Nie som nvidiotský zlobor (troll); sám som bol fanATIkom – mal som AIW Radeon 9700 Pro / AIW Radeon 9800 Pro (po tom ako som tú 9700-ovku odpálil pri čistení debny, mi dali 9800-vku), potom som mal Radeon HD 3850 AGP (prvá s vodným chladením), ďalšou bola Radeon HD 6970 (pre mňa vôbec najlepšia karta všetkých čias, lebo ako jediná si na seba zarobila – samozrejme, že s vodným chladením)...
Odpovedať Hodnotiť:
 

... ale samozrejme, po pár rokoch už na ťaženie nemalo zmysel ani pomyslieť... a uvedomil som si, že taká GeForce GTX 960 je už nielenže výkonom mierne predstihuje Radeon 6970, ale robí to s polovičnou spotrebou a má navyše kopu vychytávok, (ako napríklad urýchľovanie dekódovania 4K H.265) – skrátka, AMD bolo ďaleko pozadu za Nvidiou, pretože kým Nvidia neustále vynovovala, tak v AMD vydávali v podstate stále to isté... a tak som napokon presedlal (kedysi nepredstaviteľné!) – a veruže som to nikdy neľutoval!

Ďalšou mojou vyvolenou preto stala MSI GeForce GTX 1060 6GT OCV1... (k Ryzenu)
Odpovedať Hodnotiť:
 

A vtip je práve v tom, že podporujú CUDA, takže máš kartu, na ktorej sa môžeš so všeličím zahrať – a nemusia to byť len hry. A to, že sa na nej dajú popri tom zahrať aj hry, je už taký prídavok.

Načo mi je nejaká karta so surovým veľkým výpočtovým výkonom, keď ju nemám na čo využiť?!

Hovorím, odkedy som presedlal, tak sa nečudujem, že v tomto Nvidia tak vedie. Ona totiž do CUDA aj pomerne dosť veľa vrazila... A vtedy som pochopil, že v podstate za takú istú (alebo len o trochu vyššiu) cenu – lebo sa zdá, akoby karty boli naceňované podľa výkonu v hrách – mám ja v konečnom dôsledku oveľa viac „zábavy“. A nečudujem sa, že si ju vyberajú aj vývojári.

AMD len teraz začína s Instinct-om.

Ja viem, že je to špinavosť, že v podstate podporujem hnusný kapitalistický monopol a že je to odo mňa nemravné... no ale tak to skrátka je.
Odpovedať Hodnotiť:
 

Ja to nechápem. Človek upozorní na gramatickú chybu v článku a redakcia daný komentár zmaže, ale chybu neopraví. A to nie je prvý krát. Hlavne že blbosti v komentároch nechávajú.
Odpovedať Známka: 10.0 Hodnotiť:
 

nj, presne tak, tiež som tu ráno napsal pochvalný koment, priamo k veci, k téme, (ale aj vetu o tom, že by sa už po všech těch rokoch zišiel nejaký prehledový článek, nejaké zhrnutie (tabulkou, /aabo timeline), lebo už sú tie gpu, /cpu kus neprehladné, matúce - s čím súhlasil aj další komentujúci),
a tiež ma 2x zmazali..

nj, však pražáci, blaváci - zmrdi-manažéri (určo nemajú víac jak 25- max. 30 roků..)

by som ich poslal na stavbu, kvádre nosit, abo do lesa, drevo, kmene ručne tahat, oklieštovat, do skladů..
za 2 koruny /hod.

clvek sa im tu snaží, píše, otročí im tu zadarmo, na ich pageranky, a pagehity, na ich BEZPRACNE zisky z reklamy, pre pánov továrnikov, a ešte ho aj takto vykopnú na holú dlažbu, na holo´mrázy :/ :(

Odpovedať Známka: 1.1 Hodnotiť:
 

nic si z toho nerobte, mne uz ten jebo s dawnovym syndromom zabanoval vsetky ipcky z ktorych sem normalne chodim.

PS: trtko pozri si aspon co banujes (tuto tu) a nech ta od riti po lopatky rozdrapi.
Odpovedať Známka: 10.0 Hodnotiť:
 

tesla je v prvom rade urcena pre narocne vypocty (napr. je to jedina GPU ktora je podporovana CST microwave pre dedikovanie vypoctov) a nepride mi vhodne ju porovnavat s hracskymi kartami. To je ako porovnavat Quadro a TI1080 a vyhlasit ze Quadro je slaby smejd. Absolutne neporovnatelne karty. Takze ak tu chce niekto porovnavat Teslu, tak prosim, ale k niecomu co ma rovnake urcenie.
Odpovedať Známka: 10.0 Hodnotiť:
 

kedy to bude na ALZE?
Odpovedať Hodnotiť:

Pridať komentár