Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
Cinema 4D
NVidia GK 110 čip a CUDA computing (01 - představení, technologie)
29. května 2014, 14.09 | V oblasti GPU se komunita uživatelů vždy štěpila. Na jedné straně tábor červených příznivců ATI, respektive AMD, na straně druhé zelených příznivců NVidia. A ani sami výrobci nedělají uživatelům situaci snadnou. V tom vládne ten, v tamtom onen. A jsou oblasti, ve kterých jsou vody velmi poklidné a pod výsostní vlajkou jedné z barev. V případě AMD je to bezesporu OpenCL, tam však občas může NVidia zabrousit. V případě NVidia je to CUDA. CUDA, kde vítr vane silně, ale vždy jistě a jedním směrem. CUDA je odpověď. A když CUDA, pak čipy Kepler GK 110. Pojďme se podívat na to, jak se těmto verkrze výpočetním kartám daří v oblasti, pro kterou byly zrozeny...
Historie
Pojďme nejdříve trochu do historie. Historie z pohledu vývoje hardware dost dávné, protože dva roky jsou opravdu hodně. A co více, když se podíváme na roadmapy Nvidie, pak jsme na konci produkční živnosti celé řady Kepler. Přesto pořád jsou čipy GK 10 tím nejlepším co NVidia nabízí a navíc jsou opravdu velmi výkonné. Tak, že naplňují i velmi optimistické předpoklady, které se kdysi při příchodu celé řady vyrojily.
Také jsem se nechal nachytat. Při prvním schlédnutí parametrů karet Kepler jsem lapal po dechu. Představa až tisíců výpočetních stream jader mne nenechávala klidnou a věštil jsem sladkou budoucnost unbias GPU výpočtů takřka v reálném čase. Jenže situace byla jiná.
A to proto, že valná většina čipů GK není ve výpočtech efektivní. Důvodů je mnoho, zejména ale malá průchodnost (šíře sběrnice a pod). To může být částečně nahrazeno množstvím stream procesorů, ale obecně je tento limit klíčový. A tak se očekávání nenaplnilo. Až do, až do chvíle, kdy přišel čip GK 110.
Čip GK 110 byl ale nejdříve vyhrazen jen a pouze výpočetním kartám Tesla, a to kartám s označením Tesla K20X a Tesla K20. A tyto karty jsou, jak jinak, velmi luxusním zbožím.
http://www.nvidia.co.uk/object/tesla-server-gpus-uk.html
Uživatelé CUDA technologií tak museli dále čekat. A čekali tak, že používali staré karty GF580 a 590, které plnily kapsy ČEZu. Výkonu měly poměrně dost, ale ta spotřeba byla opravdu příšerná.
Situace se změnila ve chvíli, kdy NVidia přeznačila a mírně aktualizovala svou produční řadu a přišla s označením 7xx. V té chvíli totiž uvedla čipy GK 110 v kartách, které tvoří špičku, high end, celé rodiny GeForce. V ten okamžik se tedy dostaly opravdu výkonné výpočetní nástroje CUDA všem, kteří je potřebovali. A to bez ohledu na cenu, o které se často diskutuje...
Proč? Možná se vám situace může jevit poněkud jiná, ale nikdy dříve nebyla hranice mezi AMD a Nvidia tak ostře vymezená jako dnes. Obě řešení mají i opravdu ultimativní produkty a jen velmi těžce se zvažuje, které řešení je obecně lepší. Pravdou je, že AMD má obrovský náskok (obecný) v OpenCl, na stranu druhou, CUDA je devizou NVidia. CUDA a NVidia jedno jest, do této sféry nemůže nikdy AMD proniknout.
Pravdou však je i to, že množství společností zabývajících se grafickými programy již nabízí OpenCl a to i tehdy, kdy dříve nabízely jen CUDA (Adobe Premiere Mercury player například), u jiných to neplatí a to i přes proklamovanou podporu (jako tomu je například v případě aplikací The Foundry, které případnou akceleraci OpenCl nenabízí). Hraniční spory mohou být velmi ostré...
Porovnání
Můj názor? Opravdu názor. Ale obecně lze asi tvrdit, že NVidia má obecně poněkud nižší spotřebu (nikoliv zásadně), pokud je aplikace pouze CUDA, pak CUDA mívá vyšší efektivitu než OpenCL, tvrdí se, to však například v CINEMA 4D nemohu až tak potvrdit, že má Nvidia lepší ovladače. V současné chvíli ale AMD v CINEMĚ 4D rozhodně nechá NVidii za sebou, má vynikající výkon OpenCl, kdy karta středního segmentu překonává high end NVidia, nižší cenu v porovnání ve stejném segmentu a to často velmi zásadně. Jednoduše, pro mne osobně, v současné chvíli, na konci životnosti řady Kepler, je hlavní a neotřesitelnou pevností NVidia CUDA. Díky GK 110 extrémně výkonná.
Grafické karty s čipem GK 110
Jaká je tedy nabíkda karet osazených čipem GK 110? Poměrně pestrá, pojďme si to projít...
GeForce GTX 780 (bez přídomku), neupravená referenční karta:
Počet stream procesorů: 2304 CUDA
Základní frekvence: 863 (MHz)
Boost: 900 (MHz)
Specifikace pamětí
Frekvence pamětí: 6.0 Gbps
Kapacita: 3072 MB DDR5
Sběrnice: 384-bit
Datová propustnost: 288.4(GB/sec)
Orientační cena: od cca 11.800 s DPH
GeForce GTX 780 Ti (referenční karta):
Počet stream procesorů: 2880 CUDA
Základní frekvence: 875 (MHz)
Boost: 928 (MHz)
Specifikace pamětí
Frekvence pamětí: 7.0 Gbps
Kapacita: 3072 MB DDR5
Sběrnice: 384-bit
Datová propustnost: 336(GB/sec)
Orientační cena: od cca 15.200 s DPH
GeForce GTX TITAN:
Počet stream procesorů: 2688 CUDA
Základní frekvence: 837 (MHz)
Boost: 876 (MHz)
Specifikace pamětí
Frekvence pamětí: 6.0 Gbps
Kapacita: 6144 MB DDR5
Sběrnice: 384-bit
Datová propustnost: 288.4 (GB/sec)
Orientační cena: od cca 21.700 s DPH
GeForce GTX TITAN Black:
Počet stream procesorů: 2880 CUDA
Základní frekvence: 889 (MHz)
Boost: 980 (MHz)
Specifikace pamětí
Frekvence pamětí: 7.0 Gbps
Kapacita: 6144 MB DDR5
Sběrnice: 384-bit
Datová propustnost: 336 (GB/sec)
Orientační cena: od cca 24.200 s DPH
Uvedený seznam ale není konečný, ještě si jej můžeme doplnit a to následující informaci. Není to tak dávno, co NVidia ohlásila duální řešení založené na Titanech. Prozatím není tato karta k dispozici, bude velmi exkluzivním a drahým zbožím, ale také velmi výkonná (jedná se o dvě karty spojené do jednoho boxu. Předpokládané specifikace jsou následující:
GeForce GTX Titan Z
Jak jsme zmínili, tato karta prozatím není v prodeji. Očekávaná cena je 2999 USD (očekávaná, zda skutečně je otázka, protože obdobné AMD řešení je výrazně levnější a je otázkou, jak bude NVidia, a zda vůbec, reagovat).
Jedná se de facto o dvě karty Titan spojené do jednoho boxu, pokaždé s 6 GB RAM. Celkově je celé řešení 2,5 slotové. Celkově se sice bude uvádět 12 GB paměti, to ale není v případě výpočtů relevantní, protože tam je klíčem nejnižší potenciál a paměti nejsou pomocí. Obecně tedy, není pro výpočet vhodné, aby byly vaše karty propojené pomocí SLI můstku (stejně jako v případě Opencl není žádoucí propojení CrossFire u AMD).
GeForce GTX 780 (+780 Ti) 6 GB Ram
Nejvýhodnější možností se zdá koupě přicházejících nereferenčních modelů karet 780 a 780 Ti, které budou nově osazené 6 GB Ram. Dostaneme tak opravdu velmi zajimavý výpočetní nástroj s velkým potenciálem. Cena takových řešení také není až tak drastická, první taková vlašťovka od EVGA má cenovku 570 USD, což není cena nikterak dramatická. Můžeme si tak představit stanici se dvěmi, třemi kartami, které ve výsledku dají opravdu obrovský výkon. A cena nebude až tak strašná, pokud bychom předpokládali tři karty 780 s cenou okolo 600 USD (v České republice), pak je cena tří karet 1800 usd, což je řekněme 36.000. Pokud připočteme slušný podvozek v podobě i7 4930, pak stanice s rozpočtem okolo 50-55.000 dá takový výkon, který skutečně dostává termín realtime do života.
http://www.evga.com/products/product.aspx?pn=06g-p4-3787-kr
Nereferenční modely
Nereferenční modely jsou dnes alfou a omegou u obou výrobců. Jak AMD tak NVidia používá, a já se za toto tvrzení omlouvám, mizerné referenční chladiče. K dispozici máme kartu referenční (780, bez brandingu nějakého poskytovatele, jedná se o pure sample) a zde je chlazení opravdu schodné s AMD.
Tedy v zadní části je větráček, který lopatkami vhání vzduch přes blok plátkových žeber ven. Potíž je s účinností tohoto systému. Ta je poměrně nízká (blok s hliníkovými žebírky je de facto přímo na jádru), ve výsledku se tedy čip rychle zahřívá, to vede k vyšším otáčkám větráčku, to vede k vyšší hlučnosti, s vyšší teplotou se zvyšuje odpor a tím i teplota a je to začarovaný kruh. Referenční chladič kartu uchladí, ale rozhodně bych doporučoval nereferenční chlazení. To poskytují vlastně všichni výrobci, například je poměrně dobře hodnocený Phenom od Gainwardu. Tedy rozhodně se, v jakémkoliv případě, rozhlížejte po nereferenčním chlazením. To platí jen pro karty 780 a 780 Ti, protože na Titan si NVidia nenechá šáhnout a prodává se jen a pouze s referenčním chlazením.
http://www.vortez.net/articles_pages/gainward_gtx_780_phantom_glh_review,25.html
Nereferenční karty mají většinou vyšší takty a případně jinak akcelerované parametry, ale obecně pro výpočet není toto navýšení až tak významné.
Mimo to, jen poznámka pod čarou, je vhodné použít tyto karty namísto profi? To je trochu potíž s výstupem, protože výstupy těchto karet jsou striktně 8-bitové, tedy nepodporujjí 10-bit panel. Pokud ale takový panel nemáte, není co řešit!
Aplikace, které využívají CUDA
Vím, že to není otázka pro uživatele grafických aplikací, ale přesto se často na různých, pravda zejména hardwarových serverů, objevují dotazy, k čemu že ta CUDA vlastně je. Pojďme si to znova projít. Nedávám si přitom patent na to, že se jedná o výčet úplný. Jedná se o výčet z hlavy, aplikací, které jsou běžně známé.
Rendering
Octane render (Otoy): http://render.otoy.com
NVidia Iray (včetně různých klonů a odvozených aplikací): http://www.nvidia-arc.com/iray.html
Thea render, engine Presto (SolidIris technologies): http://www.thearender.com/cms/
Blender Cycles (CUDA verze): www.blender.org
Indigo renderer (pouze jeden režim, jen některé technologie, Glare technologies): http://www.indigorender.com/
Furyball (AAA Studio): http://furryball.aaa-studio.eu
Simulace
Marvelous designer, simulace látek (Virtual Fashion Inc.): http://www.marvelousdesigner.com/
Turbulence4D, simulace fluidních jevů (Jawset Visual Computing): http://www.jawset.com/
Post produkce a video
Nuke (The Foundry): http://www.thefoundry.co.uk/products/nuke-product-family/
Adobe Premiere – Mercury player (Adobe): http://www.adobe.com/products/creativecloud.html?promoid=JQPEQ
Adobe After Effects – některé prvky a pluginy (Adobe): http://www.adobe.com/products/aftereffects.html
Mimo zmíněných technologiích je možné karty s čipem GK 110 využít i v případě OpenCL technologie. Není to sice tak výkonné řešení, ale přesto jsou zde tyto karty již velmi dobře upotřebitelné:
Rendering
Luxrender: http://www.luxrender.net/
Video
Sony Vegas (Sony): http://www.sonycreativesoftware.com/vegassoftware
Na konci úvodu...
Jak vidno, výpočet není ani v případě klasické grafiky otázkou ojedinělou a může být zásadní otázkou v případě nákupu grafické karty. Jak se chová GeForce 780 v praxi se podíváme příště. V praktických testech.
|
|
|
|
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
11. května 2014
-
23. května 2014
Epson na konferenci Droidcon Berlin ukázal nové možnosti čekající na vývojáře OS Android
-
24. listopadu 2014
-
13. května 2014
Samsung NX3000: retro styl, špičkový výkon a snadná konektivita v jednom přístroji
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
15. prosince 2014
Konica Minolta pomůže živnostenským úřadům s digitalizací dokumentů
-
11. května 2014
-
26. listopadu 2014
Canon Junior Awards již posedmé ocení mladé fotografy v rámci Czech Press Photo
-
21. srpna 2014