CUDA: grafická karta umí vše
Článek se nese v duchu mírně polopaticky (omlouvám se těm inteligentním z vás) komentované prezentace, fotek, a občas videí. Pokud trpíte chronickou nedočkavostí, čtěte odzadu dopředu, ne že by CUDA či Ion nebyla zajímavá témata, ale jak jsem již nastínil, velkým hitem byla Tegra, kterou jsem proto prozíravě schoval dozadu.
CUDA rozváží pizzu a vraždí ATI Stream
Hezky odzačátku. Proč se vlastně všichni snaží počítat všechno přes grafickou kartu a nikoliv přes procesor? Michael Steele nám to vysvětlil pomocí pizzy, což chápou všichni Italové a Američani. Na následujících slajdech vidíte pana CPU, jak rozváží pizzu mezi domy. Je vidět, že pan CPU je sice profesionál, ale je na to sám a objíždění všech domů mu nesvědčí. Společnost GPU shaderů na motorkách to zvládne ve zlomkovém čase. Proč? Všechno tkví v paralelizaci. A v předpokladu, že vám nechybí pece či rajčata, jak poznamenal jeden přítomný novinář.
Nvidia netvrdí, že se bez procesoru obejdeme, pouze vyzdvihuje masivně paralelní GPU „se stovkami jader“ jako mnohem silnější nástroj pro paralelní úlohy. A co že je CUDA? CUDA není rozhraní, ani jazyk, jak se mnozí domnívají, nýbrž architektura. Ano, to A v názvu stojí pro architekturu (Compute Unified Device Architecture). CUDA je tedy systém, jakým jsou grafická jádra postavena, nelze říci: „Tak, a ode dneška budou Radeony HD 4800 podporovat CUDA“.
Postupujme tedy následovně:
1) vezměme sobě GPU od Nvidie, které je postaveno na architektuře CUDA (GeForce 8 a novější)
2) vezměme programovací jazyk či API, který CUDA umí použít, tedy například C s CUDA příponami, OpenCL, DirectX Compute Shadery, Fortran, Javu či Python.
3) a naprogramujme na jazyku či přes API aplikaci, která bude skrze CUDA využívat k všeobecným výpočtům grafické jádro.
Michael Steele z Nvidie potom názorně ukazuje, že ATI Stream nemá API a programovací jazyky. Pokud si ovšem ty zelené brýle sundáte, pochopíte, že DirectX Compute či OpenCL jsou API, která s příslušným ovladačem fungují na libovolném GPU s podporou DirectX 10 a výše, CUDA je zde tedy zcela nepodstatná.
CUDA a symbióza s Windows 7
Windows 7 a jeho DirectX Compute API dovede používat nejen grafické karty pro DirectX 11 (Fermi a Evergreen), ale i současnou generaci s podporou DirectX 10 či 10.1.
Co že je ta nativně vestavěná konverze médií zač? Stačí sjet zrakem o kousek níže. Chcete si do telefonu či do MP4ky překopírovat nějaké video, nebo zkrátka nějaký multimediální obsah? Ve Windows 7 to vyřešíte klasickým drag'n'drop (ne, nemyslím to tahání počítače ze skály). Myší přetáhnete video do telefonu, a systém vám rovnou nabídne, že video převede na formát, který telefon bude schopný přehrát. A s CUDA to nyní může akcelerovat grafická karta – přes API DirectX Compute.
Pan Steele tedy zkusil Full HD video převést rovnou touto automatickou konverzí napřed na Nvidia Ionu (jehož GeForce 9400 s 16 shadery CUDA podporuje) a potom na klasickém Intel Atomu. Výsledek? Atom samotný video převáděl zhruba sedm minut, Atom s GeForce 9400 (tedy Ion) to zvládl za minuty tři.
Jelikož CUDA se využívá zejména na operace ohledně videa, Nvidia ještě stihla náležitě podtrhnout, kolikrát rychlejší bude konverze s použitím CUDA a bez něj (není bohužel psáno, jaký procesor a grafickou kartu to porovnávali).
Fotokomora, oprava domácích videí, převody videa bez legrace – to vše stále s CUDA
Na konec ještě tři pěkné a užitečné aplikace pro CUDA – jako první nVDarkRoom, zatím nevydané demo.
„nVFotoKomora“ je skvělou věcí pro fotografy-profesionály, kteří fotí v RAW formátu. Fotky v RAW formátu jsou ideální pro úpravu na počítači, přes procesor ale jejich úprava často trvá nepěknou chvíli (když má jedna fotka desítky MB). V Nvidii vymysleli způsob, jak to zprovoznit přes CUDA GPU. Načtete si třeba padesát obřích RAW fotek a všechny naráz můžete upravovat. Když úpravy aplikujete, můžete to udělat přes procesor, nebo několikanásobně rychleji přes grafickou kartu (GeForce GTX 295 vs. Core 2 Quad Q9550). Užitečné, skoro jako pizza, že?
Věcí, kterou ocení nejspíše více z vás, je nástroj vReveal od MotionDSP. Tento prográmek maximálně jednoduše, jedním kliknutím vaše videa zbaví šumu, zestabilizuje je, upraví automaticky kontrast, zvýší rozlišení a další věci. Z vlastní zkušenosti vím, že zejména stabilizace hodně pomůže rozklepaným domácím videím. Opět, významným pomocníkem je zde CUDA, použitelná jak při přehrávání, tak při převodu videí. Pro srovnání – procesor Core 2 Duo E6550 na 3,2 GHz převedl video se smartbookem za 3 minuty, zatímco grafická karta GeForce 9800 GTX to stihla za 40 sekund.
Poslední ukázkou je vám už možná známý Super LoiLoScope – editor videa pro děti. Velmi snadný a intuitivní nástroj vám videa upraví, sestříhá, spojí a exportuje v množství formátů, to vše akcelerováno grafickou kartou. Malá ukázka natočená na prezentaci viz výše.
40nm GeForce, Ion, 3D Stereo
GeForce M v 40nm kabátě
Všechno se točí kolem notebooků. Jak nám bylo vysvětleno, čím úspornější zařízení, tím více se jich prodá. Mimojiné proto se posouváme od desktopových počítačů přes velké notebooky až k Tegře.
Nové 40nm GeForce M přinášejí podstatnou úsporu energie při zdvojnásobení výkonu, což je věc, která se nám u notebooků maximálně hodí.
Nvidia se také chlubí starými známými věcmi, jako vyšším výkonem v SLI ve Windows 7 (tradiční beznulový graf to jistí), či podporou PhysX nebo CUDA.
Pokud se chcete podívat na specifikace jednotlivých karet zde vypsaných, pak vězte, že specifikace nových mobilních GeForce jsme už na Extrahardware představovali.
Posléze se Nvidia korunovala na královnu notebooků všech cenových segmentů a doporučila výše zobrazené tři. Ukázala ovšem více, jen klikejte. Notebooky bývaly vystavovány obvykle s nějakou hrou, graficky akcelerovaným Full HD videem či CUDA aplikací. Jenom pozor na cedulku u Dell Studio 14z – notebook klamě tělem, a navzdory tomu, že cedulka píše o BadaBoomu, notebook nám ukazuje hezký barevný Super LoiLoScope s Magnetem :-)
Nvidia 3D Stereo
Dříve než se pustíme do Atomů+, neboli Ionů, dáme si malou přestávku v podobě pokochání se černými plastovými brýlemi a sledováním opravdu trojrozměrného dema na Samsung 2233RZ monitoru.
Nvidia prý hodlá prodávat i papírové brýle za velice nízkou cenu, případně dodané ke grafickým kartám GeForce, aby se lidé chytili na vějičku a koupili si potom celý 3D kit s plastovými brýlemi a kvalitnějším pohledem na 120Hz obraz.
Trocha Ionu před perličkou na závěr?
Neměli bychom zapomínat ani na Nvidia Ion, poslední dobou vcelku slavný produkt. Dnes se o něj ale pouze otřu, čeká nás totiž něco velkolepějšího. Nvidia zkrátka ukázala notebooky postavené na Ionu a zpravidla na nich pouštěla CUDA aplikace či plynulé přehrávání HD videa.
Výhody Ionu oproti Atomu nejspíše znáte – na Ionu si nějaké starší hry zahrajete lépe než na Atomu, HD video není problém přehrávat přes grafickou kartu (viděli jsme Full HD 1080p Star Trek na Ionu, naprosto plynule a bez zátěže procesoru a poté na Atomu, který jednoduše nezvládal), převody videa a vůbec všechny možnosti co nabízí CUDA jsou na Ionu = Atomu s GeForce 9400 proveditelné. A s tím vším má výsledek stále téměř identickou spotřebu. Více o Ionu se můžete dočíst v chystané recenzi Aceru AspireReva.
Po řadě vidíte: Ion s dvoujádrovým Atomem od AsRocku, Ion v podání Asusu, a Ion-HTPC skříň Luxa2, která byla vystavena i na samotné prezentaci.
Možná jste si všimli, že nepoužívám slovo netbook. Stačí si nasadit zelené brýle a vše je jasné. Ion totiž svými výše vyzdviženými výhodami eliminuje nevýhody netbooku jako neschopnost přehrávání HD videa či hraní her a to z něj dělá plnohodnotný notebook. Konkurencí k Ionu by měla být chystaná nová řada Atomů a jejich čipsetů (Pinetrail), takže dnešní Atom brzy dostane na frak i z vlastní stáje.
To nejlepší jsem sliboval nakonec a dodržím to. Přichází Tegra, aneb kompletní PC se spotřebou pod 1 W.
Tegra, rychlé notebooky s výdrží 25 dní
Tegra – nežere nic, umí vše. Nic víc už nepotřebujete.
Uděláme počítač, který nebude spotřebovávat elektrickou energii. Pár čipů s nulovou spotřebou na jedno PCB a máme univerzální počítač bez potřeby napájení. No dobře, tak se vejdeme do 150 mW. A tak vznikla Tegra.
Tegra je čip, který v sobě spojuje celkem osm procesorů, osm výpočetních jednotek. Každá část čipu se specializuje na něco jiného, myslím, že obrázek hovoří vcelku názorně.
„Celý počítač, lepší než Atom, se spotřebou 150 mW – cvak, cvak, ách“
Když všichni dostali kartičky, na kterých byl v životní velikosti tento obrázek, začala další fáze omračování daty. Předpokládám, že přečtete, co vidíte na obrázku. Je to téměř kompletní počítač bez monitoru a periferií. Základní deska s procesorem, grafickou kartou, operační pamětí, flashovým úložištěm dat a čipem se správou napájení. Jak jsem již zmínil, tato destička má spotřebu pod 150 mW. Kam se hrabe superúsporný Intel Atom se svými dvěma watty jen pro procesor, když tady Tegra se vejde do 150 mW i s celým systémem.
Pokud se budeme zabývat přesnými parametry, pak v sobě Tegra 650 obsahuje a umí:
• procesor ARM11, 750 MHz, MPCore
• paměť LP-DDR 200 MHz
• podpora HD videa, podpora natáčení HD videa
• výstup na displej až 1920 × 1080 24-bitů
• podpora WiFi, diskových jednotek, myší, klávesnic a dalších periferií
Tegra pro mobilní telefony (APX 2500 a 2600) je stavěná trochu jinak, má pomalejší procesor, NAND operační flash paměť a vůbec je to procesor specializovaný přímo na smartphony, včetně podpory zařízení (např. podporuje až 12,1 MPix fotoaparáty).
Právě se díváte na moment celé prezentace. Když se ona zázračná destička objevila na scéně naživo, spustily desítky fotoaparátů a nadšených vzdechů.
Říkáte si, že když má Tegra takovou neuvěřitelně nízkou spotřebou, nemůže se přece jednat o plnohodnotný počítač. Tak na rovinu – jediné, v čem Tegra nepřekonává Atom, je nepoužitelnost klasických Windows. Pádný argument odpůrců x86 procesorů tu zasazuje těžkou ránu Microsoftu. Tegra totiž není procesor x86 architektury, a proto na ní nemohou běžet Windows. Ovšem ořezané spartánské Windows CE ano, tak se podívejme, jak to vypadá...
Na smartbooku Mobinnova Elan jsme viděli neuvěřitelné věci. Stačilo jen připojit velkou LCD obrazovku a orgie mohly začít. 150 mW destička zvládla nabootovat Windows CE, zapnout pravý Firefox a surfovat po internetu. Po dohodě s Adobe umí grafiky od Nvidie akcelerovat Flash a jelikož to platí skutečně na všechny moderní grafiky, tak světe div se – narozdíl od Atomu nemá Tegra s flashem sebemenší problémy. Na jednom obrázku vidíte, jak prezentátor neuvěřitelně plynule prohlíží flashové mapy země, o něčem takovém si může mnohonásobně žravější Atom nechat jen zdát. Vše se hýbe stoprocentně plynule.
1080p Full HD video není pro Tegru také žádný problém. 150mW čip nám dekódoval a přehrál bez problémů Full HD video, zcela plynule. Abychom to zkombinovali s flashem, přehrávání videí na HD kvalitě na Youtube bylo také dokonale plynulé, což je věc, kterou žádný Atom nesvede. Kochejte se obrázky a videem.
Smartbook s Tegrou, Mobinnova Elan, v rukou Václava Vlčka – video:
Na trh Tegru uvedli kromě Mobinnovy také: Microsoft, Compal Communications, ICD,
Inventec Applications, Pegatron, Wistron a zhruba dvacet dalších výrobců. Tegra není určena pouze do smartbooků-netbooků, ale Microsoft ji například použil ve svém novém Zune přehrávači. 25 dní na baterie je velkým pokrokem i tam.
Tegra v tabulce - 25 dní výdrže smartbooků
Tegra spojuje dohromady výhodu smartphonů (dlouhá výdrž na baterie) a
notebooků (velký displej s Windows, pohodlné prohlížení webu s flashem,
přehrávání HD videa). Proto se netbookům s Tegrou říká smartbooky.
Takový smartbook předčí co do rychlosti bez problému netbooky na Atomu,
a jak je na tom s výdrží?
První řádek, přehrávání hudby s vypnutým displejem, nám doslova vyrazil dech. Na chytrém telefonu s procesorem Qualcomm Snapdragon, současnou jedničkou na poli smartphonových procesorů, můžete přehrávat hudbu 60 hodin. Netbook s Atomem vydrží zhruba 8 hodin, možná více (zelené brýle pracují). A smartbook s Tegrou, např. Mobinnova Elan, podržte se, 25 dní.
Se zapnutým displejem můžete s Tegrou 10 hodin přehrávat HD video, hrát Quake III Arena dokonale plynule a akcelerovat flash. A to je dnešní Tegra. Co bude za rok?
Příští generace Tegry, která se má na trh dostat v první polovině roku 2010, má se stejnou spotřebou čtyřnásobný výkon, a plánuje se i dále, stále se 150 mW.
Nvidia v Mnichově předvedla rozhodně spoustu zajímavých věcí, ale za opravdu největší úspěch považuji nejen já právě Tegru.
Přečtěte si také:
• Nvidia je nadšena z Windows 7, Ion PC už za 5500 Kč
• Kozy ven, Tegra do ruky, aneb Nvidia na Computexu
Zdroj: wikipedia.org