Proč je PhysX na CPU pomalý?

8. 7. 2010

Akcelerace herní fyziky na GPU pomocí rozhraní GPU PhysX je více či méně žhavým diskuzním tématem již pár let. Nvidia hlásá, že akcelerovaná fyzika je dvou- až čtyřnásobně rychlejší, než kdyby výpočty prováděl procesor. Již v minulosti ale kalifornská společnost byla nařčena, že CPU PhysX úmyslně zpomaluje: u grafického jádra PhysX profituje z velkého množství paralelních výpočetních jednotek, na vícejádrových procesorech ale většinou zabere pouze jediné jádro.

Nvidia se brání, že nechává na vývojářích her, zdali PhysX implementují vícevláknově. Konspirační teorie, že Nvidia na vývojáře v zákulisí vyvíjí tlaky, aby PhysX neoptimalizovali, navždy zůstanou jen v rovině spekulací. Je tedy Nvidia v celé situaci nevinně, nebo je to naopak ona (či Ageia, kterou odkoupila), kdo PhysX na CPU záměrně zmrzačil? David Kanter ze serveru Real World Tech se rozhodl rozetnout všechny pochybnosti a spory. Ve svém článku hlouběji zmapoval, jak PhysX provádí výpočty na CPU, a došel k poměrně zajímavému zjištění.

Knihovny PhysX (PhysXCore.dll, ole32.dll) ve velké míře používají instrukce x87, které přibližně před 20 lety rozšířily repertoár x86 o floating point výpočty (s plovoucí desetinnou čárkou). Během uplynulých let byly tyto instrukce nahrazeny sadou SSE a SSE2; Intel, AMD i Microsoft považují sadu x87 za zastaralou a nedoporučují její používání. A není divu: dnešní procesorová jádra umí provést maximálně dvě x87 operace za takt, zatímco SSE operací s 32bitovou přesností (single precision) zvládnou až osm a budoucí generace procesorů Intelu s instrukcemi AVX dokonce dvojnásobek. David Kanter odhaduje, že použití SSE2 by CPU PhysX mohlo realisticky zrychlit minimálně dvakrát. To by stačilo, aby hra jej využívající dosáhla hratelných framerate.

Proč tedy PhysX využívá zastaralé instrukce x87 namísto moderních SSE, když všechny procesory v roce 2005 už podporovaly SSE2 (Ageia PPU karta vyšla v roce 2006)? Podle Davida Kantera jednoduše proto, že to Ageia nebo Nvidia tak chtěly. Odhaduje, že upravit a překompilovat knihovny PhysXu by zabralo jeden až dva dny a maximálně dva týdny testování navrch. Jenže je zřejmé, že Nvidia by musela být padlá na hlavu, aby své akcelerátory připravila o výhodu, kterou ve hrách s GPU PhysX nyní mají.

Celý článek „PhysX87: Software Deficiency“ čtěte na serveru Real World Technologies

Vstoupit do diskuse

Sdílet

Autor článku

Lukáš Fiala

Nejnovější

Anketa

Stali jste se někdy terčem nějakého podvodu?

Témata

Návody a tipy

Jak na Netflixu najít perfektní film během pár sekund? Tajnou zkratkou jsou skryté kódy ve vyhledávání

Usínáte pravidelně u YouTube? Nová funkce vám ušetří peníze za elektřinu

Jak vložit elektronický podpis do PDF dokumentu? Jde to snadno a zdarma

Jak zjistit heslo Wi-Fi sítě, ke které jste připojeni? Na počítači s Windows nebo na smartphonu snadno

Šest nejlepších vychytávek od Mapy.cz. Znáte je všechny?

Google se musí zbavit Chrome, Androidu a monopolu na vyhledávání, požaduje Ministerstvo…

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

Srovnání linuxových kompresorů dat: různé kompresní poměry a rychlost

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Proč je PhysX na CPU pomalý?

Sdílet

Autor článku

Anketa

Stali jste se někdy terčem nějakého podvodu?

Kvíz týdne

Návody a tipy

Z našich webů

Google se musí zbavit Chrome, Androidu a monopolu na vyhledávání, požaduje Ministerstvo…

Koalice chce na povinnosti z digitální ústavy o dva roky více, hledá se viník zpoždění

Když malý usnul, otevírala notebook. Nyní má úspěšný byznys pro nejmenší

Srovnání linuxových kompresorů dat: různé kompresní poměry a rychlost

Musk chce upgradovat státní IT systémy, návrh na rozdělení Googlu, nový minipočítač od Microsoftu

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají výrazně omezené

Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část

Krátké vlny: Odklad práva na digitální služby a Milouš Jakeš o kyberbezpečnosti

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Dále u nás najdete

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Celý příští týden se můžete nechat anonymně otestovat na HIV

Vánoční slevy operátorů? Daleko za očekáváním

Kdy se vyhneme platbě daně z příjmů při prodeji nemovitosti?

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Šestka nad čtyřkou? Zastaralé. Čtyřka nad šestkou!

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Akutní srdeční selhání může být horší než infarkt

Chrome OS se zřejmě promění v Android

Češi riskují s daty, podceňují zálohy i bezpečnost

Osvědčené způsoby, jak snížit vysoký krevní tlak

USA zastavují dodávky pokročilých AI čipů TSMC do Číny

O bonusy u VZP můžete papírově žádat už jen týden

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Prémiové AI funkce: Stojí za příplatek?

Deepl nově umí překládat v reálném čase řeč

Lumbální punkce sice vypadá děsivě, ale nebolí

Bezplatný Microsoft PC Manager vylepšen

Balík od DPD si nově můžete vyzvednout i na České poště

Prokletí slavného spisovatele: duševní poruchy a sebevraždy