To je od AMD dobrý krok a možná počátek skutečné heterogennního systému. DDR3 na to budou fajn, ale GDDR5 mají docela velké latence, takže to nepůjde použít na všechno. Docela velké naděje vkládám do rychlých veriant DDR4.
Docela by mě zajímalo, jestli to bude fungovat i na Radeonech (na diskrétních kartách).
NVidia chystá něco podobného až do příští generace Maxwell. Dalším vylepšením by měla být ultrarychlá paměť (snad až 1 TB/s), ale to bude až v generaci následující po Maxwellu - Volta.
Poměrně "vousatý" rozbor od Hiro Goto:
http://pc.watch.impress.co.jp/docs/column/kaigai/20130618_604107.html
"By the way, hUMA APU following AMD's "Kaveri": to become a memory bus route from the GPU that supports (heterogeneous Uniform Memory Access Humanity), integrated into one system, bus architecture is different from the Obis chip of PS4 . Speaking the reverse, PS4 is not a hUMA."
(Google Translate)
Huma??? Si děláte srandu!? Jako vždy to těm společnostem sežerete i s navijákem.
Není to žádná nová technologie a už vůbec nijak revoluční. Vzhledem k jednotným pamětech odpadla potřeba mít to co je v VRAM taky v RAM. Čili tím se hlavně ušetří místo. Problémem je že rychlost odezvy cache v CPU jsou jednotky nanosekundy které valili na DDR3 s odezvou ~50 nanosekund a teď GDDR5 to bude 8-6 microsekund.
Tohle způsobí to že jakýkoliv chyba při programování bude znamenat fatal error nebo velké zpoždění protože CPU nebude mít časový naskok.
Huma??? Si děláte srandu!? Jako vždy to těm společnostem sežerete i s navijákem.
Není to žádná nová technologie a už vůbec nijak revoluční. Vzhledem k jednotným pamětech odpadla potřeba mít to co je v VRAM taky v RAM. Čili tím se hlavně ušetří místo. Problémem je že rychlost odezvy cache v CPU jsou jednotky nanosekundy které valili na DDR3 s odezvou ~50 nanosekund a teď GDDR5 to bude 8-6 microsekund.
Tohle způsobí to že jakýkoliv chyba při programování bude znamenat fatal error nebo velké zpoždění protože CPU nebude mít časový naskok.
Tady je nějaký datasheet k GDDR5:
http://datasheet.eeworld.com.cn/pdf/HYNIX/311505_H5GQ1H24AFR-R0C.pdf
Jednotlivé druhy časování se od DDR3 nikterak výrazněji neliší. Sice se tím nezabývám, ale myslím, že se tyto latence dají "obenchovat" i praktičtěji v SiSoftu.
Nejde o to že by DDR3 nejako bránili, ale ten marketingový manažér AMD podľa tohto článku spomenul len Kaveri a PS4. Zamlčanie XBO sa dá vysvetliť všeliako.
Ale neviem o tom, že by niekto záväzne povedal, že eSRAM je v XBO len ako framebuffer. Taktiež nie je nutné aby boli tie čipy v XBO a PS4 "zcela totožné", čo sa týka schopností. Čo si kto (MS, Sony) objednal/dohodol, to tam má predpokladám.
To make up for the gap, Microsoft added embedded SRAM on die (not eDRAM, less area efficient but lower latency and doesn't need refreshing). All information points to 32MB of 6T-SRAM, or roughly 1.6 billion transistors for this memory. It’s not immediately clear whether or not this is a true cache or software managed memory. I’d hope for the former but it’s quite possible that it isn’t. At 32MB the ESRAM is more than enough for frame buffer storage, indicating that Microsoft expects developers to use it to offload requests from the system memory bus. Game console makers (Microsoft included) have often used large high speed memories to get around memory bandwidth limitations, so this is no different.
del42sa> "New HSA features" podľa mňa neznamená, že ide o plnú podporu hUMA, ale je mi jasné, že to je len ďalší príznak môjho zbytočného puntičkárstva. Aj Richland má v jednej z tých roadmáp "HSA enhancements" a o hUMA u toho čipu asi tiež nejde.
Podľa mňa by som ti ako puntičkár nepripadal, keby si sa končne naučil svoje nepresné dojmy nepredkladať ako fakty. ;)
opět jsi dokázal jedině to, že s tebou nemá cenu vůbec vést jakýkoliv smysluplný dialog !!!! :o((
"keď si tvrdil, že GDDR5 je nomožné použiť s CPU x86 architektúry?" v normálním bežném CPU, což konzole evidentně není !! Jenže blbce musí člověk kopnout aby mu to došlo ....
všechny argumenty máš napsané ve vláknu o GDDR5, tak si je tam najdi ! Já na tebe už prdím :o))
Also, GPUs are designed to be extraordinarily latency tolerant so I can't imagine that being much of a factor.
myslím, že tím si pan Cerny odpoveděl sám a ta první část věty spíše zlehčuje skutečnost, že ty latence opravdu stejné nejsou...
existuje důvod proč jsou ty paměti s těmi vlastnostmi které mají používány jen v GPU a ne v CPU !
btw pokud vše závisí jen na řadiči, znamená to , že s jinak nastaveným řadičem budou mít zároveň vysokou propustnost a zároveň také nízké latence ??? :o))
Není to spíše tak, že můžu volit mezi vysokou propustnosti za cenu vyšších latencí ( které ale GPU nevadí ) a mezi nižšími latencemi, ale zároveň nižší propustností ? Potom ale dosáhnu výsledku srovnatelného s DDR3 nebo ? :o)
Ty jsi nezmar, clovece... Je to jak rikam, fyzika a ovl. technologie - to je prim, ve kterych budou mit konzole pridanou hodnotu a vyrazne jim v tom dopomuze jejich diskutovana architektura, ktera ac se zda, ze je zaostala, v techto ohledech predbehne uroven/efektivitu techto technologii o stupinek, dva, pred pc... Imho o tom jestli je jejich hw vybava z hlediska grafiky nedostacujici je velmi nehodno diskutovat, protoze pozadavek znel fullHD 3D, 4K video - tzn. maji vykonu dost, zadny "trn" tam nevidim.
Plamenne diskuze muzeme vest o jejich vzhledu, u PS4 je vse ok, ale XBox One vypada proste odporne, jako "prevleceny desktop", ktery vypadnul z prelomu 80/90 let, ery VHS a modern talking, servilni az za roh...
jen 10x to není je to skoro 100x. Tabulkově to je přesně jak říkám ale v praxi to může být jinak. Nevím přesně jak paměti GDDR funguje ale jsou přizpůsobené pro paralelní čtení a zápis. Pokud se nemýlím tak jedna buňka má zhruba 0.4ns latenci. Mají téže mnohem širší sběrnice IO. DDR jsou myslím jen 8bit. Tak jako tak inženýři v AMD se při časovaní a tvoření cyklů zapotí. S instrukcemi téže budou muset udělat.
Poslední generace Intel procesorů má brutální propustnost na cache 3 přes 100GB/s takže pro ty procáky už je jediná možnost integrovat RAM paměť do procesoru protože DDR4 to nespasí.
No uvidíme jak to bude a špěkulovat tady o tom asi nemá moc smysl.
za předpokladu, že počítáš pouze 4 jádra (2 moduly), tak snad .... 4 moduly SR (8 threads) vs 8 jader Jaguaru budou těžko menší ... Dále když uvážís rozdílné pracovní frekvence, tak TDP a spotřeba by asi byly také někde jinde.
jedno Jaguar jádro má na 28nm má velikost 3,1mm2, Jeden Steamroller modul na 28nm výrobním procesu bude mít minimálně 16mm2, spíše i o trochu víc díky větší I cache a dvěma decoderům. ( Bulldozer modul má 19.42mm2 ) Navíc cena se imho neurčuje jen podle velikosti die na wafferu, ale také podle složitosti čipu. Jiná bude tedy cena stejně velkého čipu na bázi Jaguar a jiná na bázi Big Core (PD/SR)
http://chip-architect.com/news/2013_core_sizes_768.jpg
8 jader Jaguaru má tedy ~24,8mm2, 2 moduly SR mají ~32mm2, 4 moduly pak ~64 mm2.