a není za tím pouze to, že tyto PCIe karty má nahradit novější generace Knight Mill ?
http://www.anandtech.com/show/11741/hot-chips-intel-knights-mill-live-blog-445pm-pt-1145pm-utc
nemyslím si, KNM pořád podporuje 1/2 rate double precision, ale přidali 2x SP + 4x FMA/VNNI. V podstatě udělali podobný krok jako Nvidia s Volta a AMD s Vega. Sice odebrali jeden DP, ale pokud karta poběží na vyšších taktech než KNL může být přesto výkon v DP podobný jako u KNL. Uvidíme jaké budou finální takty.
http://images.anandtech.com/doci/11741/hc29.21.420-knights-mill-bradford-intel-second-draft-page-012_575px.jpg
Ten všeobecný odklon směrem k Deep Learningu a neurálním sítím je patrný skrz celý výpočetní trh a Intel logicky tento trend následuje.
Do budoucna to vidim tak, ze svetovy technologicti lidri v tomto oboru budou chte nechte nutne potrebovat integrovat vypocetni reseni. Na jednu stranu totiz s rozvojem procesoru (CPU, GPU) dochazi ke specializaci, takze zvlast segment grafik, vypocetnich karet na ruzne zamereni, malych uspornych procesoru do IOT atd. Na druhou stranu jedno nefunguje bez druheho a s rozvojem jednoho segmentu dochazi k rozvoji i tech ostatnich.
Vidim jasnou vyhodu AMD, ze uz dnes je pripraveno na vsechny eventuality, ale samozrejme museji to potvrdit v praxi, coz se zatim moc nedeje.
Intel oproti tomu ma vyraznou jen jednu cast a v ostatnich se mu prilis nedari, to same plati o NVidii, u ktere je to naopak. Hodilo by se, kdyby se spojili, pak by asi ovladli vsechno, ale nemyslim, ze by k tomu mohlo dojit. NVidia se treba i proto zacala snazit o vlastni reseni procesoru na bazi ARM. Mozna by do situace mohl casem promluvit i Qualcomm, ten take umi grafiky i procesory, ale to se teprve uvidi, jestli dokazou prorazit s tim Centriqem, oznamenym tedkom.
DP rate je pomer medzi DP a SP výkonom, nie medzi predchádzajúcou a nasledujúcou generáciou... Tuto to majú jasne.
http://images.anandtech.com/doci/11741/hc29.21.420-knights-mill-bradford-intel-second-draft-page-009.jpg
1x16 DP
2x64 SP
2x128 VP
10nm Xeon Phi nebudú. Klasické Xeony s AVX512 majú rovnaký výkon pri nižšom TDP. Navyše majú aj nejakú integer jednotku a viac portov, takže sa ľahšie optimalizujú. V každom prípade, kvôli tomu AVX512 stratili Xeony Pi akýkoľvek význam.
Na 10nm by som sa nespoliehal. 14nm KNL vyšiel zhruba v čase kedy vyšiel 16nm P100. A P100 s prehľadom vyhral. Na ďalšom procese by to bolo ešte výraznejšie. Intel totiž urobí len 1 krok (tým získa 2x lepší výkon ako KNL), 7nm Nvidia urobí 2 kroky (4x lepší výkon ako P100).
To by dalo zhruba 6 TFlops pre 10nm Xeon Phi proti 20-25 TFlops pre 7nm Nvidiu. Asi každý chápe že by to nemalo zmysel. A ani ten argument, ktorý pán Olšan tak rád opakuje by nepomohol.
Proste, na AI má Intel ASIC. Na hrubý FP64 výkon klasické Xeony. A na niečo medzi tým FPGA. Xeony Phi tam nemajú miesto lebo neprinášajú výhody v absolútne žiadnom ohľade.