Výpočetní schopnosti přímo na úrovni SSD
SSD nabízející takové pokročilé funkce nyní představila firma NGD Systems, jde o modely řady Catalina 2 (jde už o druhou generaci), která firma vyrábí jednak v provedení U.2 (s kapacitami 4, 8 a 16 TB), nebo jako karty PCI Express, kde je možné navíc pořídit i verzi s kapacitou 32 TB. V základu jde o obvyklá NVMe 1.3 úložiště s rozhraním PCI Express 3.0 ×4, používající 3D NAND typu TLC (jde o čipy BiCS3 od Toshiby). Podle výrobce mají disky dosahovat přenosových rychlostí při čtení nebo zápisu až 3,9 GB/s, IOPS v náhodném přístupu nejsou uvedeny.
Ovšem na discích NGD Catalina 2 (nebo také CAT-2) nejsou podstatné obvyklé výkonnostní propriety. Tím, čím lákají enterprise uživatele, je možnost zpracovávání či analyzování dat přímo v rámci zařízení. Striktně vzato by asi uvnitř mohla běžet aplikace skoro jakéhokoliv druhu. Elektronika disku je založena na nejmenovaných FPGA Xilinx, která kromě programovatelných bloků obsahují také několik jader Cortex-A53. Na tomto FPGA a jeho procesorových jádrech běží jednak různé základní potřeby řadiče SSD, tedy zápis a čtení dat, provádění ECC a údržba. Ale zároveň jsou jádra a výpočetní prostředky zpřístupněné i uživateli – na SSD běží operační systém na bázi Linuxu, v rámci kterého lze nasadit vlastní programy či služby.
Smyslem tohoto uspořádání je možnost, aby se některé operace, které běžně nad uloženými daty probíhají, nemusely odehrávat přímo na úrovni hostitelského počítače (nebo zde asi hlavně serveru). Například antivirový sken, vyhledávání dat, nebo různé analýzy či data mining. Pokud by počítač takové operace prováděl pomocí CPU, musí být data neustále čtena z disků, zaměstnávají se I/O rozhraní a RAM i samotný procesor. V případě operací, které nezbytně nevyžadují vysoký výkon samostatného procesoru, může být efektivnější s daty pracovat přímo na úrovni samotného SSD, pokud na to stačí výkon jeho integrovaných procesorových jader či integrovaných koprocesorů.
Výhodou je i to, že třeba v serveru s mnoha takovými úložišti vše běží paralelně, aniž by se jednotlivé disky bily po propustnost rozhraní a výpočetní prostředky CPU. Omezení pohybu dat v systému může také šetřit energii. Spotřeba disků NGD Catalina 2 je sice 12–13 W při aktivitě, ovšem to při vysokých kapacitách příliš nevyčnívá, inteligence navíc v elektronice se tak na příkonu zas tak dalece neprojevuje.
Tyto disky se již vyrábějí a jsou dostupné zákazníkům. Jak užitečné budou proti levnějším „blbým SSD“, to už pochopitelně závisí na tom, jak efektivně budou možnosti „in-situ processingu“ využity. Podle výrobce se mohou hodit pro analýzu dat v koncových zařízeních, nebo pro různé aplikace strojového učení a umělé inteligence. V osobních počítačích asi tato technologie nijak brzo neprorazí, pro serverovou oblast by ale atraktivní být měla a možná by mohla jejich architekturu úložišť dost transformovat.
Výpočty v SSD se v budoucnu rozšíří
Integrovat víc inteligence dovnitř SSD je nápad, který se přímo nabízí. Řadiče ovládající nejen SSD, ale i HDD mají dnes několik jader s nezanedbatelným výkonem (může jít o ARM Cortexy řady R, včetně FPU a MMU) a také blokem DRAM sloužícím typicky jako mezipaměť nebo jako prostor pro tabulku mapování bloků. Mělo by jít o dost paměti i procesorového výkonu, aby uvnitř dokázal i bez nasazení speciálních čipů jak v případě Catalin 2 běžet pokročilý OS typu Linuxu. Mnoho starších chytrých telefonů mělo asi hardware slabší. Už dávněji bylo demonstrováno, že tyto prostředky by dávaly hodně prostoru třeba pro zákeřný malware, takže proč je nevyužít pro legitimní aplikace.
Po podobných výpočetních operacích přímo v SSD pravděpodobně pokukuje více výrobců. Integrování více „inteligence“ do úložišť je pravděpodobně součást strategie firmy Western Digital a také důvod, proč se před nedávnem tak hlasitě postavila za novou platformu procesorů RISC-V. Pokud by tato jádra chtěla použít jen v obvyklých SSD řadičích, nešlo by pochopitelně o nic světoborného. Architekturu RISC-V nesvázanou poplatky chce ale WD zřejmě využít k tomu, aby řadiče mohly mít podstatně větší schopnosti právě i pro takovouto lokální aktivní práci s uloženými daty.