Práve ten AV1 by ma viac zaujímal, keďže je novší, má lepšiu kompresiu, je otvorený (zadarmo), a už ho podporujú aj všetky prehliadače.
X265 je taky 'zadarmo'...
Nevim uplne aktualni stav, ale drive bylo encoding do AV1 dost problemovy a hlavne casove narocnejsi. Nejsem si jisty, jestli vyhoda v mensi velikosti finalniho souboru (netusim ale okolik pri srovnatelne kvalite) kompenzuje vyssi encodovaci naroky.
Obdobne by to melo platit i u zarizeni. Vsechna v principu podporuji HW decoding H265 (X265), ale AV1 HW decoding podporuje jen neco,
Jinak zajimavy clanek, diky
24. 9. 2024, 11:34 editováno autorem komentáře
Tie hardware enkódery na GPU sú nejak napevno naprogramované na konkrétny "preset" a veľkosť súboru je potom výrazne väčšia ako keď použiješ software-ový enkóder s lepším preset-om.
Konkrétne pre AV1 je tu pekná tabuľka na porovnanie toho, čo jednotlivé "preset" zapínajú:
https://gitlab.com/AOMediaCodec/SVT-AV1/-/blob/master/Docs/CommonQuestions.md#what-presets-do
Generally speaking, presets 1-3 represent extremely high efficiency, for
use when encode time is not important and quality/size of the resulting
video file is critical. Presets 4-6 are commonly used by home enthusiasts
as they represent a balance of efficiency and reasonable compute time. Presets
between 7 and 13 are used for fast and real-time encoding.
Keďže GPU enkódery sa často používajú práve pre streaming, nečudoval by som sa, keby mali implementovaný iba práve 7 alebo 13 preset.
Nejsou obvykle úplně napevno programované a myslím že taky mají víc presetů, ale vzhledem k nepružnosti hardwaru/fixed function bloků nebo DSP a vůbec toho stylu programování, který u těch hardwarových implementací je, není hardware tak efektivní z hlediska dosažené komprese+vizuální kvality, omezenější jsou i psychovizuální optimalizace.
Ty hardwarové enkodéry můžou někdy vyhrát v rychlých nataveních, protože na CPU musíte použít už hodně špatné možnosti, abyste se dostali na podobné FPS. Ale v těch pomalých nastaveních mířících na kvalitu (kvalitní) software enkodér vede.
V článku je malá, ale opakující se chybička. RocketLake, stejně jako žádný Intel, neumí tři 512b celočíselné (ani jiné) sčítání za takt. Jen dvě. Sloučené porty 1 a 2 jsou 256-bitové a jen port 5 je 512-bitový. V případě 256-bit integer sčítání už však tři umí.
VPADDD zmm, zmm, zmm L: 0.36ns= 1.0c T: 0.18ns= 0.50c
VPADDD ymm, ymm, ymm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
Přidal jsem asm=avx512; do parametrů a rychlost padla na hubu. Při kódování x265 z 8K do 4K to z průměrných 26 snímků (bez avx512) spadlo na necelých 7 snímků (s avx512), žádnou výhodu tedy nevidím. Také je zajímavé srovnání 7950X zaškrcené na PPT 88W jede cca 15 snímků a nezaškrcený 9950X s PPT 200W jede jen o 50% rychleji.