Nvidia přináší překvapivou odpověď na úspěch Deepseek: Co se chystá?

Nvidia vzdává hold Deepseeku

Firma Nvidia nedávno pochválila nový model DeepSeek R1 jako „výjimečný skok v AI technologiích“. I přes tuto chválu došlo ke pádu akcií Nvidie o 17% po jeho oznámení.

Čínský startup DeepSeek nedávno uvedl svůj open-source model R1, který údajně konkuruje modelům velkých amerických technologických firem, včetně OpenAI s jejich modelem o1.

Navzdory nákladům ve výši pouhých 6 milionů dolarů se vyrovnává modelům, které vyžadují mnohem vyšší investice.

Přestože akcie firmy klesly, Nvidia podpořila technologii.

„DeepSeek představuje významný pokrok v AI, demonstruje možnosti využití škálování během testování. DeepSeekova práce ukazuje, jak lze vyvíjet nové modely za použití dostupných výpočetních možností, a přitom splňovat exportní omezení. Tento proces vyžaduje mnoho GPU Nvidia a vysokovýkonné sítě. Máme nyní tři škálovací zákony: před-trénink, po tréninku a testovací čas,“ vyjádřil se mluvčí Nvidie pro Investing.com.

NVIDIA $NVDA issued the following comments to https://t.co/HMaYPuSux7 on DeepSeek:

"DeepSeek is an excellent AI advancement and a perfect example of Test Time Scaling. DeepSeek’s work illustrates how new models can be created using that technique, leveraging widely-available…

— Investing.com (@Investingcom) January 27, 2025

Nvidia také zdůraznila, že DeepSeek využíval GPU v souladu s exportními pravidly, čímž zpochybnila spekulace o nesprávném vyčíslení množství potřebných GPU.

Změna paradigmu: Test-time scaling

Na novém přístupu k AI škálování, známém jako test-time scaling, pracují odborníci z Nvidie i OpenAI, včetně CEO Jensena Huanga a Sama Altmana.

Tento přístup umožňuje modelům vylepšit výsledky během predikcí použitím dodatečné výpočetní kapacity.

Tuto techniku využívá i model DeepSeek R1, čímž konkuruje etablovaným americkým firmám v technologickém sektoru.

Výzva pro americké giganty

Příchod modelu R1 vyvolal obavy, zda investice amerických firem do AI infrastruktury nejsou nadměrné.

Například Microsoft plánuje do roku 2025 investovat 80 miliard dolarů, zatímco Meta počítá s výdaji mezi 60 až 65 miliardami.

Analytik Justin Post z BofA Securities poznamenal, že pokud se potvrdí nižší náklady na trénování modelů, může to pro společnosti nabízející AI služby znamenat krátkodobé výhody.

TIP na článek: Návod jak investovat do ETF na index S&P500 u XTB brokera