Právě se to stalo! DeepSeek-R1 je tady!
Wow a ukazují vám tokens myšlení, úžasné
Omlouvám se, jsem trochu nováček
Deepseek R1 je model open source? Mohu ho spustit lokálně?
Hodnota pro další oAI vydání se právě exponenciálně zvýšila
Tato data jsou příliš šílená a jsou open source, pokud o1 nevydá lepší verzi, pak nebude potřeba 20 dolarů měsíčně.![]()
Komentář z jiného příspěvku (od fmai):
To nejšílenější na tom je, že popisují svůj proces tréninku a je to v podstatě standardní optimalizace politiky s odměnou za správnost plus nějakou odměnu za formátování. To není nic zvláštního. Pokud je to vše, co OpenAI dělá, je to opravdu nepozoruhodné.
Nevěříme, že po o1 lidé strávili roky nad problémem slabin v uvažování velkých jazykových modelů a výzvou, jak dělat inference čas výpočetní užitečný. Pokud je recept na vysoce efektivní uvažování v LLM opravdu tak jednoduchý, máme nějaké myšlenky, proč to nebylo objeveno dříve? Jako vážně, nikdo se nesnažil použít RL na zlepšení uvažování v LLM předtím?
To poskytuje zajímavý kontext pro všechny výzkumníky AI, kteří se chovají opojně v prohlášeních na Twitteru a podobně, pokud si myslí: “sakra tohle opravdu bude fungovat?! Toto je naše ‘Alpha-Go, ale pro jazykové modely’, všechno, co bude stačit k dosažení superlidkého výkonu?”. Může být, že si to dříve mysleli, ale stále spolehlivě přináší výsledky, zlepšuje se stále lepší a lepší…
Jak dlouho potrvá, než ho budou mít openrouter?! lol
takže Čína je za měsíc pozadu?
Nemám tušení, jak to udělali, ale dělají z lamy vtip
Pokud jsou tyto srovnání legitimní, právě zapálili velký požár pod OpenAI, Anthropic a Google. Pokud je to správně, dohnali o1 za zlomek nákladů s open source modelem.
Destilované verze jsou šílené. Pokud jsou ty srovnání skutečná, tak 4o dostal oblečení od 1.5B modelu.
Jaký je přesně rozdíl? Může mi někdo dát příklady toho, co bychom mohli dělat s tímto ve srovnání s V3?
Musím říct, že jsem TENTO věc velmi ohromen. Především proto, že můžete prohledávat web a hluboce přemýšlet současně. Pokud o1 vydá tuto funkci, bude to změna hry.
Zeptal jsem se ho na základě principů investic v knize Ramita Sethiho, kterou jsem znal, ale nerozuměl jsem, jak pravděpodobně bych mohl během 30letého období vydělat nebo ztratit peníze.
O ničem nevím o investicích a dostal jsem tuto odpověď. Je to naprosto změna hry pro vzdělávání
Sakra. Čekal jsem na to.
Teď potřebují deepseek r3, aby dohnali o3 (až jej vydají).
Děkuji, deepseek!
Přečtěte si zásady ochrany soukromí před registrací. Přímé citace:
“Ukládáme informace, které shromažďujeme, na zabezpečených serverech umístěných v Čínské lidové republice.”
“Shromažďujeme určité informace o zařízení a síťovém připojení, když přistupujete ke službě. Tyto informace zahrnují model vašeho zařízení, operační systém, vzorce nebo rytmy stisknutí kláves, IP adresu a jazyk systému.”
https://chat.deepseek.com/downloads/DeepSeek%20Privacy%20Policy.html
Podle DeepSeek je DeepSeek nejlepším Modelem
Podle OpenAI je nejlepším modelem ChatGPT
Podle Anthropic je nejlepším modelem Claude
…
A pak se „AI“ společnosti diví, proč už nevěříme jejich nabušené reklamy.
To je opravdu šílené, vidět, že model 32B je srovnatelný s o1 mini.
Udělat tolik zlepšení v roce 2025, těším se na to
Co znamená chyba 403?
Deepseek je přehnaný, zkoušel jsem to a vůbec to není tak na špičce, jak se slibovalo.
Je to dostupné na jejich chatovací webové stránce? Pokud používáte DeepThink, používá nyní R1?
Vytvořili jsme video o deep dive k papíru
—DeepSeek-R1: Podpora uvažovacích schopností v LLM pomocí posilovaného učení
https://www.youtube.com/watch?v=VBF9QLleUrk. Připijme si na open source! ![]()
![]()
![]()
