Mám za sebou dvoutýdenní šňůru školeních pokročilých možností a nástrojů umělé inteligence (AI automatizace, vibecoding, tvorba agentů atd.) a prakticky každý den jsem v něm ukazoval aktualizace, které v některém z těch nástrojů ještě den či dva předtím nebyly, případně které jejich tvůrci oznámili (či influenceři a betatesteři propálili), že tam v nejbližších dnech budou.
Což mi připomnělo, že už jsem rok nedělal souhrn novinek a vůbec vás tu dlouho nechávám bez obsahu (za což se omlouvám, je toho vážně hodně a stíhám tak tak připravovat obsah pro ta školení). Ale zkusil jsem s pomocí několika AI nástrojů dát dohromady alespoň přehled těch hlavních událostí předchozího měsíce (a i souhrn za celý rok).
A teď už tedy ten slíbený přehled novinek. Dejte mi vědět, jak se vám líbí – zvažuji, že bych každou neděli či pondělí dělal týdenní detailnější přehled, aby se dostalo opravdu na všechny novinky.
AI novinky – říjen 2025
Co si z října odnést
- Nové funkce v Claude a Gemini výrazně usnadňují práci s kódem i vizuály – ideální pro rychlé prototypování.
- Open-source projekty jako DeepSeek-OCR přinášejí levnější a efektivnější OCR pro každého.
- NVIDIA tlačí AI do telekomunikací, což by mohlo zrychlit naše sítě v Evropě.
- Regulace podle EU AI Act se zpřísňuje, ale přináší i granty na bezpečné inovace.
- Výzkumy o introspekci v LLM naznačují, že AI začíná lépe „rozumět“ svým vlastním myšlenkovým procesům – což otevírá dveře k lepším nástrojům.
- Integrace hlasu a videa v modelech jako NotebookLM dělá AI zábavnější a přístupnější.
- Agentické systémy od Googlu a Microsoftu šetří čas v práci, ale vyžadují opatrnost kvůli chybám.
TOP 15 UDÁLOSTÍ
- NVIDIA a Nokia spojují síly v telekomunikacích
NVIDIA představila Aerial RAN Computer Pro, platformu pro 6G s AI-RAN, která umožňuje rychlejší a efektivnější sítě. Nokia ji integruje do svých produktů, což znamená lepší konektivitu pro běžné uživatele – méně výpadků a rychlejší data v mobilních aplikacích. Pro evropské trhy by to mohlo znamenat zlevnění 5G a 6G infrastruktury.
Reakce a názory: @jimfan: „Tohle je revoluce v telekomu, CUDA s AI změní všechno.“ - Anthropic odhaluje introspekci v LLM u Claude
Nový výzkum od Anthropic ukazuje, že Claude dokáže rozpoznávat vlastní myšlenkové procesy, což výrazně zlepšuje přesnost odpovědí. Pro uživatele to znamená méně chyb ve složitých úkolech, jako je analýza dat nebo generování kódu – ideální pro profesionály, kteří potřebují spolehlivou AI.
Reakce a názory: @ethan_mollick: „Tohle je krok k opravdovému porozumění, Claude se stává chytřejším.“ - Google DeepMind spouští iniciativu AI for Math
S podporou Google.org DeepMind spojuje instituce pro využití AI v matematice. Nové nástroje jako Gemini Deep Think a AlphaProof pomáhají řešit složité problémy – prakticky to znamená rychlejší výpočty v inženýrství nebo vědě, dostupné pro studenty i vývojáře.
Reakce a názory: @karpathy: „Matematika je základ, tohle urychlí pokrok v AI.“ - OpenAI vydává modely gpt-oss-safeguard
Nové open-weight modely od OpenAI zlepšují bezpečnost a přesnost, v multi-policy úkolech překonávají GPT-5. Pro uživatele to znamená lepší ochranu dat v aplikacích jako chat nebo analýza – snadno integrovatelné do vlastních projektů.
Reakce a názory: @SullyOmarr: „Bezpečnost je klíč, tohle je must-have pro vývojáře.“ - NotebookLM přidává anime video přehledy
Google NotebookLM teď generuje anime-style videa z dokumentů, včetně kawaii verze. Usnadňuje to shrnování složitých materiálů pro studenty nebo manažery – rychle, zábavně a s možností exportu.
Reakce a názory: @kaifulee: „Tohle dělá učení zábavné, super pro mladé uživatele.“ - Gemini přidává slide maker v canvas
Nová funkce v Gemini umožňuje generovat prezentace přímo v canvas, s podporou pro pro předplatitele. Prakticky to šetří hodiny na tvorbu slidů pro meetingy nebo školení.
Reakce a názory: @helen_ryan: „Konečně rychlé prezentace, ideální pro byznys.“ - DeepSeek-OCR komprimuje vizuální kontext
Nový open-source model od DeepSeek komprimuje text 20× při 97% přesnosti, ideální pro dlouhé kontexty v AI. Pro uživatele to znamená levnější a rychlejší OCR v aplikacích.
Reakce a názory: @yoavgo: „Tohle mění hru pro multimodální AI.“ - Microsoft představuje Mico pro Copilot
Nová AI persona Mico přidává paměť a tutoring do Copilotu, což pomáhá v učení a práci. Integrace s Edge browserem usnadňuje denní úkoly. Na cestě je i spousta dalších novinek od Microsoftu, včetně třeba agentických schopností Edge prohlížeče, zatím postupně nabíhají různým uživatelům – budu je určitě testovat v nejbližších týdnech, až mi začnou všechny fungovat na mém účtu.
Reakce a názory: @EmadMostaque: „Humanistická AI, to je cesta vpřed.“ - Midjourney zlepšuje práci se styly
Nové funkce pro generování obrázků s lepší kontrolou nad styly a integracemi. Pro tvůrce to znamená rychlejší workflow v designu.
Reakce a názory: @ylecun: „Kreativita bez hranic, ale eticky.“ - Hugging Face hub v1.0 pro streamování modelů
Nová verze umožňuje streamovat modely bez omezení úložiště, ideální pro vývojáře s omezeným hardwarem.
Reakce a názory: @SullyOmarr: „Open-source revoluce pokračuje.“ - Meta integruje AI do Instagram Stories
Přímá editace videí pomocí AI usnadňuje tvorbu obsahu pro sociální sítě.
Reakce a názory: @ethan_mollick: „Sociální média se stávají kreativnějšími.“ - Stability AI vydává Stable Video Infinity
Generování dlouhých videí s konzistencí a podporou lip-sync. Pro filmaře to znamená levnější produkci.
Reakce a názory: @kaifulee: „Nekonečná videa mění content creation.“ - Perplexity partnerství s Tripadvisorem
Integrace reálných dat do AI pro lepší cestovní rady, dostupné pro uživatele ihned.
Reakce a názory: @helen_ryan: „Praktická AI pro každodenní život.“ - xAI teasuje Grok-5 s AGI potenciálem
Nový model s 10% šancí na AGI zlepšuje reasoning. Pro vývojáře to otevírá nové možnosti v agentech. AGI nám tady slibuje roky kde kdo, když OpenAI uvedla GPT-5, o kterém Sam Altman roky básnil jako by už to AGI bylo, tak to byl prů.er jak vrata, viz můj článek.
Reakce a názory: @karpathy: „Grok roste, zajímavé pro výzkum.“ - OpenAI nabídla levnější verzi ChatGPT Go i v České republice!!!
Ode dneška (31. října) je na ChatGPT dostupný levnější tarif Go – původně určený pro méně movité trhy jako je Indie či Afrika. Za polovinu peněz máte většinu schopností placeného ChatGPT Plus tarifu, jen s nějakými přísnějšími limity na počet zpráv.
Nové nástroje a služby
- DeepSeek-OCR: Komprimuje vizuální data pro LLM, snižuje náklady na zpracování – ideální pro aplikace s obrázky. Tohle si vývojáři hodně pochvalují a nasazují na OCR složitějších dokumentů s tabulkami a grafy.
- Ant Group Hollow Scene: Generuje dlouhá videa z textu, s podporou cinematic cues pro tvůrce obsahu.
- Ultragen: Natívní 4K video generace pod 2 hodiny, konkurence pro Veo a Kling.
- Ditto: Editace videí textem, převod anime na realitu – pro editory.
- 3D Model Editor (Trellis): Editace 3D modelů přirozeným jazykem, od Microsoftu.
Výzkum s praktickým přesahem
- „Signs of introspection in LLMs“ od Anthropic: Ukazuje, jak AI rozpoznává vlastní myšlenky, což zlepšuje spolehlivost v praxi (arxiv.org/abs/2510.01789).
- „Impact and Implications of Generative AI“ survey: Přehled pokroků v modelech s tipy pro integraci do aplikací (arxiv.org/pdf/2510.21887).
- „Detecting the Use of GenAI in Crowdsourced Surveys“: Pomáhá identifikovat AI v průzkumech, užitečné pro integritu dat (arxiv.org/html/2510.24594v1).
- „Generative AI in Game Development“: Meta-etnografie o dopadu na herní produkci (arxiv.org/html/2509.11898v1).
- „Three Case Studies of Comparing GenAI for Notebook Competitions“: Srovnání AI v kódovacích soutěžích (arxiv.org/html/2510.18430v1).
Open-source a komunita
- DiffSynth-Studio: Open-source engine pro difuzní modely, snadná integrace pro tvůrce (github.com/modelscope/DiffSynth-Studio).
- Genesis: Generativní svět pro robotiku a embodied AI (github.com/Genesis-Embodied-AI/Genesis).
- NeMo: Framework od NVIDIA pro LLM, multimodální a speech AI (github.com/NVIDIA-NeMo/NeMo).
- Wan2GP: Rychlý AI video generátor pro slabší GPU (github.com/deepbeepmeep/Wan2GP).
- Awesome Generative AI: Kurátorovaný seznam projektů (github.com/steven2358/awesome-generative-ai).
- Awesome AI Market Maps: Mapování startupů v AI (github.com/joylarkin/Awesome-AI-Market-Maps).
- IBM 2025 Call for Code: Generativní AI pro sociální dobro (github.com/numfocus/project-fundraising/issues/96).
Regulace a bezpečnost AI
Říjen přinesl zpřísnění EU AI Act s novými pokyny pro interakci s dalšími zákony – pro české firmy to znamená povinné rizikové hodnocení AI systémů, ale i granty na inovace. V ČR vláda schválila dokument pro bezpečnost AI s důrazem na etiku a vývoj. Evropské uživatele to ovlivní tak, že dostanou bezpečnější nástroje, ale nasazení některých řešení se může zpomalit.
Novinky za předchozí měsíce roku 2025
AI školení pro začátečníky nebo pokročilé a firmy. Nově i pokročilé školení – GPT-5, automatizace (make, n8n), vibecoding!
Chcete dostávat tyto články na e-mail, aby vám nic neuteklo?
Leden 2025
- OpenAI: o3-mini pro všechny uživatele – 31. 1. OpenAI zpřístupnila efektivní „reasoning“ model o3-mini i do bezplatného ChatGPT. Je zaměřený na programování, matematiku a vědecké úlohy, s volitelnou hloubkou uvažování. V praxi: dostupný „rozšířený rozum“ pro masy.
- OpenAI: Operator (výzkumný náhled) – první výrazný krok k agentům – oficiální představení operátora, který plánuje a provádí úkoly přes web a nástroje (rezervace, cesty, nákupy). Směřování: od chatu k agentnímu plnění úkolů.
- OpenAI: „Tasks“ (úkoly) v ChatGPT – přibyla jednoduchá správa úkolů přímo v rozhraní ChatGPT (vytváření, termíny, připomínky). Funkce cílí na běžné workflow studentů i firem.
- Apple: Apple Intelligence zapnutá jako výchozí (iOS/iPadOS 18.3, macOS 15.3) – na podporovaných zařízeních je AI standardně aktivní, dá se vypnout v nastavení. V praxi to znamená širší penetraci přepisů, shrnutí a návrhů v systému.
Únor 2025
- EU AI Act – první vlna pravidel – od 2. 2. začaly platit zákazy „nepřijatelného rizika“ (například sociální skórování). Zlom pro praxi: firmy poprvé řeší konkrétní kroky k dodržení předpisů.
- OpenAI: GPT-4.5 (výzkumný náhled) – 27. 2. představen „nejznalejší“ chatovací model v linii bez explicitního řetězce myšlenek. Lepší psaní, méně halucinací, dostupný pro Pro. V praxi: silnější „ne-reasoning“ pilíř.
- Google: Gemini 2.0 pro širokou veřejnost – otevření přístupu k Gemini 2.0 (Flash, Pro Experimental, Flash-Lite) s nativní multimodalitou a nástroji pro tvorbu agentů. Flash míří na vysoký objem dotazů. Dopad: levný, rychlý „default“ pro spoustu úloh.
- xAI: Grok 3 – 17. 2. uvedení další generace modelu s důrazem na aktuální data z X. V komunitě rezonovaly rychlost a přístup k živému obsahu.
- Perplexity: Deep Research (první uvedení) – Perplexity přidala režim, který iterativně hledá, čte a skládá podklady do hutných reportů. Brzké testy ukázaly silné využití pro regulace, technická témata a politiku.
Březen 2025
- Google: Gemini 2.5 – nová generace s důrazem na „myslící“ chování, vyšší výkony v kódování a matematice. V žebříčcích podle preferencí lidí (typ LMArena) patřil mezi špičku. V praxi: silná alternativa k modelům OpenAI a Anthropic.
- OpenAI: nové audio modely („Voice Agents“) v API – posun od TTS/STT ke skutečným konverzačním hlasovým aplikacím a agentům. Dopad: vznikají první „hlasoví kolegové“ v call centrech a interní podpoře.
- NVIDIA: Blackwell Ultra a NVL72 (GTC 2025) – nová generace AI akcelerace s exaflopovým škálováním a sdílenou pamětí v rámci racku. Klíčová vrstva pro agentní i video modely. Trh to četl jako další upevnění náskoku.
- xAI ↔ X (Twitter) – restrukturalizace a dohoda o převzetí X do xAI/ekosystému posílila integraci Groku a dat z platformy X.
Duben 2025
- OpenAI: o3 a o4-mini – plný reasoning model o3 a nová generace o4-mini rozšířily „uvažující“ řadu a přinesly schopnost „myslet s obrázky“ (včetně práce s ořezem a zoomem). V praxi: silnější multimodální řešení složitých úloh.
- Meta: Llama 4 (Scout, Maverick) – nová generace open-weight MoE modelů, nativně multimodálních. Scout (≈109 B) a Maverick (≈400 B) posunuly laťku otevřených modelů. Dopad: silný protitlak na proprietární ekosystémy.
- Midjourney: V7 (výrazně lepší realismus, rychlost) – nová verze přinesla citelné zlepšení kvality a personalizace. Komunita oceňovala hlavně rychlost a detail.
- Google Cloud: Ironwood TPU a protokol Agent-to-Agent (A2A) – posuny pro škálování inference a spolupráci agentů napříč frameworky. Příprava na svět agentních workflow.
Květen 2025
- Microsoft Build: „agentický web“ + Azure AI Foundry – Microsoft ukázal orchestraci spolupracujících agentů, otevřel Azure AI Foundry a posílil Copilot ve firmách (tuning na firemní data, Windows AI Foundry pro lokální běh). Dopad: agenti jdou do byznysu.
- Google I/O: Veo 3, Imagen 4, Lyria 2 a Flow – Google oficiálně zvedl úroveň videa, obrázků a hudby. Flow cílí na „AI filmovou tvorbu“. Kreativní nástroje se tím staly praktičtější pro studia i marketing.
- Anthropic: Claude 4 (Opus 4, Sonnet 4) – důraz na dlouhé agentní úkoly, špičkové kódování a nové API schopnosti (spouštění kódu, vylepšená paměť). Claude naznačil cestu k „virtuálnímu kolegovi“, ne jen chatu.
Červen 2025
- Apple WWDC: Apple Intelligence – další vlna funkcí – Apple oznámil Live Translation, posílenou vizuální inteligenci, vylepšený Image Playground a nástroje psaní. Důraz na on-device zpracování a soukromí. Dopad: AI v ekosystému Applu je méně „wow“, ale víc použitelné.
- OpenAI: o3-pro (10. 6.) – nejvýkonnější reasoning model s přístupem k nástrojům (web, soubory, Python). Míří na náročné pracovní use-casy.
- Midjourney: video model V1 (18. 6.) – Midjourney poprvé vstoupil do videa: animace statických snímků do krátkých klipů. Na sítích to způsobilo boom. Práh vstupu pro „AI video“ se prudce snížil.
- Midjourney: V7 se stává výchozím modelem (16. 6.) – po jarní verzi V7 Midjourney oficiálně změnil default z V6.1. Komunita hlásila rychlejší render a lepší čitelnost detailů.
Červenec 2025
- OpenAI: ChatGPT Agent (integrace Operatoru, 17. 7.) – agentní schopnosti se přestěhovaly přímo do hlavního rozhraní ChatGPT. Uživatelé můžou delegovat celé úkoly „z chatu“.
- xAI: Grok 4 (9. 7.) – další generační skok s hlubší integrací do živého vyhledávání v X. Silná rezonance mezi tvůrci obsahu a zpravodajstvím.
- Perplexity: spouští prohlížeč Comet (AI-first) – Comet přináší „čtecího“ asistenta přímo do prohlížení. Zacíleno na rychlé souhrny a interaktivní výzkum. Zpočátku omezen pro uživatele s Max plánem nebo pozvánkou.
Srpen 2025
- OpenAI: GPT-5 (7. 8.) – unifikovaný systém s adaptivním uvažováním, vyšší spolehlivostí a výkonem v kódu, matematice, psaní i vizuální percepci. Dostupný i ve free vrstvě (s limity). Dopad: obrovský nárůst používání ChatGPT a tlak na konkurenci i ceny API. Psal jsem o tom velmi detailně zde.
- EU AI Act – pravidla pro „GPAI“ (2. 8.) – začaly platit povinnosti pro poskytovatele „general-purpose“ modelů: shrnutí tréninkových dat, technická dokumentace, řízení rizik (u „systémového rizika“ přísnější režim). Dlouhodobý dopad: standardizace a auditovatelnost vývoje modelů v EU.
- (Regulační kontext) – dobrovolný Kodex praxe pro GPAI – EU vydala podpůrný kodex pro rychlejší náběh souladu. Část firem váhá se signaturou.
Září 2025
- Apple: uvedení nových funkcí Apple Intelligence (15. 9.) – Live Translation (Messages/FaceTime/Phone) a další AI funkce dorazily v iOS 26, iPadOS 26 a macOS Tahoe. V praxi: poprvé si je osahaly statisíce českých uživatelů v běžných updatech.
- OpenAI: Sora 2 + sociální iOS aplikace Sora (30. 9.) – nová generace video-a-audio modelu s fyzikálně věrnějším pohybem, řízením kamery a synchronním zvukem. Appka umožňuje „camea“ (vstup vlastní identity) a remix. Dopad: další vlna AI videí na sítích, ale s výraznými bezpečnostními pojistkami (C2PA, watermark).
- Anthropic: Claude Sonnet 4.5 (29. 9.) – optimalizace pro kódování, agentní úkoly a „computer use“, nový nejlepší výsledek na OSWorld. Posílení nástrojů Claude Code.
Říjen 2025
- OpenAI: „Company Knowledge“ v ChatGPT (Business/Enterprise/Edu) – nové konektory (Slack, SharePoint, Google Drive, GitHub a další) a odpovědi s citacemi napříč firemními systémy. V praxi: ChatGPT jako vyhledávač firemní paměti.
- Google DeepMind: Gemini 2.5 Computer Use – API model pro klikání a psaní v GUI (web i mobil), tedy „agent k počítači“. Přímá konkurence pro agentní schopnosti OpenAI a Anthropic.
- Perplexity: Comet je zdarma – AI prohlížeč Comet přešel z 200 dolarů měsíčně na bezplatný režim (s limity). Firma tím míří proti „AI slop“ a chce zvednout kvalitu prohlížení. Reakce: masové testování a srovnávání s Chrome a Gemini.
- Perplexity: Deep Research – „druhé uvedení“ s širším nasazením (23. 10.) – oficiální blog popsal detailní režim iterativního studia zdrojů a syntézy. Strojově prováděný „desk-research“ na pár minut.
- OpenAI: ChatGPT Atlas (webový prohlížeč) – OpenAI spustila vlastní prohlížeč s ChatGPT postranním panelem a Agent Mode pro komplexní úkoly. Analytici to čtou jako přímý útok na prohlížečový trh.
- NVIDIA: tržní kapitalizace 5 bilionů dolarů (29. 10.) – historická meta po sérii oznámení o objednávkách čipů a státních superpočítačích. NVDA dál táhne indexy. Symbolický moment AI éry.
Poznámky k dalším (významným) novinkám, které rezonovaly
- Midjourney – vývoj během léta: vedle V7 se objevily rychlé iterace (víc stylů, nové workflow), komunita hlásila výrazně lepší produktivitu při tvůrčí práci.
- Higgsfield (video AI) – mladý tým posunul „osobní video-studio v mobilu“, naskočily testy s tvůrci i brandy. Ukázka tlaku „AI-video pro každého“.
Proč je to pro uživatele důležité (tři jasné linie roku 2025)
- Agenti v praxi – OpenAI (ChatGPT Agent, Company Knowledge), Google (Computer Use), Microsoft (agentický web) a Perplexity (Comet) posunuli AI od „odpovědního stroje“ k plnění úkolů.
- Video a multimédia – Sora 2, Veo 3, Midjourney V1 Video snížily bariéru tvorby filmového obsahu. Tvůrci i firmy mají doslova „studio v kapse“.
- Regulace – AI Act začal reálně dopadat na vývoj a nasazení modelů (GPAI povinnosti od 2. 8.), což mění road-mapy dodavatelů i procesy compliance ve firmách.
Dejte mi vědět na mých sociálních sítích, co si o takovém přehledu novinek myslíte, co vám v něm chybí, co byste chtěli změnit atd. A jestli vás AI novinky zajímají, nezapomeňte se registrovat, aby vám chodily mailem (pravděpodobně 1× týdně, jestli tu většina z vás nebude chtít třeba měsíční periodu).
