Aktualizace: doplnil jsem na konci poslední dvě novinky
Poznámka: Před chvílí jsem vypsal po dlouhé době i nové termíny veřejných školení, kde si budeme ukazovat právě i tyto novinky. Nově budou dvoudenní a všechna jsou také dostupná opět i jako vánoční dárek – po objednání dostanete PDF certifikát, který bude opravňovat k účasti na mém školení v následujících 12 měsících. Více na konci článku nebo na stránce AI školení. A samozřejmě mohou objednávat i firmy, aby si nejen nachytřily zaměstnance, ale i snížily daňový základ :-). A teď už tedy k těm novinkám.
EDIT: anglická audio podcast verze tohoto článku (AI generovaná samozřejmě).
V nejbližších dnech vás naučím, jak takové podcasty budete sami generovat na dvě kliknutí. Registrujte se k odběru novinek, ať vám žádná zpráva neunikne.
1. ChatGPT Pro
Jako první OpenAI představila nový placený plán ChatGPT Pro. Ten je určen opravdovým profesionálům, už proto, že stojí 10× více než základní placený model Plus – konkrétně tedy 200 dolarů měsíčně (s daní cca. 5 tisíc Kč).
Jako hlavní předost tohoto tarifu byl představen nový jazykový model „o1 pro“. Jde o vylepšený tzv. reasoning model, který používá více výpočetního výkonu a delší „uvažování“, odpovědi by tak měly být mnohem lépe „promyšlené“ z mnohem více stran.
O reasoning modelech jsem zde ještě nepsal, primárně proto, že tak jak jsou nyní dostupné v ChatGPT mi nedávají z praktického hlediska moc smysl. Mají totiž jeden naprosto zásadní problém – neumí pracovat s kontextem. Nemůžete tam nahrát třeba data či PDF, neumí si to najít nic na internetu, neumí si to napsat program… S největší pravděpodobností je to něco, co během nejbližších měsíců vyřeší, ale prostě do té doby si téměř neumím představit situaci, kdybych to využil.
Například k psaní nějaké vědecké práce, což je právě oblast, kam si představují že bude ChatGPT Pro tarif cílit, budou reasoning modely skvělé, ale prostě napsat vědeckou práci bez toho, aniž bych jí v prvé řadě dal kontext, není dost dobře možné. (Nejen) vědcům bych tedy zatím pro tohle stále doporučoval Perplexity Pro – když použijete tenhle můj odkaz, dostanete 10 $ slevu. Ale i bezplatná verze umí skvěle hledat právě třeba ve vědeckých studiích, pracovat s daty, skvěle hledat na internetu. Ta placená má navíc i lepší modely a právě i právě reasoning, kdy si rozdělí nejdřív úkol do několika menších, včetně takových, které právě kombinují různé hledání, data analýzu atd.
Budu ale v nejbližších týdnech srovnávat právě i různé reasoning modely, řeším nyní i pořízení Pro tarifu s několika dalšími zájemci, takže vám pak dám dám vědět, klidně mi mezi tím pište nějaké vaše zadání, které byste chtěli s tímto modelem vyzkoušet. Bude také dostupný ke hraní účastníkům mých školení.
Nicméně nový reasoning model není to jediné, co ChatGPT Pro nabízí, takže vám může dávat smysl:
- Neomezené využití všech modelů – včetně tedy o1, o1-mini či standardního GPT-4o, kde normálně máte u bezplatných tarifů jednotky použití denně, u placených pak řádově desítky v rámci 3hodinového okna. Reálně na limity narážím, když sdílím účet s více lidmi a tak nás například 10 naráz na školení něco dělá, tohle by ten problém řešilo.
- 4× větší kontextové okno – klíčový parametr pro složitější konverzace je počet tokenů (něco jako „slov“ či „slabik“), které model zvládne „udržet v paměti“. Pro bezplatné tarify je to jen 8 tisíc tokenů, GPT Plus (a asi i Team) má kontextové okno 32 tisíc tokenů, Pro pak 128 tisíc tokenů. Bohužel bez možnosti nahrát kontext je užitečnost výrazně menší (konkurence má navíc už dnes u běžných tarifů výrazně větší kontextová okna – 200 tisíc u Gemini a 1 resp. 2 miliony tokenů u Gemini).
- Neomezené využití Advanced voice (kdo nezná, viz článek) – tohle už se může hodně lidem hodit – s bezplatným tarifem si můžete povídat 15 minut měsíčně, i s placeným jen asi hodinu denně, ale dost lidí by uvítalo třeba i celodenní asistenci (problém totiž je, že do časového limitu se počítá, i když si s hlasovým asistentem vyloženě nepovídáte, ale máte ho jen puštěný na pozadí, kdy čeká na vaše dotazy).
- 100× větší limity pro generování videí – tohle představili až o několik dní později a může to být v tuto chvíli fakticky největší důvod si ChatGPT Pro pořídit, budu se tomu věnovat v přespříští kapitole.
Více informací o novém tarifu ChatGPT Pro a srovnání v modelu OpenAI o1 pro v syntetických testech viz jeho představení. Nově všechny OpenAI o1 modely přišly o nálepku „preview“, zároveň OpenAI slibuje, že budou rychlejší a lepší (o tom ještě v zatím poslední kapitole).
Stále je ale nelze využít s kontextem, ale přeci jen jedno vylepšení zde přibylo – můžete k nim nahrát obrázky. Tím lze ale při troše snahy alespoň částečně obejít omezení kontextu – máte-li data např. v PDF, můžete jej převést na obrázky jednotlivých stran a nahrát jako kontext, podobně například jsou-li data někde na netu, můžete z nich v prohlížeči udělat screenshot a pak je tam nahrát. Ale je to furt dost krkolomné řešení a nejspíš lepších výsledků dosáhnete tak, že použijete standardní model s nahraným kontextem a „reasoning“ bude emulovat tím, že pak budete prostě klást ty správné dotazy, které jej přimějí nad kontextem „přemýšlet“ z různých úhlů, kriticky zhodnotí své odpovědi atd.
2. Dolaďování modelů pomocí vlastních dat
Druhý den se OpenAI zaměřila na vývojáře AI aplikací a služeb a představila Reinforcement Fine-Tuning (RFT) pro jejich nejnovější model O1. Tato technologie (česky nejlépe asi dolaďování pomocí zpětnovazebního učení nebo zpětnovazební dolaďování), která má být veřejně dostupná v příštím roce, umožní uživatelům vylepšit model O1 pomocí vlastních datových sad.
Na rozdíl od standardního fine-tuningu využívá RFT algoritmy posíleného učení, které dokážou model naučit zcela nové způsoby uvažování nad specifickými doménami. Pozoruhodné je, že k efektivnímu natrénování stačí jen několik desítek příkladů.
Demonstrace této technologie byla předvedena ve spolupráci s výzkumníkem Justinem Reem z Berkeley Lab na případu diagnostiky vzácných genetických onemocnění. Tým ukázal, jak lze pomocí RFT vylepšit menší model O1 Mini tak, že v konkrétní úloze předčí výkon většího modelu O1. Na validačním datasetu model dosáhl 31% přesnosti při určování správného genu na první pokus, což představuje významné zlepšení oproti základnímu modelu O1 Mini (17,7 %) i standardnímu modelu O1 (25 %). Vzhledem k výrazně nižší výpočetní náročnosti u jednoduššího modelu to může značné zrychlení i ohromné snížení nákladů za tokeny.
OpenAI již spolupracuje s několika partnery na testování této technologie, například s Thomson Reuters na vývoji právního asistenta v rámci jejich systému Co-Counsel AI. Společnost nyní rozšiřuje přístup k RFT prostřednictvím programu „reinforcement fine-tuning research program“, který je zaměřen především na organizace pracující na komplexních úkolech s týmy expertů. Veřejné spuštění technologie je plánováno na začátek příštího roku.
3. Generátor videí SORA
Zatím asi nejzajímavější ze všech novinek představila OpenAI minulé pondělí – jde o novou a první veřejnou verzi jejich modelu na generování videa na základě textového a obrazového vstupu (text-to-video, image-to-video a video-to-video). Výstupy z první verze tohoto modelu začala OpenAI ukazovat koncem února, psal jsem o tom zde, ale nedali ji k dispozici veřejnosti, oficiálně proto, že se obávali zneužití před americkými volbami. Neoficiálně se psalo o ohromné výpočetní náročnosti (několik minut generování na párvteřinová videa i na nejnadupanějších serverech), a tedy i tržně neakceptovatelnou cenu.
Nyní tedy OpenAI představila službu Sora, dostupnou na webové stránce Sora.com, kde mohou uživatelé placených tarifů ChatGPT generovat videa pomocí nové verze stejnojmenného modelu. Přesněji – ne všichni platící uživatelé, zatím pouze uživatelé tarifů Plus a Pro (tedy nikoliv například Team) a opět zatím pouze mimo evropských uživatelů (což ale lze samozřejmě řešit s pomocí VPN, předpokládám, že opět v nejbližších týdnech začne fungovat i nám).
Více o Sora funkcionalitě na produktové stránce, o modelu jako takovém na jeho systémové kartě. O Sora budu na přelomu roku psát více, nyní testuji a sleduji cvrkot na sociálních sítích od dalších lidí, kteří si Sora hrají a kteří třeba měli přístup i k předchozí verzi. Určitě chci, abychom si jej mohli zkoušet už na školení příští týden.
Zatím v krátkosti
- Nový model Sora byl výrazně optimalizovaný pro snížení výpočetní náročnosti – to ale také znamená, že jsou jeho výstupy horší než ty které ukazovali v únoru. Například vše ve videu kromě hlavního „předmětu“ se pohybuje divně a výstup není zcela dle zadání. Po prvotním nadšení se tak spíše objevuje kritika. Problémem je i silná ochrana různých práv, takže například neumožňuje generování videí se skutečnými osobami (zejm. v Plus plánu).
- Přesto jde nepochybně o jeden z nejlepších text-to-video modelů dostupných na trhu a to, že jej uživatelé běžného placeného ChatGPT dostanou „zdarma“ v rámci svého předplatného z něj nepochybně udělá krále různých drobných klipů na socky a hodí to vidle do business plánů dnešních leaderů typu Runway či HailuoAI. Nicméně se rýsují noví konkurenti (a zejména ty od Google vypadají hodně zajímavé, také o nich budu psát).
- Prompty můžete psát i česky, viz třeba výše uvedené video, které vzniklo mým zadáním českého pangramu „Příliš žluťoučký kůň úpěl ďábelské ódy“. Budu ale určitě ve svých testech dál porovnávat shodu výstupu u českých a anglických promptů (jak vidíte, tady tomu moc neodpovídá, ale není to příliš kvalitní prompt).
- Je možné vytvářet videa na šířku či na výšku ve 3 různých (ne přilíš detailních) rozlišeních (480, 720 a 1080p). Rozhraní je příjemně přehledné, připomíná Midjourney, kombinovaný s nějakými webovými editory videa, umožňuje vám videa různě upravovat, ořezávat, pomocí AI prodlužovat, měnit scény, vytvořit z nich bezešvou smyčku, kombinovat několik videí dohromady atd.
- Počet a délka videí, které můžete generovat na Plus plánu je velmi omezený (řádově nižší desítky pětivteřinových videí s malým rozlišením za měsíc), navíc je tam vodoznak. S Pro tarifem je to cca. 100× více, můžete dělat videa ve vyšším rozlišení a bez vodoznaku. Plus plán také neumožňuje využít fotografie a videa skutečných lidí v režimu image-to-video a video-to-video. V zásadě jestli je dnes něco důvodem ke koupi Pro tarifu, tak je to právě Sora.
- Sora není jen „hloupý“ AI generátor videí – můžete nakombinovat několik textů a vytvářet ve speciálním editoru celý storyboard, se kterým vytvoříte delší video, ve kterém na sebe budou scény a objekty na nich navazovat. Chystám se k tomu napsat návod a budeme si s tím hrát na mých školeních, takže se neváhejte přihlásit.
4. Vylepšený Canvas – pracovní plocha pro všechny
OpenAI v říjnu představilo pro placené tarify Canvas (česky Pracovní plocha), bylo to ale zjevně šité horkou jehlou jako reakce na obdobnou funkci Claude Artifact a funkčně hodně omezené.
Canvas je de-facto speciální rozvržení do kterého lze ChatGPT přepnout, ve kterém samotný chat zabírá jen úzký pruh stránky a většinu zabírá speciální plocha, kde je obsah, který pomocí chatu generujete – například chcete napsat nějaký článek, tak veškerá konverzace a ladění bude v chatu, ale článek budete mít stále na očích. Vedle tvorby článků má speciální funkcionalitu pro psaní programovacího kódu.
Nově umí kód Canvas kód i spouštět (zatím tedy jen Python, podobně jako Code interpreter) a ladit, je možné také výstup upravovat i přímo v canvas okně a doplňovat poznámky resp. náměty na revize (může vám je navrhnout i AI). Při vložení dlouhého textového obsahu do běžného pole pro zadání promptu, ChatGPT vám nabídne možnost předat tento kontext do Canvas okna. Navíc je tato funkcionalita nově dostupná i registrovaným uživatelům neplacené verze. Canvas navíc můžete nově používat i uvnitř GPT asistentů.
Více informací o funkci Canvas najdete v tomto jejich článku. Já si s novým Canvas nyní týden hraju, připravuji nějaké zajímavé use case na školení a mám také rozepsaný podrobný návod, tak se neváhejte přihlásit či alespoň registrovat, aby vám to neuniklo.
Zatím dva postřehy – Canvas bohužel nemá přístup k souborům, které tam nahrajete, což omezuje jeho využití pro některé funkce, jako je třeba datová analýza přes code interpreter. Zjevně jsou to dvě zcela oddělená prostředí. Druhým nedostatkem je nemožnost snadno sdílet výstup – to je schopnost, která mě moc baví u Claude Artifacts, viz například simulátor hanojských věží, který jsem pomocí několika dotazů vytvořil na minulém školení.
5. ChatGPT v Apple Intelligence
Apple společně s OpenAI představili integraci ChatGPT od OpenAI do svých zařízení prostřednictvím aktualizace iOS 18.2. Tato integrace umožňuje hlasové asistentce Siri využívat schopnosti ChatGPT k poskytování podrobnějších odpovědí na dotazy uživatelů, a to nejen v oblasti textu, ale i při analýze fotografií a dokumentů (tzv. Visual intelligence). Uživatelé mohou také využít funkci Writing Tools pro tvorbu psaného obsahu v podporovaných aplikacích, což zahrnuje i generování obrázků. Sympatická je spolupráce s ChatGPT, kdy můžete vaši konverzaci i třeba s prohlíženým dokumentem snadno dokončit v ChatGPT a využít tak jeho plných schopností.
Bohužel, tato funkce opět není dostupná mimo USA a v tomto případě se obávám, že ani jen tak nebude. Nejsem si také jist, jestli půjde rozchodit pomocí VPN, napište mi, jestli se vám to někomu povedlo. Pro zapnutí integrace je třeba zapnout Apple Intelligence v Nastavení/Settings a integraci ChatGPT (viz ukázka na začátku videa resp. v půlce pro Mac OS).
Pro využití těchto funkcí je nutné mít zařízení s podporou Apple Intelligence, konkrétně telefony iPhone 16, iPhone 15 Pro, tablety iPad s čipy A17 Pro nebo M1 a novější, či počítače Mac s čipy M1 a novějšími. Uživatelé mohou přistupovat k ChatGPT prostřednictvím Siri nebo Writing Tools, přičemž není nutné mít účet u OpenAI, avšak přihlášení může nabídnout rozšířené možnosti.
6. Hlasový asistent s kamerou a obrazovkou a pokec se Santou
Moje oblíbená funkce hlasového asistenta Advanced Voice (viz můj článek) dostává konečně funkci, kterou slibovali již při jejím představení – umí live analyzovat obraz – stream z kamery (přední i zadní) vašeho telefonu nebo obrazovku vašeho displeje a diskutovat o tom, co viděl.
Typicky se to tak bude využívat třeba k radám jak něco vyřešit, asistent vám bude „koukat pod ruce“ a navede vás k řešení. Super užitečná může být ale třeba i pro osoby se zrakovými obtížemi, pomůže jim interagovat se světem kolem nich. Ovšem stále nejspíš zůstává výrazné časové omezení a i s placenými tarify si pokecat budete moci pokecat jen desítky minut denně.
V tuhle chvíli by měla být funkce dostupná všem uživatelům tarifu Team a většině uživatelů Plus a Pro tarifů, zbytek platících ji dostane začátkem příštího roku. Zatím je tedy dostupná jen v mobilních aplikacích, ale předpokládám, že se brzy dočkáme i v ChatGPT aplikaci pro Windows.
Přidali i jeden „easter egg“, i když bych měl říct spíš „christmas egg“ – až do konce roku si můžete pokecat se Santou – přibyl nový hlas – staršího bodrého muž co každou odpověď začíná Ho-ho-ho. Přepnete na něj ikonkou nastavení, která dočasně změnila podobu na sněhovou vločku (funguje to i v té Windows aplikaci). Santa neumí příliš česky (můžete mu říct, ať česky mluví, ale i pak má výslovnost jak Lendl týden po emigraci), Ježíška zná ale prý se vzájemně doplňují, dárky nosí i zlobivým dětem ale přibalí třeba kus uhlí.
7. ChatGPT Projekty
Radost mi udělala další novinka – projekty. Opět se jedná o funkcionalitu, kterou opsali od svých konkurentů – Perplexity a Claude a umožňuje jistou debordelizaci prostředí ChatGPT.
Projekty, které můžete nově vytvořit, jsou něco jako složky, do kterých můžete zařadit jednotlivé konverzace a nemít je tak pomíchané bez ladu a skladu. Zároveň můžete ke složce nahrát soubory, které budou dostupné ze všech jejích konverzací jako knowledge a můžete jim také nastavit vlastní instrukce. Složce lze pro lepší odlišení nastavit i nějakou barvu ikonky (škoda že ne i samotnou ikonku) pro lepší odlišení a ve složce lze i vyhledávat.
Bohužel mají projekty i nějaká omezení – nelze v nich používat jiné modely ani GPT asistenty a k projektovým souborům nelze přistupovat pomocí interpretu kódu. Je to tak trochu nedodělané ale v zásadě to nahradí pluginy do prohlížečů, které někteří pro lepší organizaci chatů používali.
Zatím je tato funkce dostupná pro placené účty, ale měla by se časem objevit i u bezplatných.
8. Vylepšené vyhledávání kontextu. Pro všechny
Na začátku jsem psal, že považuji za naprosto klíčové při použití AI chatbotů typu ChatGPT u téměř všech konverzací doplnit k nim kontext a jedním ze způsobů, jak to udělat, je nechat ChatGPT najít relevantní kontext na internetu.
Tato funkce byla doteď dostupná pouze platícím uživatelům, uživatelé bezplatné verze ji mohli použít jen velmi omezeně několikrát za den. Byl to důvod, proč jsem třeba na přednáškách pro studenty škol (kteří vesměs placené ChatGPT nemají), doporučoval použít jiné služby jako již zmíněné Perplexity, nebo Microsoft Copilot, které hledání od počátku umožňují i právě u bezplatné verze. Nově tedy toto omezení padá a lze očekávat mnohem méně halucinací a lepší výstupy od všech uživatelů ChatGPT.
Zároveň se po vzoru Perplexity zlepšilo i zobrazení zdrojů použitých pro vytváření odpovědi, které jsou přehledně zobrazené ve vlastním boxu pod či nad generovaným výstupem z modelu a lze zobrazit i další související zdroje. Může také zobrazit nalezené obrázky, embed video z YouTube, mapu, detaily k firmám atd.
Hledání nyní funguje i ve funkci Advanced Voice, o které jsem psal při jejím uvádění, absence znalostí byla doteď její největší slabinou, nemohli jste si tak povídat třeba k nějakému aktuálnímu tématu nebo složitější problematice, nově tedy toto omezení padá a hlasový asistent/ka se tak stává ještě mnohem užitečnější.
Přibylo také rozšíření do prohlížeče Chrome (a Edge), umožňující vytvořit novou konverzaci (třeba i s hledáním) pomocí zadání promptu do adresního řádku prohlížeče a tedy náhradu výchozího prohlížeče (obvykle Google nebo Bing) v těchto prohlížečích. Všechny tyto novinky k hledání popsala OpenAI v tomto článku.
Tyto změny mohou udělat vrásky na čele Google, reálně hrozí že jej uživatelé přestanou používat jako primární vyhledavač informací a místo něj začnou používat právě ChatGPT.
Při zkoušení jsem odhalil i jednu zajímavost – pakliže zapnete nástroj Hledání, ChatGPT doplní do systémových instrukcí vaší IP adresu a z ní odhadnuté město (a možná v některých případech i hostname). Občas tak lidi zaskočí, že o nich ChatGPT ví něco, co mu nikdy neřekli. Není to nějak tajné či překvapivé – stejný údaj ví každý server, který používáte a například tak může vyhledávání nabídnout nějaký blízký obchod a ne nějaký v Americe.
9. Novinky pro vývojáře
Zatím poslední novinky OpenAI zaměřila včera v devátém dni své akce na vývoáře. Klíčovým oznámením bylo uvedení modelu OpenAI o1 do plné produkce v rámci API, a to včetně nových funkcí jako je function calling, strukturované výstupy, developer messages a zpracování obrazových vstupů. Mezi další zajímavosti patří nový parametr „reasoning effort“, který umožňuje optimalizovat výpočetní náročnost modelu v závislosti na složitosti úlohy. OpenAI navíc zdůraznilo zlepšení výkonu modelu o1 v oblastech jako jsou volání funkcí, strukturované výstupy a kódování, s nižší latencí a nižší spotřebou výpočetních zdrojů oproti předchozím verzím.
Další zásadní novinkou je aktualizace pro Realtime API, která nyní podporuje WebRTC. Tato technologie zjednodušuje implementaci hlasových aplikací a přináší výrazné snížení složitosti kódu potřebného pro vytvoření aplikací s nízkou latencí. Kromě toho OpenAI představilo metodu preference fine-tuning, umožňující modely lépe přizpůsobit preferencím uživatelů. Tato metoda, dostupná pro modely o1, umožňuje ladění na základě porovnání odpovědí, což je užitečné například při tvorbě zákaznické podpory nebo kreativního psaní. OpenAI také oznámilo snížení nákladů na některé služby, nové SDK pro Go a Java a zjednodušený proces registrace API klíčů.
Nové OpenAI o1 modely dostupné přes API mají nově také větší kontextové okno – konkrétně 200 tisíc tokenů, a zvětšila se i maximální generovaná délka výstupu na 100 tisíc tokenů (v češtině podle mých čerstvých testů přibližně 50 tisíc slov, cca. 120 normostran). Detailnější informace k těmto novinkám včetně třeba příkladů kódů najdou vývojáři na této stránce.
10. OpenAI na telefonu a WhatsApp
Novinka, která zní ovšem trochu jako něco z minulého tisíciletí, je možnost zavolat v Americe na bezplatnou telefonní linku 1-800-ChatGPT (1-800-2428478) a budete si povídat s ChatGPT hlasovou asistentkou.
Výhoda je, že k tomu nepotřebujete ani placený účet, ani chytrý telefon (dokonce ukazují i starý telefon s rotační číselnicí), takže to prostě může být váš „chytrý přítel na telefonu“.
Z Čech si ale na americkou bezplatnou linku nezavoláme, a tak tu možná někdo využije druhou dnes představenou novinku – možnost povídat si s ChatGPT přes WhatsApp, ale jde pouze o textové povídání, a bez funkcí, které umí webová či mobilní aplikace, takže v tom popravdě nevidím moc přínos.
Nicméně tohoto asistenta možná ocení například důchodci, lidé hůře ovládající technologie, či prostě jen osamělí – možnost mí kdykoliv „přítele na telefonu“ se kterým si mohou povídat o čemkoliv, může být pro ně příjemná. A nemusí se učit ovládání nějaké další aplikace. Takže můžete zkusit přidat jej svým babičkám a dědečkům na jejich WhatsApp, třeba vás překvapí.
Jak na to? Prostě přidáte nový kontakt – pojmenujte si jej jak chcete (třeba „Milenka“ či „Milenec“, psaní s nimi jistě ocení váš partner/ka 🙂 ) a jako číslo zvolte US předvolbu +1, a číslo 800-242-8478. Následně se vám přidá kontakt už mu/jí/tomu můžete psát, klidně normálně česky (případně mu/jí/tomu napište instrukce, ať s vámi komunikuje výhradně česky). První odpověď bude obsahovat upozornění (v angličtině), že si píšete s AI, že tam můžou být chyby a že souhlasíte s podmínkami, pak už následuje samotná konverzace. Delší odpovědi umí nasekat do několika zpráv, používá formátování, atd.
11. Desktop ChatGPT co pracuje s aplikacemi
Desktop aplikace ChatGPT od OpenAI má novou funkci „Work with Apps“. Ta umožňuje ChatGPT vidět, co je zobrazeno na obrazovce, a spolupracovat s aplikacemi, což znamená, že může číst a analyzovat text, obrázky a další obsah přímo z aplikací. Funkce je zatím dostupná pro Mac, ale verze pro Windows by měla následovat brzy. ChatGPT podporuje různé aplikace, jako jsou vývojářské nástroje, textové editory a terminály, a umožňuje uživatelům klást otázky nebo žádat o pomoc přímo v kontextu toho, co vidí na obrazovce. Této novince jsem věnoval samostatný článek S OpenAI ChatGPT můžete nově ovládat svůj počítač.
12. Nové reasoning model OpenAI o3 a o3-mini na cestě
Poslední den vánoční dvanáctidenní akce si OpenAI nechala do budoucna asi to nejlepší. Během živého vysílání na YouTube představila nové vrcholné modely o3 a o3-mini, které posouvají hranice toho, co je dnes možné s AI dosáhnout.
Poznámka: ne, opravdu jste se nepřehlédli a po modelech o1 přichází modely o3. Sam Altman to „vysvětlil“ tak, že jsou prostě špatní v pojmenovávání, což je sice fakt, ale pravda bude nejspíš trochu jinde – v marketingu. Tipuji, že prostě chtějí mít vyšší číslo verze než má Gemini a „dohnat“ v číslování Claude, u technologií často vyšší číslo znamená prostě novější/lepší
O3 je skutečně mimořádně výkonný model. V syntetických testech předčil svého předchůdce o1 o desítky procent. V složitých matematických úlohách má úspěšnost přes 96 % a umí řešit i problémy, nad kterými by zkušení matematici strávili hodiny či dny. Navíc je i špičkovým programátorem – v populárním testu programátorských schopností CodeForces dosahuje úrovně okolo 2700 ELO, což je více než má hlavní výzkumník OpenAI. A je to i model schopný vysoce sofistikované logiky a „zdravého rozumu“ – v neuvěřitelně obtížném testu obecné inteligence ARC dosáhl skóre přes 87 %, což je více než průměrný člověk a dosud to nedokázal žádný jiný model.
Hezkou ukázkou posunu je výkon v EpochAI Frontier Math – nejtěžší test, vytvořený ve spolupráci s 60 matematiky, držiteli cen atd., skládající se ze stovek nezveřejněných testů. Po letech zkoušení jej nejlepší současné modely zvládaly na pouhá 2 %. O3 dosáhl 25.3 %.
Vedle toho představili i model o3-mini, který by měl nabídnout skvělý poměr ceny a výkonu. Je až 4x rychlejší a levnější než o1, přitom má srovnatelné či lepší schopnosti. Například v testu matematických schopností AMC 2024 je na tom stejně jako o1. Zároveň podporuje i pokročilé funkce jako function calling, strukturované výstupy či generování obrázků ze zadání. Opravdu se tak zdá, že o3-mini bude skvělá volba pro naprostou většinu aplikací a use-cases.
Oba modely budou k dispozici přes API ve třech verzích dle „reasoning effort“ – od rychlé po důkladnou. První z nich slibuje odezvu podobnou GPT-3 či GPT-4, u nejvyšší verze půjde spíše o vteřiny, za to s tím nejlepším výkonem.
Bohužel zatím nejsou nové modely o3 a o3-mini dostupné veřejně, pouze pro bezpečnostní testování vybraným výzkumníkům, kteří se jim zaregistrují. O3-mini by měla být k dispozici širší veřejnosti koncem ledna, o3 pak někdy zkraje příštího roku.
O3 a o3-mini jsou vybaveny i nejnovějšími bezpečnostními prvky založenými na „deliberative alignment“ (česky asi nejlíp „promyšlené sladění“), kdy je model naučený přímo bezpečnostní pravidla a postupy, jak o nich přemýšlet a aplikovat je ve svých odpovědích. Mělo by to vést k jeho bezpečnějšímu a užitečnějšímu chování.
Vánoční dárek – školení pro jednotlivce i firmy, novinky…
Poslední měsíce jsem z různých důvodů neměl moc času na školení a psaní článků, nyní se k tomu vracím a budu se snažit školit a psát každý týden.
Jak už jsem psal na začátku, úplně jsem překopal svá školení, nebyl jsem totiž moc spokojen s tím, že jsme v rámci jednoho dne vše prolítli a nebyla moc možnost si to to pořádně zkoušet. Proto jsem předělal školení na dvoudenní s tím že cca třetinu času budeme společně zkoušet různé nástroje, techniky atd
Dělal jsem na tom několik posledních měsíců a ladil jsem to už u 10 skupin z řad firem, které si u mě školení objednaly a spokojenost byla značná, takže jsem to teď dal do nabídky AI školení a vypsal jsem první termíny (včetně první už příští týden). A už tam budu učit nově právě i novinky, včetně těch o kterých píšu v tomto článku.
Koncem ledna se chystám opět udělat školení v Brně, kdyby vás bylo víc z nějakého jiného města, tak mi napište. A vypsal jsem i online školení na konec ledna. i to bude dvakrát delší. A určitě vás potěší, že cena téměř zůstává.
Všechna AI školení můžete objednat i jako dárek pod stromeček, dostanete pak certifikát se jménem obdarovaného, se kterým se pak on může kdykoliv přihlásit na libovolný další volný termín.
Firmy mohou objednat školení – buď opět stejná dvoudenní, nebo je mohu různé rozkouskovat, nebo dělat i školení na míru a kratší školení…, napište mi, nebo zavolejte a určitě něco vymyslíme. A můžeme to stihnout vyfakturovat ještě do konce tohoto roku, ať si to můžete odečíst z daní.
No a protože už mnoho stovek z vás mělo školení před rokem, možná budou někteří z nich mít zájem o update, budu dělat zvýhodněné doplňovací online školení pro všechny, co už u mě byli – projdeme novinky z posledního roku a třeba i to, co jste zatím řešili, kde se trápíte atd. Tam budu termín vypisovat asi zítra a pošlu to všem účastníkům.