OpenAI Dev Day – představení budoucnosti generativní umělé inteligence

Jestli jste četli můj včerejší přehled novinek, mohli jste vědět, že se na dnešek chystala klíčová vývojářská konference OpenAI Dev Day. Začínala v 7 večer úvodní keynote, kterou jsme mohli sledovat živě online, a kterou se v následujících odstavcích pokusím shrnout (s pomocí AI)

Vesměs tak novinky nebudou překvapením, většinu z nich jsem popsal už včera, ale i tak bylo super je vidět „v plné kráse“.

Jinak si také můžete o novinkách přečíst na jejich blogu:

Chcete dostávat tyto články na e-mail, aby vám nic neuteklo?

Registrujte se

AI školení pro začátečníky, pokročilé (automatizace, vibecoding) a firmy.

Školení umělé inteligence

Úvodní slovo generálního ředitele

(Čas 30:00)

Sam Altman, generální ředitel společnosti OpenAI, zahájil akci připomenutím úspěchů společnosti za poslední rok. Zmínil spuštění ChatGPT na konci listopadu 2021, který označil za velmi úspěšný. Dále zmínil březnové spuštění modelu GPT-4, který je podle něj stále nejpokročilejším modelem na světě.

V posledních měsících OpenAI spustilo nové modality jako je zpracování obrazu a zvuku, takže ChatGPT umí nyní vidět, slyšet a mluvit. Nedávno byl spuštěn také model DALL-E 3 pro generování obrázků. Tyto nové schopnosti jsou nyní integrovány přímo v ChatGPT.

Pro firemní zákazníky byl spuštěn ChatGPT Enterprise s vylepšeným zabezpečením, vyšší rychlostí a delší pamětí kontextu. OpenAI API aktuálně využívá přes 2 miliony vývojářů a přes 92% firem ze žebříčku Fortune 500. ChatGPT má nyní okolo 100 milionů aktivních uživatelů týdně, získaných čistě organickým šířením.

„OpenAI is the most advanced and the most widely used AI platform in the world now,“
Sam Altman [čas 31:47]

Příběhy spokojených uživatelů

(Čas 32:25)

Jako mnohaletý markeťák miluju tuhle část (vesměs amerických) prezentací. České firmy tohle většinou nedělají, nechápou a neumí, přitom je to naprosto úchvatný marketingový tah, kde zároveň ukážete, že s vaší firmou/výrobky/službami jsou zákazníci spokojení, zároveň ukážete různé užití vašich výrobků a služeb. V Americe pak také bývá zvykem ukázat postavy rozličného věku, pohlaví, národnosti, postižené… takže předvedete inkluzi a přínos pro každého, a když jste hodně šikovní, tak ještě dojmete publikum.

Jestli řešíte marketing, tohle si dejte, protože zde OpenAI předvedlo za 2,5 minuty ukázkový výkon jak z učebnice:

Mladá Filipinka, umělkyně, která psala dopis svému milovanému tatínkovi
Mladý afroameričan, začínají podnikatel, který potřeboval srovnat myšlenky co dělat
Osoba středního věku, která s ChatGPT rozvíjí svou kreativitu
Lékař středního věku, kterému ChatGPT napsalo vizualizaci cirkulace hemoglobinu
Mladý futurista, vegan, který vyfotí ledničku a ChatGPT mu řekne, co mu chybí pro nějaký recept
Středně starý inženýr, který se rozplývá nad Advanced Data Analysis
Stařík, který se s ChatGPT seznámil na svých stých narozeninách, povídá si s ním a oceňuje jeho přátelskost, trpělivost a znalosti
Afroamerická velmi úspěšná studentka, která je zároveň matkou 4 dětí, která s ChatGPT se může ptát a získat nejen odpověď, ale i vysvětlení a díky tomu má čas na rodinu
Mladý afroamerický postižený umělec, který oceňuje hlasové ovládání

Nový model a vylepšení parametrů a podmínek u stávajících

(Čas 34:45)

Altman představil nový model GPT-4 Turbo, který přináší řadu vylepšení:

Delší kontext až 128 000 tokenů (tj. 300 stran knihy), což je 16x více než předchozích 8000 tokenů u GPT-4. Model je přesnější i při velmi dlouhém kontextu.
Větší kontrola nad výstupy díky funkcím jako garantovaný JSON výstup, lepší volání funkcí a možnost nastavit seed pro reprodukovatelné výstupy.

„Developers need more control over the model’s responses and outputs,“.
Sam Altman

Lepší znalosti o okolním světě díky načítání externích zdrojů znalostí a aktualizaci interních znalostí modelu až do dubna 2023 s častou aktualizací.
Nové modality jako generování obrazu (DALL-E 3), GPT-4 Turbo + Vision, zpracování zvuku (převod textu na přirozeně znějící řeč) a brzy i rozpoznávání řeči (Whisper V3).

„GPT-4 Turbo can now accept images as inputs via the API, can generate captions, classifications, and analysis,“
Sam Altman (čas 38:37)

Přizpůsobení – finetuning i pro 16K verzi GPT 3.5 a pro GPT-4 a pro pár velkých zákazníků rozjedou zakázkové Custom Models, kdy takovým firmám pomohou vytvořit model přesně pro jejich potřeby.
Vyšší limity – uživatelé API mají nyní 2× větší limity na počet dotazů za minutu a možnost zažádat si o další zvýšení těchto limitů.

Copyright shield – OpenAI se zavázala bránit své zákazníky při jakýchkoliv copyright problémech vzniklých využitím OpenAI a uhradit náklady případných soudních sporů. Zároveň připomněl, že při využívání API se nikdy nevyužívají konverzace pro trénování modelů a neměl by tak nastat problém s únikem dat.
Nižší ceny, vyšší rychlost – u nového GPT-4 Turbo modelu jsou zadání jsou 3x levnější a odpovědi 2x levnější než u GPT-4. V průměru by to tak mělo být zhruba 2.75× levnější. Také měl být brzo také „o hodně rychlejší“. Stejnou měrou je snížena cena u modelu ChatGPT 3.5 16K, který je tak levnější než dosavadní 4K model. A stejně poklesly ceny i pro finetuning u 3.5 4K modelu a u 16K modelu je pokles ještě o třetinu větší.

„We worked really hard to make this [lower prices] happen. We hope you’re as excited about it as we are,“
Sam Altman (čas 43:05)

Partnerství s Microsoftem

(Čas 44:30)

Na pódium byl pozván Satya Nadella, generální ředitel Microsoftu. Mluvil o prohlubujícím se partnerství s OpenAI a o tom, jak Microsoft buduje nejlepší infrastrukturu pro trénování AI modelů na Azure.

„We want to make sure you all, as builders of these foundation models, have not only the best systems for training but the most compute so you can keep pushing forward,“
Satya Nadella (čas 47:48)

Také zmínil důležitost zaměření se na bezpečnost při vývoji AI. Microsoft hodlá využívat API a modely OpenAI ve svých produktech jako je GitHub Copilot.

Vylepšení ChatGPT

GPT-4 All Model

(Čas 49:10)

Altman oznámil vylepšení ChatGPT díky novému modelu GPT-4 Turbo a také odstranění obtěžujícího výběru modelu (Browsing, DALL-E, ADA). Nyní bude ChatGPT automaticky volit nejlepší model pro daný dotaz, aniž by uživatel musel cokoliv nastavovat (i když Pluginy budou myslím stále zvlášť).

Představení GPTs – AI Agenti

(Čas 50:00)

Jednou z hlavních novinek je představení GPTs – přizpůsobených verzí ChatGPT pro konkrétní účely. GPTs kombinují instrukce, rozšířené znalosti a akce.

„With GPTs we’re letting people easily share and discover all the fun ways that they use ChatGPT with the world,“
Sam Altman (čas 51:05]

GPTs are a new way for anyone to create a tailored version of ChatGPT to be more helpful in their daily life, at specific tasks, at work, or at home — and then share that creation with others. No code required. https://t.co/SPV4TcMiQw pic.twitter.com/PcmorZwtMF
— OpenAI (@OpenAI) November 6, 2023

Ukázka GPT

GPTs lze vytvářet snadno přímo konverzací s modelem, bez nutnosti programování pomocí jednoduchého nástroje GPT Builder, Sam Altman tam takhle během minuty vyšvihnul asistenta schopného odpovídat na dotazy startupistů.

Vytvořené agenty lze používat soukromě či sdílet veřejně nebo v rámci organizace. Altman také ukázal 3 agenty, které už připravili někteří partneři – Code.org (plánovač vyučovací hodiny), Canva (generátor grafiky přímo z rozhraní ChatGPT), Zapier (automatizace s využitím kalendáře a textové zprávy).

Brzy bude spuštěn GPT Store, kde bude možné GPTs publikovat a vyhledávat. Autoři nejlepších GPTs budou dostávat podíl z příjmů OpenAI.

Nové API pro vývojáře

(Čas 1.02:00)

Pro vývojáře OpenAI představilo Assistants API, které usnadňuje vytváření vlastních konverzačních asistentů s využitím funkcí jako jsou persistentní vlákna, načítání externích znalostí, spouštění Python kódu v sandboxu (code interpreter – ten mě osobně v API velmi mile překvapil) a volání funkcí. Vývojář má také perfektní přehled, co se tam děje, díky přehledu všech diskusních vláken.

„With just a few lines of code, users can now have a very specialized assistant right inside the app.“
Romain, head of developer experience (čas 1:04:03)

Jde o první krok k budoucím AI agentům. Asistenti mohou využívat nové modality OpenAI API jako je zpracování přirozené řeči, generování textu i obrazu. Romain to následně předvedl, kdy pomocí jednoduché aplikace hlasem všem přítomným vývojářům dal 500$ kredit na využívání OpenAI API.

Mimochodem – v keynote to trochu zapadlo – představili také novou verzi jazykového modelu Whisper a uvolnili v otevřené licenci Consistency Decoder – který zlepšuje kvalitu výstupů Stable diffusion modelů.

Závěrečné shrnutí

Altman na závěr shrnul hlavní novinky a vyjádřil nadšení z toho, jak vývojáři využijí tyto možnosti k vytváření užitečných věcí.

„We believe that AI will be about individual empowerment and agency at a scale that we’ve never seen before, and that will elevate humanity to a scale that we’ve never seen before, either“
Sam Altman (čas 1:14:37)

Zopakoval, že umělá inteligence dá lidem nevídané schopnosti a pozvedne lidstvo na zcela novou úroveň.

Co vy na to?

Co říkáte na novinky? Mimochodem – už nyní se všem uživatelům spouští, takže nezapomeňte obnovit své prohlížeče s ChatGPT (případně se odhlašte a znovu přihlašte) a začněte si hrát.

Já už tak třeba vidím aktualizaci dat do dubna 2023 (ale zatím ne nové funkce) a také novinky v API rozhraní. Bohužel, ale z českého kontextu příliš nových informací nemá – neví ani, jak dopadly prezidentské volby.

Dejte mi vědět v komentářích na sociálních sítích a nezapomeňte článek sdílet a registrovat se, aby vám novinky chodily do mailu. A jestli jste jej nečetli, určitě si dejte včerejší přehled AI novinek, za poslední měsíc se toho stalo opravdu hodně.