Souhrn AI novinek #6

Od posledního občasníku s novinkami z oblasti umělé inteligence uplynul měsíc, omlouvám se za prodlevu, ale vlna různých AI akcí, školení atd. sebrala většinu mého času. Naštěstí klíčové novinky se odbyly v září, takže nebylo třeba to hrotit.

OpenAI Dev Day – klíčové novinky už dnes

O OpenAI byla polovina mých článků v posledním měsíci. Přeložil jsem článek z Reuters: OpenAI plánuje významné aktualizace, aby nalákala vývojáře na nižší náklady a ten moment nastane již dnes večer, tj. v pondělí.

Aktualizace: keynote už proběhla, nezapomeňte si tak přečíst můj článek o všech novinkách, které skutečně OpenAI uvedla.

Na akci primárně pro vývojáře OpenAI představí zřejmě několik klíčových novinek (následující seznam je můj osobní odhad na základě různých zdrojů, tak mě nebijte, jestli se něco z toho nepotvrdí):

Paměť pro GPT API – dnes musíte s každým požadavkem na API poslat celou předchozí konverzaci a ta z té se pokaždé spočítají tokeny, plus za vaše nové zadání a novou odpověď. Když máte v konverzaci 10 zadání, tak to první zadání a první odpověď je započítána 10×. Nově by API mělo mít paměť, což by mělo přinést v průměru i řádové snížení nákladů.
GPT-4V API – přibude aplikační rozhraní pro rozpoznání obrázků, nedávnou novinku o kterém jsem psal v článku Rozpoznávání obrázků v OpenAI ChatGPT Plus bude bomba. Tohle může být gamechanger pro spoustu firem, nad téměř každým z těch příkladů v článku si dokážu představit postavit nějakou specializovanou online službu (včetně takových, které za pár centů nahradí dnešní miliardové firmy).
DALL-E 3 API – novou verzi generativního modelu pro tvorbu obrázků nemusím představovat, psal jsem o ní mnohokrát (např. Tvoříme obrázky s OpenAI DALL-E 3 (ChatGPT, Bing Create), Adobe Firefly 2, Midjourney a Stable Diffusion, Pokročilé možnosti generování obrázků pomocí OpenAI DALL-E 3 v ChatGPT Plus, DALL-E 3 vrací úder – kvalitní generování obrázků jednoduchým textovým zadáním). Vývojáři by se konečně mohli dočkat jejího API, což bude nepochybně znamenat další boom různých specializovaných aplikací, které vám třeba na pár kliknutí a zadání navrhnou celou knížku či prezentaci včetně kvalitních obrázků.

Chcete dostávat tyto články na e-mail, aby vám nic neuteklo?

Registrujte se

AI školení pro začátečníky, pokročilé (automatizace, vibecoding) a firmy.

Školení umělé inteligence

Vedle toho se ale možná dočkáme představení novinek i pro neprogramující „smrtelníky“.

ChatGPT Team plán – neomezený ChatGPT 4 se 4× větším kontextovým oknem a sdílením v rámci týmu pro týmy s minimálně 3 uživateli – cena za uživatele 30 $ (25 $ při roční objednávce).
Aktualizace dat – v posledních týdnech se některým uživatelům objevuje informace o tom, že je GPT natrénovaný na datech do března, dubna či dokonce 2023. To by byl velký skok oproti aktuálnímu lednu 2022 a spolu s Chat with Bing by to řešilo problém se zastaralými informacemi.
All tools model – Nový „model“ shrnující v sobě všechny ostatní modely GPT-4 s výjimkou pluginů – tj. Default, Browse with Bing, Advanced Data Analysis, DALL-E. Výsledek můžete vidět například v následující ukázce, kdy se přes Browse with Bing stáhla informace o ceně nového Macbooku a tak se pak dala na obrazovku notebooku vygenerovaného přes DALL-E.
Knowledge upload – Možnost nahrát ke konverzaci textový soubor, například dokument v PDF, DOC…, který se zpracuje a použije jako základ/kontext konverzace. Nejspíš to bude znamenat velký problém pro služby typu Chat with PDF, které právě na tomhle postavily svůj business.
Connected apps – Budete moci připojit data na Google Drive (Docs, Sheets Slide) i Microsoft 365 (Word, Excel, Powerpoint) a opět je budete moci použít jako kontext.
Custom GPT / Create a GPT / GPT Builder – Nejvíc se těším na možnost vytvořit vlastní konverzační agenty – nastavíte jim vlastní instrukce, návrhy pro uživatele na začátek konverzace, knowledge, vlastní funkce přes OpenAI Schema… Takto budete moci snadno vytvořit třeba učitele matematiky, fitness trenéra, nástroj co bude identifikovat kytky a jejich nemoci a doporučovat řešení, kritika umění atd. Tohle rozboří domeček spoustě AI startupů. Své GPT agenty budete moci i sdílet, jednak pomocí odkazu, tak lidem v rámci jednoho workspace, tak pak i na nově vzniklém ChatGPT Marketplace.
Změny v DALL-E – před týdnem jsem psal o tom, jak na Pokročilé možnosti generování obrázků pomocí OpenAI DALL-E 3 v ChatGPT Plus s využitím parametru „seed“ – bohužel, tahle funkcionalita předevčírem přestala v podstatě fungovat – parametr stále existuje, ale nelze jej nastavit. Místo toho ale přibyly parametry „gen_id“ a „referenced_image_ids“, kterými lze dělat podobná kouzla, udělám aktualizaci nebo napíši nový článek – mimo jiné by tak mohlo jít udělat něco jako blend/prolnutí několika obrázků.

Jestli chcete sledovat představení novinek živě se mnou, pak nalaďte v 7 hodin večer středoevropského času následující stream, chystám pak samozřejmě článek a hned jak to bude možné vyzkoušet i praktický test všech novinek.

OpenAI Dev Day Live Stream – Pondělí 6. listopadu 19:00

Skončily Dny AI

4 města, 4 týdny, cca. 70 různých akcí několika desítek firem – tak vypadala největší AI událost tohoto roku Dny AI. Tento týden bylo probíhal v Praze, seznam všech akcí jsem zde psal minulou neděli a účastnil jsem se několika z nich každý volný okamžik.

Potkal jsem se s několika desítkami z vás, co mě tady čtete, díky za super feedback, dokonce jsem byl odkazován v mnoha prezentacích skvělých osobností jako doporučené čtivo, což mě neskutečně potěšilo a nabudilo k dalšímu psaní. Ještě kdybyste tak víc sdíleli mé články a budu spokojený :-).

Těžko vybírat, která z akcí se mi líbila nejvíc, už proto, že jsem jich stihl jen pár, ale kdybych měl vybrat, byla by to včerejší Lamaday – perfektní přednášky k tématu, které mě extrémně zajímá (tedy AI ve vzdělávání), zkušení odborníci s velmi praktickými a užitečnými radami a vysvětleními – Petr Koubský, Petra Dolejšová, David Grudl, Kateřina Švidrnochová, Pavel Hodál… K tomu perfektní prostory, perfektní catering, fajn after party. A neříkám to proto, že mě na konci vzali do panelové diskuse. Určitě si začněte rezervovat už teď místa na příští ročník.

Lamaday 4. 11. 2023

Ze všech akcí kde jsem byl jsem si pořizoval zápisky, zajímavé informace zkusím shrnout v nějakých dalších článcích. A velký dík a potlesk týmům prg.ai a brno.ai, které Dny AI pořádaly.

Elon Musk a jeho xAI představili vlastní LLM a konverzační chatbot Grot

Grot má přístup ke všem tweetům (či xkům?), včetně těch aktuálních, takže s ním bude moci pracovat s novinkami. Krom toho má také zvláštní humor a bude zřejmě trochu laxnější k různým omezením. Není zřejmé, kdy a jestli vůbec se dostane do EU, každopádně by jej mohli mít k dispozici platící uživatelé nejvyššího X Premium+ plánu, nyní to běží jako omezená beta. Podle vlastních testů a tiskové zpráv by měl být někde mírně nad úrovní GPT 3.5.

Pro zajímavost: Sloveso grok, v češtině „grokovat“, se poprvé objevilo ve skvělé knize Roberta Ansona Heinleina „Cizinec v cizí zemi“ (Henlein byl jeden „big three“ – zakladatelů moderního Sci-Fi žánru, určitě od něj znáte třeba Hvězdnou pěchotu). „Grokovat“ v knize doslova znamená „pít“, ale také „milovat“ a „být jedním s“.

Postupem času bylo přejato do angličtiny a našlo odezvu zejména v geekovské a hackerské kultuře. Ve své podstatě znamená „grok“ hluboké, intuitivní porozumění, které přesahuje povrchní chápání a vede k úplnému, empatickému pochopení předmětu.

Neznamená jen intelektuální osvojení, ale také emocionální spojení, které často odráží určitou formu osvícení nebo hlubokého, holistického porozumění. V technických a programátorských komunitách se tento termín často používá k vyjádření hlubokého porozumění programovacímu jazyku, systému nebo konceptu, například když se řekne „groks Python“, což znamená, že člověk ovládá programovací jazyk Python.

Kromě pouhých faktických znalostí je grokking ztělesněním úrovně integrace, kdy se pochopený materiál stává součástí znalostní báze jedince, což znamená jak tvůrčí, tak technické mistrovství. Koncept v knize nese také duchovní rozměr, který naznačuje hluboké spojení s vesmírem.

Microsoft Windows Copilot a Office 365 Copilot už i v ČR

Inception – Windows Copilot, Edge Copilot, Bing Chat

Ačkoliv podle předchozích vyjádření by AI funkce Windows Copilot měla přijít do Evropy až v březnu, zdá se, že už se lidem s Windows 11 instaluje. Osobně jsem předevčírem přeinstalovával svůj počítač záměrně čistou instalací a po několika kolech aktualizací se mi Copilot objevil. Na tomto stroji přitom nemám zapnutý beta program. V nastavení profilu jsem si nicméně zvolil jako zemi US a taktéž při instalaci, nicméně podle reakcí pod mým dotazem na FB se to lidem instaluje i s normálně českými Windows. Zkuste tedy aktualizovat a uvidíte.

Složitější je to s Office 365 Copilot – ten je podle mých informací aktuálně možný pořídit od tohoto týdne nicméně pouze u firem s minimálně 300 E3 licencemi. Ovšem funkcemi je to neskutečně nadupané a na rozdíl od aktuální verze AI v Google Duet AI to rozhodně doporučím téměř do všech českých firem, potenciál pro zefektivnění práce je ohromný.

Chystám samozřejmě článek, resp. nejspíš celou sérii, kde popíšu všechny Microsoftí AI vychytávky.

Mimochodem – ptáčci štěbetají, že by brzo měla přibýt podpora OpenAI pluginů do Bing Chat a tedy nejspíš o do Copilotů.

Další novinky

Apple představil nové MacBook Pro notebooky a iMac počítače. V půlhodinovém streamu se neobjevilo slovo AI ani jednou (stejně jako když představoval nové verze hodinek Watch a telefonů iPhone), nicméně v tiskové zprávě se nějak zapomněli a slovo AI tam mají dokonce 6×. A nemají se za co stydět, zejména 40 jádrové M3 MAX stroje se 128 GB RAM budou myslím tím nejnadupanějším notebookem na planetě a ideálním strojem pro počítání jazykových či obrazových modelů (když to nechcete přenechat specializovaným serverům).

Runaway přišla s novou verzí svého modelu / aplikace pro generování videa ze statických obrázků a textu. WOW. Chystám se na test a článek.

We have released an update for both text to video and image to video generation with Gen-2, bringing major improvements to both the fidelity and consistency of video results.

Try it now at https://t.co/ekldoIshdw pic.twitter.com/RyLiar7MFj
— Runway (@runwayml) November 2, 2023

Jestli chcete pro nějaký váš projekt open source LLM s velkým kontextovým oknem, zkuste nový Mistral-7b-128k – jak už název napovídá, má kontext 128 tisíc tokenů, tedy 4× více než nejlepší GPT-4 model a dokonce 16× více než kolik má GPT-4 v ChatGPT.

Generátor obrázků Ideogram, o kterém jsem se zmiňoval ve 3. AI novinkách, a který se vyznačuje slušnou schopností zvládat text na obrázku, má novou verzi – 0.2. Na první pohled se nic nezměnilo, ale kvalita výstupu je o dost větší. Zkusil jsem s ním vygenerovat i úvodní obrázek pro toto číslo, ale nakonec jsem zvolil výstup z DALL-E. Ale nemáte-li přístup k placenému ChatGPT Plus, pak tohle může být pro vás cesta jak generovat slušně kvalitní obrázky s trochou (nejlépe anglického textu v příjemném rozhraní.

Adobe představilo spoustu úchvatných AI novinek ve svých nástrojích na vytváření a editaci obrázků a videí. Převod obrázku na video, zvýšení rozlišení, překlad řeči ve videu se synchronizací obličeje, generativní úprava videí atd. Zkusím se k tomu někde pořádně nachytřit a napsat tady recenzi (nebo dám prostor někomu z vás, kdo to ovládáte).

Canva představila několik bezplatných AI nástrojů pro učitele, chystám se je brzy otestovat:

Magic Write: Pomocník pro psaní textů, který může pomoci studentům i učitelům s tvorbou návrhů, shrnutím složitých myšlenek nebo přepsáním textu.
Magic Grab Images: Generátor obrázků a umění v různých designových stylech.
Magic Animate: Přidává automatické animace do jakéhokoli plánu lekce nebo úkolu jedním kliknutím.
Magic Switch: Přeměňuje textové prezentace na celé webové stránky nebo video.
Magic Grab Text: Převádí poznámky na tabuli nebo vizuální brainstorming na dokumenty a editovatelný text.
Magic Translate: Překládá text do 100 různých jazyků.
Design Accessibility Checker: Kontroluje návrhy z hlediska přístupnosti podle mezinárodních standardů.

Midjourney přidalo funkci Style (a ještě více technických detailů viz zde). Ta vám umožňuje vytvořit k jednomu zadání 16 až 128 stylů, viz například tato stránka s různými styly Sluncovek kalifornských. Vy si pak můžete buď vybrat některý ze stylů, nebo vybrat, které se vám líbí a vytvořit z nich nový styl.

Tímto postupem vy si můžete postupně vyladit svůj vlastní oblíbený styl, který pak můžete používat pro všechny nově generované obrázky a mít tak vlastní jednotnou vizuální identitu.

Čekám, až Midjourney vyjde ven s nějakou větší aktualizací a zas k tomu pak nejspíš udělám návod, podobně jako když uváděli Midjourney Vary (Region) / Inpainting.

MJ také přidal možnost 2× resp. 4× zvětšit rozlišení generovaných obrázků, funguje to pěkně, ale zdá se mi, že u obličejů jsou nově generované verze příliš vyhlazené, chybí jim detaily, jiné upscalling nástroje to umí líp.

Motorola představila koncept ohybného telefonu, který může sloužit jako náramek, a krom toho i AI funkce, které by měly být brzy součástí jejich nově uváděných telefonů. Telefon tak bude přizpůsobovat svou barevnost svůj (např.) stylu oblečení uživatele, model přímo na telefonu se bude učit chování uživatele a adaptovat se na vzory jeho chování, přibydou AI funkce na skenování dokumentů, na sumarizaci zpráv či ochranu soukromí při sdílení obrazovek ze sociálních sítí.

Jestli programujete, tak by se vám mohly líbit novinky v rozšíření Code GPT do IDE nástroje Visual Studio Code, zejména několik nových jazykových modelů včetně Claude, Llama či Palm 2.

Shane Legg, zakladatel a nyní šéf výzkumníků britskoamerické výzkumné laboratoře na umělou inteligenci DeepMind, která je nyní dceřinkou Google a stojí i za spoustou dnešních AI technologií, se domnívá, že je 50 % šance, že do roku 2028 zde bude obecná umělá inteligence (AGI). V rozhovoru vysvětlí i co si pod AGI představuje, jaké jsou silné a slabé stránky dnešních LLM, zamýšlí se nad bezpečností a etikou AI. Stojí to za to.

Microsoft představil opensource službu/plugin Semantic (resp. nově Kernel) Memory, který umožňuje dotazování se přirozeným jazykem na indexovaná data. Je navržen tak, aby se snadno integroval do populárních AI platforem jako ChatGPT či Copilot.

Kanadští výzkumníci prý umí s cca. 85 % pravděpodobností určit diabetes 2. typu z pouhých hlasových nahrávek. Pakliže se to potvrdí, pak to může znamenat ohromnou úsporu peněz a zvýšení dostupnosti léčby. Přijde mi ale, že měli dost malý vzorek účastníků (192), zejména s ohledem na to, jak častá je to nemoc a jak moc je závislá na věku či BMI, které budou mít nepochybně také značný vliv na hlasový projev. Ale třeba to tu zaujme nějaké místní diabetology a budou to chtít také zkoumat.

Má oblíbená Scarlett Johansson žaluje tvůrce AI aplikace, že bez jejího souhlasu využil její hlas. Další a určitě ne poslední soud tohoto typu, jsem zvědav, kam se tohle bude vyvíjet. Jsem přesvědčen, že časem bude možné si koupit hlasy mnoha slavných osobností, stejně tak jako jejich AI podobu, a že to budou chtít i sami herci, byť třeba jen pro to, aby mohli „hrát“ jako mladí krasavci klidně i v sedmdesáti. A že vzniknou nějaké licenční systémy kontrolující výskyt hlasů a osob v různém obsahu, stejně jako se dnes kontroluje licencovaná hudba či film.

Čínská společnost Baidu oznámila, že nová verze jejich jazykového modelu ERNIE a chatbot ERNIE Bot, který tento model využívají, dohnaly ve všech parametrech a měřeních jazykový model GPT 4. Zkoušet to nebudu, ale nepochybuji, že k tomuto cíli napnuli mnoho sil, peněz a nejspíš i průmyslové špionáže. Spíš by mě zajímalo, na jakých strojích to počítají.

Americký Qualcomm uvede brzy na trh novou řadu mobilních procesorů resp. SoC „systému na chipu“ Snapdragon 8. generace. Ty budou zaměřené na využití AI v mobilních zařízeních a měly by „vyzvat na souboj“ AI schopnosti Apple Silicon SoC nových iPhonů. Naživo je poprvé spatříme nejspíše v únoru při představení nových vlajkových lodí Samsungu.

Na revolučně novém procesoru optimalizovaném pro AI pracuje i IBM, ten má 256 jader a u každého z nich je i paměť, takže odpadá přenos zpracovávaných informací do paměti a zpět, což prý 25× zvyšuje efektivitu takového procesoru.

Výzkumníci vyvinuli AI nástroj nazvaný SIDE, který může zlepšit kvalitu a spolehlivost článků na Wikipedii. SIDE dokáže identifikovat špatné reference a navrhnout lepší zdroje, což by mohlo ušetřit čas editorům a moderátorům a zlepšit správné ozdrojování informací Wikipedie.

Google pracuje nejen na novém multimodálním jazykovém modelu Gemini, ale i na nástroji/službě Stubbs, která vám umožní vytvářet funkční prototypy aplikací čistě pomocí jednoduchých zadání.

Amazon integruje nový AI robotický systém Sequoia, ten dokáže zrychlit vyřízení objednávky o 25 %.

České AI novinky

Tento měsíc se mnoho věcí točilo okolo výše uvedených AI days. Jejich organizátoři si myslí, že Česko by mohlo být evropským centrem umělé inteligence a jde jen o to umět spojit síly. Osobně takovým optimistou nejsem, protože abychom se dostali do popředí, musely by jiné státy zaspat více než my a to se neděje. Musela by se z toho stát skutečně priorita – pro vládu, pro politiky a úředníky na všech úrovních, pro školy, pro firmy. Stačí se podívat, jaký je dlouhodobý přístup k jiným moderním trendům, ať už je to modernizaci výuky, přístup k elektroautům, cyklodopravě či obnovitelným zdrojům energie.

AI v českém školství

Selfie z mého úvodního AI školení pro VOŠ, SOŠP a Gymnázia na Praze 6. Chcete také takové školení na vaší škole? Kontaktujte mě.

Technologická univerzita v Liberci povolila použití AI při psaní diplomových prací, za předpokladu, že student přizná použití u příslušných pasáží a je také plně zodpovědný za faktickou správnost. Doporučení k využívání AI má i Masarykova Univerzita v Brně. Předpokládám, že mají i nějaké podmínky na přínosnost tématu diplomové práce a například povinnost zahrnout vlastní výzkum, měření, dotazování atp., pak může být využití AI pro psaní nějaké omáčky okolo dobrým pomocníkem.

Mimochodem čtvrtina tuzemských studentů už AI zneužila k podvádění. Třetina si myslí, že AI je lepší než oni. Většina studentů se staví k AI pozitivně, což je v příkrém rozporu s tím, co vidím na mnoha školách u učitelů, které se k tomu ve většině nestaví vůbec, nezajímá je to jinak, a myslí, že to budou moci odignorovat či zakázat stejně jako ostatní technologické novinky typu mobily, počítače či internet. Schválně, kdy něco z toho povolí třeba k maturitě.

Průzkumy o AI v českých firmách

Podle výzkumu Digital Trust Insights Survey poradenské firmy PwC české firmy zatím nevěří umělé inteligenci: 75 % světových firem díky ní sází na růst produktivity, v ČR je to jen 39 %. Nijak mě to nepřekvapuje, a to se ještě ptali jen větších firem, nedivil bych se, kdyby o AI nevědělo naprosto nic 90 % z 2.1 milionů našich živnostníků.

Průzkum agentury Randstad AI Trends 2023 má podobně tristní čísla a tvrdí „Vyhazovu se bát nemusíte, firmy zásadní nárůst nezaměstnanosti kvůli umělé inteligenci neočekávají“. Aby taky jo, když podle tohoto výzkumu 2 třetiny firem ještě s AI ani nijak nezačali a vůbec netuší, co to obnáší.

Top manažeři poboček velkých mezinárodních firem jsou ale samozřejmě myšlenkově jinde AI řeší jako nikdy předtím, viz článek na serveru Forbes.

Technické podmínky k rychlému zavedení AI má prý podle poradenské společnosti RSM téměř polovina firem. Podle mě má technické podmínky k alespoň elementárnímu využití AI – využití generativní AI pro psaní mailů, nabídek, prezentací, článků, příspěvků, pomoci při datové analytice… prakticky 100 % firem. Problém není technika ale schopnost adaptace na nové podmínky a využití příležitosti.

Chcete konzultaci k zavedení AI ve vaši firmě či proškolit vaše zaměstnance? Vyberte si z mých AI business služeb a kontaktujte mě.

Bylo by fajn alespoň zavést ve firmě nějaká pravidla, aby třeba ti šikovnější zaměstnanci, kteří si budou chtít ušetřit pomocí AI práci, nedávali interní data vaše či vašich klientů do nástrojů typu ChatGPT, protože se pak může stát, že se na nich model naučí a budou přístupná všem. Seznam především právních rad jak taková pravidla pro užívání AI ve společnosti nastavit přinesl magazín ePrávo.

Další české AI novinky

RemSpace položil 5 otázek týkajících se AI vicepremiérovi pro digitalizaci / ministrovi pro místní rozvoj / předsedovi Pirátské strany Ivanu Bartošovi. Škoda, že nezazněly otázky, které by se týkaly třeba možného vzniku českého jazykového modelu a podobně.

Zaujala mě reportáž v ČT24, ukazující zneužití AI generovaného hlasu

https://twitter.com/UKomentare/status/1720723754572042599

A to je vše

Snad jsem na nic zásadního nezapomněl, jestli se vám souhrn AI novinek líbil, nezapomeňte jej sdílet, jeho napsání trvalo přibližně 12 hodin a sbírání podkladů několik týdnů, tak aspoň poznám, jestli vás to zajímá. A když přidáte svůj mail do registrace níže, žádná novinka vám neunikne. A určitě se koukněte na novinky představené na OpenAI keynote.

Chystám se také opět rozjet další vlnu školení, rezervuji nyní prostory a termíny na příští týden, takže kdo budete mít zájem a ještě jste se nepřihlásil, máte šanci. Nová AI školení budou aktualizovaná samozřejmě o všechny novinky.