AI Chatbot Google Bard získal skvělé nové schopnosti. Naučte se je používat

Zatímco jsem psal svou velmi kritickou recenzi Google Duet AI – placeného rozšíření, které slibuje (ale nepřináší) využití umělé inteligence v kancelářském balíku Google Workspace, vyšel Google s mnohem zajímavější AI novinkou, respektive hned několika vylepšeními, a to u jejich AI chatbota Bard.

Jestli máte rádi marketingové ptydepe a angličtinu, můžete si přečíst originální přehled novinek či blogpost, věnoval jsem ale půlku noci jejich praktickému testování a mé praktické poznámky byste myslím neměli minout.

Nový jazykový model – PaLM 2 postupně nahrazuje LaMDA

Tohle se teda nikde ve zprávě explicitně nepíše (jen pár náznaků), ve skutečnosti běží Palm 2 v některých případech už od května, kdy jej představovali na Google I/O. Ovšem záleží, v jakém jazyce se ptáte – jestli v češtině, je používán (alespoň u mě) stále starší model LaMDA, zatímco v angličtině už PaLM 2. Když se Barda zeptám na důvod, píše, že LaMDA lépe generuje v češtině a PaLM v angličtině, ale je otázka, jestli mu zrovna tohle lze věřit, bylo by to dost divné.

Je to generační posun, LaMDA je relativně starý model (2020) a byť byl trénovaný na novějších datech, nestačil ani na základní GPT 3.5 model pohánějící ChatGPT.

Nový Palm 2 je trénován na více než 100 jazycích a speciální pozornost byla věnovaná programování, logickému argumentování a matematickým schopnostem (díky trénování na vědeckém a matematickém obsahu).

Příklad, jak může pomoci s programováním je zde.

Ukázka využití vícejazyčnosti modelu je zde.

Pro srovnání LaMDA model měl 137 miliard parametrů, PaLM jich má 540 miliard. GPT 3.5 má 175 miliard parametrů, GPT 4 dokonce 1.7 bilionu. Čistě podle tohoto ukazatele by tak měl být PaLM a nový Bard lepší než GPT 3.5, ale stále by neměl dosahovat kvalit GPT-4. To se slibuje až od nově připravovaného modelu Gemini, který se očekává na konci roku a měl by být navíc multimodální (obraz, zvuk i text).

Určitě se budu testování kvality výstupů věnovat, podobně jako jsem testoval dříve Anthropic Claude.

Přehlednější a intuitivnější rozhraní

Na základě reakcí od uživatelů vylepši Google uživatelské rozhraní Barda. To tak nabízí na jedno kliknutí běžně vzory zadání, rozdělené do skupin Porozumění, Vytváření, Prozkoumávání a Kódování.

Bohužel, tahle funkce není v češtině dostupná, jestli chcete nové rozhraní, musíte jít do nastavení jazyka vašeho Google účtu a přepnout na angličtinu (přidat či posunout na první místo).

Nové rozhraní (navíc je zde zvolený tmavý motiv)

Nemá to ale vliv na používání jazykového modelu – i nové rozhraní používá pro češtinu LaMDA a i staré pro angličtinu PaLM 2.

Integrace s vybranými Google aplikacemi

Bard nyní umožňuje přístup k reálným informacím z Google Maps, YouTube, a databází hotelů a letů. Tato rozšíření jsou standardně aktivována ale můžete je vypnout (ikonka puzzle vpravo nahoře)

Můžete tak naplánovat let, dovolenou, zájezd… najít k tomu potřebné informace, letenky, hotely, trasy atd.

Nebo s YouTube různá videa související s vaším dotazem a podobně. Bohužel ale neumí zodpovídat dotazy k videím, jen je najít.

Někdo píše o těchto integracích jako o pluginech, sám google je nazývá rozšířeními (extensions), ale nepřirovnával bych to ChatGPT pluginům či třeba Google Apps rozšířením, protože se jedná pouze o vybrané služby přímo od Google, není zatím ani nějaký popis, API… pro případné vývojáře rozšíření, tak jako jiných pluginů/rozšíření.

Nicméně integrace těchto rozšíření je řešená velmi podobně, jde o samostatná volání z klientské strany, nikoliv o nějaké zadrátování do odpovědi od modelu na straně serveru, lze tedy očekávat, že podpora pro pluginy třetích stran se v následujících měsících opravdu objeví.

Pozor – tato rozšíření fungují pouze v jazykovém modelu PaLM 2 – jinými slovy nefungují zadání v češtině, protože ta (minimálně u mě) stále běží s LaMDA modelem.

Pozor – tato rozšíření nefungují ve firemních Google Workspace – budu ještě přes den zjišťovat, jestli to náhodou nejde někde zapnout, každopádně je mám aktuálně dostupné pouze na svém soukromém Gmailu.

Propojení Bard do Gmailu, Dokumentů a Disku

Potenciálně naprosto revoluční a skvělá věc (kvůli které ale teď myslím zkrachuje několik startupů, které to řešily). Google Bard můžete propojit se svým Gmailem, Google Drive a Dokumenty na něm a pak se pomocí chatbota doptávat, hledat souvislosti, souhrny atd. napříč vším co tam máte.

Popravdě naprosto nechápu, proč tahle funkcionalita není až placená právě v tom mnou kritizovaném a zatím zcela zbytečném Duet AI. Tohle je věc, za kterou budou lidé ochotni platit, zejména až bude právě i nad firemními daty.

Pozor – i zde platí zatím nefunkčnost zadání v češtině a firemním Google Workspace

Pár jednoduchých příkladů všech integrací ukazuje následující video

Zkusím ale vysvětlit přínos této novinky na svých praktických příkladech: Možná jste si všimli, že se chystám pořádat kurzy AI, moc jsem to zatím neinzeroval, protože řeším aktuálně dojednané firemní kurzy, ale pár vás si odkazu v hlavičce všimlo a rezervovali si předběžně místo.

A protože zatím zjišťuji, o jaké informace máte na kurzu zájem a jaký termín by vám vyhovoval, mohu se nyní díky propojení mailu a Google Bard zeptat například na to, kdo z přihlášených preferuje večerní školení. Bard z mého dotazu pochopil, že mě zajímají maily s RSVP, načetl si je, prošel a vypsal mi jména lidí, kteří zatrhli, že chtějí přijít večer.

anglicky „kteří lidé, co poslali RVSP z mého webu, chtějí přijít večer“

Dokonce mu mohu říct, aby vytvořil z některých dat v mailu tabulku. Udělá ji a nabídne její export do Google Sheets. Bohužel ale z nějakého důvodu jeden z emailů nezahrnul a ani se nenechal nijak přesvědčit. Nicméně beru to spíš jako první betu a ukázku budoucích možností.

anglicky „dej jejich jméno a preferovaný čas do tabulky“

Mohu dokonce obejít tragickou impotenci Google Duet AI a přímo z Bardu napsat odpověď (byť bohužel nelze přímo odeslat). Bard našel poslední email od Michaely, načetl si ho, zjistil kontext a vytvořil podle něj odpověď (na základě toho, co zvolila že se chce na kurzu dozvědět dostala odpověď že přesně to tam je).

anglicky „napiš odpověď Michaele …“

A mimochodem tyto emaily jsou celé česky, tedy email s odpovědí od Michaely obsahuje: „Která témata vás především zajímají: Vysvětlení základních principů a praktické ukázky, Pokročilá tvorba zadání (prompt engineering), Generování AI obrázků“ a Bard mi tak veškeré odpovědi i předchozí souhrny překládá.

Můžete si ale rovnou vynutit i odpověď v češtině, tím že si o to (anglicky) řeknete.

anglicky „napiš odpověď Martinovi v češtině“

Pozor – mohlo by se vám někdy zdát, že i dotazování funguje v češtině. Nedělejte to – v ten moment se totiž Bard přestane dotazovat rozšíření, ale začne si odpovědi vymýšlet (starým) jazykovým modelem.

Takže mi takhle klidně vymyslel i nějakou Petru Novákovou, dokonce mi napsal mail, který mi údajně psala (dokonce bůhvíproč slovensky). Bylo to tak přesvědčivé, že jsem jej pak hledal, jestli jsem jej náhodou nepřehlédl. Lze to ale poznat podle chybějícího dotazování do Google Workspace integrace na začátku a chybějících odkazů na maily na konci.

Kromě mailů se můžete ptát také Disku a Dokumentů (Google Docs a PDF soubory). Můžete tak například najít dokumenty na vašem disku, které obsahují nějaké slovo.

anglicky „ukaž mi dokumenty, které zmiňují chatgpt“

Nebo chtít k nim udělat třeba souhrn, a to aniž byste je otevřeli.

anglicky „udělej mi souhrn reportu IBV“

A opět z něj můžete pomocí triku „write … in Czech“ dostat třeba onen souhrn i v češtině.

anglicky „udělej mi souhrn reportu IBV v češtině“

Případně když už jste jej přiměli načíst si dokument do kontextového okna v angličtině, můžete se pak ptát i v češtině (Ale dokument se nebude znovu načítat, je možné, že nějaká informace se mezitím zapomene a s výrazně pravděpodobněji si pak bude vymýšlet).

Ba co víc, můžete dokonce srovnávat více dokumentů, hledat v nich paralely, rozpory… Tady dokonce Google v něčem i překovává mého favorita Anthropic Claude, o jehož schopnostech analyzovat dokumenty jsem psal minulý týden.

Google Bard je totiž mnohonásobně rychlejší, nemá žádná omezení na počet dotazů, ani problémy s připojením.

anglicky „srovnej report x a a dokument y, napiš klíčové body z obou dokumentů a klíčové rozdíly“

A tak bych mohl s příklady pokračovat, každopádně jak jste asi pochopili, tahle funkce opravdu stojí za to a Google Bard se rázem dostává mezi mé favority. Pojďme se ale kouknout na zbylé novinky.

Prověření odpovědi prostřednictvím Google

Pomocí Google vyhledávání je nyní možné ověřit odpovědi generované Bardem. U vyhodnotitelných tvrzení bude možné kliknout a dozvědět se více.

Pakliže se mu něco nepodaří ověřit, vrací odpověď oranžově.

Při dotazování na poslední zprávy docházelo k zajímavým rozporům – zatímco když jsem se ptal na zprávy z tohoto měsíce o ruské okupaci Ukrajiny, vrátil mi novinky ze včerejška, když jsem chtěl ze stejného období novinky o AI, vrátil mi novinky klidně i z roku 2000.

Pozor – ani na ověřování se nedá úplně spolehnout. Google hledá jen podobnost daného tvrzení. To že se to třeba ve skutečnosti stalo někdy jindy, nebo jde o jiný kontext, to už neověří.

I tak je to ale velmi vítané zlepšení a vlastně by se mi líbilo, kdybych to měl implicitně zapnuté ke každé zprávě (ale chápu, že by to byl záhul na servery).

Pokračování ve sdílených konverzacích

Pokud vám někdo pošle konverzaci s Bardem prostřednictvím veřejného odkazu, můžete v této konverzaci pokračovat a rozvíjet ji ve svém vlastním účtu.

Toto je opět velmi užitečné vylepšení, dříve byl nasdílená konverzace jen statickou kopií, nyní může uživatel zvolit Continue this chat (ostatně můžete si to vyzkoušet na tomto odkazu s předchozí odpovědí o českých aktualitách).

Můžete stále sdílet jak celou konverzaci, nebo pouze jedno zadání a odpověď, sdílecí tlačítko je pod každou odpovědí.

Rozpoznání obrázků už i v českém rozhraní a v češtině

Nahrávání a rozpoznání obrázků pomocí technologie Google Lens funguje nově ve 40 jazycích, včetně češtiny. Dříve bylo nutné přejít na angličtinu a psát dotazy v angličtině.

Tohle se hodí třeba na řešení obrázkových úloh, o kterém jsem zde psal.

Ale přijde mi, že položíte-li dotaz anglicky (solve), je pravděpodobnost správného výsledku výrazně větší. Odpovídalo by to i informacím o lepší schopnosti PaLM právě v matematických úlohách i můj výše uvedený důkaz, že pro české dotazy se používá starší LaMDA.

Možnosti tohoto nástroje v AI chatbotu jsou ale mnohem větší. Můžete jej například nechat navrhnout reklamu či Facebook příspěvek k nějakému produktu, aniž byste mu dali nějaké detaily.

Lze také najít kontext k fotkám, zejména když už třeba byly někdy na webu použité, ale často to dokáže i poznat třeba místo, kde byla fotka pořízena z nějakého kontextu. Samozřejmě někdy si i dost vymýšlí, ale to zrovna u popisu fotek nemusí být vždy na škodu.

Další novinky Google Bard

Můžete získávat obrázky z vyhledávání Google (jen teda ten text moc nesedí).

Odpovědi můžete nyní snadno na dvě kliknutí zestručnit, rozšířit, zjednodušit a udělat méně či více formální. Chválím – jednoduché a užitečné.

A to je vše

Budou čtyři hodiny ráno, jdu spát a doufám, že mě po probuzení čeká spousta nově registrovaných k odběru novinek a spousta pochvalných sdílení na sociálních sítích :-). Sdílecí tlačítka jsou ⬇️⬇️⬇️ pod článkem.

Dejte mi vědět, jestli narazíte ještě na nějaké vylepšení, které jsem přehlédl, nebo vás napadne další zajímavé využití novinek. A nezapomeňte si přečíst i mou včerejší recenzi na Google Duet AI, ten kontrast (ne)užitečnosti je opravdu zajímavý.