Nový Google Gemini Advanced s modelem Ultra – stojí za to?

Google ve čtvrtek konečně dal k dispozici uživatelům možnost zkoušet jejich nejlepší jazykový model Gemini Ultra a představil placenou verzi svého chatbota. Co všechno umí?

Uveřejněno

Rubrika

Autor

Na začátku prosince uvedl Google svou rodinu multimodálních modelů Gemini, psal jsem o nich detailní článek. TL;DR verze – Google nasliboval spoustu věcí, ale reálně nic světoborného nepředvedl, pouze si už poněkolikáté hezkou prezentací „koupil“ další čas, aby nevypadal jako někdo, komu ujel vlak. Ty skutečné novinky přišly až teď.

Představení všech novinek v jedné minutě

Před 3 dny přejmenoval aplikaci Bard na Gemini – nyní se tedy Gemini jmenuje jak samotný jazykový (resp. multimodální) model, tak nástroj / konverzační chatbot, který tento model používá. Zároveň s tím uvedl i placenou verzi této služby – Gemini Advanced, která uživateli dává k dispozici nejlepší verzi jazykového modelu Gemini – Gemini Ultra. Obě naleznete na adrese https://gemini.google.com/

Pro lepší chápání tohoto trochu matoucího pojmenování to přirovnám k OpenAI a Microsoft Copilot termínům, které už zde asi většina z vás zná.

Gemini

Jazykové* modely

Gemini Ultra – nejlepší model dostupný jen v Gemini Advanced, konkurent OpenAI GPT 4

Gemini Pro – základní model, konkurent OpenAI GPT 3.5

Gemini Nano – osekaný model optimalizovaný pro provoz přímo např. na mobilních zařízeních (viz článek o Samsung S24), u OpenAI nemá zatím ekvivalent.

Aplikace (tarify)

Gemini – základní verze zdarma, nahrazuje Google Bard. U OpenAI odpovídá (bezplatnému) ChatGPT, u Microsoftu pak bezplatnému Copilotu.

Gemini Advanced – pokročilá placená verze s možností používat nejlepší model Gemini Ultra a dalšími výhodami (viz níže). Cílí proti OpenAI ChatGPT Plus resp. Team. U Microsoftu je pak ekvivalentem Microsoft Copilot Pro.

* Modely Gemini jsou multimodální, tj. v budoucnu by měly pokrývat nejenom schopnosti jazykového modelu, ale i obrazových či hlasových modelů, tj. jako byste u OpenAI nakombinovali schopnosti GPT, DALL-E, GPT-4V a Whisper. Zatím ale nelze těch jiných modalit využít.

O modelech jsem napsal všechno už ve svém předchozím článku Google představil multimodální AI modely Gemini. Jsou lepší než GPT-4?, dnes se tak budeme věnovat především novinkám, tedy aplikaci resp. tarifům Gemini a Gemini Advanced.

Webová aplikace Gemini

Aplikace Gemini nahrazuje svého předchůdce Google Bard, o kterém jsem psal koncem září v článku AI Chatbot Google Bard získal skvělé nové schopnosti. Naučte se je používat a vizuálně se prakticky kromě změny názvu nezměnila, snad ještě více se přiblížila ChatGPT.

Jedna změna je ovšem „pod kapotou“ – nově využívá multimodální model Gemini Pro, který je o něco lepší než jeho předchůdci Palm 2 a Lambda. Ovšem pozor – když se ptáte česky, nejspíš použije opět některý ze starších jazykových modelů. Můžete mu ale říct, aby použil model Gemini, těžko se nicméně ověřuje, jestli jej skutečně používá, mezi Gemini Pro a staršími modely nevidím zásadní rozdíl v kvalitě.

AI školení – nové termíny a místa (Praha, Brno…)

Chcete dostávat tyto články na e-mail, aby vám nic neuteklo?

Každopádně tedy platí všechny vlastnosti, výhody a nevýhody, které měl předtím Bard, psal jsem o většině z nich ve zmíněném článku a zítra si je ještě vysvětlíme ve srovnání všech Chatbotů.

  • je zdarma
  • je velmi rychlý
  • každou odpověď generuje 3× a následně vybere jednu z nich a vy si mezi nimi můžete přepínat
  • nemá přímý přístup na internet a vyhledávání informací, zásadnější informace se ale relativně rychle dostávají do trénovacích dat.
  • má okamžitý přístup k novinkám, zejména těm zásadnějším mezinárodního výstupu a funguje to velmi dobře
  • pakliže odpověď obsahuje nějaké faktické údaje, může je ověřit „živým“ dotazováním pomocí Google
  • umí rozpoznávat obrázky (nicméně není to tak schopné, jako obdobná funkce s GPT-4 Vision v ChatGPT Plus)
  • neumí vytvářet obrázky
  • zadání můžete nadiktovat hlasem, neumí jej ale hlasem přečíst
  • neumí pracovat s dokumenty
  • model se dotrénovává na vašich datech, není tedy bezpečný pro práci s neveřejnými informacemi. Můžete to vypnout, ale přijdete tím i o možnost uchovávání historie konverzací
  • odpovědi lze jedním kliknutím upravit – zkrátit, prodloužit, zjednodušit, učinit více neformální či naopak formální
  • odpovědi lze sdílet a ve sdílených odpovědích lze pak pokračovat
  • odpovědi lze exportovat do dokumentů, či z nich udělat koncept v Gmailu, pakliže je v textu tabulka, lze ji exportovat do Google Sheets, v případě kódu je pak možné jej jedním kliknutím přenést do služeb Google Colab či Replit
  • pouze pakliže přepnete svůj Google profil do angličtiny, umí se propojit s vybranými Google službami a vy se pak můžete pomocí chatu doptávat na informace z těchto služeb
    • Google Flights – letenky
    • Google Hotels – ubytování
    • Google Maps – místa a trasy
    • Youtube – videa
    • Google Workspace – vaše dokumenty, sheety a maily

Zejména ten poslední řádek z předchozího seznamu je zajímavý – možnost pracovat s vlastními dokumenty a maily je potenciálně dost užitečná, problém je, že funguje zatím pouze bezplatných Gmail účtech, tam, kde by se uplatnila nejvíc, tj. na firemních účtech, zatím dostupná není. Navíc nefunguje v češtině.

Popravdě – totožný set funkcí jsme měli v Google Bard od září a od té doby jsem to prakticky nikdy nepoužil, zatímco ChatGPT či Copilot používám dnes a denně. Není to tím, že by byl Bard respektive nově Gemini k ničemu, ale prostě ChatGPT Plus a i bezplatný Copilot jsou většinou pro reálnou práci mnohem užitečnější.

Kdybych měl vybrat jednu věc, kde Gemini může být už dnes pro vás užitečnější než konkurence, pak je to práce s novinkami, zejména pakliže se ptáte v češtině. Například dnes jsem se večer ptal v češtině na výsledky voleb ve Finsku a už několik minut po sečtení hlasů vracel perfektní odpovědi. Konkurence to zvládala jen v angličtině, česky vracela výsledky k loňským volbám.

Mobilní aplikace Gemini

Jistou novinkou je uvedení mobilní aplikace Google Gemini – jak pro Android tak pro iOS. Ale nenamáhejte se na ty odkazy klikat – aplikace je ke stažení pouze z amerických aplikačních obchodů, takže si ji nejspíš nestáhnete.

Přesněji ještě – pro iOS to není aplikace Gemini ale aplikace Google, zajímavé je, že když na tuto aplikaci přejdete normálně z Apple Store, není tam o Gemini ani slovo, když se ale prokliknete z jejich blogpostu (či odkazu výše), máte tam screenshoty ukazující použití právě Gemini a na začátku popisu větu „Gemini, an experimental AI assistant, is now available in the Google app. Access Gemini at the top of the app homepage to get started.“

U androidu je zas id aplikace „com.google.android.apps.bard“, zjevně tak k přejmenování došlo na poslední chvíli.

Samotná aplikace umí to samé co webová stránka, navíc vám ale umožňuje vyměnit Google Asistenta za experimentálního asistenta „Gemini“ (asi aby se to nepletlo) a co si tak pročítám reakce, tak jsou spíše záporné – neumí to co uměl předchozí asistent a mnoha lidem to rozbilo i funkčnost toho původního asistenta. Tedy i v případě, že byste měli možnost instalovat aplikace z anglického obchodu to zatím nedoporučuji.

Tarif Gemini Advanced

Ve skutečnosti tedy jedinou zásadní novinkou, kterou Google ve čtvrtek představil, bylo uvedení Gemini Advanced – placené verze chatbota Gemini. Ta cílí přímo proti konkurenčním službám ChatGPT Plus a Microsoft Copilot a má tak i stejnou cenovku.

Gemini Advanced with Ultra 1.0 model

Hlavním tahákem tarifu Gemini Advanced je schopnost využívat jejich nejlepší jazykový model – Gemini Ultra (s dodatkem 1.0, takže už se zjevně nechystají pojmenovávat další verzi zas jiným jménem). Konečně tedy od jeho představení 6. prosince si jej můžeme vyzkoušet a můžeme ověřit, nakolik potvrzuje nabubřelé zprávy o jeho schopnostech. Připravuji na to téma ještě speciální článek a srovnání, takže se nezapomeňte registrovat k odběru novinek, aby vám neutekl. Bohužel, zatím není model Ultra dostupný přes API, takže lze testovat jen velmi pracně ručně. Už teď ale můžu prozradit, že bude srovnání dost zajímavé a nebude jeden vítěz ve všech kategoriích.

Všechny ostatní vlastnosti jsou stejné jako u základního tarifu Gemini. Konkurence má u placených verzí spoustu funkcionality navíc, jak je na tom Gemini Advanced? No, nic moc. Teda spíš nic než moc.

Vlastně jediná funkce navíc je možnost generování obrázků. Ale ta opět nefunguje mimo Spojené státy a když to obejdete pomocí VPN, tak nefunguje v češtině. Obrázky jsou navíc vzhledem ke své kvalitě prakticky nepoužitelné, prakticky kterákoliv konkurence vytváří po všech stránkách lepší obrázky.

Mimochodem – v předchozích odstavci jsem použil spojení „jazykový model Gemini Ultra“, a to schválně – ačkoliv Gemini by měly být multimodální modely, tak zde není žádná jiná modalita k dispozici a ani obrázky negeneruje Gemini, ale oficiálně model Imagen (a tomu by odpovídala i kvalita výstupů, čtvercový formát a rozlišení, viz ukázky).

Ovšem když jsem se jej zeptal, jaký model používá na generování obrázků, ve všech 3 variantách odpovědí mi odpověděl, že používá mix různých modelů, s tím že si vybere podle toho, jaký styl obrázku chcete. V jedné odpovědi dokonce zmínil i OpenAI DALL-E. Přijde mi ale, že jde o jednu z jeho mnoha halucinací, kdy prostě smíchal dohromady informace ze všech možných stránek, kde se mohl jazykový model dozvědět něco o AI generování obrázků.

Gemini Advanced nemá žádnou z pokročilých funkcionalit, kterou disponují ChatGPT Plus/Team či Copilot Pro. Neumí ani vytvářet lepší obrázky na šířku/výšku, ani vlastní asistenty, ani práci s daty a spouštět své programy, ani plnohodnotně pracovat s internetem, ani s dokumenty. Trénuje model na vašich dotazech a odpovědích, takže jej nedoporučím pro práci s neveřejnými informacem

Nemáte ani možnost AI využívat ve svých Google aplikacích, ale to se brzy změní. Zatím to ale nebyla žádná výhra, viz Google Duet AI je (zatím) prakticky k ničemu, nekupujte jej, to ale měli jen pár týdnů na vývoj. Teď uplynul rok a čekal bych pořádný posun, podle popisku to ale má být zatím stále stejně pitomé.

Gemini Advanced stojí stejných 20 dolarů měsíčně jako ChatGPT Plus či Copilot Pro, přesněji u nás bez jednoho haléře 545 Kč. Fakticky si ale nekupujete samotný chatbot, ale platíte si předplatné služby Google One, kde k tarifům AI Premium „dostáváte v ceně“ právě možnost využívat Gemini Advanced.

Google One je fakticky služba cloudového úložiště, v tarifu AI Premium tak máte i 2 TB dat úložného prostoru pro vaše fotky, dokumenty, videa atd. Tarif Premium se stejným objemem úložiště ale bez přístupu ke Gemini Advanced stojí 300 Kč (250 Kč při roční platbě), dá se tedy na to dívat i tak, že samotný Gemini stojí 245 Kč (zvýhodněná roční platba u AI tarifu není k dispozici). K ještě vyšším tarifům – 5 TB a 10 TB je dokonce zatím zcela zdarma.

Stojí Gemini Advanced za to?

Když se k tomuto tarifu nyní registrujete, tak navíc dostanete 2 měsíce zdarma, což je fér cenovka :-), ale jestli nemáte neodbytnou potřebu jej vážně používat, tak možná i tak raději počkejte alespoň na uvedení Gemini v Google aplikacích.

Ale zítra budu psát detailnější srovnání všech oblíbených chatbotů z pohledu jejich funkcí, zjišťuji, že ne všechny jsou obecně známé a občas ten nejlepší způsob jak něco vyřešit je prostě použít ten správný nástroj. A v dalším článku je pak srovnám z pohledu schopnosti odpovídat na různá zadání a řešit různé úlohy.

Samozřejmě také můžete přijít na má AI školení, kde se vše dozvíte a naučíte – zítra školím v Brně, v pátek a sobotu mám školení v krásném penzionu u Ostravy, tam mám ještě pár volných míst. Když se přihlásí dost zájemců, budeme mít další školení i v Českých Budějovicích a Plzni a samozřejmě další Praha a Brno.

Používáte Google Bard/Gemini? Napište mi na sociálních sítích a dejte vědět, kde vidíte vy jeho výhody.

Nové články sem přidávám porůznu, tak jestli nechcete, aby vám něco uniklo, přidejte si můj feed do RSS čtečky, sledujte můj Twitter, Facebook a LinkedIn, případně si nechte nové příspěvky posílat mailem (žádný spam!)