(Před)poslední z Big Five – velké pětky předních amerických technologických firem, která měla své podzimní představení novinek a své celoroční práce byla Meta – společnost zastřešující Facebook, Instagram, WhatsApp a další produkty služby (ještě nás příští týden čeká představení hardware od Google, ten si ale jinak velké představování částečně odbyl už při Google Next 2023).
A bylo se na co dívat, osobně mě jejich novinky potěšily a překvapily mnohem víc než třeba Apple. Jejich nové VR/AR brýle Meta Quest 3 jsou 7× levnější než ty od Apple a přesto (a vlastně i právě proto) mi přijdou užitečnější. Nová verze chytrých brýlí s kamerou a sluchátky Ray-ban Stories nemá konkurenci a začíná být skutečně užitečná díky AI (o tom dále),
Ale tady nejste na technologickém serveru, které teď nepochybně mají k Meta novinkám spoustu článků. Jste na webu zaměřeném na AI a tak se zde rozepíšu čistě o AI. Jste-li ale technologický fanda a máte-li ale chvíli času, pusťte si záznam, aspoň těch prvních 45 minut s Markem Zuckebergem.
AI už v první větě a třetině keynote
Hned v první větě po pozdravu Mark zmínil AI a jinak tvořila jeden ze 3 pilířů dnešní keynote – Mixed Reality (VR), AI a Smart Glasses. Navíc byla velkou částí i právě třetí části o brýlích, dalo by se tak říct, že skoro polovina dnešní přednášky byla o AI.
1. část – Mixed Reality
V první části věnované novým brýlím na virtuální resp. rozšířenou realitu Meta Quest 3 se o AI vůbec nemluvilo. Nicméně samozřejmě funkce jako mapování okolního fyzického prostoru a propojení jej s digitálním obrazem jsou také náročnou úlohou právě umělé inteligence.
Přesto mi přijde vlastně škoda, že s těmito brýlemi nejde dělat i to, co pak se Smart Glasses, tipnul bych si ale, že časem se do nich nějaká možnost komunikace s AI doplní. Technologická životnost takových brýlí bude nejspíš opět alespoň 3 roky a když si vezmu tempo AI v posledním roce a drajv Meta na poli AI, nemyslím si, že by si tuto příležitost nechali ujít.
2. část – AI
Z pohledu AI hlavní část začala 16,5 minuty po začátku keynote. Mark začal souhrnem toho, co všechno Meta v AI za poslední rok udělala
- AI Modely na generování videa z textů – zatím nicméně veřejně jen jako research paper s pár ukázkami Make-A-Video
- Generování zvuků z obrázků a naopak – přesněji technologie pro propojení různých dat k jednomu objektu/obrázku – textu, zvuku, hloubce ale i třeba teplotní mapě či rozměrech ImageBind
- Hodně užitečná technologie segmentování objektů z obrázků, tedy jejich „vykousnutí“ z okolí viz Segment Anything.
- Technologie na převod řeči na text a textu na řeč a mezitím i překládat mezi 100 různými jazyky Seamless – viz můj článek.
- A samozřejmě jejich velmi schopný (celkem) volně dostupný jazykový model Llama 2, který zde zmiňuji opakovaně v různých novinkách.
- Nezmínil ještě jejich AI technologii na generování obrázků pomocí textu nebo nákresu Make-A-Scene.
To všechno ukazuje, že Meta neklouže po povrchu a nesnaží se jen dohánět ostatní, má velmi silný svůj vlastní výzkum, který se zabývá i jinými aplikacemi AI než jen jazykovým modelem a snaží se maximálně využít své aplikace a date, aby až bude připravena, mohla přijít právě s funkcemi pro své uživatele. A ta chvíle právě nastává.
Emu – Expressive media universe
Právě o generování obrázků je jejich první praktická aplikace, které říkají EMU. Jako hlavní přednost Mark zmiňoval rychlost generování, obrázky by měly být do 5 vteřin. Nepochybně tak podobně jako OpenAI DALL-E nepoužívají časově náročné difusní modelování jako Stable Diffusion či Midjourney.
Mark zmiňoval, že tyto obrázky bude možné generovat v chatu.
AI Stickers
Jako první ale ukázal jednodušší a nejspíš do budoucna využívanější fičuru – AI „nálepky“ – stickers. Malé obrázky které budete moci využívat při konverzacích v různých chatovacích aplikacích od Meta a nebudete se tak muset omezovat na set existujících nálepek. Dostupnost by měla být „teď“, ale zatím to tam ještě nemám.
AI úpravy fotek na Instagramu
Hodně oblíbená bude určitě úprava fotek na Instagramu pomocí textového zadání – třeba jen zadáním „party s hnusnými svetry“ či „punk rock“ změnili fotku mladého Zucka – jeho oblečení, vlasy, nasvícení scény. Už vidím, jak to budou lidé využívat jak pro zábavu, tak pro praktické účely – zkouška různých účesů, stylů oblečení atp. Třeba to bude praktičtější i než generování AI fake profilovek, když nemáte žádnou slušnou fotku.
Ještě zajímavější byla ukázka s jeho psem Beastem. Ukázali, jak z něj udělají Origami, růžového pudla, háčkovaný obraz… meze budou zjevně opravdu široké, nejde jen o náhradu nějakých detailů. Těšit se můžeme na Instagramu přibližně do měsíce
Různé AI pro různé věci
Mark zmiňoval, že je spousta různých potřeb různých typů uživatelů, spousta AI a spoustu různých míst, kde se dá využít, ať už v komunikátorech, profilech, zprávách… a Meta připravuje platformu pro vývojáře, aby mohli snadno vytvářet co potřebují. Zároveň připravili několik svých řešení.
Meta AI
Univerzální asistent, obdoba ChatGPT založená na Llama 2, zároveň má ale přístup k aktuálním informacím díky partnerství s Microsoft a jejich Bingem – tedy spíše půjde o obdobu Bing Chat, přímo v chatu.
Zároveň bude do chatu zabudovaná i Emu, takže budete moci v chatu vytvářet obrázky (ChatGPT Plus a Bing Chat takto mají resp. budou mít DALL-E 3). Zajímavé je, že se pro vygenerování obrázku bude používat klíčové slovo /imagine, které „proslavil“ Midjourney.
Nejzajímavější ovšem je, že budete moci Meta AI přizvat do jakéhokoliv chatu, včetně skupinových, takže kdykoliv se vám bude hodit v diskusi pomoc AI, tak jen napíšete @metaai a dotaz a ona se zapojí do diskuse.
Meta AIs
Naprosto skvělá je ovšem ještě jedna funkce – Meta AI charaktery (můj název, jinak tomu říkají Meta AIs) – AI agenti speciálně dotrénování pro nějaký konkrétní účel – například je tam bot, který vám poradí s vařením, jiný který s nějakou business analýzou. Není to ale jen o radách – je tam třeba fitness trenér, který vás bude motivovat do cvičení nebo Dungeon master – pán jeskyně, se kterým můžete hrát D&D.
A aby to bylo ještě zábavnější, tyto role reprezentují známé osobnosti, takže třeba toho pána jeskyně hraje Snoop Dog, forenzní kriminalistku, se kterou budete řešit detektivky, hraje Paris Hilton… a po celou dobu chatu se na vás budou různě ksichtit z „video“ okýnka.
Pro více ukázek si prohlédněte těchto 90 vteřin z keynote.
Některé z osobností a jejich rolí:
- Charli D’Amelio jako Coco, nadšená do tance
- Chris Paul jako Perry, profesionální golfista, který vám pomáhá zdokonalit váš úder
- Dwyane Wade jako Victor, Ironman triatlonista, který vás motivuje k tomu, abyste ze sebe vydali to nejlepší.
- Izzy Adesanya jako Luiz, nápadný nadějný hráč MMA, který dokáže obhájit své chvástání.
- Kendall Jennerová jako Billie, bezchybná společnice, která jede život naplno
- LaurDIY jako Dylan, svérázná odbornice na kutilství a řemesla a společnice pro generaci Z
- MrBeast jako Zach, Starší brácha, který vás zpraží – protože mu na vás záleží
- Naomi Osaka jako Tamika, Anime posedlá Sailor Senshi ve výcviku
- Paris Hilton jako Amber, detektivní partnerka pro řešení záhadných případů
- Raven Rossová jako Angie, královna cvičebních hodin, která kombinuje fitness s meditací
- Roy Choi jako Max, zkušený pomocný kuchař pro kulinářské tipy a triky
- Sam Kerr jako Sally, volnomyšlenkářská kamarádka, která vám řekne, kdy se máte zhluboka nadechnout
- Snoop Dogg jako Dungeon Master, pán jeskyně se kterým prožijete vlastní dobrodružství
- Tom Brady jako Bru, sportovní vševěd, který si nebere servítky.
Meta AIs by se měly ve všech kecálcích od Meta objevit v nejbližších dnech a týdnech, postupně budou přibývat další osobnosti (Bear Grylls, Chloe Kim, Josh Richards…) a ty současné se budou dále vylepšovat, získají přístup k aktuálním informacím atd.
Tahle funkce hodí vidle do businessu mnoha dnešních AI startupů, nejvíc asi Character.AI – zde málo známé službě, ale celosvětově dnes nejpoužívanější platformě pro „chytré agenty“, kteří mají své instrukce („osobnost“) na základě kterých vám radí.
AI Studio
Platforma pro vývojáře, o které jsem se zmínil na začátku této kapitoly, se bude jmenovat AI Studio, dostupná by měla být během několika týdnů, není ale úplně jasné, jestli všem (zcela otevřené by to mělo být v průběhu příštího roku), některé vybrané firmy jsou již v Alfa programu zařazené.
První funkcí bude právě možnost vytváření takových AI charakterů, které budete moci nějak snadno „no-code“ trénovat na svých datech, a například firmy si tak budou moci vytvořit své AI asistenty, se kterými budou zákazníci řešit své požadavky, nebo osobnosti budou moci takto reagovat na zprávy od fanoušků.
Hlavní výzvou, na kterou se Facebook přitom zaměřuje je „brand safety“ – tedy ochrana vaší značky, aby bot odpovídal tak jak chcete a neudělal nějaké komunikační „boty“ (pun intended), které by mohly poškodit vaší značku.
3. část – Ray-Ben Meta Smart Glasses s AI
Druhá generace chytrých brýlí – lepší kamera, zvuk, vzhled atd., ale jak i Zuck sám řekl, to nejzajímavější je právě fakt, že jde o první chytré brýle se zabudovanou Meta AI.
AI ve vašich brýlích tak bude mít přístup ke kameře a zvuku a bude mít mnoho praktických použití.
Začte se hlasovým dotazováním -například u grilování se zeptal, jak dlouho se bude grilovat kuřecí steak, u pálkované (Pickleball – nový aktuálně děsně populární sport v USA, podobný tenisu, všude se teď pro něj dělají hřiště) se ptal, jestli je OK když míček padne na čáru, nebo prostě pro běžné otázky, když chcete dělat chytrého.
V průběhu příštího roku ale přibude právě i multimodalita – AI získají přístup ke kameře a vy se tak budete moci ptát, co brýle vidí, nechat si přeložit ceduli, nebo poradit s opravou kapajícího kohoutku.
Škoda jen, že brýle zatím nemají možnost něco i zobrazovat na displeji, prý se na tom pracuje, i tak je ale už právě kombinace brýlí, sluchátek a AI dost užitečná a hodně budu o jejich nákupu uvažovat, zejména jestli se třeba časem naučí i česky (vyloženě se nabízí využít je pro překlad konverzace). Ostatně aktuálně teď používám takto cyklistické brýle s Bluetooth sluchátky, přidání kamery by umožnilo třeba nahrávat jízdu, AI by mi mohla umožnit ovládat navigaci…
Kromě AI budete moci brýle využít i pro livestream videa – nesouvisí to s AI ale i to by se hodilo, když třeba ukazuji jak jedu na kole, něco vyrábím či vařím, kdy mám plné ruce práce a nechci opatlávat telefon. Cena 299$ mi přijde dost v pohodě, jsem zvědav na testy od uživatelů. Jo a v ceně je i krásné stylové nabíjecí pouzdro.
Taky jste nadšení?
Popravdě nečekal bych, že mě nejvíce potěší a překvapí právě Meta. Líbí se mi, že si jde svou cestou, zároveň ovšem uzavírá partnerství třeba s Microsoftem při integraci jejich Bingu, líbí se mi, že jejich VR je něco, co definuje trendy i Apple se jen horko těžko chytá, a jejich brýle nemají naprosto žádného konkurenta.
Líbí se mi, že řeší skutečné potřeby svých uživatelů, i to, že jdou do AI poctivě, od základů a prvotního výzkumu, kdy navíc jako jediní ke všemu zveřejňují papery a vesměs i modely a dávají vývojářům snadné nástroje na tvorbu řešení nad nimi. Paradoxně tak tahle „evil“ značka je najednou tou nejpřátelštější.
Dejte mi vědět, co si myslíte, tad dole ⬇️⬇️⬇️ jsou sdílecí tlačítka a můžete tak článek nasdílet svým kruhům a napsat mi tam váš názor. Nezapomeňte se také registrovat, ať vám žádná novinka neunikne.