AI řešení obrazových úloh z matematiky a fyziky

Část mé práce spočívá i v testování schopností různých AI modelů pro vytváření řešení různých úkolů. Ukážu vám jeden příklad, který mě dnes „posadil na zadek“.

Uveřejněno

Rubrika

Autor

Jedním z klientů, pro které pracuji, je SCIO – společnost zaměřená na školní i mimoškolní vzdělávání dětí, kde pomáhám hledat způsoby, jak pomocí různých AI nástrojů zefektivnit a zlepšit práci pracovníků různých oddělení a připravit nástroje, které díky AI pomohou studentům i učitelům.

O tom všem se určitě v nejbližších měsících dovíte víc, každopádně část mé práce spočívá i v testování schopností různých AI modelů pro vytváření řešení různých úkolů. A ukážu vám jeden příklad, který mě dnes „posadil na zadek“.

AI školení – nové termíny a místa (Praha, Brno…)

Chcete dostávat tyto články na e-mail, aby vám nic neuteklo?

Do Google Bard jsem dal následující obrázkovou úlohu a zeptal se, jaký je výsledek.

A co on na to? Naprosto s přehledem, během pár vteřin.

Zkoušel jsem i ostatní LLM které testuji – ChatGPT 3.5 a 4, Anthropic Claude i Bing. Ani jeden z nich řešení přímo z obrázku nezvládl, nicméně kromě Bingu jej zvládli alespoň při textovém zadání (v češtině).

I zde ale Bard vyčníval – jako jediný totiž předvedl zjednodušený výpočet, každé zvíře se totiž vyskytuje na prvních 3 obrázcích 2× a pro zjištění váhy všech tak stačí pouze sečíst všechny hodnoty a vydělit dvěma.

Zkoušel jsem i Google Bard nějaké fyzikální příklady:

Mimochodem – Google Bard zatím nezvládá komunikaci k obrázkům v češtině – když mu napíšete „Vyřeš to“, odpoví vám „Je mi líto, pokyny s obrázky zatím zvládám zpracovávat jen v angličtině.“ Ale dá se to celkem obstojně obejít tím, že mu řeknete anglicky, aby vám odpovídal v češtině, nejvíc se mi osvědčila fráze: „Figure it out. Do all reasoning and explanations in Czech.

Jestli si trochu něco málo pamatujete z fyziky, tak vám je ta odpověď možná divná. Ignoruji teď fakt, že tíhové zrychlení v této odpovědi uvedl jako 10 m/s2 namísto obvyklejšího a přesnějšího 9.81 m/s2, protože tak se to někdy počítá, když nepotřebujeme přesný výsledek (stejně tady zanedbáváme tření) a Bard někdy použije tu přesnější, jindy méně přesnou hodnotu. Ale neměla by být potřebná síla jiná, když jde o kladkostroj? Nevím, zeptáme se (nyní už v češtině):

Jo, to zní už líp. Google zřejmě při prvním dotazu z obrázku nepoznal, že jde o kladkostroj, tím že jsem mu pomohl a další další kontext tak už neměl s řešením problém.

A teď hádanka pro vás

Popravdě nemám rád měření v čemkoliv jiném než SI jednotkách, takže mu trochu změním zadání. Také mu trochu napovím, ať používá při výpočtu Jouly a Newtony, nechci, aby to používalo nějaké obskurní jednotky jako třeba síly potřebné k veletuctu otočení mlýnského kola či v čem by to jinak chtěl vyjádřit.

Co myslíte, Má to i tentokrát Google Bard správně? A jestli ne, jaký dotaz bych mu měl napsat (bez přímého uvedení čísel), aby se opravil? Sdílejte a napište mi třeba na Twitteru nebo na Facebooku. A pro pokročilé – dokážete napsat prompt, který by vracet lepší výsledky s takovýmito obrázky, aniž bych musel každý obrázek kontrolovat a radit mu, co by měl opravit?

A mimochodem – samozřejmě jako u všech LLM, při každém dotazu se generuje jiná odpověď. Google Bard dokonce vždy generuje 3 odpovědi – můžete si je prohlédnout přes View other drafts vpravo nahoře.

Nové články sem přidávám porůznu, tak jestli nechcete, aby vám něco uniklo, přidejte si můj feed do RSS čtečky, sledujte můj Twitter, Facebook a LinkedIn, případně si nechte nové příspěvky posílat mailem (žádný spam!)