---
title: "AI řešení obrazových úloh z matematiky a fyziky"
id: "1511"
type: "post"
slug: "ai-reseni-obrazovych-uloh-z-matematiky-a-fyziky"
published_at: "2023-08-03T12:57:00+00:00"
modified_at: "2023-08-17T11:49:36+00:00"
url: "https://www.kapler.cz/ai-reseni-obrazovych-uloh-z-matematiky-a-fyziky/"
markdown_url: "https://www.kapler.cz/ai-reseni-obrazovych-uloh-z-matematiky-a-fyziky.md"
excerpt: "Část mé práce spočívá i v testování schopností různých AI modelů pro vytváření řešení různých úkolů. Ukážu vám jeden příklad, který mě dnes \"posadil na zadek\"."
taxonomy_category:
  - "AI"
taxonomy_post_tag:
  - "Analýza obrazu"
  - "Google Bard"
  - "Srovnání LLM"
  - "Vzdělávání"
---

# AI řešení obrazových úloh z matematiky a fyziky

Část mé práce spočívá i v testování schopností různých AI modelů pro vytváření řešení různých úkolů. Ukážu vám jeden příklad, který mě dnes „posadil na zadek“.

Uveřejněno

3. 8. 2023

Rubrika

[AI](https://www.kapler.cz/category/ai/)

Autor

Tomáš Kapler

Značky:

[Analýza obrazu](https://www.kapler.cz/tag/analyza-obrazu/)
, [Google Bard](https://www.kapler.cz/tag/google-bard/)
, [Srovnání LLM](https://www.kapler.cz/tag/srovnani-llm/)
, [Vzdělávání](https://www.kapler.cz/tag/vzdelavani/)

Jedním z klientů, pro které pracuji, je SCIO – společnost zaměřená na školní i mimoškolní vzdělávání dětí, kde pomáhám hledat způsoby, jak pomocí různých AI nástrojů zefektivnit a zlepšit práci pracovníků různých oddělení a připravit nástroje, které díky AI pomohou studentům i učitelům.

O tom všem se určitě v nejbližších měsících dovíte víc, každopádně část mé práce spočívá i v testování schopností různých AI modelů pro vytváření řešení různých úkolů. A ukážu vám jeden příklad, který mě dnes „posadil na zadek“.

Do Google Bard jsem dal následující obrázkovou úlohu a zeptal se, jaký je výsledek.

A co on na to? Naprosto s přehledem, během pár vteřin.

Zkoušel jsem i ostatní LLM které testuji – ChatGPT 3.5 a 4, Anthropic Claude i Bing. Ani jeden z nich řešení přímo z obrázku nezvládl, nicméně kromě Bingu jej zvládli alespoň při textovém zadání (v češtině).

I zde ale Bard vyčníval – jako jediný totiž předvedl zjednodušený výpočet, každé zvíře se totiž vyskytuje na prvních 3 obrázcích 2× a pro zjištění váhy všech tak stačí pouze sečíst všechny hodnoty a vydělit dvěma.

Zkoušel jsem i Google Bard nějaké fyzikální příklady:

Mimochodem – Google Bard zatím nezvládá komunikaci k obrázkům v češtině – když mu napíšete „Vyřeš to“, odpoví vám „Je mi líto, pokyny s obrázky zatím zvládám zpracovávat jen v angličtině.“ Ale dá se to celkem obstojně obejít tím, že mu řeknete anglicky, aby vám odpovídal v češtině, nejvíc se mi osvědčila fráze: „*Figure it out. Do all reasoning and explanations in Czech.*„

Jestli si trochu něco málo pamatujete z fyziky, tak vám je ta odpověď možná divná. Ignoruji teď fakt, že tíhové zrychlení v této odpovědi uvedl jako 10 m/s2 namísto obvyklejšího a přesnějšího 9.81 m/s2, protože tak se to někdy počítá, když nepotřebujeme přesný výsledek (stejně tady zanedbáváme tření) a Bard někdy použije tu přesnější, jindy méně přesnou hodnotu. Ale neměla by být potřebná síla jiná, když jde o kladkostroj? Nevím, zeptáme se (nyní už v češtině):

Jo, to zní už líp. Google zřejmě při prvním dotazu z obrázku nepoznal, že jde o kladkostroj, tím že jsem mu pomohl a další další kontext tak už neměl s řešením problém.

## A teď hádanka pro vás

Popravdě nemám rád měření v čemkoliv jiném než SI jednotkách, takže mu trochu změním zadání. Také mu trochu napovím, ať používá při výpočtu Jouly a Newtony, nechci, aby to používalo nějaké obskurní jednotky jako třeba [síly potřebné k veletuctu otočení mlýnského kola](https://en.wikipedia.org/wiki/Horsepower)
 či v čem by to jinak chtěl vyjádřit.

Co myslíte, Má to i tentokrát Google Bard správně? A jestli ne, jaký dotaz bych mu měl napsat (bez přímého uvedení čísel), aby se opravil? [Sdílejte a napište mi třeba na Twitteru](https://twitter.com/tkapler/status/1691123106944053249)
 nebo [na Facebooku](https://www.facebook.com/tomas.kapler/posts/pfbid0DZk6UyumKKvscW8J3wKyPcHyT7dATtDRpLmaxayLiH6BE7rGuzif7cgi1yBKQVcFl)
. A pro pokročilé – **dokážete napsat prompt, který by vracet lepší výsledky s takovýmito obrázky, aniž bych musel každý obrázek kontrolovat a radit mu, co by měl opravit?**

A mimochodem – samozřejmě jako u všech LLM, při každém dotazu se generuje jiná odpověď. Google Bard dokonce vždy generuje 3 odpovědi – můžete si je prohlédnout přes View other drafts vpravo nahoře.
