Strona 1 z 1

AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: wt 25 lis 2025, 20:49
autor: skrzynka97
Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię.

Zainteresowanym amatorom AI polecam sprawdzenie tego modelu.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: wt 25 lis 2025, 21:18
autor: Aquila
No to u mnie właśnie z Chryzostoma Sawickiego Gemini zrobiło Krzysztofa Kamickiego. Choć resztę tekstu odczytało całkiem poprawnie.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: wt 25 lis 2025, 22:21
autor: semux
skrzynka97 pisze: wt 25 lis 2025, 20:49 Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię. Pismo jest lepiej odczytywane przez model niż przez moje oko. A przecież jest to model "ogólny", nie dedykowany kilkuset letnim rękopisom.

Zainteresowanym tematem AI polecam sprawdzenie tego modelu.
Dla testu przepuściłem cały rocznik aktów małżeństwa z parafii Obryte z roku 1917 i otrzymałem takie wyniki (zapisane już w pliku do indeksacji) https://docs.google.com/spreadsheets/d/ ... SH/pubhtml
Błędów w indeksie jest 33:
  • Gałka -> Falba
  • Józef -> Franciszek
  • Książek -> Książak
  • Perkowska -> Berkowska
  • Sikora -> Pikora
  • Skuleński -> Szulewski
  • Cholińska -> Choliwska
  • Podlasińska -> Podlasin
  • Książek -> Książak
  • Szczepanek -> Szczepanik
  • 1917-02-18 -> 1917-02-12
  • 1917-02-28 -> 1917-02-08
  • 1917-05-27 -> 1917-05-28
  • Pałasek -> Palasek
  • Pałasek -> Palasek
  • Zając -> Zaręba
  • Dygoń -> Dyga
  • Lach -> Łach
  • Pyszkiewicz -> Tyszkiewicz
  • Rogoń -> Kozan
  • Ciura -> Ciuba
  • Klisiak -> Książak
  • Łyszkowska -> Łyczkowska
  • Bladosz -> Blados
  • Wolańska -> Wólańska
  • Łęg -> Pęgra
  • Kwiatkowska -> Kwiatek
  • Karlińska -> Koźlińska
  • Stawarak -> Stańczak
  • Gąsior -> Gązek
  • Ryczonowska -> Ryczanowska
  • Bartczak -> Bartniczak
  • Ciuk -> Ciuba
Jak widać nie jest źle, a na pewno zdecydowanie lepiej niż model Gemini 2.5 Pro, o Chat-GPT nie wspominając.

pozdrawiam
Sergiusz

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: śr 26 lis 2025, 01:40
autor: piotr_nojszewski
Założywszy w indeksie M 11 danych kluczowych (napturienci, rodzice i data) i 43 rekordy miałes wpółczynnik błedu bliski 7%. Bo miejsce ślubu było tu stałe jak widze.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: śr 26 lis 2025, 13:13
autor: hospes
Model Gemini 3 PRO staje się przydatnym narzędziem do odczytywania pisma odręcznego. Należy tylko pamiętać, aby wybrać wariant "myślący" a nie "szybki". Oczywiście wynik pracy AI trzeba sprawdzić i poprawić po niej błędy. Warto też próbować ograniczać pomyłki AI, podpowiadając co ma odczytać. Nie wydajemy polecenia: "Odczytaj tekst", tylko staramy się jak najbardziej zawęzić pole do domysłów za pomocą poleceń takich jak np: "Odczytaj tekst, w którym są indeksy uporządkowane rosnąco z zakresu 1-78", "Odczytaj tekst, w którym są daty uporządkowane rosnąco z zakresu 1.01.1800 - 31.12.1800", "Odczytaj tekst, w którym są nazwiska w kolejności alfabetycznej".

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

: czw 27 lis 2025, 20:48
autor: semux
To jeszcze warto wspomnieć o kolejnej nowości tj. Nano Banana Pro od Googla - można użyć do szybkiego i sprawnego retuszu zdjęć.
Tu przykład:

Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):
Obrazek

Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek

Mamy poprawione zdjęcie przez Nano Banana Pro:
Obrazek

Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).