AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

skrzynka97 · Post autor: **skrzynka97** » wt 25 lis 2025, 20:49

Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię.

Zainteresowanym amatorom AI polecam sprawdzenie tego modelu.

Aquila · Post autor: **Aquila** » wt 25 lis 2025, 21:18

No to u mnie właśnie z Chryzostoma Sawickiego Gemini zrobiło Krzysztofa Kamickiego. Choć resztę tekstu odczytało całkiem poprawnie.

semux · Post autor: **semux** » wt 25 lis 2025, 22:21

skrzynka97 pisze: wt 25 lis 2025, 20:49 Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię. Pismo jest lepiej odczytywane przez model niż przez moje oko. A przecież jest to model "ogólny", nie dedykowany kilkuset letnim rękopisom.

Zainteresowanym tematem AI polecam sprawdzenie tego modelu.

Dla testu przepuściłem cały rocznik aktów małżeństwa z parafii Obryte z roku 1917 i otrzymałem takie wyniki (zapisane już w pliku do indeksacji) https://docs.google.com/spreadsheets/d/ ... SH/pubhtml
Błędów w indeksie jest 33:

Gałka -> Falba

Józef -> Franciszek

Książek -> Książak

Perkowska -> Berkowska

Sikora -> Pikora

Skuleński -> Szulewski

Cholińska -> Choliwska

Podlasińska -> Podlasin

Książek -> Książak

Szczepanek -> Szczepanik

1917-02-18 -> 1917-02-12

1917-02-28 -> 1917-02-08

1917-05-27 -> 1917-05-28

Pałasek -> Palasek

Pałasek -> Palasek

Zając -> Zaręba

Dygoń -> Dyga

Lach -> Łach

Pyszkiewicz -> Tyszkiewicz

Rogoń -> Kozan

Ciura -> Ciuba

Klisiak -> Książak

Łyszkowska -> Łyczkowska

Bladosz -> Blados

Wolańska -> Wólańska

Łęg -> Pęgra

Kwiatkowska -> Kwiatek

Karlińska -> Koźlińska

Stawarak -> Stańczak

Gąsior -> Gązek

Ryczonowska -> Ryczanowska

Bartczak -> Bartniczak

Ciuk -> Ciuba

Jak widać nie jest źle, a na pewno zdecydowanie lepiej niż model Gemini 2.5 Pro, o Chat-GPT nie wspominając.

pozdrawiam
Sergiusz

piotr_nojszewski · Post autor: **piotr_nojszewski** » śr 26 lis 2025, 01:40

Założywszy w indeksie M 11 danych kluczowych (napturienci, rodzice i data) i 43 rekordy miałes wpółczynnik błedu bliski 7%. Bo miejsce ślubu było tu stałe jak widze.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.

hospes · Post autor: **hospes** » śr 26 lis 2025, 13:13

Model Gemini 3 PRO staje się przydatnym narzędziem do odczytywania pisma odręcznego. Należy tylko pamiętać, aby wybrać wariant "myślący" a nie "szybki". Oczywiście wynik pracy AI trzeba sprawdzić i poprawić po niej błędy. Warto też próbować ograniczać pomyłki AI, podpowiadając co ma odczytać. Nie wydajemy polecenia: "Odczytaj tekst", tylko staramy się jak najbardziej zawęzić pole do domysłów za pomocą poleceń takich jak np: "Odczytaj tekst, w którym są indeksy uporządkowane rosnąco z zakresu 1-78", "Odczytaj tekst, w którym są daty uporządkowane rosnąco z zakresu 1.01.1800 - 31.12.1800", "Odczytaj tekst, w którym są nazwiska w kolejności alfabetycznej".

semux · Post autor: **semux** » czw 27 lis 2025, 20:48

To jeszcze warto wspomnieć o kolejnej nowości tj. Nano Banana Pro od Googla - można użyć do szybkiego i sprawnego retuszu zdjęć.
Tu przykład:

Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):

Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek

Mamy poprawione zdjęcie przez Nano Banana Pro:

Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).

AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.