AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Wszystkie sprawy związane z naszą pasją, w tym: FAQ - często zadawane pytania

Moderatorzy: maria.j.nie, elgra, Galinski_Wojciech

skrzynka97
Posty: 3
Rejestracja: sob 07 wrz 2024, 21:48

AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: skrzynka97 »

Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię.

Zainteresowanym amatorom AI polecam sprawdzenie tego modelu.
Ostatnio zmieniony śr 26 lis 2025, 00:04 przez skrzynka97, łącznie zmieniany 4 razy.
Aquila

Sympatyk
Posty: 185
Rejestracja: wt 16 sty 2018, 02:03

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: Aquila »

No to u mnie właśnie z Chryzostoma Sawickiego Gemini zrobiło Krzysztofa Kamickiego. Choć resztę tekstu odczytało całkiem poprawnie.
Pozdrawiam,
Mirek
semux

Sympatyk
Adept
Posty: 15
Rejestracja: czw 20 kwie 2023, 15:56
Lokalizacja: Nowe Grabie koło Gąbina

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: semux »

skrzynka97 pisze: wt 25 lis 2025, 20:49 Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię. Pismo jest lepiej odczytywane przez model niż przez moje oko. A przecież jest to model "ogólny", nie dedykowany kilkuset letnim rękopisom.

Zainteresowanym tematem AI polecam sprawdzenie tego modelu.
Dla testu przepuściłem cały rocznik aktów małżeństwa z parafii Obryte z roku 1917 i otrzymałem takie wyniki (zapisane już w pliku do indeksacji) https://docs.google.com/spreadsheets/d/ ... SH/pubhtml
Błędów w indeksie jest 33:
  • Gałka -> Falba
  • Józef -> Franciszek
  • Książek -> Książak
  • Perkowska -> Berkowska
  • Sikora -> Pikora
  • Skuleński -> Szulewski
  • Cholińska -> Choliwska
  • Podlasińska -> Podlasin
  • Książek -> Książak
  • Szczepanek -> Szczepanik
  • 1917-02-18 -> 1917-02-12
  • 1917-02-28 -> 1917-02-08
  • 1917-05-27 -> 1917-05-28
  • Pałasek -> Palasek
  • Pałasek -> Palasek
  • Zając -> Zaręba
  • Dygoń -> Dyga
  • Lach -> Łach
  • Pyszkiewicz -> Tyszkiewicz
  • Rogoń -> Kozan
  • Ciura -> Ciuba
  • Klisiak -> Książak
  • Łyszkowska -> Łyczkowska
  • Bladosz -> Blados
  • Wolańska -> Wólańska
  • Łęg -> Pęgra
  • Kwiatkowska -> Kwiatek
  • Karlińska -> Koźlińska
  • Stawarak -> Stańczak
  • Gąsior -> Gązek
  • Ryczonowska -> Ryczanowska
  • Bartczak -> Bartniczak
  • Ciuk -> Ciuba
Jak widać nie jest źle, a na pewno zdecydowanie lepiej niż model Gemini 2.5 Pro, o Chat-GPT nie wspominając.

pozdrawiam
Sergiusz
Awatar użytkownika
piotr_nojszewski

Sympatyk
Nowicjusz
Posty: 1682
Rejestracja: ndz 21 kwie 2013, 01:17
Lokalizacja: Warszawa
Podziękował: 2 times
Kontakt:

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: piotr_nojszewski »

Założywszy w indeksie M 11 danych kluczowych (napturienci, rodzice i data) i 43 rekordy miałes wpółczynnik błedu bliski 7%. Bo miejsce ślubu było tu stałe jak widze.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.
pozdrawiam
Piotr
hospes

Sympatyk
Posty: 78
Rejestracja: pt 18 cze 2021, 21:27

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: hospes »

Model Gemini 3 PRO staje się przydatnym narzędziem do odczytywania pisma odręcznego. Należy tylko pamiętać, aby wybrać wariant "myślący" a nie "szybki". Oczywiście wynik pracy AI trzeba sprawdzić i poprawić po niej błędy. Warto też próbować ograniczać pomyłki AI, podpowiadając co ma odczytać. Nie wydajemy polecenia: "Odczytaj tekst", tylko staramy się jak najbardziej zawęzić pole do domysłów za pomocą poleceń takich jak np: "Odczytaj tekst, w którym są indeksy uporządkowane rosnąco z zakresu 1-78", "Odczytaj tekst, w którym są daty uporządkowane rosnąco z zakresu 1.01.1800 - 31.12.1800", "Odczytaj tekst, w którym są nazwiska w kolejności alfabetycznej".
Kamil
semux

Sympatyk
Adept
Posty: 15
Rejestracja: czw 20 kwie 2023, 15:56
Lokalizacja: Nowe Grabie koło Gąbina

Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.

Post autor: semux »

To jeszcze warto wspomnieć o kolejnej nowości tj. Nano Banana Pro od Googla - można użyć do szybkiego i sprawnego retuszu zdjęć.
Tu przykład:

Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):
Obrazek

Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek

Mamy poprawione zdjęcie przez Nano Banana Pro:
Obrazek

Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).
ODPOWIEDZ

Wróć do „Ja i Genealogia, wymiana doświadczeń”