Strona 1 z 1
AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: wt 25 lis 2025, 20:49
autor: skrzynka97
Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię.
Zainteresowanym amatorom AI polecam sprawdzenie tego modelu.
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: wt 25 lis 2025, 21:18
autor: Aquila
No to u mnie właśnie z Chryzostoma Sawickiego Gemini zrobiło Krzysztofa Kamickiego. Choć resztę tekstu odczytało całkiem poprawnie.
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: wt 25 lis 2025, 22:21
autor: semux
skrzynka97 pisze: wt 25 lis 2025, 20:49
Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię. Pismo jest lepiej odczytywane przez model niż przez moje oko. A przecież jest to model "ogólny", nie dedykowany kilkuset letnim rękopisom.
Zainteresowanym tematem AI polecam sprawdzenie tego modelu.
Dla testu przepuściłem cały rocznik aktów małżeństwa z parafii Obryte z roku 1917 i otrzymałem takie wyniki (zapisane już w pliku do indeksacji)
https://docs.google.com/spreadsheets/d/ ... SH/pubhtml
Błędów w indeksie jest 33:
- Pyszkiewicz -> Tyszkiewicz
- Ryczonowska -> Ryczanowska
Jak widać nie jest źle, a na pewno zdecydowanie lepiej niż model Gemini 2.5 Pro, o Chat-GPT nie wspominając.
pozdrawiam
Sergiusz
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: śr 26 lis 2025, 01:40
autor: piotr_nojszewski
Założywszy w indeksie M 11 danych kluczowych (napturienci, rodzice i data) i 43 rekordy miałes wpółczynnik błedu bliski 7%. Bo miejsce ślubu było tu stałe jak widze.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: śr 26 lis 2025, 13:13
autor: hospes
Model Gemini 3 PRO staje się przydatnym narzędziem do odczytywania pisma odręcznego. Należy tylko pamiętać, aby wybrać wariant "myślący" a nie "szybki". Oczywiście wynik pracy AI trzeba sprawdzić i poprawić po niej błędy. Warto też próbować ograniczać pomyłki AI, podpowiadając co ma odczytać. Nie wydajemy polecenia: "Odczytaj tekst", tylko staramy się jak najbardziej zawęzić pole do domysłów za pomocą poleceń takich jak np: "Odczytaj tekst, w którym są indeksy uporządkowane rosnąco z zakresu 1-78", "Odczytaj tekst, w którym są daty uporządkowane rosnąco z zakresu 1.01.1800 - 31.12.1800", "Odczytaj tekst, w którym są nazwiska w kolejności alfabetycznej".
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
: czw 27 lis 2025, 20:48
autor: semux
To jeszcze warto wspomnieć o kolejnej nowości tj. Nano Banana Pro od Googla - można użyć do szybkiego i sprawnego retuszu zdjęć.
Tu przykład:
Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):
Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek
Mamy poprawione zdjęcie przez Nano Banana Pro:
Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).