Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię.
Zainteresowanym amatorom AI polecam sprawdzenie tego modelu.
AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
Moderatorzy: maria.j.nie, elgra, Galinski_Wojciech
-
skrzynka97
- Posty: 3
- Rejestracja: sob 07 wrz 2024, 21:48
AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
Ostatnio zmieniony śr 26 lis 2025, 00:04 przez skrzynka97, łącznie zmieniany 4 razy.
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
No to u mnie właśnie z Chryzostoma Sawickiego Gemini zrobiło Krzysztofa Kamickiego. Choć resztę tekstu odczytało całkiem poprawnie.
Pozdrawiam,
Mirek
Mirek
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
Dla testu przepuściłem cały rocznik aktów małżeństwa z parafii Obryte z roku 1917 i otrzymałem takie wyniki (zapisane już w pliku do indeksacji) https://docs.google.com/spreadsheets/d/ ... SH/pubhtmlskrzynka97 pisze: wt 25 lis 2025, 20:49 Model Gemini 3 został wdrożony w ubiegłym tygodniu. Nowy model wprowadził ulepszenia w zakresie odczytywania pisma odręcznego. Zmiana jest duża.
Umiejętne korzystanie z modelu w połączeniu z średnio czytelnym pismem daje wynik transkrypcji 1:1 (sprawdzałem język polski i łacinę).
Ale to co mnie zaskoczyło, to transkrypcja bazgrołów, pisarzy niedbających o kaligrafię. Pismo jest lepiej odczytywane przez model niż przez moje oko. A przecież jest to model "ogólny", nie dedykowany kilkuset letnim rękopisom.
Zainteresowanym tematem AI polecam sprawdzenie tego modelu.
Błędów w indeksie jest 33:
- Gałka -> Falba
- Józef -> Franciszek
- Książek -> Książak
- Perkowska -> Berkowska
- Sikora -> Pikora
- Skuleński -> Szulewski
- Cholińska -> Choliwska
- Podlasińska -> Podlasin
- Książek -> Książak
- Szczepanek -> Szczepanik
- 1917-02-18 -> 1917-02-12
- 1917-02-28 -> 1917-02-08
- 1917-05-27 -> 1917-05-28
- Pałasek -> Palasek
- Pałasek -> Palasek
- Zając -> Zaręba
- Dygoń -> Dyga
- Lach -> Łach
- Pyszkiewicz -> Tyszkiewicz
- Rogoń -> Kozan
- Ciura -> Ciuba
- Klisiak -> Książak
- Łyszkowska -> Łyczkowska
- Bladosz -> Blados
- Wolańska -> Wólańska
- Łęg -> Pęgra
- Kwiatkowska -> Kwiatek
- Karlińska -> Koźlińska
- Stawarak -> Stańczak
- Gąsior -> Gązek
- Ryczonowska -> Ryczanowska
- Bartczak -> Bartniczak
- Ciuk -> Ciuba
pozdrawiam
Sergiusz
- piotr_nojszewski

- Posty: 1682
- Rejestracja: ndz 21 kwie 2013, 01:17
- Lokalizacja: Warszawa
- Podziękował: 2 times
- Kontakt:
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
Założywszy w indeksie M 11 danych kluczowych (napturienci, rodzice i data) i 43 rekordy miałes wpółczynnik błedu bliski 7%. Bo miejsce ślubu było tu stałe jak widze.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.
Pytanie jakie współczynnik uznajemy za akceptowalny dla masowej indeksacji.
A zapewne nie jest to ostanie słowo i model można "podciągnąć"
Widac postęp.
pozdrawiam
Piotr
Piotr
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
Model Gemini 3 PRO staje się przydatnym narzędziem do odczytywania pisma odręcznego. Należy tylko pamiętać, aby wybrać wariant "myślący" a nie "szybki". Oczywiście wynik pracy AI trzeba sprawdzić i poprawić po niej błędy. Warto też próbować ograniczać pomyłki AI, podpowiadając co ma odczytać. Nie wydajemy polecenia: "Odczytaj tekst", tylko staramy się jak najbardziej zawęzić pole do domysłów za pomocą poleceń takich jak np: "Odczytaj tekst, w którym są indeksy uporządkowane rosnąco z zakresu 1-78", "Odczytaj tekst, w którym są daty uporządkowane rosnąco z zakresu 1.01.1800 - 31.12.1800", "Odczytaj tekst, w którym są nazwiska w kolejności alfabetycznej".
Kamil
Re: AI - Gemini 3 wdraża model odczytywania pisma odręcznego.
To jeszcze warto wspomnieć o kolejnej nowości tj. Nano Banana Pro od Googla - można użyć do szybkiego i sprawnego retuszu zdjęć.
Tu przykład:
Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):

Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek
Mamy poprawione zdjęcie przez Nano Banana Pro:

Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).
Tu przykład:
Oryginał (jest to skan z odbitki robionej z fragmentu zdjęcia zbiorowego):

Po wpisaniu prostego prompt'a:
Popraw jakość zdjęcie, wykadruj aby nie było białych ramek
Mamy poprawione zdjęcie przez Nano Banana Pro:

Tylko niestety jest to płatne, choć mi Google nie naliczył żadnej opłaty za kilkunastokrotne użycie via Google AI Studio (ale to jeszcze nic pewnego, że nie naliczy).