Transkribus czyta dokumenty z poziomem błędów około 6%. Jeśli mamy jakieś skany metryk po rosyjsku ściągnięte np. z Geneteki lub serwisu szukajwarchiwach, możemy spróbować.
Oto instrukcja:
1. Rozpoznajemy. Otwieramy
https://readcoop.eu/model/russian-civil ... -xix-cent/
2. Kombinacją klawiszy SymbolWindows+ e otwieramy managera plików, wyszukujemy plik ze skanem metryki. Przesuwamy myszą wybraną metrykę zapisaną na naszym komputerze w pliku z rozszerzeniem jpg na pole Drag an image here (w dole okienka)
lub
wybieramy położenie pliku ze skanem metryki na komputerze klikając Select a file
3. Magia działa. Sztuczna inteligencja się poci. Czekamy
4. Otwieramy rezultat, klikając Doc w dole okienka Transkribusa po prawej stronie, otwiera się plik Worda, który edytujemy, usuwając wszystkie podziały wyrazów na końcu wiersza (i towarzyszące im znaki przeniesienia -). Po zakończeniu edycji zapisujemy kombinacją klawiszy ctrl+s. Usuwanie podziałów wyrazów jest bardzo ważne, bez tego otrzymamy bardzo zły wynik tłumaczenia.
5. Kopiujemy rezultat, klikając w Wordzie w dowolnym miejscu na rozpoznany tekst, zaznaczamy całość kombinacją klawiszy ctrl+a i i kopiujemy nasz rezultat kombinacją klawiszy ctrl+c
6. Tłumaczymy: otwieramy
https://translate.google.com/?sl=ru&tl=pl&op=translate
7. klikamy w lewe okienko i wklejamy nasz rezultat kombinacją klawiszy ctrl+v
8. klikamy w prawe okienko i kopiujemy nasz rezultat kombinacją klawiszy ctrl+c
9. wracamy do naszego Worda (czy innego edytora) i wklejamy na dole nasz rezultat kombinacją klawiszy ctrl+v
10. zapisujemy plik Worda kombinacją klawiszy ctrl+s
Teraz możemy się zastanawiać, co sztuczna inteligencja miała na myśli w przypadku wątpliwych lub niezrozumiałych fragmentów. Najłatwiej wrócić do okienka Transkribusa, znaleźć wątpliwe fragmenty w odczytanym tekście, wtedy możemy zaznaczyć je w pliku Worda i zapisać plik do późniejszej analizy.
Oczywiście, możemy także rozpoznawać metryki polskie, w kroku 1 otwierając https://readcoop.eu/model/polish-general-model/
i powtarzając wszystko do kroku 4 włącznie.
Jestem bardzo ciekaw Państwa wrażeń, jak poszło, jakie pojawiały się trudności; chętnie poczytam w tym wątku. Starałem się napisać instrukcję jak najprościej.
Przy okazji, będę szukał osób o kompetencjach informatycznych i archiwistycznych do podobnych zabaw, ale o tym wkrótce w innym wątku.
Petrus
