Geneteka - Nazwiska równoważne na potrzeby wyszukiwania

Tematy - indeksacja i digitalizacja metryk, projekty PTG

Moderatorzy: maria.j.nie, elgra, Galinski_Wojciech

rafal_rr

Sympatyk
Nowicjusz
Posty: 112
Rejestracja: pt 06 sty 2023, 22:44

Geneteka - Nazwiska równoważne na potrzeby wyszukiwania

Post autor: rafal_rr »

Dzień dobry wszystkim.
Jest na forum osobny wątek odnośnie imion równoważnych: https://genealodzy.pl/PNphpBB2-viewtopi ... -asc.phtml

Chciałbym się dowiedzieć, gdzie można zgłaszać listę nazwisk, które występują w aktach jako równoważne, ale wyszukiwarka geneteki nie ma o tym wiedzy?

Pozdrawiam,
Rafał
Giemza_Karol

Sympatyk
Ekspert
Posty: 100
Rejestracja: śr 14 gru 2016, 01:25
Otrzymał podziękowania: 1 time

Geneteka - NAZWISKA równoważne na potrzeby wyszukiwania

Post autor: Giemza_Karol »

W parafii, którą indeksuję (lata 40te XIX w.) właśnie pojawili się koloniści niemieccy.
W aktach urodzin jest raz Szmitke, a raz Kowalski, a potem znowu Szmitke.
Również Sztejn występije jako Sztajn i też jako Kamiński.

Nie wiem czy dodanie z automatu "Kowalski" do wyszukiwania "Szmit" nie spowoduje lawiny wyników - niekoniecznie właściwych.

Pozdrawiam
Karol Giemza
pawel_bo

Sympatyk
Adept
Posty: 47
Rejestracja: ndz 29 lip 2018, 11:54
Lokalizacja: Warszawa

Geneteka - NAZWISKA równoważne na potrzeby wyszukiwania

Post autor: pawel_bo »

Wyszukiwarka Geneteki traktuje obecnie jako równoważne nazwiska w formie męskiej i żeńskiej kończące się przyrostkami -cki/-cka oraz -ski/-ska, zaś taka równoważność nie występuje w przypadku form nazwisk kończących się przyrostkiem -dzki/-dzka.

Czy możliwe byłoby wprowadzenie modyfikacji do wyszukiwarki powodującej traktowanie nazwisk w formach męskich i żeńskich kończących się przyrostkiem -dzki/-dzka jako równoważne?

Pozdrawiam,
Paweł
Kamil0123

Nieaktywny
Posty: 248
Rejestracja: pt 30 sie 2024, 20:01

Geneteka - NAZWISKA równoważne na potrzeby wyszukiwania

Post autor: Kamil0123 »

Panie Karolu

Genealodzy indeksujący tę parafię mający tam przodków doskonale wiedzą jakie jest nazwisko rodowe ich przodków .Ja zawsze tego typu poprawki robię w programie do wyszukiwania przodków .Zapisy skrybów a nazwisko rodowe to dwie różne sprawy .
Najważniejsze jest aby w indeksie było nazwisko takie jakie jest w metryce.Interpretację najlepiej zna mający tam przodków . On sobie doskonale dopowie jakie nazwisko ma być .
Pozdrawiam
Kamil
SlawomirB

Sympatyk
Mistrz
Posty: 31
Rejestracja: pt 02 paź 2020, 12:37
Kontakt:

Post autor: SlawomirB »

Nazwiska "równoważne" można wpisać w pole "vel".
Markos

Sympatyk
Mistrz
Posty: 130
Rejestracja: pt 25 gru 2009, 16:34

Post autor: Markos »

Jeżeli to "vel" widnieje również w akcie. W przeciwnym wypadku wprowadzi to tylko niepotrzebne zamieszanie.
Paweł.
semux

Sympatyk
Adept
Posty: 15
Rejestracja: czw 20 kwie 2023, 15:56
Lokalizacja: Nowe Grabie koło Gąbina

Post autor: semux »

Mi brakuje:
Zaremba i Zaręba

pozdrawiam
Sergiusz
SlawomirB

Sympatyk
Mistrz
Posty: 31
Rejestracja: pt 02 paź 2020, 12:37
Kontakt:

Post autor: SlawomirB »

Markos pisze:Jeżeli to "vel" widnieje również w akcie. W przeciwnym wypadku wprowadzi to tylko niepotrzebne zamieszanie.
Dodatkowe formy nazwiska zapisane w kolumnie "vel" w wynikach wyszukiwania pojawiają się tylko w dymkach - więc niczego nie zamieszają, a jedynie pozwolą na wyszukanie, czy podpowiedź indeksującego, jakie jeszcze formy danego nazwiska są w tej parafii czy dla danej osoby.
Nazwiska mają jeszcze trzecią kolumnę - czyli forma taka jak w indeksie dla dziwnie zapisanych nazwisk - i ona też pojawia się w tym samym dymku co nazwiska w kolumnie "vel".
Markos

Sympatyk
Mistrz
Posty: 130
Rejestracja: pt 25 gru 2009, 16:34

Post autor: Markos »

Jeżeli użytkownik trafi na indeks, w którym widnieje "vel", a po przejściu do skanu nie jest w stanie zlokalizować tego "vel" w akcie, to jak najbardziej powoduje to zamieszanie, bo:
1.) skąd to "vel" skoro w akcie nie ma o tym słowa?
2.) Na jakiej podstawie autor indeksu to "vel" dodał?
3.) Skoro to inwencja autora indeksu to czy na pewno dobrze wydedukował?
4.) A może się pomylił i miało to dotyczyć poprzedniego/następnego indeksu?

Czasem akty są wybrakowane, np. pisarz zapomniał wpisać nazwiska rodowego matki dziecka. Przecież można by odnaleźć akt ślubu danej pary i w indeksie to nazwisko wpisać. Ale jednak tak się nie robi, z prostej przyczyny: to jest indeks tego konkretnego aktu, tylko i wyłącznie.
Paweł.
rafal_rr

Sympatyk
Nowicjusz
Posty: 112
Rejestracja: pt 06 sty 2023, 22:44

Post autor: rafal_rr »

Jako autor wpisu, pozostawionego bez odpowiedzi i odkopanego po dłuższym czasie, czuję się zobowiązany rozwinąć moją myśl. Zakładając wątek chciałem poznać JAKI JEST MECHANIZM stojący za tym, że wpisując w genetece nazwisko, wyświetlają się inne nazwiska, będące (teoretycznie) obocznościami tego nazwiska.

Przykłady: wpisując nazwisko moich przodków "Wieteska", nie wyświetlają się indeksy z nazwiskiem "Wieteszka", będące zapisem tego nazwiska w XIX wieku (par. Krzemienica, Łódzkie). Wyświetlają się natomiast z nazwiskami "Witek", "Witczak", "Witkowski", które w mojej rodzinie nie były nigdy innymi formami nazwiska Wieteska.
Tak samo z innym nazwiskiem moich przodków, które tu już zostało wspomniane: Zaręba/Zaremba.

I tak miałem zamiar odkopać ten wątek, skrupulatnie sobie notuję listę takich nazwisk z mojego drzewa, mam już ponad 50 linijek. Jeśli to tylko kwestia wprowadzenia do bazy, to wyślę


Pozdrawiam,
Rafał
Kamil0123

Nieaktywny
Posty: 248
Rejestracja: pt 30 sie 2024, 20:01

Post autor: Kamil0123 »

Panie Rafale

Mówiąc szczerze mam za niską inteligencję ale za Chiny nie wiem o co chodzi w tym poście .
Co Pan chce wysyłać do bazy ? To baza indeksacji , czyli wpisów brzmienia metryk .
Tak indeksujący widział tekst i tak wiernie wpisał .
Nie interpretuje się nazwisk ale wpisuje się tak jak indeksujący je widzi .
Pozdrawiam

Kamil
rafal_rr

Sympatyk
Nowicjusz
Posty: 112
Rejestracja: pt 06 sty 2023, 22:44

Post autor: rafal_rr »

Kamil0123 pisze:Panie Rafale

Mówiąc szczerze mam za niską inteligencję ale za Chiny nie wiem o co chodzi w tym poście .
Co Pan chce wysyłać do bazy ? To baza indeksacji , czyli wpisów brzmienia metryk .
Tak indeksujący widział tekst i tak wiernie wpisał .
Nie interpretuje się nazwisk ale wpisuje się tak jak indeksujący je widzi .
Pozdrawiam

Kamil
Panie Kamilu.

To może krok po kroku, najpierw chciałbym dowiedzieć się jak działa wyszukiwanie w genetece. Pokażę na przykładzie:
- wybieramy łódzkie
- wybieramy parafię Lubochnia
- wpisujemy nazwisko "Wieteska"
- pierwszych kilkadziesiąt indeksów to indeksy aktów z nazwiskiem "Witek" - nie ma ani w akcie, ani w żadnej komórce indeksu nazwiska "Wieteska".

Dlaczego geneteka zwraca te indeksy?

Pozdrawiam,
Rafał
Adamus_P

Zarząd PTG
Mistrz
Posty: 126
Rejestracja: pt 03 sty 2020, 13:52
Otrzymał podziękowania: 4 times

Post autor: Adamus_P »

Wygląda na to, że ż wyszukiwanie imion i wyszukiwanie nazwisk to są zupełnie dwa różne mechanizmy.

Prawdopodobnie w dużym uproszczeniu:
Po podaniu w wyszukiwarce imienia X, do bazy wysyłany jest komunikat:
"Znajdź osoby, które mają IMIĘ = X lub IMIĘ = (imię równoważne imienia X)".

Te imiona równoważne prawdopodobnie są przechowywane w dodatkowej tabeli bazy danych.

Natomiast podczas podania w wyszukiwarce nazwiska Y, do bazy danych wysyłany jest komunikat:
"Znajdź osoby, dla których PRZETWORZONY(Y) mieści się w PRZETWORZONY(NAZWISKO) lub w PRZETWORZONY(NAZWISKO_VEL)".

Przykładowo dla Y= KOWALSKI, PRZETWORZONY(Y) może się równać KOWAL.
I wtedy w wynikach dostajemy osoby, które mają na nazwisko z kawałkiem tekstu "KOWAL", typu Kowalski, Kowal. Przy czym nie znam szczegółów tego, jak dokładnie działa algorytm "PRZETWORZONY" i jakie końcówki odcina, a jakie nie. Może nie ogranicza się tylko do odcinania końcówek, ale również do zamiany pojedynczych znaków i dzięki temu wpisując "Wójcik", otrzymamy też "Wujcik".

Niezależnie od tego co ten algorytm ma dokładnie w bebechach, to wniosek jest przede wszystkim taki, że w przeciwieństwie do imion, przy nazwiskach nie ma czegoś takiego jak lista nazwisk równoważnych, a podczas zwracania wyników wykorzystuje się stopień podobieństwa porównywanych fragmentów tekstu.

Jak szukać by znaleźć? Być kreatywnym podczas korzystania z Geneteki i wprowadzać do wyszukiwarki różne kombinacje brzmienia badanego nazwiska.
Pozdrawiam,
Patrycja
Kamil0123

Nieaktywny
Posty: 248
Rejestracja: pt 30 sie 2024, 20:01

Post autor: Kamil0123 »

Pani Patrycjo

To jest banalne w każdym Excelu gdzie możemy filtrować do woli w poprzek i jak się chce i wymarzy .
Nie mówiąc o dziesiątkach specjalnych programów do wyszukiwania przodków amatorskich i komercyjnych .
Przepraszam nigdy nie wyszukiwałem bezpośrednio w bazie , więc nie znam się .
Pozdrawiam

Kamil
rafal_rr

Sympatyk
Nowicjusz
Posty: 112
Rejestracja: pt 06 sty 2023, 22:44

Post autor: rafal_rr »

Adamus_P pisze:Wygląda na to, że ż wyszukiwanie imion i wyszukiwanie nazwisk to są zupełnie dwa różne mechanizmy.

Prawdopodobnie w dużym uproszczeniu:
Po podaniu w wyszukiwarce imienia X, do bazy wysyłany jest komunikat:
"Znajdź osoby, które mają IMIĘ = X lub IMIĘ = (imię równoważne imienia X)".

Te imiona równoważne prawdopodobnie są przechowywane w dodatkowej tabeli bazy danych.

Natomiast podczas podania w wyszukiwarce nazwiska Y, do bazy danych wysyłany jest komunikat:
"Znajdź osoby, dla których PRZETWORZONY(Y) mieści się w PRZETWORZONY(NAZWISKO) lub w PRZETWORZONY(NAZWISKO_VEL)".

Przykładowo dla Y= KOWALSKI, PRZETWORZONY(Y) może się równać KOWAL.
I wtedy w wynikach dostajemy osoby, które mają na nazwisko z kawałkiem tekstu "KOWAL", typu Kowalski, Kowal. Przy czym nie znam szczegółów tego, jak dokładnie działa algorytm "PRZETWORZONY" i jakie końcówki odcina, a jakie nie. Może nie ogranicza się tylko do odcinania końcówek, ale również do zamiany pojedynczych znaków i dzięki temu wpisując "Wójcik", otrzymamy też "Wujcik".

Niezależnie od tego co ten algorytm ma dokładnie w bebechach, to wniosek jest przede wszystkim taki, że w przeciwieństwie do imion, przy nazwiskach nie ma czegoś takiego jak lista nazwisk równoważnych, a podczas zwracania wyników wykorzystuje się stopień podobieństwa porównywanych fragmentów tekstu.

Jak szukać by znaleźć? Być kreatywnym podczas korzystania z Geneteki i wprowadzać do wyszukiwarki różne kombinacje brzmienia badanego nazwiska.
Myślę, że wątpliwości rozwiałaby osoba zajmująca się kodem geneteki. Mogłaby po prostu spojrzeć w implementację i wytłumaczyć na forum jak to w końcu działa. Czy ktoś ma kontakt?
ODPOWIEDZ

Wróć do „Indeksacja metryk - projekty PTG”