Geneteka - Genealogiczna Kartoteka (wyszukiwanie)

Tematy - indeksacja i digitalizacja metryk, projekty PTG

Moderatorzy: elgra, Galinski_Wojciech, maria.j.nie

Sroczyński_Włodzimierz

Członek PTG
Nowicjusz
Posty: 35480
Rejestracja: czw 09 paź 2008, 09:17
Lokalizacja: Warszawa

Post autor: Sroczyński_Włodzimierz »

wpisując nazwisko wyszukuje także panieńskie, jeśli wprowadzone to jest w wynikach
Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
zetka

Sympatyk
Adept
Posty: 459
Rejestracja: wt 08 sty 2008, 11:27

Post autor: zetka »

Rozumiem - pewnie trafilam na wpisy bez takowych. Dziekuje :)
Pozdrawiam
Żaneta
Sroczyński_Włodzimierz

Członek PTG
Nowicjusz
Posty: 35480
Rejestracja: czw 09 paź 2008, 09:17
Lokalizacja: Warszawa

Post autor: Sroczyński_Włodzimierz »

to byłoby niepokojące
ale chyba wyszukuje jednak;)
np
http://geneteka.genealodzy.pl/index.php ... 07mz&op=gt
to że jest w wyszukiwaniu pokazany rekord
1 1900 80 Wanda Maria Baciarelli Alfons Ludwika Sarnecka Żyrardów
przy wprowadzeniu jako kryterium "Kowalewska"
oznacza, że w tym przypadku działa
jeśli wiesz o tym, że powinno (dane zostały wprowadzone), a nie działa w jakimś konkretnym przypadku - daj znać w wątku "błędy"

pozdrawiam
Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
Kolank0

Sympatyk
Adept
Posty: 367
Rejestracja: wt 03 sty 2012, 15:07

Post autor: Kolank0 »

Pomyślałem sobie, że w przypadku geneteki przy rekordach powinna się znajdować informacja o źródle. np AP Pułtusk, AD Siedlce ;))) lub np Parafia. W przypadku "metryk" gdzie udostępnione są skany aktów nie ma to takiego znaczenia, ale ktoś kto w genetece znalazłby interesujący go rekord wiedziałby gdzie dalej kierować swoje kroki by pozyskać odpis/kopię aktu.
Pozdrawiam
Wojciech P.
Awatar użytkownika
Michał_Zieliński

Zarząd PTG
Legenda
Posty: 1125
Rejestracja: wt 22 lut 2011, 13:00
Lokalizacja: Warszawa

Post autor: Michał_Zieliński »

W zdecydowanej większości przypadków odpowiedź znajdziesz w bazie Pradziad - jeśli nie ma w AP to pewnie jest w AA (stosunkowo najrzadziej indeksowane są metryki przechowywane w parafiach). Jeśli to nie pomoże to zawsze pozostaje mail na forum;) A geneteka ma taki przyjazny wygląd m.in. dlatego, że przekazuje możliwie najwięcej informacji bez natłoku zbędnych informacji.

Pozdrawiam,
Michał
Pozdrawiam,
Michał
Marynicz_Marcin

Sympatyk
Mistrz
Posty: 2313
Rejestracja: sob 20 cze 2009, 19:06
Lokalizacja: Międzyrzecz

Post autor: Marynicz_Marcin »

Nie lubię się powtarzać, ale niestety w tym przypadku muszę.
Nie chodzi mi o same statystki jako liczby, a o ich wartość!

Nie każdy ma możliwości jeździć po całej Polsce i poza nią, więc
w takich przypadkach prosi się o pomoc w danym Archiwum osobę, która często tam bywa lub mieszka w pobliżu.

Minimum trzy razy dzięki indeksacji otrzymałem pomoc w Archiwum (na zasadzie: pomagasz całej rzeszy genealogów, to ja także pomogę Tobie).

Więc jaki jest sens indeksowania czegokolwiek, skoro jest strach przed tym, że ktoś może mieć lepsze źródła (bogatsze w dane) i nasza praca zostanie wręcz wyzerowana. Chyba nie o to tu chodzi.


Za jakiś czas format geneteki zostanie rozszerzony o świadków/stawiających się i co? Kolejna fala zmian?
Coś tu chyba nie tak, bo skoro na tym ma to polegać, to chyba zrezygnuję z tego całego "wolontariatu" .
dpawlak pisze: Marcin zresztą pisze że zindeksował parafie, nie Marcinie zindeksowałeś jakieś pojedyncze roczniki jednego zdarzenia np. urodzeń z danej parafii, w zestawieniu z licznikiem (zaledwie 10tys) zabrzmiało pretensjonalnie i żałośnie.
Gdyby każdy zindeksował te zaledwie 10 tys. to dzisiaj nie mielibyśmy co robić ;)
dpawlak pisze: Ja tego zjawiska w ogóle nie rozumiem, nigdy nie liczyłem tego co zindeksowałem i portal gdzie jest to publikowane też tego nie robi podając tylko ogólny licznik dla całe bazy i wszyscy szczęśliwi.
Może to jest ta myśl, którą powinni zastosować do geneteki ?!
Na dobrą sprawę, byłoby to korzystniejsze, bo bez zakłamań...
Pozdrawiam,
Marcin Marynicz

Zapraszam na mojego bloga genealogicznego :
http://przodkowieztamtychlat.blogspot.com/
Awatar użytkownika
Michał_Zieliński

Zarząd PTG
Legenda
Posty: 1125
Rejestracja: wt 22 lut 2011, 13:00
Lokalizacja: Warszawa

Post autor: Michał_Zieliński »

Podzielam zdanie Marcina i nie rozumiem pojawiającego się tu czasami piętnowania osób, które wprost mówią, że statystyki autorów indeksów w genetece mają dla nich znaczenie. Co w tym jest złego? Skoro taka statystyka już powstała, jest prowadzona na bieżąco, a jej istotą jest dokładność co do jednego i obrazowanie wkładu każdego indeksującego we wspaniałe, wspólne dzieło indeksacji, to osoby indeksujące mogą chyba oczekiwać, że będzie ona odzwierciedlała stan faktyczny. A jeśli pięcie się w górę w takim zestawieniu dodatkowo mobilizuje indeksujących (a myślę, że osób, na które tak to działa jest dużo więcej niż się przyznaje :wink: ) to czemu im tego bronić?? To w niczym nie jest sprzeczne z ideą wolontariatu!

Natomiast z drugiej strony, myślę Marcinie, ze nie powinienes oczekiwać od administratorów lub od kogokolwiek innego, że zweryfikują Twoje 10k pozycji, żeby wychwycić błąd. Moim zdaniem jeśli statystyka ma dla kogoś znaczenie (z jakiegokolwiek powodu), to sam to powinien weryfikować (najlepiej na bieżąco, w miarę dodawania indeksów).

Moim zdaniem wyjaśnienia tej różnicy są 3:
1. Indeks nie został jeszcze dodany do geneteki, stąd statystyka nie odpowiada liczbie przesłanych indeksów.
2. Indeks został dodany, ale autor został pomyłkowo zmieniony (widziałem już taki przypadek) - stąd nowe dodane indeksy nie zostały zaliczone autorowi, tylko jakiejś innej osobie.
3. Pozycje wpadły w dziurę liczącą prawie 13.000 pozycji, którą nie wiem jak wytłumacyć (zgodnie ze statystyką autorów indeksów jest 8.372.832 a w genetece jest ich 8.385.573)

Nie sądzę, aby wszystkie Twoje brakujące 3.500 indeksów wpadło w dziurę o której mowa w punkcie 3 (musiałbyś mieć dużego pecha :lol: ).
A jeśli ta różnica wynika z przyczyn podanych w punktach 1-2, jesteś w stanie sam to zweryfikować.

Pozdrawiam serdecznie,
Michał
Awatar użytkownika
sponikowski

Sympatyk
Posty: 355
Rejestracja: ndz 13 gru 2009, 02:51

uwagi/info w genetece

Post autor: sponikowski »

Nie wiem, czy to właściwy temat do poruszenia problemu – jeśli nie proszę o przeniesienie. Chciałem poruszyć kwestię dotyczącą algorytmu działania wyszukiwarka Geneteki.
Spory czas już temu z powodzeniem można było wykorzystywać w niej znak „%”, który w moim przekonaniu był lekarstwem na wszelkie możliwe oboczności nazwiska, a także pojawiające się błędy literowe, czy niepełne wpisy poczynione przez indeksujących mających problem z rozczytaniem nazwiska w danej metryce. Dla rozjaśnienia podam przykład: wpisanie znaku i ciągu liter „%niewski” zwracało w odpowiedzi wszystkie nazwiska zawierające w sobie człon „niewski”. Można zatem było otrzymać odpowiedź wskazującą czy w danej parafii występuje dajmy na to nazwisko „Pniewski”, „Kaniewski”, czy „Ćwiertniewski”. Obecnie, wpisując znak „%” otrzymujemy odpowiedź, z której wynika, że nie ma takich nazwisk

http://geneteka.genealodzy.pl/index.php ... 13sk&op=gt

Obecnie, podobną odpowiedź otrzymamy, gdy „niewski” wpiszemy bez znaku „%”.

http://geneteka.genealodzy.pl/index.php ... 13sk&op=gt

Otrzymany wynik sprawdzenia, skłania do stwierdzenia, że obecny algorytm działania wyszukiwarki odsyła niejako w niebyt wszystkie rekordy zawierające niepełny lub błędny (tzw. literowy błąd) zapis nazwiska. Te bowiem wyszukiwarka traktuje jako pełne nazwiska choć takimi nie są. Dla przykładu podam próbę wyszukania sformułowania „wiertniewski”, które traktowane jest właśnie jako pełne nazwisko choć takim nie jest.

http://geneteka.genealodzy.pl/index.php ... p=gt&exac=

W odniesieniu do powyższego, stwierdzam, że to wyszukujący ma się domyśleć w jakiej formie nazwisko widnieje w bazie. Wyszukiwarka w żaden sposób mu tego niestety nie ułatwia. O ile z wpisem „wiertniewski” jest jeszcze mały problem, to schody zaczynają się przy indeksach zawierających takie wpisy jak z poniższego linku w pozycjach 5,6,7,9,11. Takie wpisy mogą zostać odszukane jedynie pod dwoma warunkami. Pod pierwszym, że wyszukujący sam będzie „okrajał” dane nazwisko z liter, pod drugim natomiast, że daną parafię będzie przeszukiwał rocznikami bez wpisywania jakiegokolwiek nazwiska, a więc de facto tak jakby daną parafię miał przeglądać niczym indeksujący, na piechotę.

http://geneteka.genealodzy.pl/index.php ... 13sk&op=gt

Powodzenia zatem, życzyć "NowAKom", "PolAKowskim", "SkrzypczAKom" i innym, których nazwisko zawiera te dwie litery; których przodek być może znajduje się pod pozycją 5,6,7 a którego wyszuiwarka nie pomoże im znaleźć. No chyba, że domyślą się, że akurat z ich nazwiska te dwie litery ktoś rozczytał i wpisał, a nie np: "ko"

W miejscu tym zapytam więc, czy obecna zasada działania wyszukiwarki to skutek jej awarii, czy też nowość, która zamiast ułatwić utrudnia życie genealoga-amatora. W moim odczuciu, algorytm wykorzystujący znak "%" dawał wiele możliwości, a przede wszystkim zaoszczędzał czas. Czy ktoś może wytłumaczyć ten stan rzeczy?

Pozdrawiam – Sławek
Słomińska_Dominika

Sympatyk
Ekspert
Posty: 701
Rejestracja: sob 27 cze 2009, 21:43
Lokalizacja: Pow. Grójecki

uwagi/info w genetece

Post autor: Słomińska_Dominika »

To ciekawe jak działa przeglądarka. Wpisując Słomiński pojawiają się Słoma, Słomski. Słomka Słomianska, Słomecki, Słomicki, Słomieński. Ktoś moze przyblizyć TĄ zasadzę działania bo nijak nie mogę ogarnąć. Normalne szukarki wyszukują takie przekręcenia gdy się poda skrót typu "Słom" a nie gdy poda się pełne i konkretne nazwisko. Patrząc w ten sposób To wpisując dajmy na to Wawrzyszewski dostaniemy tych podobnych wg szukarki nazwisk jeszcze więcej... Tylko w imię czego? ;)
Pozdrawiam
Dominika

Interesuja mnie nazwiska Słomiński, Szelągowski, Maroszek, Chłopecki
Awatar użytkownika
sponikowski

Sympatyk
Posty: 355
Rejestracja: ndz 13 gru 2009, 02:51

uwagi/info w genetece

Post autor: sponikowski »

Po prostu wygląda to tak jakby wyszukiwarka żyła własnym życiem; wiedziała lepiej co szukający chce znaleźć.
Sroczyński_Włodzimierz

Członek PTG
Nowicjusz
Posty: 35480
Rejestracja: czw 09 paź 2008, 09:17
Lokalizacja: Warszawa

Post autor: Sroczyński_Włodzimierz »

http://geneteka.genealodzy.pl/index.php ... 71wa&op=gt
"wyszukiwanie dokładne" - dla tych, którym przeszkadza pokazywanie wyników zbliżonych
a post w imię ..."popatrz zamiast mieć pretensję":)
Awatar użytkownika
sponikowski

Sympatyk
Posty: 355
Rejestracja: ndz 13 gru 2009, 02:51

Post autor: sponikowski »

Wyszukiwania dokładne wyszukiwaniem dokładnym... A co z obocznościami? Wyszukiwarka wrzuca własne, a nie takie jakie interesują wyszukującego. :(
Z "%" było to możliwe...
Sroczyński_Włodzimierz

Członek PTG
Nowicjusz
Posty: 35480
Rejestracja: czw 09 paź 2008, 09:17
Lokalizacja: Warszawa

Post autor: Sroczyński_Włodzimierz »

odnosiłem się tylko wpewnym stopniu do Twojego życia własnym życiem, w większości jednak do zdania Dominiki dot. sugerowanego braku możliwości wyszukania tylko i wyłącznie danych nazwisk
zresztą nie mógłbym do Waszych obydwu - są w zasadzie sprzeczne -Dominice przeszkadzają większe możliwości, Ty postulujesz (z czym się zresztą zgadzam;) powiększenie istniejących
nie sposób byłoby jednym postem (chyba że w stylu "jeszcze taki sie nie narodził...:) wyjaśnić/odnieść się do obu w całości

przy okazji bo zdaje się, że brak tej praktyki leży u podstaw narzekania na zbyt wiele wyników (!!!): w większości zasobu ograniczenie poprzez założenie filtra na okres przeszukiwany i pozostawienie wyszukiwania "zbliżone" tj nie zaznaczanie, że chcę dokładnie - jest znacznie korzystniejsze
niż szukać Kowalskich (jakichkolwiek) na przestrzeni dziejów
czyli
szukając Kowalskiego ur. ca 1880 lepiej mieć i Kowalów z 1875 niż Kowalskiego z 1912
banał, ale...
Awatar użytkownika
sponikowski

Sympatyk
Posty: 355
Rejestracja: ndz 13 gru 2009, 02:51

Post autor: sponikowski »

Włodku, może nie tyle postuluję za powiększeniem istniejących możliwości, co za przywróceniem tego co było. Przeszukuąc daną parafię pod kątem figurowania w niej metryk z moim nazwiskiem, za pomocą znaku "%" załatwiałem większość problemów. Jeszcze jakiś czas temu było to możliwe. Znak "%" bowiem, za którym wstawiałem "owski" zwracał mi wyniki, co do których mogłem być pewien, że wśród nich znaleźć mogę wpisy potencjalnie dotyczące moich przodków. Otrzymywałem "Szczepkowskich", "Polkowskich", "nikowskich", czy "wskich" i z tego wybierałem co mnie interesuje.
Obecnie takiej alternatywy niestety już nie mam. Przekręcone przez księdza nazwisko w stopniu, w którym nie jestem w stanie sobie nawet go wyobrazić, ale zawierające prawidłową końcówkę "owski" czy niepełny wpis indeksującego, który nie mógł rozczytać pierwszych liter nazwiska i wpisał "wski" nie pozwala mi nawet na odnalezienie takich przekręconych lub niepełnych rekordów. Filtr wyszukiwarki podaje mi swoje "widzimi się"; swoją oboczność. Dla przykładu, oboczność mojego nazwiska upraszcza do "Punikowski". Oboczność "Panikowski", "Płonikowski", "Monikowski", "Konikowski", czy inna możliwa już niestety nie jest zwracana. Tym bardziej wyszukiwarka nie poda mi rekordów w przeszukiwanej przeze mnie parafii, gdzie indeksujący z mojego - nawet poprawnie wpisanego nazwiska - mógł rozczytać i wpisał jedynie "owski". Dla obecnego algorytmu działania wyszukiwarki "owski", "wski", "ski" czy "ki" to oddzielne nazwiska a nie jego człony... W ten sposób w genetece "giną" te indeksy, które zawierają niepełne wpisy, choćby składające się z dwóch rozczytanych w nazwisku liter.

pozdrawiam - Sławek
Ostatnio zmieniony ndz 16 cze 2013, 20:43 przez sponikowski, łącznie zmieniany 1 raz.
Słomińska_Dominika

Sympatyk
Ekspert
Posty: 701
Rejestracja: sob 27 cze 2009, 21:43
Lokalizacja: Pow. Grójecki

Post autor: Słomińska_Dominika »

Włodku, mnie nie chodzi o wielość rozwiązań ale o sorry za słowo ich głupotę. Słomiński to nie Słomczyński tak jak Słomeński. Słomka i inne różne. Wpisuję całe nazwisko to niech szuka całego nazwiska. Wpisuję cześć nazwiska to wtedy niech mi szuka róznych opcji. Tak własnie działają wszystkie znane mi szukarki z wyjątkiem tej tutaj. Mało tego. Wiem, że w takim Worowie mam krewnych widziałam ich akty itd. Spisałam nazwiska, lecz szukarka nie szuka mi nic nawet oboczności różniących się jednym czy dwoma znakami. Więc co jest grane, że tak zapytam? Słomiński ma miliard opcji a Zagański, Zygański, Zygańczyk i temu podobne nie istnieją mimo, że są w aktach i bodaj te indeksy w bazie są.

edit. Czy działają "*" i "?" ?
Pozdrawiam
Dominika

Interesuja mnie nazwiska Słomiński, Szelągowski, Maroszek, Chłopecki
ODPOWIEDZ

Wróć do „Indeksacja metryk - projekty PTG”