Geneteka - Genealogiczna Kartoteka (wyszukiwanie)
Moderatorzy: elgra, Galinski_Wojciech, maria.j.nie
-
sebastian_gasiorek

- Posty: 548
- Rejestracja: ndz 18 lis 2007, 14:32
- Kontakt:
Usprawnienie geneteki
Potwierdzam, że na obecną chwilę nadal nie jest to możliwe.
Najpierw musimy przenieść forum i portal na nowy silnik, następnie zaktualizować oprogramowanie serwerów i wtedy zacznę myśleć o możliwości wprowadzenia wyszukiwania po imionach.
Nie jestem tutaj w stanie podać daty wprowadzenia takiego rozszerzenia. Jeśli wydajność po wykonaniu aktualizacji na to pozwoli to będzie to zapewne najprędzej w przyszłym roku.
Najpierw musimy przenieść forum i portal na nowy silnik, następnie zaktualizować oprogramowanie serwerów i wtedy zacznę myśleć o możliwości wprowadzenia wyszukiwania po imionach.
Nie jestem tutaj w stanie podać daty wprowadzenia takiego rozszerzenia. Jeśli wydajność po wykonaniu aktualizacji na to pozwoli to będzie to zapewne najprędzej w przyszłym roku.
Pozdrawiam,
Sebastian Gąsiorek
http://genrod.eu - największe opracowanie Kwiatkowskich (6 tys. osób)
Sebastian Gąsiorek
http://genrod.eu - największe opracowanie Kwiatkowskich (6 tys. osób)
Usprawnienie geneteki
A czy sortowanie po wybranej kolumnie (np. rok, imię parafia itp) też jest w planach?
Pozdrawiam
Jarek
Jarek
-
sebastian_gasiorek

- Posty: 548
- Rejestracja: ndz 18 lis 2007, 14:32
- Kontakt:
Usprawnienie geneteki
Obecnie nie ma w planach funkcji sortowania. Operacja tego typu mocno obciąża zasoby sprzętowe.
Pozdrawiam,
Sebastian Gąsiorek
http://genrod.eu - największe opracowanie Kwiatkowskich (6 tys. osób)
Sebastian Gąsiorek
http://genrod.eu - największe opracowanie Kwiatkowskich (6 tys. osób)
A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
-
Marynicz_Marcin

- Posty: 2313
- Rejestracja: sob 20 cze 2009, 19:06
- Lokalizacja: Międzyrzecz
Jarek,
rekordy z geneteki pojawiają się również w Google, więc możesz próbować w ten sposób. Ja czasem korzystam z tej opcji i dzięki niej miejscami docierałem do metryk, których odnalezienie przez genetekę trwałoby znacznie dłużej.
rekordy z geneteki pojawiają się również w Google, więc możesz próbować w ten sposób. Ja czasem korzystam z tej opcji i dzięki niej miejscami docierałem do metryk, których odnalezienie przez genetekę trwałoby znacznie dłużej.
Pozdrawiam,
Marcin Marynicz
Zapraszam na mojego bloga genealogicznego :
http://przodkowieztamtychlat.blogspot.com/
Marcin Marynicz
Zapraszam na mojego bloga genealogicznego :
http://przodkowieztamtychlat.blogspot.com/
- Mirek.Kozak

- Posty: 632
- Rejestracja: ndz 10 maja 2009, 16:44
- Lokalizacja: Debrecen
Ja bym nie polecal wyszukiwarki MyHeritage nikomu i na zadnym forum.MacRek pisze:A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
MacRek-u wpisz do wyszukiwarki 100 trafien na strone i idz po kolei na 11 strone...
MacRek-u - przy 11 stronie pokaze sie ERROR - tego chcesz na genetece?
Wniosek? - MyHeritage nie jest w stanie obsluzyz ponad 1.000 trafien...
Pozdrawiam: MireQ
Parafie: Chodel, Karczmiska, Końskowola, Kazimierz Dolny, Opole Lubelskie, Wąwolnica, Wilków
Parafie: Chodel, Karczmiska, Końskowola, Kazimierz Dolny, Opole Lubelskie, Wąwolnica, Wilków
-
Wojciechowicz_Krzysztof

- Posty: 399
- Rejestracja: pt 09 kwie 2010, 22:36
To ciekawe zagadnienie, ale chyba zależy od oprogramowania. Wydaje się że wyszukiwarki po prostu przeczesują całą bazę danych na wszystkich polach (fields), podczas gdy bazy SQL mają oddzielne pola (fields) dla poszczególnych elementów (nazwisko, miasto,etc).
Ale bazy SQL są bardzo wrażliwe na indexowanie swoich fields - czasem jeden index może zwiększyć rozmiar bazy danych o 50 %.
Pozdrawiam
Krzysztof
Ale bazy SQL są bardzo wrażliwe na indexowanie swoich fields - czasem jeden index może zwiększyć rozmiar bazy danych o 50 %.
Pozdrawiam
Krzysztof
- Mirek.Kozak

- Posty: 632
- Rejestracja: ndz 10 maja 2009, 16:44
- Lokalizacja: Debrecen
Krzysztofie,Wojciechowicz_Krzysztof pisze:To ciekawe zagadnienie, ale chyba zależy od oprogramowania.
raczej zalezy od kasy...
Geneteka kasy nie ma i ma ograniczenia w systemie wyszukiwania, ale nie narzekajmy, ze nie mozemy szukac wedlug imion...
MyHeritage ma kase - wiec nie rozumiem ograniczenia do 1.000 trafien?
Przy posiadaniu kasy - cena oprogramowania nie ma znaczenia, wiec dlatego mnie dziwi postawa MyHeritage...
Pozdrawiam: MireQ
Parafie: Chodel, Karczmiska, Końskowola, Kazimierz Dolny, Opole Lubelskie, Wąwolnica, Wilków
Parafie: Chodel, Karczmiska, Końskowola, Kazimierz Dolny, Opole Lubelskie, Wąwolnica, Wilków
-
Wojciechowicz_Krzysztof

- Posty: 399
- Rejestracja: pt 09 kwie 2010, 22:36
Mirku,
Szkoda, że w tej materii nie wypowiadają się specjaliści – autorzy oprogramowania Geneteki. Bo, gdy się bliżej przyjrzeć tej sprawie, problem jest bardzo prosty do rozwiązania.
Ja na swojej stronie Internetowej mam prostą Access file, zawierająca 17,000,000 records składających się z 14 fields (nie znam polskiego słownictwa komputerowego, ponieważ z kraju wyjechałem za czasów Gomułki).
Wyszukiwanie rekordów, nawet obejmujących połączenie kilku fields, zajmuje najwyżej kilka sekund. Czyli, w Genetece wyszukiwanie łączne (nazwiska + imienia + miasta), nie powinno przedstawiać trudności. Chyba, że jedno z fields obciążone jest zawartością obrazka (zamiast linkiem do niego), co niezmiernie powiększyłoby objętość danej file. Zamiast kilku GB, taka file musiałaby zawierać ich kilka tysięcy.
A jeżeli chodzi o Myheritage, musi tam być błąd w programie. Wyszukiwarka gromadzi tysiąc rekordów, które zapisuje na dysku w serwerze (i widocznie determinuje ich dimension). Potem cyka po sto rekordów z serwera do użytkownika, a po dojściu do tysiąca, dalsze próby kończą się sygnałem ERROR, bo żądanie przekracza dimensions of the array.
Pozdrawiam,
Krzysztof
Szkoda, że w tej materii nie wypowiadają się specjaliści – autorzy oprogramowania Geneteki. Bo, gdy się bliżej przyjrzeć tej sprawie, problem jest bardzo prosty do rozwiązania.
Ja na swojej stronie Internetowej mam prostą Access file, zawierająca 17,000,000 records składających się z 14 fields (nie znam polskiego słownictwa komputerowego, ponieważ z kraju wyjechałem za czasów Gomułki).
Wyszukiwanie rekordów, nawet obejmujących połączenie kilku fields, zajmuje najwyżej kilka sekund. Czyli, w Genetece wyszukiwanie łączne (nazwiska + imienia + miasta), nie powinno przedstawiać trudności. Chyba, że jedno z fields obciążone jest zawartością obrazka (zamiast linkiem do niego), co niezmiernie powiększyłoby objętość danej file. Zamiast kilku GB, taka file musiałaby zawierać ich kilka tysięcy.
A jeżeli chodzi o Myheritage, musi tam być błąd w programie. Wyszukiwarka gromadzi tysiąc rekordów, które zapisuje na dysku w serwerze (i widocznie determinuje ich dimension). Potem cyka po sto rekordów z serwera do użytkownika, a po dojściu do tysiąca, dalsze próby kończą się sygnałem ERROR, bo żądanie przekracza dimensions of the array.
Pozdrawiam,
Krzysztof
-
Sroczyński_Włodzimierz

- Posty: 35480
- Rejestracja: czw 09 paź 2008, 09:17
- Lokalizacja: Warszawa
Krzysztofie:
ano szkoda:)
posadź przy swoim komputerze (pewnie słabszym, ale niewiele niż serwer) kilka tysięcy użytkowników, którzy będą JEDNOCZEŚNIE wyszukiwać w Twojej bazie, przy okazji postaw kilka innych baz na tym samym sprzęcie i róbmy porównania
Specjaliści się już wypowiedzieli niejednokrotnie (nawet i dziś), ale na ogół wolą milczeć- nic nowego nie wniosą. Konkrety co do ewentualnych zmian (naszkicowany zakres i termin, a przede wszystkim kolejność) także się pojawiły.
W dalszym ciągu jest możliwość zbudowania od podstaw (ale nawiązującej wyglądem interfejsu) nowej bazy dotyczącej innych danych, może być więcej niż jedna testowa implementacja (podjęcie tematu zakończone realizacją). Jednak nie na "żywym organiźmie" wrażliwym na zmiany.
PS jest kilka innych tematów, poza geneteką, które czekają i być może im również warto poświęcić czas nie tylko projektantów ale i czas procesorów;)
ano szkoda:)
posadź przy swoim komputerze (pewnie słabszym, ale niewiele niż serwer) kilka tysięcy użytkowników, którzy będą JEDNOCZEŚNIE wyszukiwać w Twojej bazie, przy okazji postaw kilka innych baz na tym samym sprzęcie i róbmy porównania
Specjaliści się już wypowiedzieli niejednokrotnie (nawet i dziś), ale na ogół wolą milczeć- nic nowego nie wniosą. Konkrety co do ewentualnych zmian (naszkicowany zakres i termin, a przede wszystkim kolejność) także się pojawiły.
W dalszym ciągu jest możliwość zbudowania od podstaw (ale nawiązującej wyglądem interfejsu) nowej bazy dotyczącej innych danych, może być więcej niż jedna testowa implementacja (podjęcie tematu zakończone realizacją). Jednak nie na "żywym organiźmie" wrażliwym na zmiany.
PS jest kilka innych tematów, poza geneteką, które czekają i być może im również warto poświęcić czas nie tylko projektantów ale i czas procesorów;)
Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
https://genealodzy.pl/index.php?module= ... 3odzimierz
-
Wojciechowicz_Krzysztof

- Posty: 399
- Rejestracja: pt 09 kwie 2010, 22:36
Włodku,
Ależ ja wcale nie krytykuję programistów Geneteki, tylko ogólnie mówię o problemie dodania jednego indeksu, który (być może) posiada swój odrębny field. Jeżeli taka file (teoretycznie) ma jedynie kilka fields (nazwisko, region, miejscowość, urodzenia, małżeństwa, zgony – według wyszukiwarki Geneteki), to dodanie imienia nie powinno dramatycznie zwiększać czasu wyszukiwania.
Inna sprawa, że taki dodatek sprawiłby wielką trudność programistom, zmuszonym do przeprogramownia całej bazy danych. Nie wiem, na jakiej platformie oparta jest Geneteka, więc trudno mi zabierać głos w tej sprawie. Rozumiem jednak, że w wypadku dodania imienia, owa index file musiała by się równać ilościowo z ilością skanów. Przy dodaniu ineksu współmałżonka, sam index małżeństw wzrósłby czterokrotnie.
Tak więc, cieszmy się tym, co mamy. Praca ludzi zaangażowanych w tym projekcie, napewno warta jest miliardy złotych - według oficjalnych stawek wynagrodzenia. Gdyby uczciwość, bezinteresowność i zapał do pracy byłyby miernikiem wartości ludzkich, właśnie ci anonimowi współpracownicy Geneteki powinni zajmować najwyższe stanowiska w administracji państwowej i w polityce. Inaczej Polska by wyglądała!
Krzysztof
Ależ ja wcale nie krytykuję programistów Geneteki, tylko ogólnie mówię o problemie dodania jednego indeksu, który (być może) posiada swój odrębny field. Jeżeli taka file (teoretycznie) ma jedynie kilka fields (nazwisko, region, miejscowość, urodzenia, małżeństwa, zgony – według wyszukiwarki Geneteki), to dodanie imienia nie powinno dramatycznie zwiększać czasu wyszukiwania.
Inna sprawa, że taki dodatek sprawiłby wielką trudność programistom, zmuszonym do przeprogramownia całej bazy danych. Nie wiem, na jakiej platformie oparta jest Geneteka, więc trudno mi zabierać głos w tej sprawie. Rozumiem jednak, że w wypadku dodania imienia, owa index file musiała by się równać ilościowo z ilością skanów. Przy dodaniu ineksu współmałżonka, sam index małżeństw wzrósłby czterokrotnie.
Tak więc, cieszmy się tym, co mamy. Praca ludzi zaangażowanych w tym projekcie, napewno warta jest miliardy złotych - według oficjalnych stawek wynagrodzenia. Gdyby uczciwość, bezinteresowność i zapał do pracy byłyby miernikiem wartości ludzkich, właśnie ci anonimowi współpracownicy Geneteki powinni zajmować najwyższe stanowiska w administracji państwowej i w polityce. Inaczej Polska by wyglądała!
Krzysztof
-
Sroczyński_Włodzimierz

- Posty: 35480
- Rejestracja: czw 09 paź 2008, 09:17
- Lokalizacja: Warszawa
no miliardy to nie..ale owszem wartość "odtworzeniowa" (gdyby coś i trzeba było od początku..to pomimo spadku cen) - grube grube miliony
mi chodziło o argument "u mnie chodzi baza na kilkanaście milionów rekordów"
oprócz objętości jest kilak innych parametrów - w tym jako istotny - ilość zapytań mocna zależny od liczby użytkowników
wiec nie jest tak, ze to co chodzi przy wprowadzaniu z konsoli przez jednego usera oznacza, że będzie chodziło "w sieci" przy kilkuset (najmarniej) użytkownikach działających razem
są oczywiście patenty mniej lub bardziej wyszukane. Można nie wiem..np zdecydować się na wstępną indeksację (jeśli użytkownicy byliby skłonni używać baz z głową: tj nie szukać Kowalskiego UMZ 200 lat w całej bazie) ale wprowadzać to czego naprawdę poszukują typu B1850-1870 etc) minus - to co wchodzi na bieżąco byłoby dostępne następnego dnia, po wstępnej indeksacji w okresie mniejszego obciążenia
wyodrębnić (licząc na to, że jednak zdarzają się ..lub wymusić takie zachowania:) zakresy do przeszukiwań
to nie jest bardzo prosty temat, tym bardziej nie jest nieczasochłonny
pomysłów to na pęczki:) ale przeprojektować, przeorganizować, skodować, przetestować etc..to już inna zabawa
jest teraz taki wyjątkowy czas budowania nowych źródeł (opartych na kls-ach, może takze notariatach), który umożliwi realizację osób. Podobnie bywało zresztą z geneteką - wpierw mechanizmy w metryki (mniejsze baz pod względem ilości rekordów), obserwacja (m.in obciążeń) i po wniosku, że działa w sposób przyzwoity zaimplementowanie wzorców sprawdzonych. To naprawdę najlepsza i najprostsza droga. Test działającego rozwiązania w realnej pracy z użytkownikami. Ale nie na sztandarowej części serwisu:)
Stąd sie pojawia w moich postach pisanych w watkach nt "usprawnień" właśnie taka sugestia -spróbuj, zrób, testy później i wtedy jest nie projektowy hipotetyczny argument, a realny z obserwacji.
pozdrawiam
mi chodziło o argument "u mnie chodzi baza na kilkanaście milionów rekordów"
oprócz objętości jest kilak innych parametrów - w tym jako istotny - ilość zapytań mocna zależny od liczby użytkowników
wiec nie jest tak, ze to co chodzi przy wprowadzaniu z konsoli przez jednego usera oznacza, że będzie chodziło "w sieci" przy kilkuset (najmarniej) użytkownikach działających razem
są oczywiście patenty mniej lub bardziej wyszukane. Można nie wiem..np zdecydować się na wstępną indeksację (jeśli użytkownicy byliby skłonni używać baz z głową: tj nie szukać Kowalskiego UMZ 200 lat w całej bazie) ale wprowadzać to czego naprawdę poszukują typu B1850-1870 etc) minus - to co wchodzi na bieżąco byłoby dostępne następnego dnia, po wstępnej indeksacji w okresie mniejszego obciążenia
wyodrębnić (licząc na to, że jednak zdarzają się ..lub wymusić takie zachowania:) zakresy do przeszukiwań
to nie jest bardzo prosty temat, tym bardziej nie jest nieczasochłonny
pomysłów to na pęczki:) ale przeprojektować, przeorganizować, skodować, przetestować etc..to już inna zabawa
jest teraz taki wyjątkowy czas budowania nowych źródeł (opartych na kls-ach, może takze notariatach), który umożliwi realizację osób. Podobnie bywało zresztą z geneteką - wpierw mechanizmy w metryki (mniejsze baz pod względem ilości rekordów), obserwacja (m.in obciążeń) i po wniosku, że działa w sposób przyzwoity zaimplementowanie wzorców sprawdzonych. To naprawdę najlepsza i najprostsza droga. Test działającego rozwiązania w realnej pracy z użytkownikami. Ale nie na sztandarowej części serwisu:)
Stąd sie pojawia w moich postach pisanych w watkach nt "usprawnień" właśnie taka sugestia -spróbuj, zrób, testy później i wtedy jest nie projektowy hipotetyczny argument, a realny z obserwacji.
pozdrawiam
Bez PW. Korespondencja poprzez maila:
https://genealodzy.pl/index.php?module= ... 3odzimierz
https://genealodzy.pl/index.php?module= ... 3odzimierz
Geneteka jest zbiorem indeksów osobowych ksiąg metrykalnych, a nie zbiorem informacji o osobach. Ta sama osoba w każdym kolejnym akcie może mieć nieco inaczej zapisane nazwisko. Celem tego wątku jest eliminowanie rozbieżności między tym, co jest zapisane w akcie, a tym co znajduje się w indeksie. Różne księgi się trafiają, ale akurat w tej nazwiska są pięknie wykaligrafowane, w tym konkretnym przypadku Żelazko:sloniatko60 pisze:pisali się zawsze "Żelasko"
http://www.szukajwarchiwach.pl/59/1542/ ... Whm9a41CEA
pozdrawiam
Tomek Turniak
Tomek Turniak
PODOBNĄ bym chciał.Mirek.Kozak pisze:Ja bym nie polecal wyszukiwarki MyHeritage nikomu i na zadnym forum.MacRek pisze:A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
MacRek-u wpisz do wyszukiwarki 100 trafien na strone i idz po kolei na 11 strone...
MacRek-u - przy 11 stronie pokaze sie ERROR - tego chcesz na genetece?
Wniosek? - MyHeritage nie jest w stanie obsluzyz ponad 1.000 trafien...
Czyli taką, która zrealizuje poszukiwanie tego typu jak podane w przykładzie.
Pozdrawiam
Maciej
- jarymi

- Posty: 663
- Rejestracja: ndz 11 kwie 2010, 23:10
- Lokalizacja: z Łodzi w Ostrowie Wielkopolskim
Re: Usprawnienie geneteki
Śledziłem dyskusję na temat trudności z dodaniem dodatkowego indeksu i w zasadzie argumenty za kłopotami z wprowadzeniem mnie przekonały.huberp pisze:Witam,
W związku z poszukiwaniami osoby o bardzo rzadkim imieniu, tj. Pudencjanna, chciałbym skierować pytanie do administracji geneteki, czy w ogóle możliwe jest dodanie wyszukiwarki wg imion? Również pomogłoby to w przypadkach zgonów kobiet, których nazwisk panieńskich w akcie nie podano.
Miałem taki problem przy szukaniu w popularnych nazwiskach takich jak Kaczmarek. Oj wtedy indeks imienia bardzo by się przydał.
Ale ponieważ takie konieczności są raczej incydentalne - poradziłem sobie w trochę inny sposób.
Wybieram np. urodzenia Kaczmarek - nawet nie zawężam lat wyszukiwania wtedy dostaję np. w woj. Łodzkim przeszło 7000 trafień.
Wtedy robię tak:
z poziomu u mnie FireFox'a - z zakładki edycja wybieram znajdź - i wpisuję Pudencjanna, jeśli jest w Genetece to po kilku kliknięciach myszą na pewno ją znajde. Gorzej to działa jeśli i nazwisko i imię należą do popularnych np. Kowalska Anna ale i wtedy ten system edycja/znajdź także dużo pomaga.
Jak dla mnie bardziej byłby przydatny system wyszukiwania obu nazwisk małżonków nie tylko z poziomu województwa ale z poziomu całej Geneteki - ale prawdopodobnie argumenty przeciw są podobne. Tak, że możliwość takiego wyszukiwania już z poziomu województw jest dużym ułatwieniem
Pozdrawiam Ryszard Jankielewicz
W kręgu moich zainteresowań nazwiska: Biedrzycki , Sobolewski, (okolice Brzezin, Piotrkowa, Częstochowy) Mirosław (Lubelskie) , Stożek (Myślenice, Kraków), Jankielewicz, Stabeusz, Garbacz (Warszawa, Wilno, Kowno)
W kręgu moich zainteresowań nazwiska: Biedrzycki , Sobolewski, (okolice Brzezin, Piotrkowa, Częstochowy) Mirosław (Lubelskie) , Stożek (Myślenice, Kraków), Jankielewicz, Stabeusz, Garbacz (Warszawa, Wilno, Kowno)
