Strona 10 z 26
Usprawnienie geneteki
: pn 09 mar 2015, 09:00
autor: sebastian_gasiorek
Potwierdzam, że na obecną chwilę nadal nie jest to możliwe.
Najpierw musimy przenieść forum i portal na nowy silnik, następnie zaktualizować oprogramowanie serwerów i wtedy zacznę myśleć o możliwości wprowadzenia wyszukiwania po imionach.
Nie jestem tutaj w stanie podać daty wprowadzenia takiego rozszerzenia. Jeśli wydajność po wykonaniu aktualizacji na to pozwoli to będzie to zapewne najprędzej w przyszłym roku.
Usprawnienie geneteki
: pn 09 mar 2015, 09:44
autor: JarekK
A czy sortowanie po wybranej kolumnie (np. rok, imię parafia itp) też jest w planach?
Usprawnienie geneteki
: pn 09 mar 2015, 10:33
autor: sebastian_gasiorek
Obecnie nie ma w planach funkcji sortowania. Operacja tego typu mocno obciąża zasoby sprzętowe.
: pn 09 mar 2015, 13:50
autor: MacRek
A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
: pn 09 mar 2015, 14:16
autor: Marynicz_Marcin
Jarek,
rekordy z geneteki pojawiają się również w Google, więc możesz próbować w ten sposób. Ja czasem korzystam z tej opcji i dzięki niej miejscami docierałem do metryk, których odnalezienie przez genetekę trwałoby znacznie dłużej.
: pn 09 mar 2015, 18:49
autor: Mirek.Kozak
MacRek pisze:A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
Ja bym nie polecal wyszukiwarki MyHeritage nikomu i na zadnym forum.
MacRek-u wpisz do wyszukiwarki 100 trafien na strone i idz po kolei na 11 strone...
MacRek-u - przy 11 stronie pokaze sie ERROR - tego chcesz na genetece?
Wniosek? - MyHeritage nie jest w stanie obsluzyz ponad 1.000 trafien...
: pn 09 mar 2015, 19:10
autor: Wojciechowicz_Krzysztof
To ciekawe zagadnienie, ale chyba zależy od oprogramowania. Wydaje się że wyszukiwarki po prostu przeczesują całą bazę danych na wszystkich polach (fields), podczas gdy bazy SQL mają oddzielne pola (fields) dla poszczególnych elementów (nazwisko, miasto,etc).
Ale bazy SQL są bardzo wrażliwe na indexowanie swoich fields - czasem jeden index może zwiększyć rozmiar bazy danych o 50 %.
Pozdrawiam
Krzysztof
: pn 09 mar 2015, 19:43
autor: Mirek.Kozak
Wojciechowicz_Krzysztof pisze:To ciekawe zagadnienie, ale chyba zależy od oprogramowania.
Krzysztofie,
raczej zalezy od kasy...
Geneteka kasy nie ma i ma ograniczenia w systemie wyszukiwania, ale nie narzekajmy, ze nie mozemy szukac wedlug imion...
MyHeritage ma kase - wiec nie rozumiem ograniczenia do 1.000 trafien?
Przy posiadaniu kasy - cena oprogramowania nie ma znaczenia, wiec dlatego mnie dziwi postawa MyHeritage...
: pn 09 mar 2015, 20:45
autor: Wojciechowicz_Krzysztof
Mirku,
Szkoda, że w tej materii nie wypowiadają się specjaliści – autorzy oprogramowania Geneteki. Bo, gdy się bliżej przyjrzeć tej sprawie, problem jest bardzo prosty do rozwiązania.
Ja na swojej stronie Internetowej mam prostą Access file, zawierająca 17,000,000 records składających się z 14 fields (nie znam polskiego słownictwa komputerowego, ponieważ z kraju wyjechałem za czasów Gomułki).
Wyszukiwanie rekordów, nawet obejmujących połączenie kilku fields, zajmuje najwyżej kilka sekund. Czyli, w Genetece wyszukiwanie łączne (nazwiska + imienia + miasta), nie powinno przedstawiać trudności. Chyba, że jedno z fields obciążone jest zawartością obrazka (zamiast linkiem do niego), co niezmiernie powiększyłoby objętość danej file. Zamiast kilku GB, taka file musiałaby zawierać ich kilka tysięcy.
A jeżeli chodzi o Myheritage, musi tam być błąd w programie. Wyszukiwarka gromadzi tysiąc rekordów, które zapisuje na dysku w serwerze (i widocznie determinuje ich dimension). Potem cyka po sto rekordów z serwera do użytkownika, a po dojściu do tysiąca, dalsze próby kończą się sygnałem ERROR, bo żądanie przekracza dimensions of the array.
Pozdrawiam,
Krzysztof
: pn 09 mar 2015, 21:04
autor: Sroczyński_Włodzimierz
Krzysztofie:
ano szkoda:)
posadź przy swoim komputerze (pewnie słabszym, ale niewiele niż serwer) kilka tysięcy użytkowników, którzy będą JEDNOCZEŚNIE wyszukiwać w Twojej bazie, przy okazji postaw kilka innych baz na tym samym sprzęcie i róbmy porównania
Specjaliści się już wypowiedzieli niejednokrotnie (nawet i dziś), ale na ogół wolą milczeć- nic nowego nie wniosą. Konkrety co do ewentualnych zmian (naszkicowany zakres i termin, a przede wszystkim kolejność) także się pojawiły.
W dalszym ciągu jest możliwość zbudowania od podstaw (ale nawiązującej wyglądem interfejsu) nowej bazy dotyczącej innych danych, może być więcej niż jedna testowa implementacja (podjęcie tematu zakończone realizacją). Jednak nie na "żywym organiźmie" wrażliwym na zmiany.
PS jest kilka innych tematów, poza geneteką, które czekają i być może im również warto poświęcić czas nie tylko projektantów ale i czas procesorów;)
: pn 09 mar 2015, 21:59
autor: Wojciechowicz_Krzysztof
Włodku,
Ależ ja wcale nie krytykuję programistów Geneteki, tylko ogólnie mówię o problemie dodania jednego indeksu, który (być może) posiada swój odrębny field. Jeżeli taka file (teoretycznie) ma jedynie kilka fields (nazwisko, region, miejscowość, urodzenia, małżeństwa, zgony – według wyszukiwarki Geneteki), to dodanie imienia nie powinno dramatycznie zwiększać czasu wyszukiwania.
Inna sprawa, że taki dodatek sprawiłby wielką trudność programistom, zmuszonym do przeprogramownia całej bazy danych. Nie wiem, na jakiej platformie oparta jest Geneteka, więc trudno mi zabierać głos w tej sprawie. Rozumiem jednak, że w wypadku dodania imienia, owa index file musiała by się równać ilościowo z ilością skanów. Przy dodaniu ineksu współmałżonka, sam index małżeństw wzrósłby czterokrotnie.
Tak więc, cieszmy się tym, co mamy. Praca ludzi zaangażowanych w tym projekcie, napewno warta jest miliardy złotych - według oficjalnych stawek wynagrodzenia. Gdyby uczciwość, bezinteresowność i zapał do pracy byłyby miernikiem wartości ludzkich, właśnie ci anonimowi współpracownicy Geneteki powinni zajmować najwyższe stanowiska w administracji państwowej i w polityce. Inaczej Polska by wyglądała!
Krzysztof
: pn 09 mar 2015, 22:14
autor: Sroczyński_Włodzimierz
no miliardy to nie..ale owszem wartość "odtworzeniowa" (gdyby coś i trzeba było od początku..to pomimo spadku cen) - grube grube miliony
mi chodziło o argument "u mnie chodzi baza na kilkanaście milionów rekordów"
oprócz objętości jest kilak innych parametrów - w tym jako istotny - ilość zapytań mocna zależny od liczby użytkowników
wiec nie jest tak, ze to co chodzi przy wprowadzaniu z konsoli przez jednego usera oznacza, że będzie chodziło "w sieci" przy kilkuset (najmarniej) użytkownikach działających razem
są oczywiście patenty mniej lub bardziej wyszukane. Można nie wiem..np zdecydować się na wstępną indeksację (jeśli użytkownicy byliby skłonni używać baz z głową: tj nie szukać Kowalskiego UMZ 200 lat w całej bazie) ale wprowadzać to czego naprawdę poszukują typu B1850-1870 etc) minus - to co wchodzi na bieżąco byłoby dostępne następnego dnia, po wstępnej indeksacji w okresie mniejszego obciążenia
wyodrębnić (licząc na to, że jednak zdarzają się ..lub wymusić takie zachowania:) zakresy do przeszukiwań
to nie jest bardzo prosty temat, tym bardziej nie jest nieczasochłonny
pomysłów to na pęczki:) ale przeprojektować, przeorganizować, skodować, przetestować etc..to już inna zabawa
jest teraz taki wyjątkowy czas budowania nowych źródeł (opartych na kls-ach, może takze notariatach), który umożliwi realizację osób. Podobnie bywało zresztą z geneteką - wpierw mechanizmy w metryki (mniejsze baz pod względem ilości rekordów), obserwacja (m.in obciążeń) i po wniosku, że działa w sposób przyzwoity zaimplementowanie wzorców sprawdzonych. To naprawdę najlepsza i najprostsza droga. Test działającego rozwiązania w realnej pracy z użytkownikami. Ale nie na sztandarowej części serwisu:)
Stąd sie pojawia w moich postach pisanych w watkach nt "usprawnień" właśnie taka sugestia -spróbuj, zrób, testy później i wtedy jest nie projektowy hipotetyczny argument, a realny z obserwacji.
pozdrawiam
: wt 17 mar 2015, 22:05
autor: janden
sloniatko60 pisze:pisali się zawsze "Żelasko"
Geneteka jest zbiorem indeksów osobowych ksiąg metrykalnych, a nie zbiorem informacji o osobach. Ta sama osoba w każdym kolejnym akcie może mieć nieco inaczej zapisane nazwisko. Celem tego wątku jest eliminowanie rozbieżności między tym, co jest zapisane w akcie, a tym co znajduje się w indeksie. Różne księgi się trafiają, ale akurat w tej nazwiska są pięknie wykaligrafowane, w tym konkretnym przypadku Żelazko:
http://www.szukajwarchiwach.pl/59/1542/ ... Whm9a41CEA
: pt 03 kwie 2015, 10:30
autor: MacRek
Mirek.Kozak pisze:MacRek pisze:A może przenieść bazę do tzw. chmury?
Tam więcej miejsca i chyba szybciej chodzi wszystko.
Może trochę mniej bezpieczne, ale można kopie robić.
Co do wyszukiwarki to proponuje zrobić podobną jak jest na MyHeritage.
Dla przykładu znamy imię i nazwisko matki, mniej więcej rok urodzenia, nazwisko ojca, a nie znamy imienia dziecka.
Taka wyszukiwarka by pomogła.
Ja bym nie polecal wyszukiwarki MyHeritage nikomu i na zadnym forum.
MacRek-u wpisz do wyszukiwarki 100 trafien na strone i idz po kolei na 11 strone...
MacRek-u - przy 11 stronie pokaze sie ERROR - tego chcesz na genetece?
Wniosek? - MyHeritage nie jest w stanie obsluzyz ponad 1.000 trafien...
PODOBNĄ bym chciał.
Czyli taką, która zrealizuje poszukiwanie tego typu jak podane w przykładzie.
Pozdrawiam
Maciej
Re: Usprawnienie geneteki
: wt 05 maja 2015, 09:59
autor: jarymi
huberp pisze:Witam,
W związku z poszukiwaniami osoby o bardzo rzadkim imieniu, tj. Pudencjanna, chciałbym skierować pytanie do administracji geneteki, czy w ogóle możliwe jest dodanie wyszukiwarki wg imion? Również pomogłoby to w przypadkach zgonów kobiet, których nazwisk panieńskich w akcie nie podano.
Śledziłem dyskusję na temat trudności z dodaniem dodatkowego indeksu i w zasadzie argumenty za kłopotami z wprowadzeniem mnie przekonały.
Miałem taki problem przy szukaniu w popularnych nazwiskach takich jak Kaczmarek. Oj wtedy indeks imienia bardzo by się przydał.
Ale ponieważ takie konieczności są raczej incydentalne - poradziłem sobie w trochę inny sposób.
Wybieram np. urodzenia Kaczmarek - nawet nie zawężam lat wyszukiwania wtedy dostaję np. w woj. Łodzkim przeszło 7000 trafień.
Wtedy robię tak:
z poziomu u mnie FireFox'a - z zakładki edycja wybieram znajdź - i wpisuję Pudencjanna, jeśli jest w Genetece to po kilku kliknięciach myszą na pewno ją znajde. Gorzej to działa jeśli i nazwisko i imię należą do popularnych np. Kowalska Anna ale i wtedy ten system edycja/znajdź także dużo pomaga.
Jak dla mnie bardziej byłby przydatny system wyszukiwania obu nazwisk małżonków nie tylko z poziomu województwa ale z poziomu całej Geneteki - ale prawdopodobnie argumenty przeciw są podobne. Tak, że możliwość takiego wyszukiwania już z poziomu województw jest dużym ułatwieniem