Na forum nosimy plakietki "admin Geneteki", ale nie jesteśmy administratorami bazy danych w rozumieniu realnego, zawodowego świata. Do nas bardziej pasuje określenie "operator bazy danych", ponieważ modyfikujemy zawartość bazy Geneteki w ramach przyznanych nam uprawnień (dodając, podmieniając indeksy, czy wprowadzając poprawki), ale nie modyfikujemy ani struktury bazy (tabele, pola), ani kodu wyświetlającego zawartość bazy ("wyszukiwarki", czyli tego co my wszyscy widzimy na geneteka.genealodzy.pl).
Jacek Młochowski w wątku o Walnym (12.06) napisał ważną rzecz, z której nie wszyscy zdają sobie sprawę - z jednej strony mamy bazę i jej strukturę (np. podział na tabele-tereny), a z drugiej "coś", co pozwala przejrzeć zawartość bazy, "odpytać", "przesiać wyniki", przejść do upragnionego skanu.
Jedno z drugim jest powiązane, ale nie jest jednością. Bazę (za naszym pośrednictwem) zapełniają indeksujący-wolontariusze. W bazie są także dodatkowe informacje, które są podstawą działania różnych "wodotrysków" - np. współrzędne geograficzne siedzib parafii (do wyliczania odległości między parafiami i pokazywania wyników także z sąsiednich parafii), powiązania z parafie.genealodzy.pl czy dane archiwów (do pokazywania źródła danych do indeksu).
Reszta, czyli wyszukiwarka plus "wodotryski" jest po stronie kodu wyświetlającego, czyli tego, czym zajmował się Kamil.
Jeżeli czegoś nie ma w bazie (np. daty wprowadzenia/modyfikacji danego rekordu), to nawet najlepszy kod nie pokaże indeksów dodanych czy zmodyfikowanych w ostatnim miesiącu, ponieważ nie będzie "wiedział", który rekord był w tym czasie zmodyfikowany.
Z góry przepraszam, że nie odpisuję na konkretne posty poszczególnym osobom. Nie użalam się, staram się opisać działanie Geneteki tak, żeby więcej osób było świadome jak to wszystko działa. Czy ktoś zrobi z tego użytek - nie wiem, ale zawsze będzie "wisiało", ponieważ z każdym tygodniem zbliża się koniec mojej roli jako głównego administratora Geneteki. Może kolejnemu administratorowi uda się zwerbować więcej osób do pracy i kiedyś Geneteka dorobi się "rzecznika prasowego", który będzie bardzo aktywny na forum.
Poniżej parę kwestii opisanych w konwencji FAQ. Ciąg dalszy jeszcze nastąpi, ale nie wiem kiedy. Jeżeli ktoś chciałby się czegoś dowiedzieć o działaniu Geneteki, proszę pisać w tym wątku - postaram się w miarę możliwości odpowiedzieć.
Dlaczego nie ma linków bezpośrednio do zdjęć w Metrykach, a tylko do jednostek?
Jeszcze za czasów administrowania Marty, Sebastian zrobił specjalny adres mailowy, na który przychodziły automatycznie generowane maile, z informacją gdzie w Genetece ktoś kliknął w przycisk SKAN i zamiast upragnionego zdjęcia zobaczył komunikat "nieprawidłowy link do zespołu, administrator Geneteki został powiadomiony".
Od stycznia 2014 do września 2015 roku, kiedy to dostałem dostęp do tej skrzynki, uzbierało się takich maili prawie 12 tys. Po ich analizie okazało się, że większość problemów jest związana z pomyłkami w nazwie pliku. Nie ma w Genetece narzędzia do generowania, i co ważniejsze, weryfikowania i poprawiania linków do Metryk. Dlatego też od września 2014 roku linkujemy "płytko", czyli do jednostki (rocznika), a odpowiednie zdjęcie trzeba już sobie wybrać w Metrykach samemu.
Minusy: jedno kliknięcie więcej do skanu, trzeba zapamiętać w co kliknąć (nr aktu lub karty/strony).
Plusy: radykalnie spadła ilość "odbić od ściany", czyli komunikatu "nieprawidłowy link do zespołu", błędne linki znacznie łatwiej kontrolować i poprawiać (jeden taki sam dla całej jednostki/rocznika).
Dlaczego nie ma gwarancji odpowiedzi w ciągu jednego-dwóch dni oraz wstawienia indeksu w tym czasie?
Nie ma, ponieważ Geneteka nie jest naszą pracą zarobkową i w związku z tym nie poświęcamy jej umownych ośmiu godzin dziennie przez pięć dni w tygodniu. Nie poświęcamy Genetece nawet każdego wieczora i powinno być to zrozumiałe dla wszystkich, którzy nie indeksują po godzinkę-dwie każdego wieczora przez siedem dni w tygodniu. Od początku za rozsądny i realistyczny termin uznaliśmy tydzień na wstawienie indeksu i kontakt mailowy w sprawach bezpośrednio związanych z indeksacją. Wszystkie inne sprawy (w tym poprawki) mają niższy priorytet. Jeżeli nikt nie jest chory, nie wyjechał, nie ma świąt i serwer genealodzy.pl działa, gdy mamy czas na administrowanie, to raczej nie ma problemów z dotrzymaniem tygodniowego terminu. Ale jeżeli tylko coś się przytrafi, robią się zatory, a rozładowanie ich trwa.
Dlaczego nie ma ustawionego autorespondera na czas nieobecności administratora?
Bardzo by to pomogło, prawda? Admin jest chory, albo na urlopie, ustawia autoresponder i każdy dostaje automatyczną odpowiedź o nieobecności. Indeksujący nie musi się zastanawiać, co się dzieje z jego indeksem, ponieważ dostał od razu odpowiedź, że administrator wróci za tydzień czy dwa. Otóż nie ma póki co takiej możliwości, ponieważ serwer pocztowy w tej wersji, która jest, nie obsługuje autorespondera. Zaktualizować serwer? Bardzo dobry pomysł, ale wówczas popsuje się strona genealodzy.pl, która korzysta ze starych pakietów - najpierw trzeba przerobić stronę, dostosowując ją do nowych pakietów. Sebastian się tym zajmował od dłuższego czasu, ale nie udało się tego zakończyć. Teraz nie ma nikogo, kto by się tym zajmował.
Skąd się biorą problemy z Geneszukaczem?
Geneszukacz jest multiwyszukiwarką, czyli wyszukiwarką podającą wyniki od razu z wielu różnych baz, nie tylko z Geneteki. W przypadku Geneteki, Geneszukacz pokazuje tylko liczbę wyników z poszczególnych terenów i typów rejestrów (U, M, Z). To samo zresztą robi wyszukiwarka "sprawdź występowanie nazwiska" na podstronie Geneteki
http://geneteka.genealodzy.pl/index.php?op=se&lang=pol
I tak np. dla zapytania "Żurek" i przedziału lat 1840-1845 dowiemy się, że w mazowieckim są 74 pasujące do zapytania zgony:
http://geneteka.genealodzy.pl/index.php ... e&lang=pol
Te wszystkie cyferki (liczby pasujących urodzeń, małżeństw czy zgonów) są w istocie linkami do odpowiednich miejsc w Genetece i po kliknięciu w nie, "przenosimy się" z zapytaniem do Geneteki:
http://geneteka.genealodzy.pl/index.php ... m=D&w=07mz
Jeżeli kodowanie znaków w linkach jest zgodne, to nie ma problemów. A jeżeli nie jest zgodne - są "krzaki" (jak w przypadku Geneszukacza).
Od stycznia br. Geneteka stosuje kodowanie znaków UTF-8, dzięki czemu np. nie ma problemów z obsługą polskich znaków diakrytycznych w listach rozwijanych (wskazując odpowiednią parafię można korzystać z klawiatury i polskie znaki nie będą przeszkodą). Sebastian informował mnie jeszcze w styczniu, że pracuje nad zmianą kodowania na UTF-8 w bazie.
Kamil nie zajmował się Geneszukaczem i nie zajmuje się. Nie ma obecnie nikogo, kto miałby odpowiednie uprawnienia i chciał się zająć dostosowaniem generowania linków w Geneszukaczu do UTF-8, co rozwiązałoby problem.
Wszystkim, którzy chcą przeszukać całą Genetekę mogę póki co zaproponować (jako jedną z wielu protez) korzystanie z "lupki" na stronie Geneteki: http://geneteka.genealodzy.pl/index.php?op=se&lang=pol
Tam linki dla zapytań z polskimi znakami diakrytycznymi generują się dobrze (do tego Kamil miał uprawnienia).
Wyszukiwarka źle działa i nic z tym nie robicie.
Tak jak pisałem wcześniej jesteśmy jedynie "operatorami", a nie ma obecnie osoby, która miałaby odpowiednie uprawnienia i wykazywała gotowość do analizowania i udoskonalania algorytmu wyszukiwania nazwisk w Genetece, zwłaszcza nazwisk "podobnie brzmiących".
To co jest w nowej odsłonie Geneteki, jest wzięte bez modyfikacji z poprzedniej wersji.
Możemy tylko zgłaszać jakieś uwagi lub zauważone problemy i to wszystko. Kwestię "Stępień/Stempień" czy "Zięba/Ziemba" omawiałem z Sebastianem jeszcze w 2014 roku i stanęło na tym, że proste środki odpadają i trzeba być bardzo ostrożnym, żeby przy modyfikacji algorytmu nie przedobrzyć i zepsuć tego, co działa. I tak to już zostało. Przyzwyczaiłem się, że nie mogę zadać jednego zapytania i muszę po kolei wpisywać te formy, z którymi wyszukiwarka "podobnie brzmiących" sobie nie radzi.
Nade wszystko zalecam korzystanie z gwiazdki (*) zastępującej pozostałe znaki.
Zgłaszanie poprawek jest nieprzyjazne.
Zdaję sobie sprawę, że zgłaszanie poprawek przez formularz nie jest wygodne - trzeba przepisać z Geneteki wiele informacji, na każdym kroku można się pomylić, a wszystko zajmuje niepotrzebnie dużo czasu (wierzcie mi lub nie, ale administratorom również). Jest to jedna z wielu protez w Genetece, ale jest krokiem w dobrym kierunku, czyli początkiem rejestracji zmian w bazie (wszystkie zgłoszenia "odkładają się" automatycznie w arkuszu kalkulacyjnym). Czysto teoretycznie mogłem blokować wydanie nowej odsłony Geneteki do czasu wdrożenia zgłaszania poprawek bezpośrednio z poziomu Geneteki, ale Kamil za bardzo się postarał, żeby czekać jeszcze kilka czy kilkanaście miesięcy (recenzje testujących nową odsłonę były bardzo entuzjastyczne).
Teraz kwestia mechanizmu zgłaszania i wprowadzania poprawek stała się najprawdopodobniej nic nie wnoszącym "wodotryskiem", więc musimy sobie radzić z tym co mamy (czyli protezą w postaci formularza).
Ksiądz się "pomylił", a wy nie chcecie tego poprawić.
Oprócz kwestii czym jest Geneteka (zbiorem indeksów osobowych ksiąg metrykalnych), a czym nie jest (Wielką Genealogią Wszystkich Polaków), równie ważna jest kwestia nad czym jesteśmy w stanie zapanować.
Każdy, kto zapoznał się z dużą liczbą aktów z danej parafii, zapewne zauważył, że nie jest rzadkością zapis danych jednej i tej samej osoby w odmienny sposób. Wielu indeksujących wpisuje w pole "vel" różne formy nazwiska, często "na wszelki wypadek", co oczywiście pomaga później przy wyszukiwaniu. Jednakże nie można wymagać od indeksujących, żeby przed wpisaniem nazwiska analizowali poprzednie i kolejne lata w poszukiwaniu form, które można/wypada/warto wpisać do "vel", zwłaszcza, że tych lat może nie być jeszcze zrobionych.
Tak samo nie można oczekiwać od administratorów, że będą analizować szereg aktów, żeby dopisać w "vel" inną formę. Czy to przeszkadza w poszukiwaniach? Nie bardziej niż brak indeksu i samodzielne przeszukiwanie ksiąg.
W idealnej sytuacji byłaby możliwość analizowania i dopisywania do "vel" innych form przez osoby tylko tym się zajmujące, większej interakcji między użytkownikami Geneteki itp., ale pójście w tę stronę jest chyba tymi właśnie "niepotrzebnymi wodotryskami", o których była mowa. Na tę chwilę jedyne, do czego możemy się zobowiązać i starać się wypełnić to zobowiązanie, to poprawianie znalezionych rozbieżności tak, żeby Kowalski w indeksie nie okazywał się Nowakiem w księdze oraz uczciwie informować, na podstawie czego został zrobiony indeks.
Dlaczego nie poprawiacie tzw. indeksów skróconych czy ze spisów rocznych?
Dlatego, że każdy taki indeks z założenia jest tymczasowy. Taka tymczasowość może trwać jeszcze wiele lat, ale w końcu zostanie zastąpiony. Dodatkowo nie dopisujemy do pojedynczych pozycji w takich indeksach danych rodziców, dat czy miejscowości - trzeba zrobić cały rocznik.