Pilotażowy program indeksacji metryk (komentarz)
Moderator: maria.j.nie
- Nater_Stanislaw

- Posty: 158
- Rejestracja: ndz 01 paź 2006, 16:51
- Lokalizacja: Świnoujście
- Otrzymał podziękowania: 3 times
- bozenabalaw

- Posty: 248
- Rejestracja: śr 02 sty 2008, 13:56
- Lokalizacja: Dolny Śląsk
- Kaczmarek_Aneta

- Posty: 6307
- Rejestracja: pt 09 lut 2007, 13:00
- Lokalizacja: Warszawa/Piaseczno
- Podziękował: 2 times
- Otrzymał podziękowania: 14 times
Mam pytanie techniczne, może nie dotyczące same go Projektu, ale programu Indeksownik.Młochowski_Jacek pisze: Tomek Nitsch ma na ukończeniu program Indeksownik dedykowany właśnie do tego projektu. W tym projekcie musimy zrezygnować z excela i dowolności formatu danych, by minimalizować ryzyko powstania pomyłek. Wszystkie dane muszą być bezbłędnie zapisane we właściwym polu, a sam program powinien wspomagać weryfikację danych. Program ten umożliwić ma również przesłanie danych na serwer.
Jakie mianowicie właściwości posiada ów program, które miałyby zapobiec wprowadzeniu pomyłkowych danych. Inaczej, co Excel ma w sobie niedoskonałego, co powoduje, że nie nadaje się on do indeksowania ?
Pytam o to z punktu widzenia osób indeksujących parafie poza Projektem, które używają w swojej pracy właśnie Excela. Nam również zależy na tym, by zminimalizować ryzyko powstania pomyłek, stąd to pytanie.
Pozdrawiam serdecznie,
Aneta
- Kaczmarek_Aneta

- Posty: 6307
- Rejestracja: pt 09 lut 2007, 13:00
- Lokalizacja: Warszawa/Piaseczno
- Podziękował: 2 times
- Otrzymał podziękowania: 14 times
- donchichot

- Posty: 550
- Rejestracja: czw 08 lut 2007, 00:45
- Lokalizacja: TGCP Łódź
- Kontakt:
- Młochowski_Jacek

- Posty: 1725
- Rejestracja: wt 20 cze 2006, 19:41
- Lokalizacja: Radom
- Kontakt:
Administrując Geneteką przekonałem się, że każdy indeksujący inaczej przesyła dane. Pomijając różnice w wykorzystywanym narzędziu (Word, Excel, OpenOffice) mimo wzorca http://www.geneteka.genealodzy.pl/jakpomoc.php większość osób inaczej zapisywała dane. Kolejność kolumn dość łatwo zamienić, tekst pisany dużymi literami na pisany małymi z dużej litery trochę trudniej lecz często trzeba było rozdzielać imiona od nazwisk zapisane w jednej komórce lub poprawiać ich kolejność w wybranych wierszach. Wiele osób dodawało kilka dodatkowych kolumn z dodatkowymi informacjami zamiast zmieścić je w jednej kolumnie z uwagami. Część osób tłumaczyła nazwiska na formę męską a część zostawiała pisownię oryginalną. Każdy plik przed wrzuceniem danych na serwer wymaga sprawdzenia i włożenia dodatkowej pracy administratora.
Indeksownik Tomka ma zlikwidować część problemów wymuszając większą poprawność danych oraz ujednolicić format pliku do eksportu na serwer. Ma też umożliwić łatwiejszą weryfikację danych przez osobę sprawdzającą. Indeksujący powinien zaznaczyć rekordy w których ma wątpliwości. Sądzę, że niebawem osoby które wezmą udział w indeksacji dla pilotażowego projektu będą mogły na własne oczy przekonać się jak to działa. Być może trzeba będzie jeszcze coś w nim zmienić, ale po to są właśnie programy pilotażowe, by wszystko sprawdzić w działaniu.
Indeksownik Tomka ma zlikwidować część problemów wymuszając większą poprawność danych oraz ujednolicić format pliku do eksportu na serwer. Ma też umożliwić łatwiejszą weryfikację danych przez osobę sprawdzającą. Indeksujący powinien zaznaczyć rekordy w których ma wątpliwości. Sądzę, że niebawem osoby które wezmą udział w indeksacji dla pilotażowego projektu będą mogły na własne oczy przekonać się jak to działa. Być może trzeba będzie jeszcze coś w nim zmienić, ale po to są właśnie programy pilotażowe, by wszystko sprawdzić w działaniu.
Pozdrawiam serdecznie
Jacek Młochowski
Jacek Młochowski
- Młochowski_Jacek

- Posty: 1725
- Rejestracja: wt 20 cze 2006, 19:41
- Lokalizacja: Radom
- Kontakt:
Umowa PTG z NDAP została podpisana i otrzymaliśmy skany mikrofilmów do indeksacji w ramach projektu pilotażowego http://www.metryki.genealodzy.pl . Są to:
1. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii św. Andrzeja Apostoła w Warszawie z lat 1884-1888.
2. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii św. Katarzyny (Służew) w Warszawie z lat 1880-1884.
3. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii Św. Anny (Wilanów) w Warszawie z lat 1878-1882.
4. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii MB Loretańskiej (św. Floriana – Praga) w Warszawie z lat 1876-1880.
5. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów gminy Wawrzyszew z lat 1808-1810.
Miejsce przechowywania: Archiwum Państwowe m. st. Warszawy.
6. Duplikat metryk chrztów, ślubów i pogrzebów parafii Chyrów w pow. Stary Sambor (obecnie Ukraina) z lat 1896-1900 (Księga przekazana do AGAD w maju 2008, fotokopie w posiadaniu PTG).
Po Nowym Roku zaczniemy indeksację. Mamy nadzieję, że chętnych do uczestnictwa w projekcie nie zabraknie.
1. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii św. Andrzeja Apostoła w Warszawie z lat 1884-1888.
2. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii św. Katarzyny (Służew) w Warszawie z lat 1880-1884.
3. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii Św. Anny (Wilanów) w Warszawie z lat 1878-1882.
4. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów rzymskokatolickiej parafii MB Loretańskiej (św. Floriana – Praga) w Warszawie z lat 1876-1880.
5. Duplikat akt stanu cywilnego urodzeń, małżeństw i zgonów gminy Wawrzyszew z lat 1808-1810.
Miejsce przechowywania: Archiwum Państwowe m. st. Warszawy.
6. Duplikat metryk chrztów, ślubów i pogrzebów parafii Chyrów w pow. Stary Sambor (obecnie Ukraina) z lat 1896-1900 (Księga przekazana do AGAD w maju 2008, fotokopie w posiadaniu PTG).
Po Nowym Roku zaczniemy indeksację. Mamy nadzieję, że chętnych do uczestnictwa w projekcie nie zabraknie.
Pozdrawiam serdecznie
Jacek Młochowski
Jacek Młochowski
- bozenabalaw

- Posty: 248
- Rejestracja: śr 02 sty 2008, 13:56
- Lokalizacja: Dolny Śląsk
Chętnie pomogę szczególnie w indeksacji Ukrainy
Mam tylko taką podpowiedź, że indeksując dla geneteki w Ekselu tabelki tworzyliśmy sami wg podpowiedzi z projektu Poznań. Dopiero teraz dostałam wzór tabelek dla geneteki.
Te tabelki wiele mają do życzenia. Jeżeli piszę urodzenia To dziecko najczęściej nie ma nazwiska natomiast często ma je ojciec czasami matka dziecka. Jakie dać nazwisko dziecku z niepraweło łoża gdy matka ma wpisane w odmianie np Bąkówna, Bąkowska, Bąkowszczanka itp
Serdecznie pozrawiam Bożena Balawender
Mam tylko taką podpowiedź, że indeksując dla geneteki w Ekselu tabelki tworzyliśmy sami wg podpowiedzi z projektu Poznań. Dopiero teraz dostałam wzór tabelek dla geneteki.
Te tabelki wiele mają do życzenia. Jeżeli piszę urodzenia To dziecko najczęściej nie ma nazwiska natomiast często ma je ojciec czasami matka dziecka. Jakie dać nazwisko dziecku z niepraweło łoża gdy matka ma wpisane w odmianie np Bąkówna, Bąkowska, Bąkowszczanka itp
Serdecznie pozrawiam Bożena Balawender
Serdeczności Bożena Balawender
- Młochowski_Jacek

- Posty: 1725
- Rejestracja: wt 20 cze 2006, 19:41
- Lokalizacja: Radom
- Kontakt:
W Genetece nie udało się zachować jednolitości. W programie Metryki trzeba będzie wpisać obie formy nazwiska: uwspółcześnioną i oryginalną.bozenabalaw pisze: Jakie dać nazwisko dziecku z nieprawego łoża gdy matka ma wpisane w odmianie np Bąkówna, Bąkowska, Bąkowszczanka itp.
Pozdrawiam serdecznie
Jacek Młochowski
Jacek Młochowski
- Kaczmarek_Aneta

- Posty: 6307
- Rejestracja: pt 09 lut 2007, 13:00
- Lokalizacja: Warszawa/Piaseczno
- Podziękował: 2 times
- Otrzymał podziękowania: 14 times
Witam,Młochowski_Jacek pisze: Po Nowym Roku zaczniemy indeksację. Mamy nadzieję, że chętnych do uczestnictwa w projekcie nie zabraknie.
czy akcja indeksowania w ramach Pilotażu już ruszyła ? Wiele osób zgłaszało chęć pomocy, a więc prosimy o informację jak i kiedy rozpocznie się akcja ?
Czy zindeksowane dane, oprócz opublikowania na http://www.metryki.genealodzy.pl będą sukcesywnie pojawiały się w Genetece ?
Pozdrawiam serdecznie,
Aneta Kaczmarek
- Fronczak_Waldemar

- Posty: 676
- Rejestracja: śr 28 cze 2006, 23:44
- Lokalizacja: Łódź
To i ja dodam pytanie.
Czy zespoły robocze ustaliły coś w sprawie wykorzystania dotychczas zindeksowanych zasobów?
Wiem, że to trudny temat, bo w większości nasze indeksy opierają się o księgi kościelne, ale jednak spora część to także zbiory AP spisywane loco.
Czy opracowane standardy pozwolą na to aby skorzystać z tych dziesiątków tysięcy zapisów, czy też będzie trzeba ponownie sięgać po te same zbiory, aby je spisać wg. nowych wzorców?
Pozdrawiam
Waldemar Fronczak
Czy zespoły robocze ustaliły coś w sprawie wykorzystania dotychczas zindeksowanych zasobów?
Wiem, że to trudny temat, bo w większości nasze indeksy opierają się o księgi kościelne, ale jednak spora część to także zbiory AP spisywane loco.
Czy opracowane standardy pozwolą na to aby skorzystać z tych dziesiątków tysięcy zapisów, czy też będzie trzeba ponownie sięgać po te same zbiory, aby je spisać wg. nowych wzorców?
Pozdrawiam
Waldemar Fronczak
- Młochowski_Jacek

- Posty: 1725
- Rejestracja: wt 20 cze 2006, 19:41
- Lokalizacja: Radom
- Kontakt:
Projekt indeksacji metryk AP służy przede wszystkim opublikowaniu on-line w internecie skanów ASC będących w dyspozycji AP, a właściwie stworzeniu metod do realizacji tego celu w dużej skali.Fronczak_Waldemar pisze:Czy zespoły robocze ustaliły coś w sprawie wykorzystania dotychczas zindeksowanych zasobów? ...Czy opracowane standardy pozwolą na to aby skorzystać z tych dziesiątków tysięcy zapisów, czy też będzie trzeba ponownie sięgać po te same zbiory, aby je spisać wg. nowych wzorców?
Trzeba będzie ponownie sięgać do zbiorów i to niejednokrotnie, gdyż zakładam, że korzystając z metody stosowanej przez Mormonów nad tym samym zasobem pracować będzie 2-3 osoby. Dwie z nich niezależnie przygotują indeksy korzystając ze specjalnego indeksownika. Indeksy zostaną porównane przez oprogramowanie komputerowe a rozbieżności zweryfikowane przez trzecią osobę. Poza tym, jak już zaznaczyłem, będą one skojarzone ze skanami, a te będą jednoznacznie określone przez zasób, sygnaturę, (unikat, duplikat, parafia, lokalizacja źródła skanów). Takie są założenia, ale ponieważ jest to program pilotażowy więc zmiany metodyki są możliwe.
Obecnie w Genetece brak wielu z tych informacji. Mamy dane z określonej miejscowości nie wiedząc z której parafii pochodzą ani czy były spisane z unikatu czy z duplikatu.
Pozdrawiam serdecznie
Jacek Młochowski
Jacek Młochowski
- Jerzy_Stawiński

- Posty: 25
- Rejestracja: ndz 30 lis 2008, 17:01
- Lokalizacja: Warszawa
Witam !
Czytając powyższe posty, widzę jak na portalu GENEALODZY zamiera bardzo wartościowy temat jakim jest GENETEKA i prowadzona w nim indeksacja. Czy tak musi być? Co z GENETEKĄ, z ponad milionem wykonanych w niej wpisów? Dlaczego te wpisy nie są uwzględnione w pilotażowym programie? Przecież na ich wykonanie autorzy indeksacji poświęcili tysiące godzin. Dlaczego PTG, będąc współautorem nowego programu, nie uwzględnia własnego, wcześniej wprowadzonego. Fakt, że nie jest on doskonały więc trzeba było go zmodyfikować tak, żeby ograniczyć wprowadzanie błędnych i chaotycznych informacji, ale nie marnować własnego dorobku.
Pozdrawiam Jerzy
Czytając powyższe posty, widzę jak na portalu GENEALODZY zamiera bardzo wartościowy temat jakim jest GENETEKA i prowadzona w nim indeksacja. Czy tak musi być? Co z GENETEKĄ, z ponad milionem wykonanych w niej wpisów? Dlaczego te wpisy nie są uwzględnione w pilotażowym programie? Przecież na ich wykonanie autorzy indeksacji poświęcili tysiące godzin. Dlaczego PTG, będąc współautorem nowego programu, nie uwzględnia własnego, wcześniej wprowadzonego. Fakt, że nie jest on doskonały więc trzeba było go zmodyfikować tak, żeby ograniczyć wprowadzanie błędnych i chaotycznych informacji, ale nie marnować własnego dorobku.
Pozdrawiam Jerzy
- Młochowski_Jacek

- Posty: 1725
- Rejestracja: wt 20 cze 2006, 19:41
- Lokalizacja: Radom
- Kontakt:
Geneteka rozwija się bardzo dynamicznie. Ostatnio przybyło bardzo wiele wpisów. Wpisy z Geneteki nie zostaną uwzględnione w pilotażowym projekcie choćby dlatego, ze nie mamy do nich skanów oraz upoważnienia do ich publikacji. Program pilotażowy nie zastępuje Geneteki. Jest on przygotowywany pod kątem prezentacji zasobów AP. To raczej Geneteka skorzysta z programu pilotażowego. Po pierwsze powiększając swoje zasoby o zindeksowane księgi, po drugie poprzez wykorzystanie nabytych w pilotażu doświadczeń do poprawy jej funkcjonalności.
Geneteka będzie rosła i będzie się zmieniać. Program pilotażowy również w tym pomoże.
Geneteka będzie rosła i będzie się zmieniać. Program pilotażowy również w tym pomoże.
Pozdrawiam serdecznie
Jacek Młochowski
Jacek Młochowski
- Jerzy_Stawiński

- Posty: 25
- Rejestracja: ndz 30 lis 2008, 17:01
- Lokalizacja: Warszawa
Dziękuję za odpowiedz. Nowy program nazywa się pilotażowym przez okres próbny, następnie stanie się programem, który zdominuje program GENETEKI. Jak to się mówi - pożyjemy, zobaczymy. Ale jeżeli jest stwierdzenie Pan Prezesa PTG, że "Geneteka będzie rosła i będzie się zmieniać", to muszę to przyjąć z pokorą i ochłonąć. Właśnie w dotychczasowych postach na ten temat, brakowało mi takiego stwierdzenia.
Pozdrawiam Jerzy
Pozdrawiam Jerzy