Geneteka - Nazwiska równoważne na potrzeby wyszukiwania

Tematy - indeksacja i digitalizacja metryk, projekty PTG

Moderatorzy: maria.j.nie, elgra, Galinski_Wojciech

Scowron

Sympatyk
Mistrz
Posty: 78
Rejestracja: pt 18 sty 2008, 21:53
Lokalizacja: Kraków

Post autor: Scowron »

Nawet jeśli funkcja/algorytm Soundex nie jest użyty/-a w bazie Geneteki tylko inny mechanizm to polecam o tym poczytać. Poniżej kawałek tego co zapodał Chat GPT.

Funkcja Soundex opiera się na algorytmie fonetycznym opracowanym na [początku XX wieku przez Robert C. Russell i William S. Church, którzy pracowali nad poprawą sposobu kodowania słów w kontekście analizy nazwisk i genealogii. Celem algorytmu było stworzenie systemu kodowania, który pozwalałby na porównywanie słów na podstawie ich wymowy, a nie pisowni, co miało ułatwić porównywanie podobnych dźwiękowo słów, szczególnie w sytuacjach, gdzie błędy ortograficzne były częste.

Podpytując o logikę otrzymamy proste przykłady jak działa metoda.

Piotrek
ODPOWIEDZ

Wróć do „Indeksacja metryk - projekty PTG”