Daitch – Mokotoff Soundex - Daitch–Mokotoff Soundex - Wikipedia
Daitch – Mokotoff Soundex (D – M Soundex) je a fonetický algoritmus vynalezli v roce 1985 židovští genealogové Gary Mokotoff a Randy Daitch. Je to zdokonalení Russella a Američana Soundex algoritmy navržené tak, aby umožňovaly větší přesnost při porovnávání slovanský a jidiš příjmení s podobnými výslovnost ale rozdíly v pravopisu.
Daitch – Mokotoff Soundex je někdy označován jako „židovský Soundex“ a „východoevropský Soundex“, ačkoli autoři odrazují od používání těchto přezdívek pro algoritmus, protože samotný algoritmus je nezávislý na skutečnosti, motivací pro vytvoření nového systému byla chudá výsledky systémů předchůdců při práci se slovanskými a jidiš příjmením.
Vylepšení
Vylepšení oproti starším algoritmům Soundex zahrnují:
- Kódovaná jména jsou šestimístná, což má za následek vyšší přesnost vyhledávání (tradiční Soundex používá čtyři znaky)
- Počáteční znak jména je kódován.
- Několik pravidel v algoritmu kóduje víceznakové n-gramy jako jednu číslici (American a Russell Soundex nezpracovávají víceznakové n-gramy)
- Pro jedno jméno lze vrátit více možných kódování (tradiční Soundex vrací pouze jedno kódování, i když pravopis jména může mít potenciálně více výslovností)
Příklady
Nějaké příklady:
Příjmení | Americký Soundex | D – M Soundex |
---|---|---|
Peters | P362 | 739400, 734000 |
Peterson | P362 | 739460, 734600 |
Moskowitz | M232 | 645740 |
Moskovitz | M213 | 645740 |
Auerbach | A612 | 097500, 097400 |
Uhrbach | U612 | 097500, 097400 |
Jackson | J250 | 154600, 454600, 145460, 445460 |
Jackson-Jackson | J252 | 154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464 |
Beider – Morseův fonetický algoritmus shody názvu
Pro řešení velkého počtu falešně pozitivních výsledků generovaných D – M Soundex, Stephen P. Morse a Alexander Beider vytvořil algoritmus Beider – Morse Phonetic Name Matching.[1] Tento nový algoritmus omezuje falešné pozitivy na úkor některých falešných negativů. Řada webů nabízí kromě Soundexu D-M i zvuk B – M.[2]
Poznámky
- ^ Fonetická shoda Beider – Morse: Alternativa k Soundexu s méně falešnými hity - kopie Avotaynu: International Review of Jewish Genealogy (léto 2008)
- ^ Nu? Co je nového? Svazek 9, číslo 22 Gary Mokotoff, redaktor - E-zin židovské genealogie od Avotaynu
externí odkazy
- Mokotoff, Gary. „Soundexing a genealogie.“ Popisuje historii a motivaci D – M Soundex.
- Židovský gen. „Kódování Soundexu.“ Popisuje Russel i D – M Soundex.
- Coles, Michael. „SQL 2000 DBA Toolkit, Part 3: Phonetic Matching“ Implementace algoritmu D – M Soundex se zdrojem na serveru SQL.