New York State Identification and Intelligence System - New York State Identification and Intelligence System - Wikipedia
The New York State Identification and Intelligence System Fonetický kód, běžně známý jako NYSIIS, je a fonetický algoritmus koncipovaný v roce 1970 jako součást Stát New York Identifikační a zpravodajský systém (nyní součást newyorské státní divize služeb trestního soudnictví). Vyznačuje se zvýšením přesnosti o 2,7% oproti tradičnímu Soundex algoritmus.[1]
Postup
Algoritmus, jak je popsán v Techniky vyhledávání jmen,[2] je:
- Pokud jsou první písmena jména
- 'MAC', pak změňte tato písmena na 'MCC'
- 'KN', pak změňte tato písmena na 'NN'
- „K“, pak změňte toto písmeno na „C“
- 'PH', pak změňte tato písmena na 'FF'
- 'PF', pak změňte tato písmena na 'FF'
- 'SCH', pak změňte tato písmena na 'SSS'
- Pokud jsou poslední písmena jména[3]
- 'EE', pak změňte tato písmena na 'Y␢'
- 'IE', pak změňte tato písmena na 'Y␢'
- 'DT' nebo 'RT' nebo 'RD' nebo 'NT' nebo 'ND', pak změňte tato písmena na 'D␢'
- První znak kódu NYSIIS je první znak jména.
- V následujících pravidlech se provádí skenování znaků jména. To je popsáno z hlediska programové smyčky. Ukazatel se používá k označení aktuální zvažované polohy v názvu. Krok 4 je nastavení tohoto ukazatele tak, aby ukazoval na druhý znak jména.
- Vzhledem k poloze ukazatele lze provést pouze jeden z následujících příkazů.
- Pokud je prázdné, přejděte na pravidlo 7.
- Pokud je aktuální pozicí samohláska (AEIOU), pak pokud se rovná „EV“, změňte ji na „AF“, jinak změňte aktuální polohu na „A“.
- Pokud je aktuální pozice písmeno
- „Q“, pak změňte písmeno na „G“
- „Z“, pak změňte písmeno na „S“
- „M“, pak změňte písmeno na „N“
- Pokud je aktuální pozicí písmeno „K“, pak je-li další písmeno „N“, nahraďte aktuální pozici „N“, jinak nahraďte aktuální pozici „C“
- Pokud aktuální pozice ukazuje na řetězec písmen
- 'SCH' poté nahraďte řetězec 'SSS'
- 'PH', pak nahraďte řetězec 'FF'
- Pokud je aktuální pozicí písmeno „H“ a předchozí nebo následující písmeno není samohláska (AEIOU), nahraďte aktuální pozici předcházejícím písmenem.
- Pokud je aktuální pozicí písmeno „W“ a předchozí písmeno je samohláska, nahraďte aktuální pozici předchozí pozicí.
- Pokud žádné z těchto pravidel neplatí, ponechejte si aktuální hodnotu pozičního písmene.
- Pokud se písmeno aktuální pozice rovná poslednímu písmenu umístěnému v kódu, nastavte ukazatel tak, aby ukazoval na další písmeno, a přejděte ke kroku 5.
Dalším znakem kódu NYSIIS je písmeno aktuální polohy.
Zvýší ukazatel tak, aby ukazoval na další písmeno.
Přejděte na krok 5. - Pokud je posledním znakem kódu NYSIIS písmeno „S“, odstraňte jej.
- Pokud jsou poslední dva znaky kódu NYSIIS písmena „AY“, nahraďte je jediným znakem „Y“.
- Pokud je posledním znakem kódu NYSIIS písmeno „A“, odstraňte toto písmeno.
Reference
- ^ Rajkovic, P .; Jankovic, D. (2007), „Adaptace a aplikace algoritmu Daitch-Mokotoff Soundex na srbské názvy“ (PDF), XVII. Konference o aplikované matematice, Novi Sad, Srbsko, archivovány od originál (PDF) 27. srpna 2011
- ^ Taft, R. L. (1970), "Techniky vyhledávání jmen", New York State Identification and Intelligence System, Albany, New York
- ^ https://www.fileformat.info/info/unicode/char/2422/index.htm