Síto z Atkinu - Sieve of Atkin

v matematika, síto Atkin je moderní algoritmus za nalezení všech prvočísla až do zadaného celého čísla. Ve srovnání se starým síto Eratosthenes, který označí násobky prvočísel, provede sítko Atkin nějakou předběžnou práci a poté označí násobky čtverce prvočísel, čímž se dosáhne lepší teoretické úrovně asymptotická složitost. To bylo vytvořeno v roce 2003 A. O. L. Atkin a Daniel J. Bernstein.[1]

Algoritmus

V algoritmu:

  • Všechny zbytky jsou modulo -šedesát zbytky (vydělte číslo 60 a zbytek vraťte).
  • Všechna čísla včetně X a y, jsou kladná celá čísla.
  • Převrácení položky v seznamu sít znamená změnu označení (prime nebo nonprime) na opačné.
  • To má za následek, že čísla s lichým počtem řešení odpovídající rovnice jsou potenciálně prvočísla (prvočísla, pokud jsou také čtvercová volná), a čísla se sudým počtem řešení jsou složená.

Algoritmus:

  1. Vytvořte seznam výsledků naplněný 2, 3 a 5.
  2. Vytvořte seznam sít se záznamem pro každé kladné celé číslo; všechny položky v tomto seznamu by měly být zpočátku označeny jako nepřipravené (složené).
  3. Pro každé číslo záznamu n v seznamu sít, se zbytkem modulo-šedesátr :
    1. Li r je 1, 13, 17, 29, 37, 41, 49 nebo 53, otočte položku pro každé možné řešení na 4X2 + y2 = n. Počet operací převrácení jako poměr k rozsahu prosévání pro tento krok se blíží 4π/15[1] × 8/60 („8“ ve zlomku pochází z osmi modulů zpracovaných tímto kvadratickým a 60, protože to Atkin vypočítal na základě sudého počtu kol 60 modulů), což má za následek zlomek asi 0,1117010721276 ....
    2. Li r je 7, 19, 31 nebo 43, otočte položku pro každé možné řešení na 3X2 + y2 = n. Počet operací převrácení jako poměr k rozsahu prosévání pro tento krok se blíží π0.12[1] × 4/60 („4“ ve zlomku pochází ze čtyř modulů zpracovaných tímto kvadratickým a 60, protože to Atkin vypočítal na základě sudého počtu kol 60 modulů), což má za následek zlomek asi 0,072551974569 ....
    3. Li r je 11, 23, 47 nebo 59, otočte záznam pro každé možné řešení 3X2 − y2 = n když X > y. Počet operací převrácení jako poměr k rozsahu prosévání pro tento krok se blíží 1.92ln (0.5+1.5)[1] × 4/60 („4“ ve zlomku pochází ze čtyř modulů zpracovaných tímto kvadratickým a 60, protože to Atkin vypočítal na základě sudého počtu kol 60 modulů), což má za následek zlomek asi 0,060827679704 ....
    4. Li r je něco jiného, ​​úplně to ignorujte.
  4. Začněte nejnižším číslem v seznamu sít.
  5. Vezměte další číslo ze seznamu sít, který je stále označen jako prvočíslo.
  6. Zahrňte číslo do seznamu výsledků.
  7. Čtvereček číslo a označte všechny násobky tohoto čtverce jako jiné než primární. Všimněte si, že násobky, které lze započítat pomocí 2, 3 nebo 5, nemusí být označeny, protože tyto budou při konečném výčtu prvočísel ignorovány.
  8. Opakujte kroky čtyři až sedm. Celkový počet operací pro tato opakování značení čtverců prvočísel jako poměru rozsahu prosévání je součtem inverzní hodnoty prvočísel na druhou, která se blíží primární funkce zeta (2) z 0,452 24752004 ... minus 1/22, 1/32, a 1/52 pro prvočísla, která byla vyloučena kolem, s výsledkem vynásobeným 16/60 pro poměr zásahů kol na rozsah; výsledkem je poměr asi 0,01363637571 ....

Když přidáme výše uvedené poměry operací, výše uvedený algoritmus převezme konstantní poměr operací převrácení / značení k rozsahu prosévání přibližně 0,2587171021 ...; Ze skutečné implementace algoritmu je poměr asi 0,25 pro prosévací rozsahy až 67.

Pseudo kód

Toto je pseudo kód který kombinuje Atkinovy ​​algoritmy 3.1, 3.2 a 3.3[1] pomocí a kombinovaný sada "s" všech čísel 60 modulo kromě těch, která jsou násobky prvočísel 2, 3 a 5 podle algoritmů, pro přímou verzi algoritmus který podporuje volitelné balení bitů kola; i když to není konkrétně zmíněno v referovaném článku, tento pseudokód eliminuje některé zjevné kombinace lichých / sudých x / y, aby se snížil výpočet, kde by tyto výpočty stejně nikdy neprošly testy modulo (tj. produkovaly sudá čísla nebo násobky 3 nebo 5 ):

omezit  1000000000        // libovolný limit vyhledávání// sada pozic „zasažených“ kol pro 2/3/5 kolo, které se dvakrát otočilo podle Atkinova algoritmus  {1,7,11,13,17,19,23,29,31,37,41,43,47,49,53,59}// Inicializujte síto s dostatečným množstvím kol, aby zahrnovalo limit:pro n  60 × w + X kde w  {0,1,...,omezit ÷ 60}, X  s:    is_prime(n)  Nepravdivé// Vložte kandidátní prvočísla:// celá čísla, která mají lichý počet// reprezentace určitými kvadratickými formami.// Krok algoritmu 3.1:pro n  omezit, n  4+ kde X  {1,2,...} a y  {1,3,...} // všechna x jsou lichá y    -li n mod 60  {1,13,17,29,37,41,49,53}:        is_prime(n)  ¬is_prime(n)   // přepnout stav// Krok algoritmu 3.2:pro n  omezit, n  3+ kde X  {1,3,...} a y  {2,4,...} // pouze lichá x    -li n mod 60  {7,19,31,43}:                                 // a dokonce i y        is_prime(n)  ¬is_prime(n)   // přepnout stav// Krok algoritmu 3.3:pro n  omezit, n  3- kde X  {2,3,...} a y  {X-1,X-3,...,1} // všechny sudé / liché    -li n mod 60  {11,23,47,59}:                                   // lichá / sudá komba        is_prime(n)  ¬is_prime(n)   // přepnout stav// Eliminujte kompozity proséváním, pouze pro ty výskyty na kole:pro   omezit, n  60 × w + X kde w  {0,1,...}, X  s, n  7:    -li is_prime(n):        // n je prvočíslo, vynechá násobky jeho čtverce; to je dostačující         // protože kompozity bez čtverců se na tento seznam nedostanou        pro C  omezit, C   × (60 × w + X) kde w  {0,1,...}, X  s:            is_prime(C)  Nepravdivé// jedním zatažením vytvoříte sekvenční seznam prvočísel až do limitu:výstup 2, 3, 5pro 7  n  omezit, n  60 × w + X kde w  {0,1,...}, X  s:    -li is_prime(n): výstup n

Tento pseudokód je napsán kvůli jasnosti; ačkoli některé redundantní výpočty byly odstraněny ovládáním lichých / sudých kombinací x / y, stále zbytečně téměř polovinu svých kvadratických výpočtů na neproduktivních smyčkách, které neprocházejí testy modulo tak, že to nebude rychlejší než ekvivalent faktorizované kolo (2/3/5) síto Eratosthenes. Aby se zlepšila jeho účinnost, musí být navržena metoda pro minimalizaci nebo eliminaci těchto neproduktivních výpočtů.

Vysvětlení

Algoritmus zcela ignoruje všechna čísla se zbytkem modulo 60, který je dělitelný dvěma, třemi nebo pěti, protože čísla se zbytkem modulo 60 dělitelným jedním z těchto tří prvočísel jsou sama dělitelná tímto prvočíslem.

Všechna čísla n se zbytkem modulo-šedesát 1, 13, 17, 29, 37, 41, 49 nebo 53 mají zbytek modulo-čtyři 1. Tato čísla jsou prvočísla kdyby a jen kdyby počet řešení 4X2 + y2 = n je liché a číslo je bez čtverce (prokázáno jako věta 6.1 z[1]).

Všechna čísla n se zbytkem modulo-sixty 7, 19, 31 nebo 43 mají zbytek modulo-six 1. Tato čísla jsou prvočísla právě tehdy, když počet řešení 3X2 + y2 = n je liché a číslo je bez čtverců (prokázáno jako věta 6.2 z[1]).

Všechna čísla n se zbytkem modulo-šedesát 11, 23, 47 nebo 59 mají zbytek modulo-dvanáct 11. Tato čísla jsou prvočísla právě tehdy, když počet řešení 3X2y2 = n je liché a číslo je bez čtverců (prokázáno jako věta 6.3 z[1]).

Žádné z potenciálních prvočísel není dělitelné 2, 3 nebo 5, takže je nelze dělit čtverci. To je důvod, proč kontroly squarefree nezahrnují 22, 32a 52.

Výpočetní složitost

To lze vypočítat[1] že výše uvedená řada tří operací kvadratické rovnice má každý počet operací, což je konstantní poměr rozsahu, když rozsah přechází do nekonečna; stejně tak operace volného zabíjení prime square lze popsat pomocí primární funkce zeta (2) s konstantními posuny a faktory, takže je to také konstantní faktor rozsahu, protože rozsah jde do nekonečna. Algoritmus popsaný výše proto může vypočítat prvočísla až N použitím Ó (N) operace pouze s Ó (N) bitů paměti.

Stejná je i segmentovaná verze implementovaná autory Ó (N) operace, ale snižuje paměťový požadavek pouze na ten, který vyžadují základní prvočísla pod druhou odmocninou rozsahu O (N1/2/ logN) bity paměti plus minimální vyrovnávací paměť stránky. To je o něco lepší výkon se stejnými požadavky na paměť jako segmentovaná stránka síto Eratosthenes který používá O (N log logN) operace a stejný O (N1/2/ logN) bitů paměti[2] plus minimální vyrovnávací paměť stránky. Takové síto však nepřekoná síto Eratosthenes s maximální praktickou faktorizací kotouče (kombinace 2/3/5/7 prosévacího kotouče a předběžného vyřazení kompozitů ve vyrovnávacích stránkách segmentové stránky pomocí 2/3/5/7 / 11/13/17/19), který, i když má o něco více operací než síto Atkin pro velmi velké, ale praktické rozsahy, má konstantní faktor menší složitosti na operaci asi třikrát při srovnání doby na operaci mezi algoritmy implementované Bernsteinem v taktovacích cyklech CPU na operaci. Hlavním problémem Page Segmented Sieve of Atkin je obtíže při implementaci utracených sekvencí „prime square free“ kvůli rozpětí mezi vyřazeními, která rychle rostou daleko za rozsah vyrovnávací paměti stránky; čas vynaložený na tuto operaci v Bernsteinově implementaci rychle roste na mnohonásobek času vynaloženého na výpočty skutečné kvadratické rovnice, což znamená, že lineární složitost části, která by jinak byla docela zanedbatelná, se stává hlavním spotřebitelem doby provádění. I když se tedy optimalizovaná implementace může znovu vyrovnat s časovou složitostí O (n), tento konstantní faktor zvýšeného času na operaci znamená, že síto Atkin je pomalejší.

Speciální upravená variace „výčtu mřížových bodů“ což není výše uvedená verze síta Atkin může teoreticky vypočítat prvočísla až N použitím Ó (N/ log logN) operace s N1/2 + o (1) kousky paměti[1] ale tato variace je zřídka implementována. To je o něco lepší výkon při velmi vysokých nákladech na paměť ve srovnání s běžnou segmentovanou verzí stránky a ekvivalentní, ale zřídka implementovanou verzí síta Eratosthenes, které používá O (N) operace a O (N1/2(log logN) / logN) bitů paměti.[3][4][5]

Pritchard poznamenal, že u sít kol lze snížit spotřebu paměti při zachování složitosti Big O time, ale to obvykle stojí za cenu zvýšeného konstantního faktoru pro čas na operaci kvůli zvláštní složitosti. Proto má tato speciální verze pravděpodobně větší hodnotu jako intelektuální cvičení než praktické síto se sníženým reálným časem vynaložené na daný velký rozsah praktického prosévání.

Viz také

Reference

  1. ^ A b C d E F G h i j A.O.L. Atkin, D.J. Bernstein, Připravte síta pomocí binárních kvadratických forem, Math. Comp. 73 (2004), 1023-1030.[1]
  2. ^ Pritchard, Paul, „Lineární síta prvočísla: rodokmen“ Sci. Comput. Programování 9: 1 (1987), s. 17–35.
  3. ^ Paul Pritchard, sublinské aditivní síto pro hledání prvočísel, Komunikace ACM 24 (1981), 18–23. PAN600730
  4. ^ Paul Pritchard, Vysvětlení síta kola, Acta Informatica 17 (1982), 477–485. PAN685983
  5. ^ Paul Pritchard, Rychlá kompaktní síta prvočísel (mimo jiné), Journal of Algorithms 4 (1983), 332–344. PAN729229

externí odkazy