Johnson – Lindenstraussovo lemma - Johnson–Lindenstrauss lemma - Wikipedia

V matematice je Johnson – Lindenstraussovo lemma je výsledek pojmenovaný po William B. Johnson a Joram Lindenstrauss týkající se nízkého zkreslení vložení bodů z vysoce dimenzionálních do nízkodimenzionálních Euklidovský prostor. Lemma říká, že množinu bodů ve vysokodimenzionálním prostoru lze vložit do prostoru mnohem nižší dimenze takovým způsobem, že vzdálenosti mezi body jsou téměř zachovalé. Mapa použitá pro vložení je minimálně Lipschitz, a lze jej dokonce považovat za ortogonální projekce.

Lema má aplikace v komprimované snímání, rozmanité učení, snížení rozměrů, a vkládání grafů. Velká část dat uložených a manipulovaných v počítačích, včetně textu a obrázků, může být reprezentována jako body ve vysokodimenzionálním prostoru (viz vektorový vesmírný model pro případ textu). Základní algoritmy pro práci s takovými daty však mají tendenci velmi rychle zapadat s rostoucí dimenzí.^[1] Je proto žádoucí snížit rozměrnost údajů způsobem, který zachovává jejich příslušnou strukturu. Johnsonovo-Lindenstraussovo lema je v tomto duchu klasickým výsledkem.

Lema je také napjatá až do konstantního faktoru, tj. Existuje množina bodů velikosti m to potřebuje rozměr

{ displaystyle Omega left ({ frac { log (m)} { varepsilon ^ {2}}} right)}

aby se zachovaly vzdálenosti mezi všemi dvojicemi bodů v rámci faktoru ${ displaystyle (1 pm varepsilon)}$ .^[2]

Lemma

Dáno ${ displaystyle 0 < varepsilon <1}$ , sada ${ displaystyle X}$ z ${ displaystyle m}$ body v ${ displaystyle mathbb {R} ^ {N}}$ a číslo ${ displaystyle n> 8 ln (m) / varepsilon ^ {2}}$ , existuje lineární mapa ${ displaystyle f: mathbb {R} ^ {N} rightarrow mathbb {R} ^ {n}}$ takhle

{ displaystyle (1- varepsilon) | uv | ^ {2} leq | f (u) -f (v) | ^ {2} leq (1+ varepsilon) | uv | ^ {2}}

pro všechny ${ displaystyle u, v v X}$ .

Vzorec lze přeskupit:

{ displaystyle (1+ varepsilon) ^ {- 1} | f (u) -f (v) | ^ {2} leq | uv | ^ {2} leq (1- varepsilon) ^ {- 1} | f (u) -f (v) | ^ {2}}

Jeden důkaz lemmatu trvá ƒ být vhodným násobkem ortogonální projekce na náhodný podprostor dimenze ${ displaystyle n}$ v ${ displaystyle mathbb {R} ^ {N}}$ a využívá fenomén koncentrace opatření.

Je zřejmé, že ortogonální projekce obecně sníží průměrnou vzdálenost mezi body, ale na lemma lze pohlížet jako na řešení relativní vzdálenosti, které se při změně měřítka nemění. Stručně řečeno, hodíte kostkami a získáte náhodnou projekci, která sníží průměrnou vzdálenost, a poté zvětšíte vzdálenosti tak, aby se průměrná vzdálenost vrátila na předchozí hodnotu. Pokud budete stále házet kostkami, najdete v polynomiálním náhodném čase projekci, pro kterou (zmenšené) vzdálenosti splňují lemma.

Alternativní prohlášení

Příbuzné lemma je distribuční JL lemma. Toto lemma uvádí, že pro libovolnou 0 <ε, δ <1/2 a kladné celé číslo d, existuje distribuce přes R^{k × d} ze kterého je matice A je nakreslen tak, že pro k = Ó(ε⁻²protokol (1 /δ)) a pro jakýkoli vektor délky jednotky X ∈ R^d, platí níže uvedený nárok.^[3]

{ displaystyle P (| Vert Ax Vert _ {2} ^ {2} -1 |> varepsilon) < delta}

Lemma JL lze získat z distribuční verze nastavením ${ displaystyle x = (u-v) / | u-v | _ {2}}$ a ${ displaystyle delta <1 / n ^ {2}}$ pro pár u,proti jak V. .. tak v X. Potom JL lemma následuje spojením vázaným přes všechny takové páry.

Urychlení transformace JL

Dáno A, výpočet maticového vektorového produktu trvá Ó(kd) čas. Tam byla nějaká práce v odvození distribucí, pro které lze vektorový produkt matice vypočítat za méně než Ó(kd) čas.

Existují dvě hlavní linie práce. První, Rychlá Johnson Lindenstrauss Transformace (FJLT),^[4] byl představen Ailon a Chazelle v roce 2006.Tato metoda umožňuje výpočet vektorového produktu matice v pouhých ${ displaystyle d log d + k ^ {2+ gamma}}$ pro jakoukoli konstantu ${ displaystyle gamma> 0}$ .

Dalším přístupem je vytvoření distribuce podporované maticemi, které jsou řídké.^[5]Tato metoda umožňuje uchovat pouze ${ displaystyle varepsilon}$ zlomek položek v matici, což znamená, že výpočet lze provést pouze ${ displaystyle kd varepsilon}$ čas. Dále, pokud má vektor pouze ${ displaystyle b}$ ne-zereo záznamy, Sparse JL nějakou dobu trvá ${ displaystyle kb varepsilon}$ , což může být mnohem méně než ${ displaystyle d log d}$ čas používaný Fast JL.

Tenzorované náhodné projekce

Je možné kombinovat dvě JL matice pomocí tzv Produkt rozdělující obličej je definován jako tenzorové produkty řádků (navrhl V. Slyusar^[6] v roce 1996^[7]^[8]^[9]^[10]^[11] pro radar a digitální anténní pole přímo), nechte ${ displaystyle {C} in mathbb {R} ^ {3 krát 3}}$ a ${ displaystyle {D} v mathbb {R} ^ {3 krát 3}}$ být dvě matice Produkt rozdělující obličej ${ displaystyle {C} odrážka {D}}$ je^[7]^[8]^[9]^[10]^[11]

{ displaystyle {C} bullet {D} = left [{ begin {array} {c} {C} _ {1} otimes {D} _ {1} hline {C} _ {2 } otimes {D} _ {2} hline {C} _ {3} otimes {D} _ {3} end {array}} right].}

Tuto myšlenku tenzorizace použili Kasiviswanathan et al. 2010^[12] pro rozdílné soukromí.

Takto definované matice JL používají méně náhodných bitů a lze je rychle použít na vektory, které mají strukturu tenzorů, kvůli následující identitě:^[9]

{ displaystyle ( mathbf {C} bullet mathbf {D}) (x ot y y) = mathbf {C} x circ mathbf {D} y = left [{ begin {pole} {c } ( mathbf {C} x) _ {1} ( mathbf {D} y) _ {1} ( mathbf {C} x) _ {2} ( mathbf {D} y) _ {2 } vdots end {pole}} vpravo]}

,

kde ${ displaystyle circ}$ je elementární (Hadamard ) Tyto výpočty byly použity k efektivnímu výpočtu polynomiální jádra a mnoho dalších algoritmů lineární algebry.^[13]

V roce 2020^[14] ukázalo se, že pokud matice ${ displaystyle C_ {1}, C_ {2}, tečky, C_ {c}}$ jsou nezávislé ${ displaystyle pm 1}$ nebo Gaussovy matice, kombinovaná matice ${ displaystyle C_ {1} kulka tečky kulka C_ {c}}$ splňuje distribuční JL lemma, pokud je počet řádků alespoň

{ displaystyle O ( epsilon ^ {- 2} log 1 / delta + epsilon ^ {- 1} ({ tfrac {1} {c}} log 1 / delta) ^ {c})}

.

Pro velké ${ displaystyle epsilon}$ to je stejně dobré jako úplně náhodný Johnson-Lindenstrauss, ale odpovídající dolní mez ve stejném článku ukazuje, že tato exponenciální závislost na ${ displaystyle ( log 1 / delta) ^ {c}}$ Je nutné obejít alternativní konstrukce JL.

Viz také

Náhodná projekce

Poznámky

^ Například psaní o hledání nejbližšího souseda ve vysokodimenzionálních souborech dat, Jon Kleinberg píše: „Sofistikovanější algoritmy obvykle dosahují logaritmického času dotazu n na úkor exponenciální závislosti na dimenzi d; dokonce i průměrná případová analýza heuristiky, jako jsou stromy k-d, odhaluje exponenciální závislost na d v době dotazu. Kleinberg, Jon M. (1997), „Dva algoritmy pro hledání nejbližších sousedů ve vysokých dimenzích“, Sborník z dvacátého devátého výročního sympózia ACM o teorii práce s počítačem, STOC '97, New York, NY, USA: ACM, s. 599–608, doi:10.1145/258533.258653, ISBN 0-89791-888-6.
^ Kasper Green Larsen; Jelani Nelson (2017). Optimalita Johnson-Lindenstrauss Lemma. Sborník 58. výročního sympozia IEEE o základech informatiky (FOCS). str. 633-638. arXiv:1609.02094. doi:10.1109 / FOCS.2017.64.
^ Johnson, William B.; Lindenstrauss, Joram (1984). "Rozšíření mapování Lipschitze do Hilbertova prostoru". In Beals, Richard; Beck, Anatole; Bellow, Alexandra; et al. (eds.). Konference o moderní analýze a pravděpodobnosti (New Haven, Conn., 1982). Současná matematika. 26. Providence, RI: American Mathematical Society. str.189–206. doi:10.1090 / conm / 026/737400. ISBN 0-8218-5030-X. PAN 0737400.
^ Ailon, Nir; Chazelle, Bernard (2006). „Přibližný nejbližší soused a rychlá transformace Johnson – Lindenstrauss“. Proceedings of the 38th Annual ACM Symposium on Theory of Computing. New York: ACM Press. str. 557–563. doi:10.1145/1132516.1132597. ISBN 1-59593-134-1. PAN 2277181.
^ Kane, Daniel M .; Nelson, Jelani (2014). „Sparser Johnson-Lindenstrauss Transforms“. Deník ACM. 61 (1): 1. arXiv:1012.1577. doi:10.1145/2559902. PAN 3167920.. Předběžná verze tohoto článku byla zveřejněna v Proceedings of the Twenty-Third Annual ACM-SIAM Symposium on Discrete Algorithms, 2012.
^ Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics - Theory and Methods, 38:19, S. 3501 [1]
^ ^A ^b Slyusar, V. I. (27. prosince 1996). „Konečné produkty v maticích v radarových aplikacích“ (PDF). Radioelektronika a komunikační systémy. - 1998, roč. 41; Číslo 3: 50–53.
^ ^A ^b Slyusar, V. I. (1997-05-20). „Analytický model digitálního anténního pole na základě produktů dělících matice tváří“ (PDF). Proc. ICATT-97, Kyiv: 108–109.
^ ^A ^b ^C Slyusar, V. I. (1997-09-15). "Nové operace maticového produktu pro aplikace radarů" (PDF). Proc. Přímé a inverzní problémy teorie elektromagnetických a akustických vln (DIPED-97), Lviv.: 73–74.
^ ^A ^b Slyusar, V. I. (13. března 1998). "Rodina produktů tváře matic a její vlastnosti" (PDF). Cybernetics and Systems Analysis C / C of Kibernetika I Sistemnyi Analiz. - 1999. 35 (3): 379–384. doi:10.1007 / BF02733426.
^ ^A ^b Slyusar, V. I. (2003). "Zobecněné produkty tváře matic v modelech digitálních anténních polí s neidentickými kanály" (PDF). Radioelektronika a komunikační systémy. 46 (10): 9–17.
^ Kasiviswanathan, Shiva Prasad a kol. „Cena soukromého uvolnění kontingenčních tabulek a spektra náhodných matic s korelovanými řádky.“ Sborník čtyřicátého druhého sympózia ACM o teorii práce s počítačem. 2010.
^ Woodruff, David P. „Skicování jako nástroj pro numerickou lineární algebru.“ Theoretical Computer Science 10.1-2 (2014): 1-157.
^ Ahle, Thomas; Kapralov, Michael; Knudsen, Jakob; Pagh, Rasmus; Velingker, Ameya; Woodruff, David; Zandieh, Amir (2020). Nezapomenutelné skicování vysoce polynomiálních jader. ACM-SIAM Symposium on Discrete Algorithms. Sdružení pro výpočetní techniku. doi:10.1137/1.9781611975994.9.

Další čtení

Achlioptas, Dimitris (2003), „Náhodné projekce vhodné pro databázi: Johnson – Lindenstrauss s binárními mincemi“, Journal of Computer and System Sciences, 66 (4): 671–687, doi:10.1016 / S0022-0000 (03) 00025-4, PAN 2005771. Deníková verze příspěvku dříve uvedeného v PODC 2001.
Baraniuk, Richard; Davenport, Mark; DeVore, Ronalde; Wakin, Michael (2008), "Jednoduchý důkaz omezené izometrické vlastnosti pro náhodné matice" (PDF), Konstruktivní aproximace, 28 (3): 253–263, doi:10.1007 / s00365-007-9003-x, PAN 2453366^{[trvalý mrtvý odkaz ]}.
Dasgupta, Sanjoy; Gupta, Anupam (2003), „Základní důkaz věty o Johnsonovi a Lindenstraussovi“ (PDF), Náhodné struktury a algoritmy, 22 (1): 60–65, doi:10.1002 / rsa.10073, PAN 1943859.
Landweber, Peter; Lazar, Emanuel; Patel, Neel (2015), "Na průměrech vláken souvislých map ".
Slyusar, V. I. (1997-05-20). „Analytický model digitálního anténního pole na základě produktů dělících matice tváří“ (PDF). Proc. ICATT-97, Kyiv: 108–109.
Slyusar, V. I. (13. března 1998). "Rodina produktů tváře matic a její vlastnosti" (PDF). Kybernetika a systémová analýza C / C Kibernetiky I Sistemnyi Analiz. - 1999. 35 (3): 379–384. doi:10.1007 / BF02733426.

[1] Například psaní o hledání nejbližšího souseda ve vysokodimenzionálních souborech dat, Jon Kleinberg píše: „Sofistikovanější algoritmy obvykle dosahují logaritmického času dotazu n na úkor exponenciální závislosti na dimenzi d; dokonce i průměrná případová analýza heuristiky, jako jsou stromy k-d, odhaluje exponenciální závislost na d v době dotazu. Kleinberg, Jon M. (1997), „Dva algoritmy pro hledání nejbližších sousedů ve vysokých dimenzích“, Sborník z dvacátého devátého výročního sympózia ACM o teorii práce s počítačem, STOC '97, New York, NY, USA: ACM, s. 599–608, doi:10.1145/258533.258653, ISBN 0-89791-888-6.

[2] Kasper Green Larsen; Jelani Nelson (2017). Optimalita Johnson-Lindenstrauss Lemma. Sborník 58. výročního sympozia IEEE o základech informatiky (FOCS). str. 633-638. arXiv:1609.02094. doi:10.1109 / FOCS.2017.64.

[3] Johnson, William B.; Lindenstrauss, Joram (1984). "Rozšíření mapování Lipschitze do Hilbertova prostoru". In Beals, Richard; Beck, Anatole; Bellow, Alexandra; et al. (eds.). Konference o moderní analýze a pravděpodobnosti (New Haven, Conn., 1982). Současná matematika. 26. Providence, RI: American Mathematical Society. str.189–206. doi:10.1090 / conm / 026/737400. ISBN 0-8218-5030-X. PAN 0737400.

[4] Ailon, Nir; Chazelle, Bernard (2006). „Přibližný nejbližší soused a rychlá transformace Johnson – Lindenstrauss“. Proceedings of the 38th Annual ACM Symposium on Theory of Computing. New York: ACM Press. str. 557–563. doi:10.1145/1132516.1132597. ISBN 1-59593-134-1. PAN 2277181.

[5] Kane, Daniel M .; Nelson, Jelani (2014). „Sparser Johnson-Lindenstrauss Transforms“. Deník ACM. 61 (1): 1. arXiv:1012.1577. doi:10.1145/2559902. PAN 3167920.. Předběžná verze tohoto článku byla zveřejněna v Proceedings of the Twenty-Third Annual ACM-SIAM Symposium on Discrete Algorithms, 2012.

[Fortiana-6] Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics - Theory and Methods, 38:19, S. 3501 [1]

[slyusar-7] A ^b Slyusar, V. I. (27. prosince 1996). „Konečné produkty v maticích v radarových aplikacích“ (PDF). Radioelektronika a komunikační systémy. - 1998, roč. 41; Číslo 3: 50–53.

[slyusar1-8] A ^b Slyusar, V. I. (1997-05-20). „Analytický model digitálního anténního pole na základě produktů dělících matice tváří“ (PDF). Proc. ICATT-97, Kyiv: 108–109.

[DIPED-9] A ^b ^C Slyusar, V. I. (1997-09-15). "Nové operace maticového produktu pro aplikace radarů" (PDF). Proc. Přímé a inverzní problémy teorie elektromagnetických a akustických vln (DIPED-97), Lviv.: 73–74.

[slyusar2-10] A ^b Slyusar, V. I. (13. března 1998). "Rodina produktů tváře matic a její vlastnosti" (PDF). Cybernetics and Systems Analysis C / C of Kibernetika I Sistemnyi Analiz. - 1999. 35 (3): 379–384. doi:10.1007 / BF02733426.

[general-11] A ^b Slyusar, V. I. (2003). "Zobecněné produkty tváře matic v modelech digitálních anténních polí s neidentickými kanály" (PDF). Radioelektronika a komunikační systémy. 46 (10): 9–17.

[12] Kasiviswanathan, Shiva Prasad a kol. „Cena soukromého uvolnění kontingenčních tabulek a spektra náhodných matic s korelovanými řádky.“ Sborník čtyřicátého druhého sympózia ACM o teorii práce s počítačem. 2010.

[woodruff-13] Woodruff, David P. „Skicování jako nástroj pro numerickou lineární algebru.“ Theoretical Computer Science 10.1-2 (2014): 1-157.

[highdeg-14] Ahle, Thomas; Kapralov, Michael; Knudsen, Jakob; Pagh, Rasmus; Velingker, Ameya; Woodruff, David; Zandieh, Amir (2020). Nezapomenutelné skicování vysoce polynomiálních jader. ACM-SIAM Symposium on Discrete Algorithms. Sdružení pro výpočetní techniku. doi:10.1137/1.9781611975994.9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]