Sauer – Shelahovo lemma - Sauer–Shelah lemma

Pajorova formulace Sauer-Shelahova lematu: pro každou konečnou rodinu množin (zelená) existuje další rodina stejně mnoha sad (modré obrysy), takže každá sada ve druhé rodině je rozbitá první rodinou

v kombinatorická matematika a teorie extrémních množin, Sauer – Shelahovo lemma uvádí, že každý rodina sad s malými VC rozměr sestává z malého počtu sad. Je pojmenován po Norbert Sauer a Saharon Shelah, který jej publikoval nezávisle na sobě v roce 1972.[1][2] Stejný výsledek byl také zveřejněn o něco dříve a znovu nezávisle, autorem Vladimír Vapnik a Alexey Chervonenkis, po kterém je pojmenována dimenze VC.[3] Shelah ve svém příspěvku obsahujícím lemma připisuje zásluhu také Micha Perles, Z tohoto důvodu bylo lemma také nazýváno Perles – Sauer – Shelah lemma.[4]

Buzaglo a kol. nazvat toto lemma „jedním z nejzásadnějších výsledků v dimenzi VC“,[4] a má aplikace v mnoha oblastech. Sauerova motivace byla v kombinatorika nastavených systémů, zatímco byl Shelah teorie modelů a Vapnik a Chervonenkis byli v statistika. Bylo také použito v diskrétní geometrie[5] a teorie grafů.[6]

Definice a prohlášení

Li je rodina souprav a je tedy další sada se říká, že je rozbila podle pokud každá podmnožina (včetně prázdná sada a sám) lze získat jako křižovatku mezi a sada v rodině. VC rozměr je největší mohutnost sady rozbité .

Pokud jde o tyto definice, lemma Sauer-Shelah uvádí, že pokud je rodina sad s odlišné prvky, jako je ten, pak rozbije sadu velikostí . Ekvivalentně, pokud je dimenze VC je pak může sestávat maximálně sady.

Hranice lemmatu je pevná: Nechte rodinu být složen ze všech podskupin s velikostí menší než . Pak velikost je přesně ale nerozbije žádnou velikost .[7]

Počet rozbitých sad

Zesílení lemmatu Sauer-Shelah kvůli Pajor (1985), uvádí, že každá rodina konečných množin rozbije se přinejmenším sady.[8] To okamžitě implikuje Sauer – Shelahovo lemma, protože pouze z podmnožin an -témový vesmír má mohutnost menší než . Takže kdy , není dost malých setů na rozbití, takže jeden z rozbitých setů musí mít alespoň mohutnost .

U omezeného typu roztříštěné množiny, nazývané řádově rozbitá množina, se počet rozbitých množin vždy rovná mohutnosti rodiny množin.[9]

Důkaz

Pajorovu variantu Sauer-Shelahova lema lze prokázat matematická indukce; důkaz byl různě připsán Noga Alon[10] nebo do Ron Aharoni a Ron Holzman.[9]

Základna: každá rodina pouze jedné sady rozbije prázdnou sadu.

Krok: Předpokládejme, že lemma platí pro všechny rodiny o velikosti menší než a nechte být rodina dvou nebo více sad. Nechat být prvkem, který patří do některých, ale ne do všech sad . Rozdělit do dvou podskupin ze sad, které obsahují a sady, které neobsahují .

Podle indukčního předpokladu tyto dvě podskupiny rozbijí dvě kolekce sad, jejichž velikosti přinejmenším přidávají .

Žádná z těchto rozbitých sad neobsahuje , protože sada, která obsahuje nelze rozbít rodinou, ve které všechny sady obsahují nebo všechny sady neobsahují .

Některé z rozbitých sad mohou být rozbity oběma podskupinami. Když sada je rozbit pouze jednou ze dvou podskupin, přispívá jednou jednotkou jak k počtu rozbitých sad podrodiny, tak k počtu rozbitých sad . Když sada je rozbita oběma podskupinami, oběma a jsou rozbiti , tak přispívá dvěma jednotkami k počtu rozbitých sad podskupin a . Proto počet rozbitých sad je přinejmenším rovné počtu rozbitých dvěma podskupinami , což je minimálně .

Jiný důkaz lemmatu Sauer-Shelah v jeho původní podobě, autor Péter Frankl a János Pach, je založeno na lineární algebra a zásada začlenění - vyloučení.[5][7]

Aplikace

Původní aplikace lemmatu, kterou napsali Vapnik a Chervonenkis, byla v tom, že každé rozdělení pravděpodobnosti lze aproximovat (s ohledem na rodinu událostí dané dimenze VC) pomocí konečné sady vzorkovacích bodů, jejichž mohutnost záleží pouze na VC dimenzi rodiny událostí. V této souvislosti existují dva důležité pojmy aproximace, oba parametrizované číslem ε: množina S vzorků a rozdělení pravděpodobnosti na S, se říká, že je ε-aproximace původního rozdělení, pokud je pravděpodobnost každé události s ohledem na S se liší od své původní pravděpodobnosti maximálně ε. Sada S z (nevážených) vzorků se říká, že ε-net pokud každá událost s pravděpodobností alespoň ε zahrnuje alespoň jeden bod S. Ε-aproximace musí být také e-sítí, ale nemusí to být nutně naopak.

Vapnik a Chervonenkis pomocí lemmatu ukázali, že množinové systémy dimenze VC d vždy mají ε-aproximace mohutnosti . Pozdější autoři včetně Haussler & Welzl (1987)[11] a Komlós, Pach & Woeginger (1992)[12] podobně ukázal, že vždy existují ε-sítě mohutnosti , a přesněji maximálně mohutnosti .[5] Hlavní myšlenkou důkazu existence malých ε-sítí je výběr náhodného vzorku X mohutnosti a druhý nezávislý náhodný vzorek y mohutnosti a omezit pravděpodobnost, že X chybí velká událost E pravděpodobností, že X je zmeškán a současně průsečík y s E je větší než jeho střední hodnota. Pro konkrétní E, pravděpodobnost, že X chybí y je větší než jeho medián je velmi malý a lemma Sauer – Shelah (platí pro ) ukazuje, že pouze malý počet odlišných událostí E je třeba vzít v úvahu, takže odborově vázán, s nenulovou pravděpodobností, X je síť ε.[5]

Ε-sítě a ε-aproximace a pravděpodobnost, že náhodný vzorek dostatečně velké mohutnosti má tyto vlastnosti, mají důležité aplikace v strojové učení, v oblasti pravděpodobně přibližně správné učení.[13] v výpočetní geometrie, byly použity vyhledávání rozsahu,[11] derandomizace,[14] a aproximační algoritmy.[15][16]

Kozma & Moran (2013) použít zevšeobecnění Sauer-Shelahova lematu k prokázání výsledků teorie grafů například počet silné orientace daného grafu je vloženo mezi jeho počty připojeno a 2-hrana připojena podgrafy.[6]

Viz také

Reference

  1. ^ Sauer, N. (1972), "O hustotě rodin množin", Journal of Combinatorial Theory, Řada A, 13: 145–147, doi:10.1016/0097-3165(72)90019-2, PAN  0307902.
  2. ^ Shelah, Saharon (1972), „Kombinatorický problém; stabilita a pořádek pro modely a teorie v nekonečných jazycích“, Pacific Journal of Mathematics, 41: 247–261, doi:10,2140 / pjm.1972.41.247, PAN  0307903, archivovány z originál dne 05.10.2013.
  3. ^ Vapnik, V. N.; Červonenkis, A. Ja. (1971), „Jednotná konvergence frekvencí výskytu událostí k jejich pravděpodobnostem“, Akademija Nauk SSSR, 16: 264–279, PAN  0288823.
  4. ^ A b Buzaglo, Sarit; Pinchasi, Rom; Rote, Günter (2013), „Topologické hypergrafy“, in Pach, János (vyd.), Třicet esejů o teorii geometrických grafů, Springer, str. 71–81, doi:10.1007/978-1-4614-0110-0_6.
  5. ^ A b C d Pach, János; Agarwal, Pankaj K. (1995), Kombinatorická geometrie, Wiley-Interscience Series in Discrete Mathematics and Optimization, New York: John Wiley & Sons Inc., str.247, doi:10.1002/9781118033203, ISBN  0-471-58890-3, PAN  1354145.
  6. ^ A b Kozma, László; Moran, Shay (2013), „Rozbití, orientace grafu a konektivita“, Electronic Journal of Combinatorics, 20 (3), P44, arXiv:1211.1319, Bibcode:2012arXiv1211.1319K.
  7. ^ A b Gowers, Timothy (31. července 2008), "Dimenzní argumenty v kombinatorice", Gowersův weblog: diskuse o matematice, Příklad 3.
  8. ^ Pajor, Alain (1985), Sous-espaces des espaces de Banach, Travaux en Cours [Probíhá práce], 16, Paříž: Hermann, ISBN  2-7056-6021-6, PAN  0903247. Jak uvádí Anstee, Rónyai & Sali (2002).
  9. ^ A b Anstee, R. P .; Rónyai, Lajos; Sali, Attila (2002), „Shattering news“, Grafy a kombinatorika, 18 (1): 59–73, doi:10.1007 / s003730200003, PAN  1892434.
  10. ^ Kalai, Gil (28. září 2008), „Extremal Combinatorics III: Some Basic Theorems“, Kombinatorika a další.
  11. ^ A b Haussler, David; Welzl, Emo (1987), „ε-nets and simplex range queries“, Diskrétní a výpočetní geometrie, 2 (2): 127–151, doi:10.1007 / BF02187876, PAN  0884223.
  12. ^ Komlós, János; Pach, János; Woeginger, Gerhard (1992), „Téměř těsné hranice pro sítě ε“, Diskrétní a výpočetní geometrie, 7 (2): 163–173, doi:10.1007 / BF02187833, PAN  1139078.
  13. ^ Blumer, Anselm; Ehrenfeucht, Andrzej; Haussler, David; Warmuth, Manfred K. (1989), „Učitelnost a dimenze Vapnik – Chervonenkis“, Deník ACM, 36 (4): 929–965, doi:10.1145/76359.76371, PAN  1072253.
  14. ^ Chazelle, B.; Friedman, J. (1990), „Deterministický pohled na náhodné vzorkování a jeho použití v geometrii“, Combinatorica, 10 (3): 229–249, doi:10.1007 / BF02122778, PAN  1092541.
  15. ^ Brönnimann, H .; Goodrich, M. T. (1995), „Téměř optimální sada pokrývá konečnou dimenzi VC“, Diskrétní a výpočetní geometrie, 14 (4): 463–479, doi:10.1007 / BF02570718, PAN  1360948.
  16. ^ Har-Peled, Sariel (2011), „O složitosti, vzorkování a ε-sítích a ε-vzorcích“, Algoritmy geometrické aproximaceMatematické průzkumy a monografie 173„Providence, RI: American Mathematical Society, s. 61–85, ISBN  978-0-8218-4911-8, PAN  2760023.