Nulový ukazatel - Null pointer

v výpočetní, a nulový ukazatel nebo nulový odkaz má uloženou hodnotu, která označuje, že ukazatel nebo odkaz neodkazuje na platný objekt. Programy běžně používají nulové ukazatele k reprezentaci podmínek, jako je konec a seznam neznámé délky nebo neprovedení nějaké akce; toto použití nulových ukazatelů lze přirovnat k typy s možnou hodnotou Null a do Nic hodnota v typ možnosti.

Nulový ukazatel by neměl být zaměňován s neinicializovaný ukazatel: je zaručeno, že nulový ukazatel porovná nerovné s jakýmkoli ukazatelem, který ukazuje na platný objekt. V závislosti na jazyce a implementaci však neinicializovaný ukazatel nemusí mít žádnou takovou záruku. Může se srovnávat s jinými platnými ukazateli; nebo by se to mohlo srovnávat s nulovými ukazateli. Mohlo by to být obojí v různých časech. Nebo srovnání může být nedefinované chování.

C

v C, jsou zaručeny dva nulové ukazatele libovolného typu, které mají stejnou hodnotu.[1] Makro preprocesoru NULA je definována jako konstanta nulového ukazatele definovaná implementací,[2] v kterém C99 lze vyjádřit jako celočíselnou hodnotu 0 převeden na typ neplatné * (ukazatel na prázdnota ).[3] Standard C neříká, že nulový ukazatel je stejný jako ukazatel na adresa paměti 0, i když v praxi to tak může být. Dereferencování nulový ukazatel je nedefinované chování v C,[4] a vyhovující implementace může předpokládat, že žádný ukazatel, který je dereferencován, není null.

V praxi může dereferencování nulového ukazatele vést k pokusu o čtení nebo zápis z Paměť to není mapováno, spustí se a Porucha Segmentace nebo narušení přístupu do paměti. To se může projevit jako selhání programu nebo může být transformováno do softwaru výjimka které lze zachytit programovým kódem. Existují však určité okolnosti, kdy tomu tak není. Například v x86 skutečný režim, adresa 0000:0000 je čitelný a také obvykle zapisovatelný a dereferencování ukazatele na tuto adresu je naprosto platná, ale obvykle nežádoucí akce, která může vést k nedefinovanému, ale nehavarujícímu chování aplikace. Existují příležitosti, kdy dereferencování ukazatele na adresu nula je úmyslné a dobře definované; například, BIOS kód napsaný v C pro 16bitová zařízení x86 v reálném režimu může psát IDT na fyzické adrese 0 stroje dereferencí nulového ukazatele pro zápis. Je také možné, aby kompilátor optimalizoval dereference nulového ukazatele, čímž se vyhne poruše segmentace, ale způsobí další nežádoucí chování.

C ++

V C ++, zatímco NULA makro bylo zděděno z C, celočíselný literál pro nulu byl tradičně preferován, aby představoval konstantu nulového ukazatele.[5] Nicméně, C ++ 11 zavedla konstantu explicitního nulového ukazatele nullptr místo toho použít.

Jiné jazyky

V některých prostředích programovacího jazyka (například alespoň jedna proprietární implementace Lisp),[Citace je zapotřebí ] hodnota použitá jako nulový ukazatel (volaný nula v Lisp ) může být ve skutečnosti ukazatelem na blok interních dat užitečných pro implementaci (ale není explicitně dosažitelný z uživatelských programů), což umožňuje použít stejný registr jako užitečnou konstantu a rychlý způsob přístupu k interním implementacím. Toto je známé jako nula vektor.

V jazycích s a označená architektura, případně nulový ukazatel může být nahrazen a označená unie který vynucuje výslovné řešení výjimečného případu; ve skutečnosti lze na nulový ukazatel pohlížet jako na označený ukazatel s vypočítanou značkou.

Programovací jazyky používají různé literály pro nulový ukazatel. Například v Pythonu se volá nulová hodnota Žádný. v Pascal a Rychlý, je volán nulový ukazatel nula. v Eiffelova, nazývá se to prázdnota odkaz.

Nulové dereferencování

Protože nulový ukazatel neukazuje na smysluplný objekt, pokus o dereference (tj. přístup k datům uloženým v tomto paměťovém umístění) nulový ukazatel obvykle (ale ne vždy) způsobí chybu běhu nebo okamžité zhroucení programu.

  • V C je dereferencování nulového ukazatele nedefinované chování.[4] Mnoho implementací způsobí, že takový kód bude mít za následek zastavení programu s narušení přístupu, protože reprezentace nulového ukazatele je zvolena jako adresa, kterou systém nikdy nepřiděluje pro ukládání objektů. Toto chování však není univerzální. Rovněž to není zaručeno, protože překladačům je dovoleno optimalizovat programy za předpokladu, že nemají nedefinované chování.
  • V Delphi a mnoha dalších implementacích Pascalu konstanta nula představuje nulový ukazatel na první adresu v paměti, který se také používá k inicializaci spravovaných proměnných. Dereferencování vyvolává výjimku externího OS, která je mapována na instanci výjimky Pascal EAccessViolation, pokud je jednotka System.SysUtils propojena v klauzuli použití.
  • V Javě přístup k nulové referenci spouští a NullPointerException (NPE), které lze zachytit kódem pro zpracování chyb, ale upřednostňovaným postupem je zajistit, aby k těmto výjimkám nikdy nedošlo.
  • V .NET přístup k referenční hodnotě null vyvolá výjimku NullReferenceException k vyvolání. I když je jejich chytání obecně považováno za špatný postup, program může tento typ výjimky zachytit a zpracovat.
  • v Cíl-C, zprávy mohou být zasílány do a nula objekt (což je nulový ukazatel), aniž by došlo k přerušení programu; zpráva je jednoduše ignorována a návratová hodnota (pokud existuje) je nula nebo 0, v závislosti na typu.[6]
  • Před zavedením SMAP, chybu dereference nulového ukazatele lze využít mapováním Pagezero do útočníka adresní prostor a proto způsobí, že nulový ukazatel bude ukazovat na tuto oblast. To by mohlo vést k provádění kódu v některých případech.[7]

Zmírnění

Existují techniky, které usnadňují ladění dereferencí nulového ukazatele.[8][9] Bond a kol.[8] navrhnout úpravu JVM, aby bylo možné sledovat nulové šíření. Myšlenka systému Casper[9] je použít transformaci zdrojového kódu za účelem sledování tohoto šíření bez úpravy JVM. V některých případech je možné automaticky vygenerovat opravu pro opravu výjimek nulového ukazatele.[10]

Dějiny

V roce 2009 Tony Hoare (C.A.R. Hoare) uvedl[11]že v roce 1965 vynalezl nulový odkaz jako součást ALGOL W Jazyk. V tomto odkazu z roku 2009 popisuje Hoare svůj vynález jako „chybu v miliardách dolarů“:

Říkám tomu moje miliardová chyba. To byl vynález nulové reference v roce 1965. V té době jsem navrhoval první komplexní typový systém pro reference v objektově orientovaném jazyce (ALGOL W). Mým cílem bylo zajistit, aby veškeré použití odkazů mělo být absolutně bezpečné, přičemž kontrola bude prováděna automaticky kompilátorem. Ale nemohl jsem odolat pokušení uvést nulovou referenci, jednoduše proto, že to bylo tak snadné implementovat. To vedlo k nesčetným chybám, zranitelnostem a haváriím systému, které za posledních čtyřicet let pravděpodobně způsobily bolest a poškození miliardy dolarů.

Viz také

Reference

Citace

  1. ^ ISO / IEC 9899 bod 6.3.2.3 odst. 4.
  2. ^ ISO / IEC 9899, článek 7.17, odstavec 3: NULL ... který se rozšiřuje na konstantu nulového ukazatele definovanou implementací ...
  3. ^ ISO / IEC 9899 bod 6.3.2.3 odst.
  4. ^ A b ISO / IEC 9899, bod 6.5.3.2, odstavec 4, zejm. poznámka pod čarou 87.
  5. ^ Stroustrup, Bjarne (Březen 2001). „Kapitola 5:
    The konst Kvalifikátor (§5.4) zabraňuje náhodnému předefinování NULA a zajišťuje to NULA lze použít tam, kde je požadována konstanta. " Programovací jazyk C ++ (14. tisk 3. ed.). USA a Kanada: Addison – Wesley. p.88. ISBN  0-201-88954-4.
  6. ^ Programovací jazyk Objective-C 2.0, sekce „Odesílání zpráv na nulu“.
  7. ^ OS X použitelné jádro NULL dereference ukazatele v AppleGraphicsDeviceControl
  8. ^ A b Bond, Michael D .; Nethercote, Nicholas; Kent, Stephen W .; Guyer, Samuel Z .; McKinley, Kathryn S. (2007). „Sledování špatných jablek“: 405. doi:10.1145/1297027.1297057. Citovat deník vyžaduje | deník = (Pomoc)
  9. ^ A b Cornu, Benoit; Barr, Earl T .; Seinturier, Lionel; Monperrus, Martin (2016). „Casper: Automatické sledování nulových dereferencí k počátku se stopami kauzality“. Journal of Systems and Software. 122: 52–62. doi:10.1016 / j.jss.2016.08.062. ISSN  0164-1212.
  10. ^ Durieux, Thomas; Cornu, Benoit; Seinturier, Lionel; Monperrus, Martin (2017). "Dynamické generování záplat pro výjimky nulového ukazatele pomocí metaprogramování" (PDF). 24. mezinárodní konference IEEE 2017 o softwarové analýze, vývoji a reengineeringu (SANER). IEEE: 349–358. doi:10.1109 / SANER.2017.7884635. ISBN  978-1-5090-5501-2.
  11. ^ Tony Hoare (2009-08-25). „Null References: The Billion Dollar Mistake“. InfoQ.com.

Zdroje

  • Smíšená technická komise ISO / IEC JTC 1, subkomise SC 22, pracovní skupina WG 14 (08.09.2007). Mezinárodní norma ISO / IEC 9899 (PDF) (Návrh výboru).CS1 maint: více jmen: seznam autorů (odkaz)