Přemístění (výpočet) - Relocation (computing)

Přemístění je proces přiřazování zátěžových adres pro kód a data závislý na poloze programu a přizpůsobení kódu a dat tak, aby odrážely přiřazené adresy.[1][2] Před příchodem víceprocesorových systémů a stále v mnoha vestavěných systémech byly adresy objektů absolutní počínaje známým místem, často nulovým. Vzhledem k tomu, že se systémy s více procesy dynamicky propojují a přepínají mezi programy, bylo nutné umět přemístit objekty pomocí kód nezávislý na poloze.A linker obvykle provádí přemístění ve spojení s rozlišení symbolů, proces hledání souborů a knihoven za účelem nahrazení symbolických odkazů nebo názvů knihovny se skutečnými použitelnými adresami v Paměť před spuštěním programu.

Přemístění obvykle provádí linker na adrese čas propojení, ale lze to provést také na doba načítání přemístěním nakladač, nebo na doba běhu spuštěným programem sám. Některé architektury se přemístění zcela vyhnou odkladem přiřazení adresy doba běhu; toto je známé jako aritmetika nulové adresy.[který? ]

Segmentace

Soubory objektů jsou rozděleny na různé segment paměti typy. Příklad segmentů zahrnuje segment kódu (.text), inicializovaný datový segment (.data), neinicializovaný datový segment (.bss ) nebo další.[je zapotřebí objasnění ]

Tabulka přemístění

Tabulka přemístění je seznam ukazatele vytvořil překladatel (a překladač nebo assembler ) a uloženy v objektu nebo spustitelném souboru. Každá položka v tabulce, nebo „oprava“, je a ukazatel na absolutní adresu v kódu objektu, která musí být změněna, když zavaděč přemístí program tak, aby odkazoval na správné umístění. Opravy jsou navrženy tak, aby podporovaly přemístění programu jako kompletní jednotky. V některých případech je každá oprava v tabulce sama relativní k základní adrese nula, takže samotné opravy musí být změněny, když se zavaděč pohybuje tabulkou.[2]

V některých architekturách je oprava, která překračuje určité hranice (například hranici segmentu) nebo není zarovnána na hranici slova, nelegální a označuje ji jako chybu linker.[3]

DOS a 16bitové Windows

Daleko ukazatele (32-bit ukazatele s segment: offset, používá se k adresování 20bitových 640 KB Paměť místo k dispozici DOS programy ), které ukazují na kód nebo data v rámci a Spustitelný systém DOS (EXE ), nemají absolutní segmenty, protože skutečné adresa kódu / dat závisí na tom, kde je program načten do paměti, a to je známo až po načtení programu.

Místo toho jsou segmenty relativní hodnoty v souboru DOS EXE. Tyto segmenty je třeba opravit, když byl spustitelný soubor načten do paměti. EXE nakladač používá tabulku přemístění k vyhledání segmentů, které je třeba upravit.

32bitový systém Windows

U 32bitových operačních systémů Windows není povinné poskytovat tabulky EXE pro soubory EXE, protože jsou prvním obrazem načteným do virtuálního adresního prostoru, a proto budou načteny na jejich preferovanou základní adresu.

Pro DLL i pro EXE, které se přihlásí randomizace rozvržení adresního prostoru (ASLR) - an využívat mitigační technika zavedená v systému Windows Vista, přemisťovací tabulky se opět stávají povinnými kvůli možnosti, že binární soubor může být před spuštěním dynamicky přesunut, přestože jsou stále první věcí načtenou ve virtuálním adresovém prostoru.

64bitový systém Windows

Při spuštění nativních 64bitových binárních souborů ve Windows Vista a novějších je ASLR povinný[Citace je zapotřebí ], a tudíž kompilátor nemůže vynechat sekce přemístění.

Unixové systémy

The Spustitelný a propojitelný formát (ELF) spustitelný formát a formát sdílené knihovny používaný většinou systémů podobných systému Unix umožňuje definovat několik typů přemístění.[4]

Postup přemístění

Linker čte informace o segmentech a tabulky přemístění v souborech objektů a provádí přemístění pomocí:

  • sloučení všech segmentů společného typu do jednoho segmentu tohoto typu
  • přiřazení jedinečných adres za běhu každé sekci a každému symbolu, což dává všem kódům (funkcím) a datům (globální proměnné) jedinečné adresy za běhu
  • s odkazem na přemístění tabulky pozměnit[proč? ] symboly tak, aby ukazovaly na správné[je zapotřebí objasnění ] adresy za běhu.

Příklad

Následující příklad používá Donald Knuth je SMĚS architektura a montážní jazyk MIXAL. Principy jsou stejné pro jakoukoli architekturu, i když se podrobnosti změní.

Příklad přemístění.tif
  • (Program SUBR je sestaven tak, aby vytvořil soubor objektu (B), zobrazený jako strojový kód i jako assembler. Kompilátor může spustit kompilovaný kód na libovolném místě, často na místě 1, jak je znázorněno. Umístění 13 obsahuje strojový kód instrukce skoku na příkaz SVATÝ v lokalitě 5.
  • (C) Pokud SUBR je později propojen s jiným kódem, může být uložen na jiném místě než 1. V tomto příkladu jej linker umístí na místo 120. Adresa v instrukci skoku, která je nyní na místě 133, musí být přemístěn přejděte na nové umístění kódu pro výpis SVATÝ, nyní 125. [1 61 zobrazený v instrukci je MIX strojový kód reprezentace 125].
  • (D) Když je program načten do paměti ke spuštění, může být načten na jiném místě, než které je přiřazeno linkerem. Tento příklad ukazuje SUBR nyní na místě 300. Adresa v instrukci skoku, nyní na 313, musí být znovu přemístěna, aby ukazovala na aktualizované umístění SVATÝ, 305. [4 49 je reprezentace stroje MIX 305].

Viz také

Reference

  1. ^ "Typy objektového kódu". Referenční příručka pro zavaděč aplikací iRMX 86 (PDF). Intel. str. 1-2, 1-3. Archivováno (PDF) od původního dne 2020-01-11. Citováno 2020-01-11. […] Absolutní kód, a modul absolutního objektu, je kód, který byl zpracován LOC86 tak, aby běžel pouze na určitém místě v paměti. The Nakladač načte modul absolutního objektu pouze do konkrétního umístění, které musí modul obsadit. Kód nezávislý na poloze (běžně označovaný jako PIC) se liší od absolutního kódu v tom, že PIC lze načíst do libovolného paměťového místa. Výhodou PIC oproti absolutnímu kódu je, že PIC nevyžaduje, abyste si rezervovali konkrétní blok paměti. Když zavaděč načte PIC, získá iRMX 86 segmenty paměti z fondu úlohy volajícího úkolu a načte PIC do segmentů. Omezení týkající se PIC spočívá v tom, že stejně jako v EU PL / M-86 KOMPAKTNÍ model segmentace […], může mít pouze jeden segment kódu a jeden segment dat, místo aby se základní adresy těchto segmentů, a tedy i samotné segmenty, dynamicky lišily. To znamená, že programy PIC jsou nutně kratší než 64 kB bajtů. PIC kód lze vytvořit pomocí BIND řízení LINK86. Lokalizovatelný kód načítání (běžně označovaný jako LTL kód) je třetí forma objektového kódu. Kód LTL je podobný PIC, protože kód LTL lze načíst kdekoli v paměti. Při načítání kódu LTL však zavaděč změní základní část ukazatelů tak, aby ukazatele byly nezávislé na počátečním obsahu registrů v mikroprocesoru. Z důvodu této opravy (úpravy základních adres) lze kód LTL použít u úkolů, které mají více než jeden segment kódu nebo více než jeden datový segment. To znamená, že programy LTL mohou mít délku více než 64 kB. FORTRAN 86 a Pascal 86 automaticky vytváří kód LTL, a to i pro krátké programy. LTL kód může být vytvořen pomocí BIND ovládání LINK86. […]
  2. ^ A b Levine, John R. (2000) [říjen 1999]. "Kapitola 1: Propojování a načítání a Kapitola 3: Soubory objektů". Linkery a nakladače. Řada Morgan Kaufmann v softwarovém inženýrství a programování (1. vyd.). San Francisco, USA: Morgan Kaufmann. p. 5. ISBN  1-55860-496-0. OCLC  42413382. Archivováno z původního dne 2012-12-05. Citováno 2020-01-12. Kód: [1][2] Errata: [3]
  3. ^ Borland (1999-09-01) [1998-07-02]. „Borland article # 15961: Coping with 'Fixup Overflow' messages". community.borland.com. Databáze technických informací - produkt: Borland C ++ 3.1. TI961C.txt # 15961. Archivováno z původního dne 2008-07-07. Citováno 2007-01-15.
  4. ^ „Spustitelný a spojitelný formát (ELF)“ (PDF). skyfree.org. Standardy rozhraní nástrojů (TIS) Specifikace přenosných formátů, verze 1.1. Archivováno (PDF) z původního dne 2019-12-24. Citováno 2018-10-01.

Další čtení