Společný střední jazyk - Common Intermediate Language

Společný střední jazyk (CIL), dříve nazývaný Microsoft Intermediate Language (MSIL) nebo Střední jazyk (IL),[1] je střední jazyk binární instrukční sada definovaná v Společná jazyková infrastruktura (CLI) specifikace.[2] Pokyny CIL jsou spouštěny runtime prostředím kompatibilním s CLI, jako je Common Language Runtime. Jazyky, které cílí na CLI, se kompilují na CIL. CIL je objektově orientovaný, založeno na zásobníku bytecode. Obvykle runtime právě včas zkompilovat pokyny CIL do nativní kód.

CIL byl původně znám jako Microsoft Intermediate Language (MSIL) během beta verzí jazyků .NET. Kvůli standardizaci C# a CLI je bytecode nyní oficiálně známý jako CIL.[3] Windows Defender definice virů nadále odkazují na binární soubory kompilované s ním jako MSIL.[4]

Obecná informace

Během kompilace Programovací jazyky CLI, zdrojový kód je přeložen do kódu CIL, nikoli do specifického pro platformu nebo procesor kód objektu. CIL je a procesor - a instrukční sada nezávislá na platformě, kterou lze provádět v jakémkoli prostředí podporujícím infrastrukturu společného jazyka, jako je .NET runtime na Okna, nebo napříč platformami Mono runtime. Teoreticky to eliminuje potřebu distribuovat různé spustitelné soubory pro různé platformy a typy CPU. CIL kód je ověřen z hlediska bezpečnosti za běhu a poskytuje lepší zabezpečení a spolehlivost než nativně kompilované spustitelné soubory.[5][6]

Proces provedení vypadá takto:

  1. Zdrojový kód je převeden na CIL bytecode a a Sestava CLI je vytvořen.
  2. Po provedení sestavy CIL je její kód předán modulem runtime Překladač JIT generovat nativní kód. Lze také použít předběžnou kompilaci, která tento krok eliminuje, ale za cenu přenositelnosti spustitelného souboru.
  3. Procesor počítače provede nativní kód.

Instrukce

Bajtový kód CIL má instrukce pro následující skupiny úkolů:

Výpočtový model

Společný intermediální jazyk je objektově orientovaný a založeno na zásobníku, což znamená, že parametry a výsledky instrukcí jsou uchovávány na jednom zásobníku místo v několika registrech nebo jiných paměťových místech, jako ve většině programovací jazyky.

Kód, který přidá dvě čísla dovnitř x86 assembler, kde eax a edx specifikují dva různé univerzální registry:

přidat eax, edx

Mohl v střední jazyk (IL) vypadají takto, kde 0 je eax a 1 je edx:

ldloc.0    // vloží lokální proměnnou 0 do zásobníkuldloc.1    // vloží lokální proměnnou 1 do zásobníkupřidat        // vyskočí a přidá dvě horní položky zásobníku a poté posune výsledek do zásobníkustloc.0    // vyskočí a uloží položku nejvyššího zásobníku do místní proměnné 0

V druhém příkladu jsou hodnoty dvou registrů, eax a edx, nejprve vloženy do zásobníku. Když se zavolá add-instrukce, operandy se „vyskočí“ nebo načtou a výsledek se „posune“ nebo uloží do zásobníku. Výsledná hodnota se poté vysune ze zásobníku a uloží se do eax.

Objektově orientované koncepty

CIL je navržen tak, aby byl objektově orientovaný. Můžete vytvářet objekty, volat metody a používat jiné typy členů, například pole.

Každý metoda potřebuje (až na některé výjimky) pobývat ve třídě. Stejně tak tato statická metoda:

.třída veřejnost Foo {    .metoda veřejnost statický int32 Přidat(int32, int32) cil podařilo se {        .maxstack 2        ldarg.0 // načíst první argument;        ldarg.1 // načíst druhý argument;        přidat     // přidat je;        ret     // vrátit výsledek;    }}

Metoda Foo nevyžaduje deklaraci žádné instance Foo, protože je deklarována jako statická a poté ji lze v C # použít takto:

int r = Foo.Přidat(2, 3);    // 5

V CIL by to vypadalo takto:

ldc.i4.2ldc.i4.3volání int32 Foo::Přidat(int32, int32)stloc.0

Třídy instancí

Třída instance obsahuje alespoň jednu konstruktor a nějaký instance členů. Následující třída obsahuje sadu metod představujících akce Car-objektu.

.třída veřejnost Auto {    .metoda veřejnost speciální jméno rtspecialname instance prázdnota .ctor(int32, int32) cil podařilo se {        / * Konstruktor * /    }    .metoda veřejnost prázdnota Hýbat se(int32) cil podařilo se { / * Vynechání implementace * / }    .metoda veřejnost prázdnota Odbočit vpravo() cil podařilo se { / * Vynechání implementace * / }    .metoda veřejnost prázdnota Odbočit vlevo() cil podařilo se { / * Vynechání implementace * / }    .metoda veřejnost prázdnota Brzda() cil podařilo se { / * Vynechání implementace * / }}

Vytváření objektů

V instancích třídy C # se vytvářejí takto:

Auto moje auto = Nový Auto(1, 4); Auto tvé auto = Nový Auto(1, 3);

A tyto výroky jsou zhruba stejné jako tyto pokyny v CIL:

ldc.i4.1ldc.i4.4newobj instance prázdnota Auto::.ctor(int, int)stloc.0    // myCar = nové auto (1, 4);ldc.i4.1ldc.i4.3newobj instance prázdnota Auto::.ctor(int, int)stloc.1    // yourCar = new Car (1, 3);

Vyvolání instančních metod

Metody instance jsou vyvolány v C # jako následující:

moje auto.Hýbat se(3);

Jak bylo vyvoláno v CIL:

ldloc.0    // Načte objekt „myCar“ do zásobníkuldc.i4.3volání instance prázdnota Auto::Hýbat se(int32)

Metadata

The Společná jazyková infrastruktura (CLI) zaznamenává informace o kompilovaných třídách jako metadata. Stejně jako knihovna typů v Komponentní objektový model To umožňuje aplikacím podporovat a objevovat rozhraní, třídy, typy, metody a pole v sestavení. Proces čtení takových metadat se nazývá „odraz ".

Metadata mohou být data ve formě „atributů“. Atributy lze přizpůsobit rozšířením Atribut třída. Toto je výkonná funkce. Umožňuje tvůrci třídy možnost zdobit ji dalšími informacemi, které mohou spotřebitelé třídy používat různými smysluplnými způsoby, v závislosti na doméně aplikace.

Příklad

Níže je základní Ahoj světe program napsaný v CIL. Zobrazí řetězec „Hello, world!“.

.shromáždění Ahoj {}.shromáždění externí mscorlib {}.metoda statický prázdnota Hlavní(){    .Vstupní bod    .maxstack 1    ldstr "Ahoj světe!"    volání prázdnota [mscorlib]Systém.Řídicí panel::WriteLine(tětiva)    ret}

Následující kód je složitější v počtu operačních kódů.

Tento kód lze také porovnat s odpovídajícím kódem v článku o Bajtový kód Java.

statický prázdnota Hlavní(tětiva[] args){    pro (int i = 2; i < 1000; i++)    {        pro (int j = 2; j < i; j++)        {             -li (i % j == 0)                 jít do vnější;        }        Řídicí panel.WriteLine(i);        vnější:;    }}

V syntaxi CIL to vypadá takto:

.metoda soukromé hidebysig statický prázdnota Hlavní(tětiva[] args) cil podařilo se{    .Vstupní bod    .maxstack  2    .místní obyvatelé inic (int32 V_0,                  int32 V_1)              ldc.i4.2              stloc.0              br.s       IL_001f    IL_0004:  ldc.i4.2              stloc.1              br.s       IL_0011    IL_0008:  ldloc.0              ldloc.1              rem              brfalse.s  IL_001b              ldloc.1              ldc.i4.1              přidat              stloc.1    IL_0011:  ldloc.1              ldloc.0              blt.s      IL_0008              ldloc.0              volání       prázdnota [mscorlib]Systém.Řídicí panel::WriteLine(int32)    IL_001b:  ldloc.0              ldc.i4.1              přidat              stloc.0    IL_001f:  ldloc.0              ldc.i4     0x3e8              blt.s      IL_0004              ret}

Toto je jen reprezentace toho, jak CIL vypadá poblíž virtuální stroj (VM) na úrovni. Při kompilaci jsou metody uloženy v tabulkách a pokyny jsou uloženy jako bajty uvnitř sestavení, což je a Přenosný spustitelný soubor (PE).

Generace

Sestava CIL a pokyny jsou generovány kompilátorem nebo obslužným programem s názvem IL Assembler (ILAsm ), který je dodáván s prováděcím prostředím.

Sestavenou CIL lze také znovu rozložit na kód pomocí IL Disassembler (ILDASM). Existují i ​​další nástroje jako např .NET Reflector které mohou CIL dekompilovat do jazyka vysoké úrovně (např. C # nebo Visual Basic ). Díky tomu je CIL velmi snadným cílem pro reverzní inženýrství. Tato vlastnost je sdílena s Bajtový kód Java. Existují však nástroje, které mohou poplést kód a udělejte to tak, aby kód nemohl být snadno čitelný, ale aby byl stále spustitelný.

Provedení

Just-in-time kompilace

Just-in-time kompilace (JIT) zahrnuje přeměnu bajtového kódu na kód okamžitě spustitelný procesorem. Převod se provádí postupně během provádění programu. Kompilace JIT poskytuje specifickou optimalizaci prostředí, běhové prostředí bezpečnost typu a ověření sestavy. Aby toho bylo možné dosáhnout, kompilátor JIT prozkoumá metadata sestavení pro všechny nelegální přístupy a náležitě zpracovává porušení.

Předběžná kompilace

CLI -kompatibilní spouštěcí prostředí také přicházejí s možností udělat Předběžná kompilace (AOT) sestavy, aby se provedla rychleji odstraněním procesu JIT za běhu.

V .NET Framework existuje speciální nástroj zvaný Nativní generátor obrázků (NGEN), který provádí AOT. Jiný přístup pro AOT je CoreRT který umožňuje kompilaci kódu .Net Core do jednoho spustitelného souboru bez závislosti na běhovém prostředí. v Mono existuje také možnost udělat AOT.

Pokyny pro ukazatel - C ++ / CLI

Pozoruhodný rozdíl od bytecode v Javě je ten, že CIL přichází s ldind, stind, ldloca a mnoha instrukcemi volání, které jsou dostatečné pro manipulaci s ukazateli dat / funkcí potřebnými pro kompilaci kódu C / C ++ do CIL.

třída A {   veřejnost: virtuální prázdnota __stdcall pervitin() {}};prázdnota test_pointer_operations(int param) {	int k = 0;	int * ptr = &k;	*ptr = 1;	ptr = &param;	*ptr = 2;	A A;	A * ptra = &A;	ptra->pervitin();}

Odpovídající kód v CIL lze vykreslit takto:

.metoda shromáždění statický prázdnota modopt([mscorlib]Systém.Runtime.CompilerServices.CallConvCdecl)         test_pointer_operations(int32 param) cil podařilo se{  .vtentry 1 : 1  // Velikost kódu 44 (0x2c)  .maxstack  2  .místní obyvatelé ([0] int32* ptr,           [1] typ hodnoty A* V_1,           [2] typ hodnoty A* A,           [3] int32 k)// k = 0;  IL_0000:  ldc.i4.0   IL_0001:  stloc.3// ptr = & k;  IL_0002:  ldloca.s   k // načte instrukci místní adresy  IL_0004:  stloc.0// * ptr = 1;  IL_0005:  ldloc.0  IL_0006:  ldc.i4.1  IL_0007:  stind.i4 // instrukce k indikaci// ptr = & param  IL_0008:  ldarga.s   param // instrukce k načtení parametru adresy  IL_000a:  stloc.0// * ptr = 2  IL_000b:  ldloc.0  IL_000c:  ldc.i4.2  IL_000d:  stind.i4// a = new A;  IL_000e:  ldloca.s   A  IL_0010:  volání       typ hodnoty A* modopt([mscorlib]Systém.Runtime.CompilerServices.CallConvThiscall) 'A.{ctor}'(typ hodnoty A* modopt([mscorlib]Systém.Runtime.CompilerServices.IsConst) modopt([mscorlib]Systém.Runtime.CompilerServices.IsConst))  IL_0015:  pop// ptra = & a;  IL_0016:  ldloca.s   A  IL_0018:  stloc.1// ptra-> meth ();  IL_0019:  ldloc.1  IL_001a:  dup  IL_001b:  lindind.i4 // čtení VMT pro virtuální volání  IL_001c:  lindind.i4  IL_001d:  calli      neřízený stdcall prázdnota modopt([mscorlib]Systém.Runtime.CompilerServices.CallConvStdcall)(rodák int)  IL_0022:  ret} // konec metody 'Globální funkce' :: test_pointer_operations

Viz také

Reference

  1. ^ „Intermediate Language & execution“.
  2. ^ „Common Language Infrastructure (CLI)“ ECMA-335 (PDF). p. 32.
  3. ^ „Co je to Intermediate Language (IL) / MSIL / CIL v .NET“. Citováno 2011-02-17. CIL: ... Když sestavujeme [a]. NET projekt, není [přímo] převeden přímo na binární kód, ale do intermediálního jazyka. Při spuštění projektu se každý jazyk programování .NET převede na binární kód do CIL. Do binárního kódu je převedena pouze část CIL, která je vyžadována za běhu. DLL a EXE .NET jsou také ve formě CIL.
  4. ^ „HackTool: MSIL / SkypeCracker“. Microsoft. Citováno 26. listopadu 2019.
  5. ^ Troelsen, Andrew (02.05.2009). Výhody CIL. ISBN  9781590598849. Citováno 2011-02-17.
  6. ^ „Unmanaged, Managed Extensions for C ++, Managed and .Net Framework“. www.visualcplusdotnet.com. Citováno 2020-07-07.

externí odkazy