Procesor digitálního signálu - Digital signal processor

A TMS320 čip procesoru digitálního signálu nalezený v a jednotka kytarových efektů. A krystalový oscilátor může být vidět výše.

A procesor digitálního signálu (DSP) je specializovaný mikroprocesor čip s architekturou optimalizovanou pro provozní potřeby zpracování digitálních signálů.[1][2] DSP jsou vymyslel na Integrovaný obvod MOS bramborové hranolky.[3][4] Jsou široce používány v zpracování audio signálu, telekomunikace, digitální zpracování obrazu, radar, sonar a rozpoznávání řeči systémy a společné spotřební elektronika zařízení jako mobilní telefony, diskové jednotky a televize s vysokým rozlišením (HDTV).[3]

Cílem DSP je obvykle měřit, filtrovat nebo komprimovat souvislý reálný svět analogové signály. Většina univerzálních mikroprocesorů může také úspěšně provádět algoritmy zpracování digitálního signálu, ale nemusí být schopna držet krok s takovým zpracováním nepřetržitě v reálném čase. Také vyhrazené DSP mají obvykle lepší energetickou účinnost, takže jsou vhodnější pro přenosná zařízení, jako jsou mobilní telefony z důvodu omezení spotřeby energie.[5] DSP často používají speciální paměťové architektury kteří jsou schopni načíst více dat nebo pokynů najednou. DSP se často také implementují komprese dat technologie s diskrétní kosinová transformace (DCT) je zejména široce používanou kompresní technologií v DSP.

Přehled

Typický systém digitálního zpracování

Zpracování digitálních signálů algoritmy obvykle vyžaduje rychlé a opakované provedení velkého počtu matematických operací na sérii vzorků dat. Signály (možná ze zvukových nebo obrazových senzorů) se neustále převádějí z analogových na digitální, digitálně se s nimi manipuluje a poté se převádějí zpět do analogové podoby. Mnoho aplikací DSP má omezení latence; to znamená, aby systém fungoval, musí být operace DSP dokončena do určité pevné doby a odložené (nebo dávkové) zpracování není životaschopné.

Většina univerzálních mikroprocesorů a operačních systémů dokáže úspěšně spouštět algoritmy DSP, ale nejsou vhodné pro použití v přenosných zařízeních, jako jsou mobilní telefony a PDA, z důvodu omezení energetické účinnosti.[5] Specializovaný DSP však bude mít tendenci poskytovat levnější řešení s lepším výkonem, nižší latencí a bez požadavků na specializované chlazení nebo velké baterie.[Citace je zapotřebí ]

Tato vylepšení výkonu vedla k zavedení digitálního zpracování signálu v komerčním prostředí komunikační satelity kde jsou stovky nebo dokonce tisíce analogových filtrů, přepínačů, frekvenčních měničů atd. vyžadovány pro příjem a zpracování uplinked signály a připravte je na downlinking a lze je nahradit specializovanými DSP s významnými výhodami pro hmotnost satelitů, spotřebu energie, složitost / náklady na konstrukci, spolehlivost a flexibilitu provozu. Například satelity SES-12 a SES-14 od operátora SES spuštěno v roce 2018, byly postaveny společností Airbus Defence and Space s 25% kapacity využívající DSP.[6]

Architektura DSP je optimalizována speciálně pro digitální zpracování signálu. Většina také podporuje některé funkce jako aplikační procesor nebo mikrokontrolér, protože zpracování signálu je zřídka jediným úkolem systému. Níže jsou uvedeny některé užitečné funkce pro optimalizaci DSP algoritmů.

Architektura

Softwarová architektura

Podle standardů univerzálních procesorů jsou sady instrukcí DSP často velmi nepravidelné; zatímco tradiční sady instrukcí jsou tvořeny obecnějšími instrukcemi, které jim umožňují provádět širší škálu operací, sady instrukcí optimalizované pro digitální zpracování signálu obsahují instrukce pro běžné matematické operace, které se ve výpočtech DSP vyskytují často. Tradiční i instrukční sady optimalizované pro DSP jsou schopné vypočítat libovolnou operaci, ale operace, která k výpočtu může vyžadovat více instrukcí ARM nebo x86, může vyžadovat pouze jednu instrukci v instrukční sadě optimalizované pro DSP.

Jedním z důsledků softwarové architektury je optimalizace ručně montážní kód rutiny (montážní programy) se běžně balí do knihoven pro opakované použití, místo aby se při zpracování základních algoritmů spoléhaly na pokročilé technologie kompilátorů. I s moderními optimalizacemi kompilátorů je ručně optimalizovaný kód sestavy efektivnější a mnoho běžných algoritmů zahrnutých do výpočtů DSP je psáno ručně, aby bylo možné plně využít architektonické optimalizace.

Sady instrukcí

Pokyny k údajům

  • Aritmetika sytosti, ve kterém se operace, které produkují přetečení, budou hromadit na maximálních (nebo minimálních) hodnotách, které registr může pojmout, místo aby se omotal (maximum + 1 nepřetéká na minimum jako v mnoha univerzálních CPU, místo toho zůstává na maximu) . Někdy jsou k dispozici různé provozní režimy lepivých bitů.
  • Aritmetika s pevným bodem se často používá k urychlení aritmetického zpracování
  • Jednocyklové operace ke zvýšení výhod potrubí

Průběh programu

Hardwarová architektura

Ve strojírenství se hardwarová architektura týká identifikace fyzických komponent systému a jejich vzájemných vztahů. Tento popis, často nazývaný model návrhu hardwaru, umožňuje návrhářům hardwaru pochopit, jak jejich komponenty zapadají do architektury systému, a poskytuje návrhářům softwarových komponent důležité informace potřebné pro vývoj a integraci softwaru. Jasná definice hardwarové architektury umožňuje různým tradičním inženýrským oborům (např. Elektrotechnice a strojírenství) efektivněji spolupracovat na vývoji a výrobě nových strojů, zařízení a komponent.

Hardware je také výraz používaný v odvětví počítačového inženýrství k výslovnému rozlišení hardwaru (elektronického počítače) od softwaru, který na něm běží. Hardware v rámci oborů automatizace a softwarového inženýrství však nemusí být prostě jen nějakým počítačem. Moderní automobil provozuje mnohem více softwaru než kosmická loď Apollo. Moderní letadla také nemohou fungovat bez spuštění desítek milionů počítačových pokynů zabudovaných a distribuovaných po celém letadle a umístěných jak ve standardním počítačovém hardwaru, tak ve specializovaných hardwarových komponentách, jako jsou logické brány IC, analogová a hybridní zařízení a další digitální komponenty. Potřeba efektivně modelovat, jak se jednotlivé fyzické součásti kombinují do komplexních systémů, je důležitá pro širokou škálu aplikací, včetně počítačů, osobních digitálních asistentů (PDA), mobilních telefonů, chirurgických přístrojů, satelitů a ponorek.

Architektura paměti

DSP jsou obvykle optimalizovány pro streamování dat a používají speciální architektury paměti, které jsou schopny načítat více dat nebo instrukcí najednou, například Harvardská architektura nebo změněno von Neumannova architektura, které používají oddělené programové a datové paměti (někdy dokonce souběžný přístup na více datových sběrnicích).

DSP se někdy mohou spoléhat na podporu kódu, aby věděli o hierarchiích mezipaměti a souvisejících zpožděních. Toto je kompromis, který umožňuje lepší výkon[je zapotřebí objasnění ]. Kromě toho rozsáhlé používání DMA je zaměstnán.

Adresování a virtuální paměť

DSP často používají víceúčelové operační systémy, ale nemají žádnou podporu virtuální paměť nebo ochrana paměti. Operační systémy, které používají virtuální paměť, vyžadují více času přepínání kontextu mezi procesy, což zvyšuje latenci.

Dějiny

Pozadí

Před příchodem samostatného procesoru digitálního signálu (DSP) bramborové hranolky, brzy zpracování digitálních signálů aplikace byly obvykle implementovány pomocí kousek řezu bramborové hranolky. The AMD 2901 bit-slice chip s jeho rodinou komponent byl velmi populární volbou. Existovaly referenční návrhy od AMD, ale velmi často specifika konkrétního designu byla specifická pro konkrétní aplikaci. Tyto architektury bitových řezů by někdy obsahovaly periferní multiplikační čip. Příkladem těchto multiplikátorů byla série z TRW včetně TDC1008 a TDC1010, z nichž některé zahrnovaly akumulátor, který poskytuje potřebné náležitosti znásobit – hromadit (MAC).

Elektronický zpracování signálu byla v 70. letech revolucí díky širokému přijetí MOSFET (kov-oxid-polovodičový tranzistor s efektem pole nebo MOS tranzistor),[15] Integrovaný obvod MOS technologie byla základem pro první jednočip mikroprocesory a mikrokontroléry na začátku 70. let,[16] a poté první jednočipové DSP na konci 70. let.[3][4]

Dalším důležitým vývojem v digitálním zpracování signálu byl komprese dat. Lineární prediktivní kódování (LPC) byl poprvé vyvinut společností Fumitada Itakura z Nagojská univerzita a Shuzo Saito z Nippon telegraf a telefon (NTT) v roce 1966 a poté jej dále rozvinul Bishnu S.Atal a Manfred R. Schroeder na Bell Labs během počátku 70. let a stal se základem pro první syntetizátor řeči DSP čipy na konci 70. let.[17] The diskrétní kosinová transformace (DCT) poprvé navrhl Nasir Ahmed na začátku 70. let a od té doby se široce implementuje v čipech DSP, přičemž mnoho společností vyvíjí čipy DSP založené na technologii DCT. DCT jsou široce používány pro kódování dekódování, kódování videa, zvukové kódování, multiplexování, řídicí signály, signalizace, analogově-digitální převod, formátování jas a barevné rozdíly a barevné formáty jako YUV444 a YUV411. DCT se také používají pro operace kódování, jako je odhad pohybu, kompenzace pohybu, mezi snímky předpověď, kvantování, percepční vážení, kódování entropie, variabilní kódování a pohybové vektory a dekódovací operace, jako je inverzní operace mezi různými barevnými formáty (YIQ, YUV a RGB ) pro účely zobrazení. DCT se také běžně používají pro televize s vysokým rozlišením (HDTV) čipy dekodéru / dekodéru.[18]

Rozvoj

V roce 1976 navrhl Richard Wiggins Mluv a kouzlo koncept pro Paula Breedlove, Larryho Brantinghama a Gene Frantze v Texas Instruments „Dallasské výzkumné zařízení. O dva roky později, v roce 1978, vyrobili první Speak & Spell, přičemž technologickým vrcholem bylo TMS5100,[19] první procesor digitálního signálu na trhu. Stanovil také další milníky a byl prvním čipem, který k provádění použil lineární prediktivní kódování syntéza řeči.[20] Čip byl umožněn pomocí 7 µm PMOS výrobní proces.[21]

V roce 1978 Americké mikrosystémy (AMI) vydala S2811.[3][4] „Periferní zařízení pro zpracování signálu“ AMI S2811, stejně jako mnoho dalších DSP, má hardwarový multiplikátor, který mu umožňuje operace násobení – akumulace v jedné instrukci.[22] S2281 byl první integrovaný obvod čip speciálně navržený jako DSP a vyrobený pomocí VMOS (V-groove MOS), technologie, která dříve nebyla hromadně vyráběna.[4] Byl navržen jako periferní mikroprocesor pro Motorola 6800,[3] a musel být inicializován hostitelem. Model S2811 nebyl na trhu úspěšný.

V roce 1979 Intel vydal 2920 jako „procesor analogového signálu“.[23] Měla na čipu ADC / DAC s interním signálním procesorem, ale neměla hardwarový multiplikátor a nebyla na trhu úspěšná.

V roce 1980, první samostatné, kompletní DSP - Nippon Electric Corporation je NEC uPD7720 a AT&T je DSP1 - byly představeny na Mezinárodní konference o polovodičových obvodech '80. Oba procesory se inspirovaly výzkumem v veřejná komutovaná telefonní síť (PSTN) telekomunikace. ΜPD7720 zavedený pro hlasové pásmo aplikací, byl jedním z komerčně nejúspěšnějších raných DSP.[3]

Altamira DX-1 byl další časný DSP, využívající čtyřčíselné potrubí se zpožděnými větvemi a predikcí větví.[Citace je zapotřebí ]

Další DSP produkovaný společností Texas Instruments (TI), TMS32010 představený v roce 1983, se ukázal jako ještě větší úspěch. Byl založen na harvardské architektuře, a proto měl samostatnou instrukční a datovou paměť. Už to mělo speciální instrukční sadu s instrukcemi jako načítání a akumulace nebo násobení a akumulace. Mohlo to fungovat na 16bitových číslech a pro operaci vícenásobného přidání bylo potřeba 390 ns. TI je nyní lídrem na trhu s univerzálními DSP.

Asi o pět let později se začala šířit druhá generace DSP. Měli 3 paměti pro současné ukládání dvou operandů a zahrnovali hardware pro zrychlení těsné smyčky; měli také adresovací jednotku schopnou adresování smyčky. Některé z nich fungovaly na 24bitových proměnných a typický model vyžadoval pro MAC pouze asi 21 ns. Členy této generace byli například AT&T DSP16A nebo Motorola 56000.

Hlavním vylepšením třetí generace byl vzhled jednotek a pokynů specifických pro aplikaci v datové cestě nebo někdy jako koprocesory. Tyto jednotky umožňovaly přímé hardwarové zrychlení velmi specifických, ale složitých matematických problémů, jako jsou Fourierova transformace nebo maticové operace. Některé čipy, například Motorola MC68356, dokonce obsahovaly více než jedno jádro procesoru, které fungovalo paralelně. Další DSP od roku 1995 jsou TI TMS320C541 nebo TMS 320C80.

Čtvrtá generace je nejlépe charakterizována změnami v instrukční sadě a kódování / dekódování instrukce. Byly přidány rozšíření SIMD a objevila se VLIW a superskalární architektura. Rychlost hodin se jako vždy zvýšila; a 3 ns MAC je nyní možné.

Moderní DSP

Moderní procesory signálu poskytují vyšší výkon; je to částečně způsobeno technologickým i architektonickým pokrokem, jako jsou nižší pravidla návrhu, rychlá přístupová dvouúrovňová mezipaměť, (E)DMA obvody a širší sběrnicový systém. Ne všechny DSP poskytují stejnou rychlost a existuje mnoho druhů signálových procesorů, každý z nich je vhodnější pro konkrétní úkol, v ceně od přibližně 1,50 USD do 300 USD.

Texas Instruments vyrábí C6000 řady DSP, které mají taktovací frekvenci 1,2 GHz a implementují samostatné instrukční a datové mezipaměti. Mají také 8 mezipaměti 2. úrovně MiB a 64 kanálů EDMA. Špičkové modely jsou schopné až 8000 MIPS (miliony pokynů za sekundu ), použijte VLIW (velmi dlouhé instrukční slovo ), provádějí osm operací za takt a jsou kompatibilní s celou řadou externích periferních zařízení a různých sběrnic (PCI / sériové / atd.). Čipy TMS320C6474 mají každý tři takové DSP a čipy nejnovější generace C6000 podporují plovoucí desetinnou čárku i zpracování s pevnou čárkou.

Freescale produkuje vícejádrovou rodinu DSP, MSC81xx. MSC81xx je založen na procesorech StarCore Architecture a nejnovější MSC8144 DSP kombinuje čtyři programovatelná jádra SC3400 StarCore DSP. Každé jádro SC3400 StarCore DSP má taktovací frekvenci 1 GHz.

XMOS produkuje vícejádrové vícevláknové řady procesorů vhodných pro operace DSP. Přicházejí v různých rychlostech od 400 do 1600 MIPS. Procesory mají vícevláknovou architekturu, která umožňuje až 8 vláken v reálném čase na jádro, což znamená, že čtyřjádrové zařízení by podporovalo až 32 vláken v reálném čase. Vlákna mezi sebou komunikují s vyrovnávacími kanály, které jsou schopné až 80 Mbit / s. Zařízení jsou snadno programovatelná v C a jejich cílem je překlenout propast mezi konvenčními mikrořadiči a FPGA

CEVA, Inc. vyrábí a licencuje tři odlišné rodiny procesorů DSP. Snad nejznámější a nejrozšířenější je rodina CEVA-TeakLite DSP, klasická architektura založená na paměti, s 16bitovou nebo 32bitovou šířkou slova a jednoduchou nebo duální MAC. Rodina CEVA-X DSP nabízí kombinaci architektur VLIW a SIMD, přičemž různí členové rodiny nabízejí duální nebo čtyřnásobné 16bitové MAC. Cíle rodiny CEVA-XC DSP Softwarově definované rádio (SDR) modem navrhuje a využívá jedinečnou kombinaci architektur VLIW a Vector s 32 16bitovými MAC.

Analogová zařízení vyrábět SHARC - založené na DSP a rozsahu výkonu od 66 MHz / 198 MFLOPS (milion operací s plovoucí desetinnou čárkou za sekundu) na 400 MHz / 2400 MFLOPS. Některé modely podporují více multiplikátory a ALU, SIMD pokyny a komponenty a periferní zařízení specifické pro zpracování zvuku. The Blackfin rodina integrovaných procesorů digitálních signálů kombinuje vlastnosti DSP s těmi procesorů pro všeobecné použití. Ve výsledku mohou tyto procesory běžet jednoduše operační systémy jako μCLinux, rychlost a Nucleus RTOS při provozu na datech v reálném čase.

NXP Semiconductors vyrábět DSP založené na TriMedia VLIW technologie optimalizovaná pro zpracování zvuku a videa. U některých produktů je jádro DSP skryto jako blok s pevnou funkcí do a SoC, ale NXP také poskytuje řadu flexibilních jednojádrových mediálních procesorů. Mediální procesory TriMedia podporují obojí aritmetika s pevným bodem stejně jako aritmetika s plovoucí desetinnou čárkou a mít konkrétní pokyny pro řešení složitých filtrů a entropického kódování.

CSR vyrábí rodinu SoC Quatro, která obsahuje jeden nebo více vlastních obrazových procesorů DSP optimalizovaných pro zpracování obrazových dat dokumentů pro aplikace skenerů a kopírek.

Technologie mikročipů produkuje řadu DSP dsPIC založenou na PIC24. Představený v roce 2004, dsPIC je určen pro aplikace, které vyžadují skutečný i skutečný DSP mikrokontrolér, jako je ovládání motoru a napájecí zdroje. DsPIC běží až na 40 MIPS a má podporu pro 16bitové MAC s pevným bodem, bitové reverzní a modulo adresování, stejně jako DMA.

Většina procesorů DSP používá aritmetiku s pevnou řádovou čárkou, protože ve zpracování signálu v reálném světě není nutný další rozsah poskytovaný plovoucí desetinnou čárkou a díky snížené hardwarové složitosti existuje velká výhoda rychlosti a nákladů. DSP s plovoucí desetinnou čárkou mohou být neocenitelné v aplikacích, kde je vyžadován široký dynamický rozsah. Vývojáři produktů mohou také použít DSP s plovoucí desetinnou čárkou ke snížení nákladů a složitosti vývoje softwaru výměnou za dražší hardware, protože je obecně snazší implementovat algoritmy s plovoucí desetinnou čárkou.

Obecně jsou DSP vyhrazené integrované obvody; funkčnost DSP však lze také vytvořit pomocí pole programovatelné brány čipy (FPGA).

Vestavěné univerzální procesory RISC jsou čím dál tím více DSP jako funkčnost. Například OMAP3 procesory zahrnují ARM Cortex-A8 a C6000 DSP.

V oblasti komunikací se do hlavního proudu dostává nové plemeno DSP nabízející spojení funkcí DSP a funkce akcelerace H / W. Mezi takové modemové procesory patří ASOCS ModemX a CEVA XC4000.

V květnu 2018 navrhl Huarui-2 Nanjing Research Institute of Electronics Technology of China Electronics Technology Group prošel přijetím. S rychlostí zpracování 0,4 TFLOPS může čip dosáhnout lepšího výkonu než současné běžné čipy DSP.[24] Konstrukční tým začal vytvářet Huarui-3, který má rychlost zpracování na úrovni TFLOPS a podporu pro umělá inteligence.[25]

Viz také

Reference

  1. ^ Dyer, S. A .; Harms, B. K. (1993). "Zpracování digitálních signálů". V Yovits, M. C. (ed.). Pokroky v počítačích. 37. Akademický tisk. str. 104–107. doi:10.1016 / S0065-2458 (08) 60403-9. ISBN  9780120121373.
  2. ^ Liptak, B. G. (2006). Řízení a optimalizace procesů. Příručka techniků. 2 (4. vydání). CRC Press. str. 11–12. ISBN  9780849310812.
  3. ^ A b C d E F „1979: Představen jednočipový procesor digitálního signálu“. Křemíkový motor. Muzeum počítačové historie. Citováno 14. října 2019.
  4. ^ A b C d Taranovich, Steve (27. srpna 2012). „30 let DSP: od dětské hračky po 4G a dále“. EDN. Citováno 14. října 2019.
  5. ^ A b Ingrid Verbauwhede; Patrick Schaumont; Christian Piguet; Bart Kienhuis (2005-12-24). „Architektury a návrhové techniky pro energeticky efektivní vestavěné DSP a zpracování multimédií“ (PDF). rijndael.ece.vt.edu. Citováno 2017-06-13.
  6. ^ Beyond Frontiers Publikace Broadgate (září 2016), s. 22
  7. ^ "Procesory paměti a DSP".
  8. ^ "DSP procesory: paměťové architektury"
  9. ^ "Architektura procesoru digitálního signálu"
  10. ^ „Možnost DSP paměti ARC XY“.
  11. ^ „Nulové režijní smyčky“.
  12. ^ „Referenční hardware hardwaru procesoru ADSP-BF533“.p. 4-15.
  13. ^ „Porozumění pokročilým funkcím procesoru podporuje efektivní kódování“.
  14. ^ „Techniky pro efektivní využití vyrovnávací paměti nulové režijní smyčky“.
  15. ^ Grant, Duncan Andrew; Gowar, John (1989). Výkonové MOSFETY: teorie a aplikace. Wiley. p. 1. ISBN  9780471828679. Tranzistor s efektem pole-oxid polovodičového pole (MOSFET) je nejčastěji používaným aktivním zařízením při velmi rozsáhlé integraci digitálních integrovaných obvodů (VLSI). V 70. letech 20. století tyto komponenty způsobily převrat v elektronickém zpracování signálu, řídicích systémech a počítačích.
  16. ^ Shirriff, Ken (30. srpna 2016). „Překvapivý příběh prvních mikroprocesorů“. IEEE Spectrum. Institute of Electrical and Electronics Engineers. 53 (9): 48–54. doi:10.1109 / MSPEC.2016.7551353. S2CID  32003640. Citováno 13. října 2019.
  17. ^ Gray, Robert M. (2010). „Historie digitální řeči v reálném čase v paketových sítích: část II lineárního prediktivního kódování a internetového protokolu“ (PDF). Nalezeno. Trendy procesu signálu. 3 (4): 203–303. doi:10.1561/2000000036. ISSN  1932-8346.
  18. ^ Stanković, Radomir S .; Astola, Jaakko T. (2012). „Vzpomínky na raná díla v DCT: Rozhovor s K.R. Rao“ (PDF). Dotisky z počátků informačních věd. 60. Citováno 13. října 2019.
  19. ^ „Speak & Spell, první použití IC pro zpracování digitálního signálu pro generování řeči, 1978“. Milníky IEEE. IEEE. Citováno 2012-03-02.
  20. ^ Bogdanowicz, A. (06.10.2009). „Milníky IEEE ctí tři“. Institut. IEEE. Archivovány od originál dne 04.03.2016. Citováno 2012-03-02.
  21. ^ Khan, Gul N .; Iniewski, Krzysztof (2017). Vestavěné a síťové systémy: design, software a implementace. CRC Press. p. 2. ISBN  9781351831567.
  22. ^ Alberto Luis Andres. „Digitální grafický audio ekvalizér“. p. 48.
  23. ^ https://www.intel.com/Assets/PDF/General/35yrs.pdf#page=17
  24. ^ „国产 新型 雷达 芯片 华 睿 2 号 与 组网 中心 同时 亮相 - 科技 新闻 - 中国 科技 网 首页“. 科技 日报. Citováno 2. července 2018.
  25. ^ 王 珏 玢. „全国 产 芯片 华 睿 2 号 通过“ 核 高 基 „验收 - 新华网“. Zpravodajská agentura Xinhua.南京. Citováno 2. července 2018.

externí odkazy