Metoda nového přiřazení - Reassignment method
The způsob přeřazení je technika pro ostření časově-frekvenční reprezentace mapováním dat na časově-frekvenční souřadnice, které se blíží skutečné hodnotě oblast podpory analyzovaného signálu. Metoda byla nezávisle zavedena několika stranami pod různými názvy, včetnězpůsob přeřazení, přemapování, časově-frekvenční přeřazení, a metoda upraveného pohyblivého okna.[1] V případě spektrogram nebo krátkodobá Fourierova transformace Metoda opětovného přiřazení zostřuje data rozmazané časově-frekvenční přemístěním dat podle místních odhadů okamžité frekvence a skupinového zpoždění. Toto mapování na přiřazené souřadnice časové frekvence je velmi přesné pro signály, které jsou oddělitelné v čase a frekvenci s ohledem na okno analýzy.
Úvod
Mnoho signálů zájmu má distribuci energie, která se liší v čase a frekvenci. Například jakýkoli zvukový signál, který má začátek nebo konec, má distribuci energie, která se mění v čase, a většina zvuků vykazuje značné rozdíly v čase i frekvenci po dobu jejich trvání. Reprezentace časových kmitočtů se běžně používají k analýze nebo charakterizaci těchto signálů. Mapují signál jednorozměrné časové domény do dvourozměrné funkce času a frekvence. Reprezentace časově-frekvenční popisuje variabilitu distribuce spektrální energie v čase, stejně jako hudební skóre popisuje variace hudebního času přechodu.
V analýze zvukových signálů je spektrogram nejčastěji používanou časově-frekvenční reprezentací, pravděpodobně proto, že je dobře známa a imunní vůči takzvaným „křížovým výrazům“, které někdy znesnadňují interpretaci jiných časově-frekvenčních reprezentací. Operace oken vyžadovaná při výpočtu spektrogramu však přináší nechutný kompromis mezi časovým rozlišením a frekvenčním rozlišením, takže spektrogramy poskytují časové a frekvenční zastoupení, které je rozmazané v čase, frekvenci nebo v obou rozměrech. Metoda časově-frekvenčního opětovného přiřazení je technika pro přeostření časově-frekvenčních dat v rozmazané reprezentaci, jako je spektrogram, mapováním dat na časově-frekvenční souřadnice, které jsou blíže skutečné oblasti podpory analyzovaného signálu.
Spektrogram jako časově-frekvenční reprezentace
Jedním z nejznámějších časově-frekvenčních reprezentací je spektrogram, který je definován jako čtvercová velikost Fourierovy transformace v krátké době. I když je známo, že krátkodobé fázové spektrum obsahuje důležité časové informace o signálu, je obtížné tyto informace interpretovat, takže při krátkodobé spektrální analýze je obvykle uvažováno pouze krátkodobé spektrum.
Jako časově-frekvenční reprezentace má spektrogram relativně špatné rozlišení. Časové a frekvenční rozlišení se řídí výběrem analytického okna a větší koncentrace v jedné doméně je doprovázena větším slyšením v druhé.
Časově-frekvenční reprezentace se zlepšeným rozlišením ve srovnání se spektrogramem je Distribuce Wigner – Ville, které lze interpretovat jako krátkodobou Fourierovu transformaci s funkcí okna, která je dokonale přizpůsobena signálu. Distribuce Wigner – Ville je vysoce koncentrovaná v čase a frekvenci, ale je také vysoce nelineární a nelokální. V důsledku toho je tato distribuce velmi citlivá na hluk a generuje křížové složky, které často maskují sledované složky, takže je obtížné získat užitečné informace týkající se distribuce energie ve vícesložkových signálech.
Cohenova třída ofbilineární časově-frekvenční reprezentace je třída „vyhlazených“ Wigner-Villeových distribucí, využívajících vyhlazovací jádro, které může snížit citlivost distribuční tonoise a potlačit křížové složky, na úkor rozmazání distribuce v čase a frekvenci. Toto zobrazení způsobí, že distribuce bude nenulová v regionech, kde skutečná distribuce Wigner – Ville nevykazuje žádnou energii.
Spektrogram je členem Cohenovy třídy. Jedná se o vyhlazenou distribuci Wigner – Ville s vyhlazovacím kernelequal k distribuci Wigner – Ville v analytickém okně. Metoda opětovného přiřazení vyhlazuje distribuci Wigner-Villed, ale poté znovu zaostří distribuci zpět na skutečné oblasti podpory signálních komponent. Ukázalo se, že metoda snižuje časové a frekvenční rozmazání kteréhokoli člena Cohenovy třídy [2].[3]V případě přiděleného spektrálního programu se krátkodobé fázové spektrum používá ke korekci nominálních časových a frekvenčních souřadnic spektrálních dat a mapování zpět blíže ke skutečným oblastem podpory analyzovaného signálu.
Způsob přeřazení
Průkopnické práce na metodě přeřazení publikovali Kodera, Gendrin a de Villedary pod jménem Metoda upraveného pohyblivého okna [4] Jejich technika zvyšuje rozlišení v čase a frekvenci klasické metody Moving Window Method (ekvivalentní spektrogramu) přiřazením každému datovému bodu novou souřadnici čas-frekvence, která lépe odráží distribuci energie v analyzovaném signálu.
V klasické metodě pohyblivého okna je signál v časové doméně, je rozložen na sadu koeficientů, , na základě sady elementárních signálů, , definována
kde je funkce jádra lowpass (se skutečnou hodnotou), jako funkce okna v krátkodobé Fourierově transformaci. Jsou definovány koeficienty v tomto rozkladu
kde je velikost a fáze, Fourierova transformace signálu posunut v čase o a oknem .
lze rekonstruovat z koeficientů pohyblivého okna pomocí
Pro signály mající spektra velikosti , jehož časová variace je pomalá vzhledem k fázové variaci, maximální příspěvek k rekonstrukčnímu integrálu pochází z blízkosti bodu splnění podmínky fázové stacionarity
nebo ekvivalentně kolem bodu definován
Tento jev je znám v takových oblastech, jako je optika jako princip stacionární fáze, který uvádí, že u periodických nebo kvaziperiodických signálů je variace Fourierova fázového spektra, které nelze připsat periodické oscilaci, pomalá s ohledem na čas v blízkosti frekvence oscilace a v okolních oblastech je variace relativně rychlá. Analogicky, u impulzivních signálů, které jsou koncentrovány v čase, je variace fázového spektra pomalá vzhledem k frekvenci blízké době impulsu a v okolních oblastech je variace relativně rychlá.
Při rekonstrukci se pozitivní a negativní příspěvky k syntetizovanému tvaru vlny ruší kvůli destruktivní interferenci ve frekvenčních oblastech rychlé fázové variace. Pouze oblasti s pomalou fázovou variací (stacionární fáze) významně přispějí k rekonstrukci a maximální příspěvek (těžiště) nastane v bodě, kde se fáze mění nejpomaleji s ohledem na čas a frekvenci.
Takto vypočítané časově-frekvenční souřadnice se rovnají zpoždění místní skupiny, a místní okamžitá frekvence, a jsou počítány z fáze krátkodobé Fourierovy transformace, která je při konstrukci spektrogramu obvykle ignorována. Tato množství jsou místní v tom smyslu, že představují okenní a filtrovaný signál, který je lokalizován v čase a frekvenci, a nejsou globálními vlastnostmi analyzovaného signálu.
Metoda upraveného pohyblivého okna nebo metoda opětovného přiřazení mění (znovu přiřazuje) bod přiřazení do tohoto bodu maximálního příspěvku , spíše než k věci při kterém se počítá. Tento bod se někdy nazývá centrum gravitace distribuce, analogicky k hromadné distribuci. Tato analogie je užitečnou připomínkou, že přiřazení spektrální energie těžišti její distribuce má smysl pouze tehdy, když existuje energie, kterou lze připsat, takže metoda opětovného přiřazení nemá žádný význam v bodech, kde je spektrogram nulový.
Efektivní výpočet přidělených časů a frekvencí
V digitálním zpracování signálu je nejběžnější vzorkování časové a frekvenční domény. Diskrétní Fourierova transformace se používá k výpočtu vzorků Fourierovy transformace ze vzorků signálu časové domény. Operace převodu navržené Kodera et al. nelze použít přímo na diskrétní data krátkodobé Fourierovy transformace, protože částečné derivace nelze vypočítat přímo na datech, která jsou diskrétní v čase a frekvenci, a bylo navrženo, že tato obtíž byla hlavní překážkou širšího využití metody přeřazení.
Je možné aproximovat parciální derivace pomocí konečných rozdílů. Například fázové spektrum lze vyhodnotit ve dvou blízkých časech a částečná derivace vzhledem k času se aproximuje jako rozdíl mezi dvěma hodnotami dělený časovým rozdílem, jako v
Pro dostatečně malé hodnoty a a za předpokladu, že je fázový rozdíl vhodně „rozbalen“, poskytuje tato metoda konečných rozdílů dobrou aproximaci parciálních derivací fáze, protože v oblastech spektra, ve kterých je vývoj fáze ovládán rotací v důsledku sinusové oscilace jediná blízká složka, fáze je lineární funkcí.
Nezávisle na společnosti Kodera et al.„Nelson dospěl k podobné metodě pro zlepšení časově-frekvenční přesnosti krátkodobých spektrálních dat z dílčích derivátů krátkodobého fázového spektra.[5] Je snadno prokázáno, že Nelson křížové spektrální povrchy vypočítat aproximaci derivátů, která je ekvivalentní metodě konečných rozdílů.
Auger a Flandrin ukázali, že metodu opětovného přiřazení, navrženou v rámci spektrogramu Kodera et al., Lze rozšířit na kteréhokoli člena Cohenova třída časově-frekvenčních reprezentací zevšeobecněním operací opětovného přiřazení
kde je distribuce Wigner – Ville společnosti , a je funkce jádra, která definuje distribuci. Dále popsali účinnou metodu pro výpočet časů a frekvencí pro přeřazený spektrogram efektivně a přesně bez výslovného výpočtu parciálních derivací fáze.[2]
V případě spektrogramu lze operace opětovného přiřazení vypočítat pomocí
kde je krátkodobá Fourierova transformace vypočítaná pomocí analytického okna je krátkodobá Fourierova transformace vypočítaná pomocí okna časově vážené analýzy a je krátkodobá Fourierova transformace vypočítaná pomocí okna analýzy časových derivací .
Pomocí funkcí pomocného okna a , operace opětovného přiřazení lze vypočítat na libovolné časově-frekvenční souřadnici z algebraické kombinace tří Fourierových transformací vyhodnocených na . Vzhledem k tomu, že tyto algoritmy fungují pouze na krátkodobých spektrálních datech vyhodnocených v jednom čase a frekvenci a výslovně nevypočítávají žádné deriváty, poskytuje efektivní metodu výpočtu přiřazené diskrétní krátkodobé Fourierovy transformace.
Jedním omezením v této metodě výpočtu je, že musí být nenulová. To není příliš omezení, protože samotná operace opětovného přiřazení znamená, že je třeba znovu přiřadit nějakou energii, a nemá to žádný význam, když je distribuce nulová.
Oddělitelnost
Krátkodobou Fourierovu transformaci lze často použít k odhadu amplitud a fází jednotlivých složek v a vícesložkový signál, jako je kvazi-harmonický tón hudebního nástroje. Kromě toho lze operace převodu času a frekvence použít k zostření reprezentace přisuzováním spektrální energie hlášené krátkodobou Fourierovou transformací do bodu, který je lokálním těžištěm komplexní distribuce energie.
U signálu skládajícího se z jedné složky lze okamžitou frekvenci odhadnout z parciálních derivací fáze jakéhokoli krátkodobého kanálu Fourierovy transformace, který prochází komponentou. Pokud má být signál rozložen na mnoho složek,
a okamžitá frekvence každé složky je definována jako derivace její fáze s ohledem na čas, tj.
pak lze okamžitou frekvenci každé jednotlivé složky vypočítat z fáze odezvy filtru, který touto složkou prochází, za předpokladu, že v propustném pásmu filtru neleží více než jedna složka.
Toto je vlastnost ve frekvenční doméně, kterou Nelson volal oddělitelnost[5] a je vyžadován u všech takto analyzovaných signálů. Pokud tato vlastnost není splněna, nelze dosáhnout požadovaného vícesložkového rozkladu, protože parametry jednotlivých složek nelze odhadnout z krátkodobé Fourierovy transformace. V takových případech musí být zvoleno jiné okno analýzy, aby bylo splněno kritérium oddělitelnosti.
Pokud jsou složky signálu oddělitelné ve frekvenci vzhledem ke konkrétnímu oknu krátkodobé spektrální analýzy, pak je výstupem každého filtru krátkodobé Fourierovy transformace filtrovaná verze maximálně jedné dominantní (mající významnou energii) složka, a tedy derivace, fáze, vzhledem k času se rovná derivaci fáze dominantní složky v čase Pokud tedy součást, s okamžitou frekvencí je dominantní složkou v okolí potom lze vypočítat okamžitou frekvenci této složky z fáze krátkodobé Fourierovy transformace vyhodnocené na To znamená,
Stejně jako může každý pásmový filtr v krátkodobé Fourierově transformační sadě filtrů procházet nanejvýš jedinou komplexní exponenciální složkou, musí být dvě časové události dostatečně časově odděleny, aby neležely ve stejném segmentu vstupního signálu. Toto je vlastnost oddělitelnosti v časové doméně a je ekvivalentní požadavku, aby čas mezi dvěma událostmi byl vyšší než délka impulzní odezvy filtrů krátkodobé Fourierovy transformace, rozpětí nenulových vzorků v
Obecně platí, že pro vícesložkový signál existuje nekonečné množství stejně platných rozkladů. Vlastnost oddělitelnosti musí být zvážena v kontextu požadovaného rozkladu. Například při analýze řečového signálu je k oddělení harmonických dostačující okno analýzy, které je relativně dlouhé k času mezi rázy, ale jednotlivé rázy budou rozmazány, protože každé okno pokrývá mnoho impulzů (tj. , jednotlivé impulsy nejsou časově oddělitelné zvoleným analytickým oknem). Analytické okno, které je mnohem kratší než doba mezi rázy, může rázové rázy vyřešit, protože žádné okno nepřekrývá více než jeden puls, ale harmonické frekvence jsou rozmazané dohromady, protože hlavní lalok spektra analytického okna je širší než mezery mezi harmonickými (to znamená, že harmonické kmitočty nelze oddělit zvoleným analytickým oknem).
Reference
- ^ Hainsworth, Stephen (2003). „Kapitola 3: Metody opětovného přiřazení“. Techniky pro automatizovanou analýzu hudebního zvuku (PhD). Univerzita v Cambridge. CiteSeerX 10.1.1.5.9579.
- ^ A b F. Auger & P. Flandrin (květen 1995). "Zlepšení čitelnosti časově-frekvenčních a časových reprezentací metodou opětovného přiřazení". Transakce IEEE při zpracování signálu. 43 (5): 1068–1089. Bibcode:1995ITSP ... 43.1068A. CiteSeerX 10.1.1.646.794. doi:10.1109/78.382394.
- ^ P. Flandrin, F. Auger a E. Chassande-Mottin, Přiřazení čas-frekvence: Od principů k algoritmům, v Applications in Time-Frequency Signal Processing (A. Papandreou-Suppappola, ed.), ch. 5, s. 179 - 203, CRC Press, 2003.
- ^ K. Kodera; R. Gendrin a C. de Villedary (únor 1978). "Analýza časově proměnných signálů s malými hodnotami BT". Transakce IEEE týkající se akustiky, řeči a zpracování signálu. 26 (1): 64–76. doi:10.1109 / TASSP.1978.1163047.
- ^ A b D. J. Nelson (listopad 2001). "Cross-spektrální metody pro zpracování řeči". Journal of Acoustical Society of America. 110 (5): 2575–2592. Bibcode:2001ASAJ..110.2575N. doi:10.1121/1.1402616. PMID 11757947.
Další čtení
- S. A. Fulop a K. Fitz, Spektrogram pro 21. století, Acoustics Today, roč. 2, č. 3, s. 26–33, 2006.
- S. A. Fulop a K. Fitz, Algoritmy pro výpočet časově korigovaného okamžitého kmitočtového (přeřazeného) spektrogramu s aplikacemi, Journal of the Acoustical Society of America, sv. 119, s. 360 - 371, leden 2006.
externí odkazy
- TFTB - Time-Frequency ToolBox
- SPEAR - Sinusová analýza částečných úprav a resyntéza
- Loris - open-source software pro modelování a morfování zvuku
- SRA - webový výzkumný nástroj pro spektrální a drsnostní analýzu zvukových signálů (podporováno grantem konsorcia Northwest Academic Computing Consortium J. Middletonovi, University of Eastern Washington)
- Řídké časově-frekvenční reprezentace - PNAS