Akustika: Psychoakustika, aneb kam nás vede sluch
Nejspíš to také znáte, že slib „…zase příště“ se může někdy protáhnout na pěkně dlouho, nebo v krajním případě také nikdy. Předchozí třetí část cyklu „Akustika:“ z pera kolegy a kamaráda Viktora Svobody, jsme zde uveřejnil vloni v červenci jako další splátku svého vydavatelského dluhu. Na ten jsem samozřejmě nezapomněl, a tak dnes (lépe než nikdy) přetiskujeme čtvrtou, předposlední, část tohoto populárního cyklu.
Šáfa
Jde o jeden z nejvýznamnějších lidských smyslů, jehož funkce není dodnes do detailů prozkoumána (resp. objasnění proč člověk občas slyší to, co slyší). Lidské ucho jakožto měřící přistroj schopný více méně bez poškození zpracovávat signály v rozsahu 0-140dB (nad 140 dB dochází k trvalému poškození). To představuje rozsah akustických tlaků 2.10-5 – 200 [Pa], respektive poměr 1:10 000 000. Tento rozsah hodnot dokáže zpracovat jen málokteré jiné čidlo.
Podrobnější vysvětlení procesů probíhajících v uchu včetně obrázku zde nebudu uvádět (nejsem patřičně vzdělán), najdete jej v příslušné např. lékařské literatuře, případně v učebnici přírodopisu 7. třídy základní školy (alespoň myslím, že sedmé).
Binaurální slyšení
…je dáno faktem, že uši jsou párový orgán (alespoň u živočicha zvaného homo sapiens . Zvuk tedy přichází do obou uší s různou intenzitou a různým spektrálním složením a fázovým zpožděním. Na základě rozdílu zvuků z levého a pravého ucha pak mozek dokáže na základě zkušeností rozlišit směr zvuku. Na nejnižších frekvencích rozhoduje fázové zpoždění dané rozdílnou vzdáleností L a P ucha (toto zpoždění zůstává prakticky pro všechny frekvence stejné, zanedbáme-li odrazy od boltce apod.). Na frekvencích nad 300 Hz se začíná uplatňovat hlava jako akustická překážka, která způsobuje rozdílnou úroveň zvuku mezi L a P. Podobně se v řádu kHz chová boltec ucha, který pak různě odclání zvuky zepředu a zezadu.
Základní parametry
Jen pro připomenutí: frekvenční rozsah ucha se nejčastěji uvádí 16-16k, 20-20k případně 16-20k (Hz). Toto frekvenční pásmo se také označuje jako akustické, slyšitelné ap. Jako cvičení zkuste určit, kam patří ultrazvuk a infrazvuk.
Jednou z nejdůležitějších skutečností je tzv. Weberův-Fechnerův zákon, který praví, že přírůstek počitku je úměrný relativní změně počitku. To je mimo jiné důvodem používání poměrové (logaritmické) stupnice pro vyjádření hlasitosti resp. akustického tlaku.
Další podstatnou vlastností, která je z části patrná z předchozího textu, je „frekvenční závislost“ subjektivně vnímané intenzity zvuku. Jinými slovy existuje podstatný rozdíl mezi subjektivně vnímanou hlasitostí a objektivně změřeným akustickým tlakem v závislosti na frekvenci zvuku resp. na jeho spektrálním složení. Patrné je to na grafu závislosti prahu slyšitelnosti na frekvenci zvuku (obr.1). Je zde také znázorněn pokles citlivosti nad 2 kHz vlivem stárnutí ucha, popř. jiným poškozením.
Frekvenční závislost lidského sluchu vedla k definování “křivek stejné hlasitosti” tedy křivek, které respektují různou citlivost sluchu při různých frekvencích a hladinách akustického tlaku. Stupnice zůstává logaritmická, ovšem označení dB se nahradilo novou jednotkou Phon (1 Ph, jeden “fon”). Jako referenční kmitočet byl zvolen 1 kHz a na tomto kmitočtu číselně odpovídá číselné vyjádření v dB stupnici ve phonech. Stupnice hlasitosti ve phonech tedy oprošťují hlasitost zvuku od frekvenční závislosti a vyjadřují tedy subjektivně vnímanou hladinu hlasitosti zvuku bez ohledu na frekvenci. Tyto křivky vypadají podobně jako průběh prahu slyšitelnosti na obr.1, akorát se pro zvyšující se hlasitost postupně “zplošťují” (hlavně na nejnižších kmitočtech je nárůst podtsatně menší), minima a maxima (vulgárněji “extrémy”) však zůstávají přibližně stejná.
Maskování zvuku
Pokud ucho najednou vnímá dva zdroje zvuku podobné hlasitosti, jejichž spektra se překrývají, tak ucho přestává tyto zvuky rozlišovat a dochází k maskování. hodnota rozdílu hlasitostí závisí na charakteru maskovacího a maskovaného zvuku (zpravidla maskovací zvuk bývá hlasitější, nežli maskovaný ). Ovšem vezmeme-li jako maskovaný zvuk například sinusový tón a budeme se jej pokoušet maskovat bílým šumem, zjistíme, že sinusový tón již bude maskován šumem, pokud intenzita šumu bude o cca 16 dB nižší (!) (při frekvencích nad 1 kHz tento rozdíl ještě narůstá). To platí i v případě, že absolutní intenzita šumu bude pod prahem slyšitelnosti (při zachování vzájemného rozdílu). Tím pádem může i zvuk, který sám o sobě neslyšíme způsobovat maskování jinak slyšitelného zvuku!
Této vlastnosti lidského ucha se mimo jiné využívá při digitální komprimaci zvukového signálu (nikoliv dynamické kompresi), kde se nepřenáší složky zvuku, které jsou maskovány jiným zvukem. Z uvedeného příkladu je však jasné, že tento jev lze těžko zobecnit a nelze vždy jednoznačně říci, jestli daný jedinec v určitém případě od sebe zvuky rozliší, nebo jestli dojde k maskování.
Dalším projevem maskování je tzv. postmaskovací efekt. Ten spočívá v setrvačnosti lidského ucha v přizůsobení citlivosti po odeznění nějaké dominanní dynamické “špičky”. V praxi to znamená, že po odeznění nějakého zvuku je ucho “hluché” ke zvukům, které jsou tižší, resp. by byly maskovány, pokud by zněly současně s maskovacím zvukem, i když následují až po jeho odeznění. V praxi se to projeví postupným poklesem hladiny maskování (hladiny, pod kterou budou zvuky maskovány) v závislosti na čase po odeznění maskovacího zvuku. Tato hladina začíná klecat přibližně po 5 ms po odeznění maskovacího zvuku a úplné odeznění postmaskovacího efektu nastává po uplynutí doby větší než cca 200ms. Tyto časové konstanty prakticky nezávisí na hladině maskovacího zvuku (pokud nejsou aktivovány jiné mechanismy na ochranu sluchu viz 4. odstavec). Podobně i když v mnohem menší míře mohou být maskovány slabší zvuky, které jsou následovány nějakou dynamickou špičkou.
Směšování zvuku
Dalším jevem souvisejícím s dynamickými vlastnostmi ucha je tzv. směšování, resp. schopnost od sebe oddělit dva po sobě následující zvuky. Touto hranicí je doba přibližně 60ms. Pokud je rozdíl dvou přicházejících zvuku (například zvuk přímý a odražený) menší a rozdíl hlasitostí je takový, že zpožděný zvuk není maskován, ucho je od sebe nedokáže oddělit a vnímá je jako jeden zvuk, čímž může dojít ke snížení až úplné ztrátě srozumitelnosti. Připomínám, že vlastnosti nepřímého zvuku jsou dány výhradně akustickou místnosti (viz minulý díl).
Konec čtvrté části
%%CHANGEAUTHOR%% set %%AUTHOR%% as the author of the ticket