1.2.1. A beszéd fiziológiai folyamata és az alapfrekvencia

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A kötet középpontjában a beszédképzés, azon belül is a beszéd akusztikai vetülete áll. Ezért a monográfia legelején ebben a fejezetben röviden végigtekintem a beszéd alapvető fiziológiai folyamatát, illetve a kötet szempontjából releváns akusztikai mérőszámokat. Az emberi beszéd, pontosabban a hangképzés fizikai alapjait a rezgés, azaz nyomásingadozás; fiziológiai alapjait a légzés, pontosabban a tüdőből kifelé áramló levegő szolgáltatja (Markó 2017). A tüdőből kifelé áramló levegő a légcsövön keresztül gégébe jut, ahol – a hangszalagok állásának függvényében – keresztülhaladhat vagy megrezegtetheti a hangszalagokat. Hangszalagrezgés esetén a hangszalagok Bernoulli-hatásnak köszönhető periodikus nyitódása és záródása kváziperiodikus nyomásingadozást, azaz egy összetett rezgést hoz létre, amit zöngének nevezünk. E kváziperiodikus nyomásingadozás azt jelenti, hogy a hangszalagok rezgése (hangforrásként) mozgási energiát ad át a levegőmolekuláknak, tehát periodikusan kimozdítja őket nyugalmi helyzetükből, és saját egyensúlyi pozíciójuk körüli rezgésre készteti őket, ezáltal sűrűsödési és ritkulási csomópontokat hozva létre (Vicsi 2013, Markó 2017). Azáltal, hogy a gerjesztett levegőmolekulák átadják egymásnak mozgási energiájukat a rezgés tovaterjed a szomszédos molekulákra és álló hanghullámok keletkeznek. Tehát a beszédképzésben a hangszalagok rezgése funkcionál hangforrásként, és hozza létre a zöngét. A zönge egyik alapvető jellemzője az alapfrekvenciája (f0), amely az egy időegység alatt lezajlott glottális ciklusok számát jelenti, azaz az alapfrekvencia értéke a teljes periódusok száma és az időegység hányadosaként írható le, és a mértékegysége Hertz (Hz) (Markó 2017).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A beszéd hangmagasságának változása, tehát a beszéddallam megvalósulása az alapfrekvencia változásából fakad, ugyanis az észlelt hangmagasság az alapfrekvenciával függ össze úgy, hogy a magasabb alapfrekvencia magasabb hangmagasság érzetét kelti (’t Hart et al. 1990; Gósy 2004). Az emberi percepcióban a hangmagasság-változás észlelete nem minden esetben írható le lineáris összefüggéssel. Ez többek között azt jelenti, hogy két frekvenciaérték közötti differenciát nem akkor észlelünk egyforma hangköznek, ha a két frekvenciaérték különbsége megegyezik, hanem hogyha a frekvenciaértékek aránya megegyezik. Az észlelt hangmagasság és a frekvenciaértékek közötti összefüggést a kettes alapú logaritmus (log2) alapján lehet leírni, amit a lentiekben az oktávskála alapján mutatok be. Két zenei hang közötti arányt zenei hangköznek nevezzük, és egy oktáv nyolc zenei hang távolságot jelöl. Ebben a példában az egyvonalas Aʹ zenei hangot választjuk ki referenciapontnak, amelynek frekvenciaértéke 440 Hz (ami a ma elfogadott konvenciók szerint értendő és a hangszerek hangolásában is referenciaként használatos) (Bolla 1995). Ehhez az zenei hanghoz viszonyítva az egy oktávval alacsonyabb kis a hang értéke 220 Hz, míg az -hoz viszonyítva egy oktávval magasabban fekvő, kétvonalas hang frekvenciaértéke 880 Hz (1. ábra).
 
1. ábra: Az A hangok frekvenciaértékei és elhelyezkedésük az oktávskálán
(Bolla 1995 és Kesztler 1952 alapján)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A 220 Hz-nél egy oktávval magasabban fekvő zenei hang (az egyvonalas ) frekvenciaértéke 440 Hz, ami a 220 Hz-nek kétszerese (21); a két oktávval magasabban fekvő zenei hang (a kétvonalas , melynek frekvenciaértéke 880 Hz) a 220 Hz-nek már négyszerese (22). Az egyvonalas -nál három oktávval magasabban realizálódó zenei hang (a háromvonalas Aʹʺ, melynek frekvenciaértéke 1760 Hz) pedig a 220 Hz frekvenciaértéknek már nyolcszorosa (23). E példa alapján az a következtetés is levonható, hogy az abszolút frekvenciaértékek összevetése nem alkalmas arra, hogy különböző személyek különböző frekvenciatartományban produkált beszédét összevessük, hiszen egy férfi ejtésében a 100 Hz-ről 150 Hz-re emelkedő f0 ekvivalensnek tekinthető egy nő produkciójában a 180 Hz-ről 270 Hz-re emelkedő hangmagasság-változással az észleletben, pedig a frekvenciakülönbség az első esetben 50 Hz, míg a második esetben 90 Hz, arányuk azonban mindkét esetben 1:1,5 (’t Hart et al. 1990: 24). Ebből fakadóan a beszéddallam vizsgálatakor az alapfrekvenciaértékeket logaritmikus egységekbe, azaz félhangokká szokás konvertálni, ezáltal normalizálva a különböző frekvenciatartományokban bekövetkező változásokat (Nolan 2003). Egy félhangnyi hangmagasság-különbség megegyezik az oktáv 1/12-ével, azaz egy oktávot 12, egymástól egyenlő távolságra elhelyezkedő félhangra lehet bontani (Bolla 1995). Ez szekundok tekintetében, azaz két egymás mellett elhelyezkedő zenei hang távolságát illetően azt jelenti, hogy kis szekund esetében (pl. E-F és H-C) 1 félhang az észlelt hangmagasság-különbség, míg egy nagy szekund esetében (azaz minden más szomszédos zenei hang esetében) 2 félhang. Terc esetében három zenei hang távolságáról beszélünk, ami kis terc esetében 3 félhangot, nagy terc esetében pedig 4 félhangot jelent. A kötet későbbi részeiben a következő hangközök merülhetnek fel: kvart (4 zenei hang, ahol a tiszta kvart: 5 félhang, és a bővített kvart 6 félhang), kvint (5 zenei hang, ahol a szűkített kvint 6, a tiszta kvint 7 félhang) és szext (6 zenei hang, ahol a kis szext 8, a nagy szext 9 félhang) (Kesztler 1952).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Tehát a beszéd észlelt hangmagassága az f0-értékkel áll összefüggésben, azonban a nyelvek eltérhetnek a beszéddallam kihasználásában, azaz hogy az f0-modulálása lokálisnak és/vagy globálisnak tekinthető. Az atonális, avagy monoton nyelvek esetében a beszéd hangmagasságának változása globálisan jelenik meg, tehát elsősorban mondat- vagy közlésszintű egységek jelentését változtatja meg, azaz az intonáció révén például érzelmeket vagy szándékot tudunk kifejezni (Markó 2017). Tonális nyelvek esetében azonban a beszédhangmagasság változása nemcsak közlések szintjén módosít a jelentésen, hanem lokálisan, lexikai szinten is: a hangmagasság-változás, azaz a tónus a szó(tag) argumentuma. Ebből következően ugyanahhoz a szó(tag)hoz eltérő hangmagasságváltozás-mintázatok (dallamkontúrok) társulhatnak, amelyek jelentésmegkülönböztető szereppel bírnak (Chao 1948/1963), és emellett a tónusok megvalósulását az intonáció is befolyásolhatja (Shen 1989a). Ez azt jelenti, hogy az olyan tonális nyelvekben, mint a mandarin kínai a tónusként megjelenő lokális f0-moduláció mellett mondatok szintjén, globálisan is jelenik meg hangmagasság-változás intonáció formájában (Shen 1989a). Tehát összegezve mind a tónusok, mind az intonáció vizsgálható egyazon paraméterrel: az f0 változásával (’t Hart et al. 1990).
 
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave