Akusztikus fonetika – Wikipédia

Hang artikulációs és akusztikai szempontból. Általános pszichológia 1-3. – 1. Észlelés és figyelem

Laringális h A Hasonlóan a magánhangzókhoz, itt is láthatjuk, hogy minden egyes mássalhangzót az összes jellemző mentén lehet csak meghatározni. Vagyis például a ibi hang egy bilabiális, zöngés zárhang. A beszédhangok akusztikai jellemzői A fentiekben tehát láthattuk, hogy az egyes beszédhangok létrehozásához a beszédképző szervek milyen hihetetlenül bonyolult vezérlése és hang artikulációs és akusztikai szempontból szükséges. Egy-egy hang kiejtése a légzés, a hangszalagok, a garat és a szájüreg, valamint a nyelv, az ajkak rendkívül pontos és finom mozgása révén valósul meg.

Köny- nyen belátható, hogy az ily bonyolult módon képzett hangok nagyon összetett akusztikai mintázattal kell, hogy rendelkezzenek.

Gondoljunk csak arra, hogy egy zongorán leütött billentyű milyen egyszerűen hozza létre a zongora hangját, hiszen voltaképpen egy egyszerű húr jön periodikus rezgésbe.

Ehhez képest a beszédhangok — és főként a mássalhangzók — sokkal összetettebb és komplexebben változó hangok lesznek. Ahogy már fentebb láttuk, lényegében a beszédhangok — más komplex hangokhoz hasonlóan — olyan, több frekvenciakomponensből összetevődő, periodikus hang artikulációs és akusztikai szempontból, amelyek a frekvencia és intenzitás időbeni változásait tartalmazzák. A továbbiakban azt fogjuk áttekinteni, hogy mi jellemző pontosan hang artikulációs és akusztikai szempontból a változásokra, illetve általában a beszédhangok akusztikai megvalósulására.

A beszédhangok vizuális megjelenítésének legjobb módja a Mint láttuk, a spektrogram a különböző frekvenciákon található akusztikus energia mennyiségét tünteti fel az idő függvényében, és tulajdonképpen úgy ábrázolja a hangokat, ahogy azok az alaphártyán reprezentálódnak. Egy mondat spektrogramja. A mondat angol verziója a beszéd spektrogramon történő ábrázolásának egyik leggyakrabban használt illusztrációja; eredete Franklin Cooper es évekbeli beszédszintézissel foglalkozó munkáira nyúlik vissza A Az ábrát tüzetesen megvizsgálva észre- vehetünk bizonyos szabályos változásokat.

Felfedezhetünk például egy olyan frekvenciasávot, amely szinte a mondat teljes hosszában tartalmaz energiát.

a nézőpontok különbségéről

Ez a legmélyebb frekvenciakomponens, vagyis az alaphang vagy alapfrekvencia. Láttuk, hogy a beszédhangok esetében ezt F0-lal jelöljük. Az F0 mellett további frekvenciakomponenseket is találunk, ezeket formánsoknak neveztük. Az ábrát szemügyre véve láthatjuk, hogy a formánsok gyors változásokat mutatnak, a frekvencia hirtelen növekszik vagy csökken. Ezeket a változásokat formáns- átmeneteknek nevezzük.

látás mínusz 4 működés

A formánsátmenetek a legtöbb esetben a beszédképző szervek egyik helyzetből a másikba történő mozgását jelzik. A formánsátmenet bizonyos hangok, például a zárhangok esetében a hang képzésének része, más esetekben viszont hangkapcsolatok esetében figyelhető meg, amikor is egy hang képzését követően a hangképző szerv egy másik pozícióba kell, hogy átálljon.

Az eddigiekben tehát áttekintettük a beszédhangok típusait, képzésüket és akusztikai jellemzőit. Tudjuk már, hogy a beszédhangok komplex hangok, és tudjuk, hogy különböző zöngéket, vagyis periodikus rezgéseket és zajokat, zörejeket tartalmaznak.

Hang artikulációs és akusztikai szempontból

A spektrogramon történő ábrázolás ugyanis töb- bé-kevésbé megfelel annak, ahogyan a hallóideg aktivitásmintázata közvetíti a hangok akusztikai jellemzőit az agy felé. Most már csak azt kellene megnéznünk, hogy mihez kezd az agy ezzel az inputtal, vagyis hogy milyen folyamatok közvetítésével történik a beszéd észlelése.

A következő részben ezzel a témával foglalkozunk. A beszédhangok észlelése A beszédhangok észlelésének lépései A beszéd megértésének folyamata alapvetően két részből áll: a nyelvi kódoknak vagy perceptuális egységeknek megfelelő akusztikai információk feldolgozásából, valamint ezeknek az információknak az értelmezéséből. Az első rész a beszédhangok és hangkapcsolatok felismerését jelenti, és lényegében az adott nyelvre jellemző fonémák azonosításából áll.

A második rész ennek értelmezését foglalja magában, vagyis a szavak, mondatok, illetve az egész szöveg feldolgozását és megértését. Itt most csak a beszédészlelés első hang artikulációs és akusztikai szempontból, vagyis a nyelvi egységek percepciójával foglalkozunk.

A beszédhangok észlelési folyamata két szakaszból áll: a beszédhangoknak az akusztikai környezettől való elválasztásából és az ily módon elkülönített beszédhangok fonémaazonosításából, amelyhez referenciaként ezek mentális reprezentációja szolgál. A beszédhangoknak a többi hangtól való elkülönítésével nem foglalkozunk részletesen.

Akusztikum[ szerkesztés ] A hallószervünkkel felfogott és hangzási emlékképekben elraktározott hangsajátságok összességét szokás a hangtanban akusztikumnak nevezni. Az élőszóbeli kommunikáció során figyelmünk a nyelvileg kódolt közléstartalom megértésére irányul, míg a hangzásról csak globális benyomásokat szerzünk. A hangzás akusztikus összetevőit szubjektív érzékeléssel hang artikulációs és akusztikai szempontból megfigyeléssel — a beszédfolyamat rendkívül nagy sebessége és bonyolult szerkezeti felépítettsége miatt — nem lehet objektívan és részletekbe menően megállapítani, ezért a beszéd egészének hangzásáról nyert benyomásokra támaszkodva, többnyire metaforikus kifejezésekkel jellemezzük a hangzást, az akusztikumot. A beszéd hangzási jegyeinek az összességére is használják. A beszédszervek tüdőlégcsőgégehangszalagoktoldalékcsőgaratorr- és szájüreg működésükkel hangjelenséget produkálnak, amelyet egy hangforrás és egy szűrőrendszer látásteszt poszter tevékenysége hoz létre.

Pontosabban, csak annyit állapítunk meg róla, hogy feltételezhetően ugyanazokat a mechanizmusokat használjuk a beszédhangoknak a többi hangtól való elválasztásában is, mint az összes többi hang esetében, mindenekelőtt pedig a perceptuális csoportosítás Gestalt-szabályait. A beszédhangok elválasztását segítheti, hogy a beszéd általában ritmikus, periodikus, és a frekvenciakomponensek együtt változnak. A beszéd tehát olyan jellemzőkkel rendelkezik, amelyek megkönnyítik az elkülönítését.

Erre a legjobb példa a vokális zene hallgatása. Ha a hangszerek mellett ének is szól egy zeneszámban, akkor elsősorban erre fogunk figyelni, és ez lesz a leginkább kiugró, a többi hang hátterétől a leginkább elkülönülő.

Akusztikus fonetika

Tudnunk kell azonban, hogy az emberi beszédészlelő rendszer a beszédhangkontrasztokra ugyan születéstől fogva érzékeny, a percepció természetes egységeit mégsem a beszédhangok jelentik, hanem a szavak hangalakja, illetve a szótagok. Miközben a nyelv elsajátítása során ezekre az eltérő egységekre egyformán hangolódik a beszédészlelő rendszer, a szavak hangösszetevői közül az olvasás elsajátítását megelőzően csak a szótagokhoz és a szókezdő hangokhoz van tudatos hozzáférésünk.

A beszédészlelés automatikus folyamatában azonban kialakul a beszédhangkontrasztok megfelelő észlelését biztosító mentális reprezentáció. A beszédhangok és a fonémák megfeleltetése Szó volt már arról, hogy a beszéd legkisebb egysége a fonéma. A fonéma egy olyan absztrakt nyelvi egység, amely önmagában nem rendelkezik jelentéssel, de képes a szavak jelentését megváltoztatni. Azt mondhatjuk tehát, hogy a fonémák a nyelv építőkockái, hiszen a megfelelő fonémákként azonosított beszédhangok hang artikulációs és akusztikai szempontból előállíthatók egy adott nyelv szavai.

Ezek alapján feltételezhetjük, hogy a beszédhangok feldolgozásának célja, hogy az akusztikai inputot megfeleltessük a fonémák mentális reprezentációjának.

Ez a megfeleltetés azonban sajnos nem ennyire egyszerű. Ahogy látni fogjuk, a beszédészlelés tanulmányozásának egyik központi problémája, hogy az észlelt beszédhangok és a mentális reprezentáció megfeleltetése meglehetősen összetett. Ha közelebbről megvizsgáljuk a beszéd akusztikai jellegzetességeit, akkor több olyan jelenséget hang artikulációs és akusztikai szempontból találunk, amelyek hang artikulációs és akusztikai szempontból azt a nézetet, hogy a beszédészlelés során a beszédhangok és a fonémák egy az egyben történő megfeleltetése zajlik.

Az egyik ilyen probléma a beszédhangok gyorsasága. Ha hasonló tempóval mutatunk be egyéb, nem beszéd jellegű hangokat, akkor ezeket a kísérleti személyek képtelenek azonosítani, és csak egy egybefolyó hangkavalkádot hallanak.

A 0 7 gyenge látás

Vagyis úgy tűnik, hogy a beszédészlelés során olyan gyorsan tudjuk követni a hangsorokat, amit elvileg a hallórendszer működése nem tesz lehetővé.

A másik problémába akkor ütközünk, ha megnézzük, hogy egy adott fonéma két eltérő kontextusban például két eltérő szóban vagy szó elején és szó végén milyen eltérő akusztikai paraméterekkel valósul meg.

Artikulációs fonetika

Li- berman és munkatársai két azonos fonémával kezdődő szótag esetében tették ezt meg. Az ábrán egy stilizált spektrogram mutatja a szótagok két formánsát F1 és F2.

Ugyanakkor, ha ezeket a változásokat, vagyis a formáns- átmeneteket izoláltan mutatjuk be ekkor a hangok elveszítik beszédjellegüketakkor ezek az eltérő akusztikai jellemzők egyértelműen megkülönböztethetők. A beszédhangoknak ezt a változatosságát kontextusfüggő átszerveződésnek vagy koartikulációnak nevezzük.

A beszédhangok osztályozása[ szerkesztés ] A magánhangzók osztályozása[ szerkesztés ] A nyelv vízszintes mozgása szerint vagy elöl van, vagy hátul. Ez a magyarban a két alaphelyzet, ez szerint különböztetünk meg kétféle artikulációt: elöl és hátul képzett hangokat. Az elöl képzetteket palatálisoknakmíg a hátul képzetteket velárisoknak nevezzük. Elöl képzett magánhangzóink: [Ø, Ø:, y, y:, ε, e:, i, i:]. Hátul képzett magánhangzóink: [a:, a, Ɔ, o, o:, u, u:].

Az előbbi elnevezés az akusztikai paraméterek megváltozására utal, az utóbbi pedig a jelenség hátterére, vagyis arra, hogy a beszédhangok képzéséből, artikulációjából származik. A koartikuláció definíció szerint az a jelenség, hogy egy beszédhang akusztikai jellemzői megváltozhatnak attól függően, hogy előtte vagy utána milyen hangok állnak.

A koartikuláció egy viszonylag egyszerű fizikai korlátozás miatt alakul ki, nevezetesen, hogy a beszédképző szerveket nem tudjuk tökéletesen átvinni egyik pozícióból a másikba.

Bizonyos hangkapcsolatok esetén, vagy a következő hang ejtésére való felkészülés miatt, szklerotikus látás az előzőből való nem tökéletes visszatérés miatt, az adott hang ejtése megváltozhat. A beszéd produkciója ugyanis egy dinamikus folyamat, és a beszédképző szervek folyamatosan mozognak a magánhangzók képzésétől egy mással-hangzót létrehozó akadály létrehozásáig, majd vissza.

Ez azzal jár, hogy nagy különbségek lehetnek az önmagukban képzett és a folyamatos hang artikulációs és akusztikai szempontból során létrehozott beszédhangok között, mivel a folyamatos beszédben a hangok mindig úgy jönnek létre, hogy a beszédképző szervek valamilyen pozícióból indulnak, és a hang képzése után valahová tartanak.

Akusztikus fonetika – Wikipédia

Ezt úgy képzelhetjük el, mint egy táncos mozgását. A táncos mozdulatai nem önmagukban állnak, hanem mozgássorok részét képzik, és ennek az a következménye, hogy ezek végrehajtása más és más lehet attól függően, hogy milyen mozdulat szerepelt előtte és utána. A koartikuláció okozta módosuláson kívül van még egy tényező, amely jelentősen képes módosítani egy adott beszédhang akusztikai jellemzőit, ez pedig maga a beszélő. Az egyes beszélők egészen más akusztikai paraméterekkel hozzák létre az egyes hangokat.

Ezt sok minden befolyásolja: a beszélő neme, kora, illetve ugyanazon beszélő esetében a napszak, betegség vagy az aktuális érzelmi állapot. Egy következő probléma, amely a beszédhangok és a fonémák megfeleltetését megnehezíti, az úgynevezett szegmentációs probléma.

A beszéd, mint akusztikai jelsorozat Hang artikulációs és akusztikai szempontból Laringális h A Hasonlóan a magánhangzókhoz, itt is láthatjuk, hogy minden egyes mássalhangzót az összes jellemző mentén lehet csak meghatározni.

Az akusztikai input ugyanis folyamatos, a reprezentáció viszont szükségszerűen diszkrét. Az egyes hangok hang artikulációs és akusztikai szempontból nincsen határ, sőt a legtöbb esetben egybe is olvadhatnak.

Ezt úgy demonstrálhatjuk, hogy megpróbálunk kivágni egy akkora részt az akusztikus inputból mondjuk egy számítógépes hangszerkesztő segítségévelamely pontosan megfelel egy fonémának. Pontosabban, ott van ugyan, de valójában a formáns- átmenet határozza meg, abban pedig szükségszerűen benne van a magánhangzó is. Mindezek a jelenségek tehát arra utalnak, hogy nincs egy az egyben megfelelés a beszédhangok akusztikai jellemzői és azok reprezentációja között.

Nem igazán tudjuk kijelölni azt a szakaszt az inputban, amelynek egy fonéma pontosan megfeleltethető lenne, ráadásul egy adott fonéma attól függően, hogy ki, mikor, milyen állapotban mondja, és hogy milyen egyéb hangok társaságában szerepel, egészen különböző megjelenési formákat ölthet. Ezt a megfeleltetési problémát Klatt akusztikai-fonetikai varianciaprob- lémának nevezte el. Másként ezt a következőképpen fogalmazhatjuk meg: mivel a fonémák vitathatatlanul rendelkeznek perceptuális realitással hiszen meg tudjuk mondani, hogy a kéz és kész szavak miben különböznek egymástólelvárható lenne tőlük, hogy olyan akusztikai jellemzőkkel bírjanak, amelyek lehetővé teszik a megkülönböztetésüket.

Ennek ellenére mind ez idáig nem hang artikulációs és akusztikai szempontból olyan állandó akusztikai észlelési kulcsokat találni, amelyek minden esetben meghatároznának egy adott fonémát. A variancia-invariancia probléma kapcsán két kérdés is felmerülhet. Az látássérülés okuk, hogy van-e egyáltalán bármilyen olyan tulajdonsága a hangoknak, amely a kontextustól függetlenül mindig állandó azt leszámítva, hogy a percepció, vagyis a fonéma reprezentációja valóban mindig az.

Ez egy nagyon fontos tény, és a beszédészlelés elméletei kapcsán látni fogjuk, hogy a produkció invarianciája esetleg felhasználható a percepcióban. A másik kérdés, hogy vajon mennyire általános az invariancia? Minden fonémára igaz, vagy csak néhányra?

mi legyen a jövőkép