Mády Katalin, Markó Alexandra (szerk.)

Általános Nyelvészeti Tanulmányok XXXIV.

Fonetikai tanulmányok


Bevezetés

A BEA magyar beszélt nyelvi adatbázis története egészen 2007-ig nyúlik vissza, amikor is az akkori MTA Nyelvtudományi Intézet Fonetikai Osztályának munkatársai Gósy Mária vezetésével megtervezték az adatbázist, és elindították az adatgyűjtést (Gósy 2008). A spontán beszédre koncentráló, de más beszédtípusokat is tartalmazó adatbázis folyamatosan bővült az évek során (Gósy–Gyarmathy 2017; Gósy et al. 2012; Gyarmathy–Neuberger 2011; Gyarmathy et al. 2014; Neuberger et al. 2014). Hatalmas munkával több száz órányi kifinomult annotáció és lejegyzés készült el. A lejegyzések és a hanganyagok számtalan nyelvészeti kutatást és publikációt tettek lehetővé: keresztmetszeti vizsgálatok felnőtt csoportjaihoz adtak alapot (pl. Krepsz 2019; Markó–Bóna 2012), vagy diakrón vizsgálatok alapjául szolgáltak (pl. Auszmann 2017), de határjelölés és irreguláris zöngevizsgálatok (pl. Huszár et al. 2021; Krepsz et al. 2021; Markó–Kohári 2015), ritmusvizsgálatok (pl. Kohári 2014), vagy épp diskurzusjelölők kutatását is szolgálták (pl. Dér 2017). Mindezeken felül a BEA gépi beszélő- és beszédfelismerési kutatások alapjául is szolgált (Beke 2014; Beke–Szaszák 2016), illetve további projektek célzott annotációjához szolgált kiindulási alapként (Horváth et al. 2019). Noha a megcélzott 500-as adatközlőszámot gyakorlatilag sikerült elérni, a rögzített hanganyagok teljes feldolgozása nem történt meg. A mai kor számára szükséges statisztikai elemzésekhez nem lett egységes formára hozva a lejegyzés/annotáció, sőt, akadnak lejegyzetlen felvételek is. Tanulmányunkban áttekintést kívánunk nyújtani a BEA aktuális feldolgozottsági állapotáról, az annotációk egységesítésére való törekvéseinkről, valamint a gépi tanulási felhasználási lehetőségekről. Elsősorban a gépi beszédfelismerési alkalmazásokra koncentrálunk, mivel ezidáig nem alakult ki olyan leiratozott magyar beszédet tartalmazó – kutatásra ingyenesen elérhető – tanító és tesztelő adathalmaz, melyen a különféle megközelítéseket egzakt módon össze lehet hasonlítani. Különösen fontosnak érezzük a spontán és kötött (elicitált vagy olvasott) beszéd gépi felismerése (leiratozása) közti különbség kontrasztív vizsgálatát, mivel a nemzetközi szinten is tipikusan vagy az egyik (olvasott), vagy a másik (társalgási) műfaj leiratozására fókuszálnak, a kettőt együtt kevésbé tárgyalják. A BEA egyedülálló lehetőséget biztosít a spontán és kötött beszéd gépi leiratozásának kontrasztív vizsgálatára, mivel ugyanazon beszélőktől ugyanolyan körülmények között rögzít hangfelvételeket és leiratot mindkét beszédtípusra.

Általános Nyelvészeti Tanulmányok XXXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2023

ISBN: 978 963 454 864 5

Az Általános Nyelvészeti Tanulmányok sorozat 59 éves történetében először jelenik meg benne fonetikai témájú tanulmányválogatás. A 34. kötet szerkesztésének fő vezérelve az volt, hogy a magyar nyelv hangzását elemző fonetikai kutatások palettájának a lehető legtöbb színárnyalatát szemléltesse a nyelvészeti elméleteket tesztelő empirikus vizsgálatoktól az agyi ingerek vizsgálatán át a gyakorlati alkalmazást lehetővé tevő kutatásokig, mint például a klinikai fonetika vagy a beszédtechnológia. Az itt közölt tanulmányok a 2020-as évek elejének pillanatfelvételei magyarországi és külföldi kutatóműhelyekből, ezek mindegyike egy vagy több kísérlet eredményeiről számol be. Szerepelnek a beszéd produkcióját (szegmentális és szupraszegmentális szerkezetét) artikulációs és akusztikai módszertannal együttesen vizsgáló kísérletek, illetve akusztikai elemzések is. A beszédészleléssel foglalkozó cikkek közös vonása, hogy a beszédhangoknál nagyobb nyelvi egységek percepcióját vizsgálják. Végül a kötetben olyan tanulmányok is helyet kaptak, amelyek valamilyen speciális nézőponttal ötvözik a fonetikai megközelítést, a beszédpatológiától a dialektometriáig.

Hivatkozás: https://mersz.hu/altalanos-nyelveszeti-tanulmanyok-xxxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave