Mády Katalin, Markó Alexandra (szerk.)

Általános Nyelvészeti Tanulmányok XXXIV.

Fonetikai tanulmányok


Neurális megközelítés nyelvmodellekkel segítve

Az előző kísérletben – a klasszikus megközelítéssel ellentétben – nem használtunk explicit nyelvmodellt, amely segítene a hasonló hangzású variánsok közül a nyelvileg valószínűbbet kiválasztani a felismerési folyamat során. Ezt a következő kísérletekben pótoltuk, egyben kiterjesztettük a vizsgálatokat az ún. Conformer enkóder struktúrára (Gulati et al. 2020), amely egyesíti a konvolúciós neurális hálózatok (LeCun–Bengio 1995) lokális modellezési képességeit az attention (figyelmi) mechanizmus (Vaswani et al. 2017) globális modellezési lehetőségeivel. Nyelvmodellként vagy a train-114 saját leiratából (0,55 millió szó) képzett n-gram modellt, vagy ehhez külső forrás, a Magyar Nemzeti Szövegtár (Oravecz et al. 2014) beszélt nyelvi alkorpusza (74 millió szó) hozzáadásával képzett n-gram modellt használtuk. Az n-gram modelleket a KenLM eszközzel1 tanítottuk, karakter alapú akusztikus egységek esetén szó 3-gram modellt, míg Sentence Piece unigram (Kudo–Richardson 2018) szótöredék-alapú akusztikus egységek esetén egyező, szótöredék-alapú 6‑gram modellt. Az n-gram nyelvmodellel kapott hipotézisek újrasúlyozásához egy GPT-2-es struktúrájú (Radford et al. 2019), 161 millió paraméterű, transformer típusú neurális nyelvmodellt is használtunk. Ezt a modellt az NVIDIA NeMo2 eszközével tanítottuk az MNSZ alkorpuszon 10 000-es szótárméretű BPE (Sennrich et al. 2015) szótöredék-egységeken, majd finomhangoltuk a train-114 szöveges leiratokon. Minden esetben az NVIDIA által angol nyelvre előtanított súlyokkal3 inicializáltuk a BEA-Base-en történő neurális akusztikusmodell-tanítást, melynek eredményei a 8. táblázatban láthatóak.

Általános Nyelvészeti Tanulmányok XXXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2023

ISBN: 978 963 454 864 5

Az Általános Nyelvészeti Tanulmányok sorozat 59 éves történetében először jelenik meg benne fonetikai témájú tanulmányválogatás. A 34. kötet szerkesztésének fő vezérelve az volt, hogy a magyar nyelv hangzását elemző fonetikai kutatások palettájának a lehető legtöbb színárnyalatát szemléltesse a nyelvészeti elméleteket tesztelő empirikus vizsgálatoktól az agyi ingerek vizsgálatán át a gyakorlati alkalmazást lehetővé tevő kutatásokig, mint például a klinikai fonetika vagy a beszédtechnológia. Az itt közölt tanulmányok a 2020-as évek elejének pillanatfelvételei magyarországi és külföldi kutatóműhelyekből, ezek mindegyike egy vagy több kísérlet eredményeiről számol be. Szerepelnek a beszéd produkcióját (szegmentális és szupraszegmentális szerkezetét) artikulációs és akusztikai módszertannal együttesen vizsgáló kísérletek, illetve akusztikai elemzések is. A beszédészleléssel foglalkozó cikkek közös vonása, hogy a beszédhangoknál nagyobb nyelvi egységek percepcióját vizsgálják. Végül a kötetben olyan tanulmányok is helyet kaptak, amelyek valamilyen speciális nézőponttal ötvözik a fonetikai megközelítést, a beszédpatológiától a dialektometriáig.

Hivatkozás: https://mersz.hu/altalanos-nyelveszeti-tanulmanyok-xxxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave