5.2.2. Tisztán neurális megközelítés
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p1 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p1)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p1)
Nézzük meg, hogy a grafémaalapú (karakteralapú) akusztikus modelleket elejétől végig (end-to-end) neuronhálóval kezelő QuartzNet (Kriman et al. 2020) + CTC (Connectionist Temporal Classification, Graves et al. 2006) megközelítés esetén hogyan alakulnak a leiratozási pontossági mérőszámok nyelvmodell alkalmazása nélkül a 7. táblázatban. Ennél a megközelítésnél a neuronhálónak a beszédfeldolgozáshoz közeli – ún. enkóder – részének struktúrája nyelvfüggetlen, így az angol nyelvre már betanított enkóder felhasználható a magyar nyelvű tanításban is. A betanítás minden esetben a hanganyag pontos leiratát igényli, azaz felügyelt tanítást alkalmazunk.
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_table_60 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_table_60)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_table_60)
7. táblázat. Karakteralapú QuartzNet + CTC end-to-end beszédfelismerési eredmények a BEA-Base adatbázison
Kötött beszéd |
Spontán beszéd | |||
Előtanítás |
WER (%) |
CER (%) |
WER (%) |
CER (%) |
nincs |
11,56 |
2,91 |
26,7 |
8,84 |
angol nyelven | 10,63 | 2,58 | 24,87 |
7,96 |
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p4 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p4)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__199/#m1003anyt34_197_p4)
Ahogy a 7. táblázat mutatja, a spontán és a kötött beszéd leiratozási hibái közötti távolság lényegesen csökkent, azonban ezt kisebb részben okozza a spontán beszédnél tapasztalható pontosságnövekedés, mint a kötött beszédnél tapasztalható romlás. Az angol nyelvű előtanítás egyértelműen csökkenti a beszédfelismerési hibákat, aminek magyarázata lehet, hogy előtanítás nélküli esetben is valahonnan el kell kezdeni a neuronháló paramétereinek hangolását, és ez ilyenkor csak véletlenszerű számokkal történhet, aminél még az angol nyelvre optimalizált súlyértékek is kedvezőbbek. Mind a 6. táblázatban, mind a 7. táblázatban közölt eredmények hasonló komplexitású, kb. 18 millió paramétert tartalmazó modellekkel készültek.