A BEA továbbfejlesztése és alkalmazása kontrasztív gépi beszédfelismerési kísérletekre1
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p2 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p2)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p2)
Mihajlik Péter1,2 – Gráczi Tekla Etelka1 – Kohári Anna1 – Tarján Balázs2,3 – Balog András1,3 – Mády Katalin1
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p3 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p3)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p3)
1 Nyelvtudományi Kutatóközpont, Budapest
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p4 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p4)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p4)
2 Budapesti Műszaki és Gazdaságtudományi Egyetem, Budapest
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p5 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p5)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p5)
3 SpeechTex Kft., Budapest
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p6 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p6)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p6)
Jegyzet elhelyezéséhez, kérjük, lépj be.!
Hivatkozások
Válaszd ki a számodra megfelelő hivatkozásformátumot:
Harvard
Mády Katalin–Markó Alexandra (szerk.) (2023): Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó.
https://doi.org/10.1556/9789634548645 Letöltve: https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p8 (2026. 05. 20.)
Chicago
Mády Katalin, Markó Alexandra, szerk. 2023. Általános Nyelvészeti Tanulmányok XXXIV.. : Akadémiai Kiadó. https://doi.org/10.1556/9789634548645 (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p8)
APA
Mády K., Markó A. (szerk.) (2023). Általános Nyelvészeti Tanulmányok XXXIV.. Akadémiai Kiadó. https://doi.org/10.1556/9789634548645. (Letöltve: 2026. 05. 20. https://mersz.hu/dokumentum/m1003anyt34__188/#m1003anyt34_186_p8)
Kivonat: A BEA (BEszélt nyelvi Adatbázis) az egyik legismertebb, legsokoldalúbb és leginkább kutatott magyar nyelvű beszédadatbázis. Meggyőződésünk azonban, hogy a jelenleginél is jobban hasznosulhat, ha egységes, sztenderd annotációt és jelölésrendszert kap, illetve a feldolgozási inkonzisztenciákat, hiátusokat korrigáljuk. A tanulmányban egyrészt bemutatjuk a BEA aktuális, ez idáig publikálatlan állapotát, és beszámolunk a továbbfejlesztési irányokról, munkálatokról. Másrészről megmutatjuk, hogy megfelelő adatszelekcióval gépi tanulásra alkalmas részhalmaz alakítható ki, amely viszonyítási alapként szolgálhat magyar nyelvű gépi beszédfelismerési kísérletekhez. A BEA sajátosságainak köszönhetően a kötött és a spontán beszédhalmazokon elért pontosságok kontrasztba állítva vizsgálhatók, amire nemzetközi szinten is kevés példa található. A kísérleti eredményeink azt mutatják, hogy noha a viszonyítási ponthoz – a mai gyakorlati beszédfelismerő alkalmazásokban elterjedten használt módszerhez – képest kevesebb mint felére sikerült csökkenteni a beszédfelismerési hibát, a spontán vs. kötött beszéd leiratozási hibái közötti jelentős különbség megmaradt. Mindez arra utal, hogy bár jól ismert, hogy a spontán beszéd természeténél fogva jelentősen különbözik az olvasottól, a további tanulmányozása mind nyelvi, mind technológiai oldalról indokolt.
Kulcsszavak: beszélt nyelvi adatbázis; spontán beszéd; olvasott beszéd; gépi beszédfelismerés; mély neurális hálózatok
Recent updates on the BEA speech database and automatic speech recognition results in a contrastive approach
Abstract: The BEA (Spoken Language Database) is one of the most well-known, most versatile and most researched Hungarian speech databases. However, we are convinced that it can be even more useful if a uniform, standard annotation is provided, the inconsistencies are corrected and the postprocessing is finished. In the study, on the one hand, we present the current, so far unpublished state of BEA, and we report on the ongoing works and on the future directions of further development. On the other hand, we show that with appropriate data selection, a subset suitable for machine learning can be developed, which can serve as a standard benchmark for automatic speech recognition experiments in Hungarian. Due to the unique features of BEA, the accuracies achieved on fixed (read/repeated) and spontaneous speech sets can be examined contrastively, for which there are not many examples across languages. Our experimental results show that, although we were able to reduce the error rates of fixed and spontaneous speech to less than half of the initial method used widely in today's practical speech recognition applications, a significant difference between the recognition errors of fixed and spontaneous speech remained. All this suggests that although the inherent difference of spontaneous and read speech is well known, still further research is necessary regarding spontaneous speech from both a linguistic and a technological point of view.
Keywords: spoken language database; spontaneous speech; read speech; automatic speech recognition; deep neural networks
Fő szerző és levelező szerző: Mihajlik Péter; szenior szerző: Mády Katalin.
1 A tanulmány a Prozódiai szerkezet és mondattípusok vizsgálata nagy beszédadatbázisokon mély tanulási támogatással (NKFI-K-135038) című projekt támogatásával készült. A kutatásokat támogatta továbbá az Európai Unió, az Innovációs és Technológiai Minisztérium és a Nemzeti Kutatási Fejlesztési és Innovációs Hivatal az Infokommunikációs és Információtechnológiai Nemzeti Laboratórium, illetve az RRF-2.3.1-21-2022-00004 azonosítójú, Mesterséges Intelligencia Nemzeti Laboratórium projekt keretében, valamint az NVIDIA Academic Hardware Grant.