5. Annotáció és strukturálás gépi tanuláshoz

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A sokszáz beszélőtől felvett, lejegyzett változatos és nagyrészt spontán beszéd kiválóan alkalmas különféle gépi tanuló – elsősorban beszédfelismerő, leiratozó – rendszerek betanítására, tesztelésére. Ezen rendszerek esetén általában nem szükséges a problémás szakaszok (pl. nem érthető vagy párhuzamos beszéd egy csatornán) pontos lejegyzése, ezeket praktikusabb kihagyni inkább a tanításból. Hasonlóan, a többszintű, nyelvészetileg igényes annotáció sem szükséges, mivel a modern beszédfelismerő rendszerek tanítása számára csak a konkrét elhangzott beszéd verbalizált (szövegszerű, számokat és egyéb speciális karaktereket nem tartalmazó) leirata és a hozzá tartozó hanganyag szolgál bemenő adatként. A beszélő személy megjelölése is hasznos, sőt beszélőfelismerő rendszereknél nélkülözhetetlen, azonban ezt elég a „problémamentes” szegmensekre fájlszinten rögzíteni, nem szükséges az annotáció szintjén, mert a zavaros, gyors, átlapolódó beszédrészeket nem használjuk alapértelmezésben. Jellemző még a gépi beszédfelismerő rendszerek tanítására, hogy néhány másodperces, minimum 200 ms hosszú beszédszünetekkel határolt beszédrészletekkel történik, így az ilyen hosszakra darabolást is el kell végezni, ami tipikusan már korábban, más hanganyagon betanított beszédfelismerő rendszer alkalmazásával valósítható meg.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A fenti megfontolások, valamint az ingyenesen elérhető magyar nyelvű beszédleiratozó tanítására és tesztelésére alkalmas adatbázisok szűkössége miatt létrehoztunk egy BEA-Base1 nevű partíciót a BEA adatbázison belül. A BEA-Base célja, hogy lehetővé tegye a kutatók számára, hogy azonos tanító, validáló és kiértékelő adatokon korszerű beszédfelismerési módszereket összehasonlítsanak. Az adatbázisról és a kezdeti gépi beszédfelismerési eredményekről beszámoltunk (Mihajlik et al. 2022a,b). Alább összefoglaló jelleggel vázoljuk a gépi tanulási részadatbázis felépítését, és részletezzük azon adatokat, melyek az előző publikációkba terjedelmi korlátok miatt nem fértek be, valamint ismertetjük a legújabb eredményeket.
 
1 Kutatási célokra regisztráció után letölthető innen: https://phon.nytud.hu/bea/
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave