6. Összefoglalás

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Tanulmányunkban bemutattuk az egyik legnagyobb magyar nyelvű, kutatási célokra elérhető, főleg spontán beszédet tartalmazó leiratozott adatbázis, a BEA aktuális állapotát, a folyó munkálatokat. Óriási értéket állítottak elő elődeink, és a jövőt tekintve is tekintélyes mennyiségű munka van hátra, hogy a teljes, közel 500 beszélőtől származó hanganyagot egységes leirattal és annotációval tudjuk a kutatóközösség elé tárni. Megmutattuk, hogy már az adatok kisebb részén, egyszerűsített annotációval is korszerű és izgalmas gépi beszédfelismerési kutatások folytathatók. Egyszerre kíséreltük meg javítani a spontán és a kötött beszéd gépi leiratozásának pontosságát, melyben minden korábbit felülmúló eredményeket sikerült elérni. Számos kísérleti elrendezésben hasonlítottuk össze – állítottuk kontrasztba – az olvasott/ismételt, illetve a spontán beszéd felismerési hibaarányait, és arra jutottunk, a közel ötször magasabb hibaérték a spontán beszédre minden releváns körülmény között megmaradt, csupán a nyelvmodell nélküli, szuboptimális elrendezésekben csökkent a különbség. Mindez megerősíti a jól ismert – a technológusok által mégis gyakran figyelmen kívül hagyott – tényt, hogy a spontán beszéd jelentősen különbözik a kötöttől, gépi leiratozása lényegesen nagyobb kihívás, így mind nyelvészeti, mind technológiai célú kutatására nagyobb hangsúlyt érdemes helyezni a jövőben.
 
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave