Prószéky Gábor, Váradi Tamás (szerk.)

Általános Nyelvészeti Tanulmányok XXIV.

Nyelvtechnológiai kutatások


Összefoglalás

Írásunkban az artikulációs megkülönböztető jegyek gépi beszédfelismerésben való felhasználására tettünk kísérletet. Bár fő motivációnk a jegyek nyelvfüggetlensége volt, bemutattuk azt is, hogy a jegyalapú modellezés számos szempontból a koartikuláció kezelését is meg tudná könnyíteni. Kísérleteinkben egy 2000 órányi angol nyelvű felvételen betanított, ingyenesen közkinccsé tett jegydetektáló rendszert próbáltunk magyar nyelvű felvételek felismerésében alkalmazni. Az eredmények sajnos nem igazolták, hogy a rendszer nyelvfüggetlen lenne, és így nagyobb tanítókorpusz gyűjtése nélkül lehetővé tenné más nyelvű felismerők készítését. A hibák részletes elemzéséből arra a következtetésre jutottunk, hogy maga a kivitelezés számos ponton támadható, így a negatív eredmény nem cáfolja a koncepció használhatóságát, pusztán azt mutatja, hogy a kényelmes út, azaz a hagyományos eszköztár feladatra való ráerőszakolása nem vezet célhoz. Úgy véljük, hogy a jó eredmények eléréséhez a jegydetektorok betanításán is finomítani kell, és speciálisan a jegyalapú reprezentációhoz kidolgozott technológiára is szükség lesz.

Általános Nyelvészeti Tanulmányok XXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2018


A kiadvány regisztrációval szabadon elérhető.

A mai számítógépeken futó legtöbb alkalmazás találkozik az emberi nyelvek beszélt vagy írásos formájának valamelyikével: leveleink, híreink, könyveink, tudományos publikációink valamilyen emberi nyelven íródnak, és a gépek ezeket a szövegeket segítenek létrehozni, kijavítani, lefordítani vagy éppen keresni bennük. Ezeknek a tevékenységeknek a leírására a human language technologies elnevezést használja a nemzetközi szakirodalom. Magyarul ez a fogalom nyelvtechnológia néven vonult be a szakmai köztudatba. Az Általános Nyelvészeti Tanulmányok 24. kötete a nyelvtechnológia legújabb hazai kutatásait állítja a középpontba.

A tanulmányok reprezentatív áttekintést szándékoznak adni a magyar nyelvtechnológia jelenleg használt módszereiről és legújabb eredményeiről: a kötet a hazai gépi nyelvészet történetének áttekintésével indul, majd egy-egy írás foglalkozik a szóalaktan, a főnévi csoportok, a tulajdonnevek, a hatóköri relációk, a birtokos és a koreferenciális szerkezetek gépi kezelésével, az igék lexikai reprezentációjával és az analógiás tanulással. Felvillantjuk a modern nyelvtechnológiának a szociolingvisztikában, a metaforikus nyelvhasználat gépi kezelésében, az emberŚgép kommunikáció különféle vonatkozásainak vizsgálatában és a nyelvtörténeti kutatásban való felhasználását is. A kötetet egy a szorosan vett nyelvtechnológiával közvetlenül szomszédos terület, a hangzó anyagok gépi feldolgozásával és létrehozásával foglalkozó beszédtechnológia két kutatási összefoglalója zárja.

A pontosan ötven évvel ezelőtti első hazai számítógépes nyelvészeti konferencia egyik fontos szereplője s az azóta eltelt ötven év jelentős részében az Általános Nyelvészeti Tanulmányok sorozat egyik szerkesztője, Szépe György közvetlenül kötetünk megjelenése előtt hunyt el. Munkánkkal az ő emléke előtt is tisztelgünk.

Hivatkozás: https://mersz.hu/kenesei-proszeky-varadi-altalanos-nyelveszeti-tanulmanyok-xxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave