Prószéky Gábor, Váradi Tamás (szerk.)

Általános Nyelvészeti Tanulmányok XXIV.

Nyelvtechnológiai kutatások


A magyar számítógépes szintaxis eredményei

A morfológiai rendszerek világához képest kisszámú és meglehetősen szerény képességű szintaktikai elemző és generáló modell készült a magyar nyelvre. Mivel kezdetben az orosz–magyar gépi fordítás megvalósítása volt a cél, a magyar szövegek szintetizálása állt a kutatások előterében, s ezt mindössze néhány kísérleti jellegű próbálkozás követte. A magyar szövegek szintaktikai szintézise a hatvanas évek elejének gépi fordítási lázában fontos kutatási területnek számított, ám egy-egy részterület tanulmányozásán túl az időszak jelentős eredmények nélkül zárult. Szintén a hatvanas években, Vargha Dénes elképzelései alapján az MTA Számítástechnikai Központjában indult meg az első automatikus mondattani elemzést végző program kidolgozása. Az eljárás alapjául Dömölki (1964) tetszőleges jelsorozatok felismerésére kidolgozott algoritmusa szolgált. A Vargha-féle felfogásban a „nyelvtan” nem a hagyományos értelemben vett nyelvtant jelenti, mivel nem célja a mondatok és a nem mondatok megkülönböztetése képességének leírása. Annak, hogy a mondat a nyelvhez tartozik-e vagy sem, annyi köze van a nyelvtanhoz, mint egy tény igaz vagy hamis voltának egy róla szóló logikai állításhoz. Vargha megállapítja, hogy a szabad szórendű nyelvek elemzője nem használhat transzformációkat, mert azok vagy nem állíthatók elő ismert transzformációk (pl. a törlés) inverzeként, vagy a szerkezet ismerete nélkül nem alkalmazhatók. Maga az eljárás morfológiai elemzéssel kezdődik, és a szöveg morfémái helyett a szintaktikai elemző már csak kategóriakódjaikkal találkozik. Hell György a hetvenes évek elején a BME Idegennyelvi Intézetében foglalkozott magyar mondatok szintaktikai elemzésével is: elképzelése a függőségi leíráson alapult. Kísérleti elemző algoritmusa csak egyszerű, ellipszismentes mondatokat kezelt. Gyakorlati megfigyelésekre épülő elemzőprogramját az Egyetemi Számítóközpont RAZDAN-1 gépén implementálták, gépi kódban (Hell 1975). Prószéky és Tóth (1979) szintaktikai elemzője szintén csak a kísérleti stádiumig jutott: az ELTE-1304 gépén futó FORTRAN nyelvű program egyszerű bővített (vesszőt nem tartalmazó) magyar mondatok nyelvtani elemzését végezte.

Általános Nyelvészeti Tanulmányok XXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2018


A kiadvány regisztrációval szabadon elérhető.

A mai számítógépeken futó legtöbb alkalmazás találkozik az emberi nyelvek beszélt vagy írásos formájának valamelyikével: leveleink, híreink, könyveink, tudományos publikációink valamilyen emberi nyelven íródnak, és a gépek ezeket a szövegeket segítenek létrehozni, kijavítani, lefordítani vagy éppen keresni bennük. Ezeknek a tevékenységeknek a leírására a human language technologies elnevezést használja a nemzetközi szakirodalom. Magyarul ez a fogalom nyelvtechnológia néven vonult be a szakmai köztudatba. Az Általános Nyelvészeti Tanulmányok 24. kötete a nyelvtechnológia legújabb hazai kutatásait állítja a középpontba.

A tanulmányok reprezentatív áttekintést szándékoznak adni a magyar nyelvtechnológia jelenleg használt módszereiről és legújabb eredményeiről: a kötet a hazai gépi nyelvészet történetének áttekintésével indul, majd egy-egy írás foglalkozik a szóalaktan, a főnévi csoportok, a tulajdonnevek, a hatóköri relációk, a birtokos és a koreferenciális szerkezetek gépi kezelésével, az igék lexikai reprezentációjával és az analógiás tanulással. Felvillantjuk a modern nyelvtechnológiának a szociolingvisztikában, a metaforikus nyelvhasználat gépi kezelésében, az emberŚgép kommunikáció különféle vonatkozásainak vizsgálatában és a nyelvtörténeti kutatásban való felhasználását is. A kötetet egy a szorosan vett nyelvtechnológiával közvetlenül szomszédos terület, a hangzó anyagok gépi feldolgozásával és létrehozásával foglalkozó beszédtechnológia két kutatási összefoglalója zárja.

A pontosan ötven évvel ezelőtti első hazai számítógépes nyelvészeti konferencia egyik fontos szereplője s az azóta eltelt ötven év jelentős részében az Általános Nyelvészeti Tanulmányok sorozat egyik szerkesztője, Szépe György közvetlenül kötetünk megjelenése előtt hunyt el. Munkánkkal az ő emléke előtt is tisztelgünk.

Hivatkozás: https://mersz.hu/kenesei-proszeky-varadi-altalanos-nyelveszeti-tanulmanyok-xxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave