Prószéky Gábor, Váradi Tamás (szerk.)

Általános Nyelvészeti Tanulmányok XXIV.

Nyelvtechnológiai kutatások


További tervek

A 2.1. pontban már megemlítettük, hogy az általunk választott feladatnak – a maximális NP-k azonosításának – egyik célja, hogy a későbbiekben lehetőségünk nyíljon mondatok közvetlen összetevőinek, elsősorban az igék vonzatainak feltérképezésére, aminek hasznát vehetjük gépi fordítási feladat során. Ennek első lépéseként szükséges elkészítenünk egy magyar–angol párhuzamos, azaz ugyanazon szövegeket két nyelven tartalmazó NP-korpuszt, amelyhez kiindulópontként szolgált a Hunglish magyar-angol párhuzamos korpusz (Varga et al. 2005). Megfelelő tanulóadat előállítását követően a hunchunk eszközt alkalmassá tettük angol nyelvű NP-felismerésre is (bővebben l. Recski et al. 2009), így elvégezhettük a Hunglish korpusz NP-chunkolását mindkét nyelven. További terveink között szerepel a korpusz NP-szintű párhuzamosítása – azaz a megfelelő NP-k összerendelése –, később egy felügyelt tanulásra épülő magyar-angol NP-fordító létrehozása. Elképzeléseink szerint az NP-fordítás képességével jelentősen közelebb kerülnénk egy jó minőségű angol-magyar fordítórendszer létrehozásához is. A bemutatott rendszert továbbá – megfelelő új tanítókorpusz létrehozásával – alkalmassá tettük tetszőleges kategóriájú maximális mondattani összetevők azonosítására (Recski 2011), ezzel újabb lépést téve a magyar mondatok felszíni szerkezetének gépi azonosítása felé.

Általános Nyelvészeti Tanulmányok XXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2018


A kiadvány regisztrációval szabadon elérhető.

A mai számítógépeken futó legtöbb alkalmazás találkozik az emberi nyelvek beszélt vagy írásos formájának valamelyikével: leveleink, híreink, könyveink, tudományos publikációink valamilyen emberi nyelven íródnak, és a gépek ezeket a szövegeket segítenek létrehozni, kijavítani, lefordítani vagy éppen keresni bennük. Ezeknek a tevékenységeknek a leírására a human language technologies elnevezést használja a nemzetközi szakirodalom. Magyarul ez a fogalom nyelvtechnológia néven vonult be a szakmai köztudatba. Az Általános Nyelvészeti Tanulmányok 24. kötete a nyelvtechnológia legújabb hazai kutatásait állítja a középpontba.

A tanulmányok reprezentatív áttekintést szándékoznak adni a magyar nyelvtechnológia jelenleg használt módszereiről és legújabb eredményeiről: a kötet a hazai gépi nyelvészet történetének áttekintésével indul, majd egy-egy írás foglalkozik a szóalaktan, a főnévi csoportok, a tulajdonnevek, a hatóköri relációk, a birtokos és a koreferenciális szerkezetek gépi kezelésével, az igék lexikai reprezentációjával és az analógiás tanulással. Felvillantjuk a modern nyelvtechnológiának a szociolingvisztikában, a metaforikus nyelvhasználat gépi kezelésében, az emberŚgép kommunikáció különféle vonatkozásainak vizsgálatában és a nyelvtörténeti kutatásban való felhasználását is. A kötetet egy a szorosan vett nyelvtechnológiával közvetlenül szomszédos terület, a hangzó anyagok gépi feldolgozásával és létrehozásával foglalkozó beszédtechnológia két kutatási összefoglalója zárja.

A pontosan ötven évvel ezelőtti első hazai számítógépes nyelvészeti konferencia egyik fontos szereplője s az azóta eltelt ötven év jelentős részében az Általános Nyelvészeti Tanulmányok sorozat egyik szerkesztője, Szépe György közvetlenül kötetünk megjelenése előtt hunyt el. Munkánkkal az ő emléke előtt is tisztelgünk.

Hivatkozás: https://mersz.hu/kenesei-proszeky-varadi-altalanos-nyelveszeti-tanulmanyok-xxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave