Prószéky Gábor, Váradi Tamás (szerk.)

Általános Nyelvészeti Tanulmányok XXIV.

Nyelvtechnológiai kutatások


A BEA adatbázis felvételi protokollja

Az adatbázis döntően spontán beszédanyagokat tartalmaz, azonban az összehasonlíthatóság érdekében mondatismétléseket és felolvasásokat is rögzítenek benne. A protokoll 6 részből áll, amelyek a következő megnevezésekkel jellemezhetők: narratíva, véleménykifejtés, tartalomösszegzés, társalgás, mondatismétlés, felolvasás. Minden adatközlővel többféle típusú spontán beszéd rögzítésére kerül sor. 1. A narratívák az adatközlő életéről, családjáról, munkájáról, hobbijáról szóló, többé-kevésbé összefüggő monologikus szövegek. 2. A véleménykifejtés (amely nagyobbrészt szintén narratíva) egy az interjúkészítő által megadott, éppen aktuális témának a véleményezése. Néhány a témák közül: jogosítványszerzés, zéró tolerancia a gépkocsivezetőkkel szemben, tervezett áremelkedések, házassági szerződés, klímaváltozás, tanárok elleni erőszak, budapesti közlekedés, otthonszülés, internetes és hagyományos könyvtár, állatvédelmi törvény, mobiltelefon kisgyerekeknek, olvasási szokások, hitelfelhalmozás, dohányzási tilalom, csipszadó. Az interjúkészítő itt is arra törekszik, hogy az adatközlő minél hosszabban beszéljen összefüggően, ez a kommunikációs helyzet azonban megköveteli, hogy néha ő is megszólaljon, elmondja a saját véleményét, így esetenként dialógus jellegű beszédrészek is létrejönnek. (Az interjúkészítő szándékosan mindig az adatközlővel ellentétes véleményt igyekszik képviselni.) 3. A tartalomösszegzés voltaképpen irányított spontán beszéd. Az adatközlő felvételről meghallgat egy szöveget, és ezt követően rögtön a saját szavaival el kell mondania annak tartalmát. Az egyik szöveg egy rövid tudománynépszerűsítő cikk (174 szavas; 1 perc 37 mp tartamú), a másik egy anekdotaszerű történet (270 szavas; 2 perc 5 mp tartamú), rögzítésük átlagos női beszélővel történt. 4. A társalgás során az adatközlőn és az interjúkészítőn kívül egy további személy vesz részt a beszélgetésben. A téma változó, az élet mindennapjaihoz kapcsolódik; ugyanazon adatközlő esetében mindig különbözik a véleménykifejtés témájától. A társalgás témáiból: szilveszter, esküvői élmények, álláskeresés, drogtermelés a lakásban, húsvét, repülőszerencsétlenség, dohányzás, házasság vagy együttélés, érettségi, nyaralás, karácsonyi készülődés, gázkrízis Európában, iskolai erőszak, állattartás lakásban, a válság hatása a kultúrára, metróépítés, a könnyű drogok legalizálása, színházi élet, a diákok jogai, nők és karrier, gyermekvállalás, biciklizés mint közlekedési forma, koncertek, a diploma értéke stb. A véleménykifejtés és a társalgás témáit az interjúkészítő választja ki a beszélő életkorának, foglalkozásának, érdeklődésének megfelelően (ebben a narratíva iránymutató). 5. A mondatismétlés anyaga 25 egyszerű vagy összetett mondat (pl. A farsangi bálban mindenkinek szép jelmeze volt). A mondatot az interjúvezető olvassa fel az adatközlőnek, akinek egyszeri meghallgatás után azonnal meg kell azt ismételnie. (Ha sikertelen az ismétlési kísérlet, többször is elhangozhat a mondat.) 6. A protokoll szerint az adatközlő kétféle szöveget olvas fel. Az egyik a huszonöt, korábban ismételt mondat, a másik egy tudománynépszerűsítő cikk felolvasása. (A felvétel mindig ezzel zárul.)

Általános Nyelvészeti Tanulmányok XXIV.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2018


A kiadvány regisztrációval szabadon elérhető.

A mai számítógépeken futó legtöbb alkalmazás találkozik az emberi nyelvek beszélt vagy írásos formájának valamelyikével: leveleink, híreink, könyveink, tudományos publikációink valamilyen emberi nyelven íródnak, és a gépek ezeket a szövegeket segítenek létrehozni, kijavítani, lefordítani vagy éppen keresni bennük. Ezeknek a tevékenységeknek a leírására a human language technologies elnevezést használja a nemzetközi szakirodalom. Magyarul ez a fogalom nyelvtechnológia néven vonult be a szakmai köztudatba. Az Általános Nyelvészeti Tanulmányok 24. kötete a nyelvtechnológia legújabb hazai kutatásait állítja a középpontba.

A tanulmányok reprezentatív áttekintést szándékoznak adni a magyar nyelvtechnológia jelenleg használt módszereiről és legújabb eredményeiről: a kötet a hazai gépi nyelvészet történetének áttekintésével indul, majd egy-egy írás foglalkozik a szóalaktan, a főnévi csoportok, a tulajdonnevek, a hatóköri relációk, a birtokos és a koreferenciális szerkezetek gépi kezelésével, az igék lexikai reprezentációjával és az analógiás tanulással. Felvillantjuk a modern nyelvtechnológiának a szociolingvisztikában, a metaforikus nyelvhasználat gépi kezelésében, az emberŚgép kommunikáció különféle vonatkozásainak vizsgálatában és a nyelvtörténeti kutatásban való felhasználását is. A kötetet egy a szorosan vett nyelvtechnológiával közvetlenül szomszédos terület, a hangzó anyagok gépi feldolgozásával és létrehozásával foglalkozó beszédtechnológia két kutatási összefoglalója zárja.

A pontosan ötven évvel ezelőtti első hazai számítógépes nyelvészeti konferencia egyik fontos szereplője s az azóta eltelt ötven év jelentős részében az Általános Nyelvészeti Tanulmányok sorozat egyik szerkesztője, Szépe György közvetlenül kötetünk megjelenése előtt hunyt el. Munkánkkal az ő emléke előtt is tisztelgünk.

Hivatkozás: https://mersz.hu/kenesei-proszeky-varadi-altalanos-nyelveszeti-tanulmanyok-xxiv//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave