Kiefer Ferenc (szerk.)

Strukturális magyar nyelvtan 3.


Számítógépes morfológia

A számítógépnek, amikor szöveggel találkozik, létre kell hoznia a szövegben szereplő szavak gépi reprezentációját. A nyelvfeldolgozó programoknak tehát először a morfológiai elemzéssel, azaz a szavak tövekre és toldalékokra való felbontásával kell foglalkozniuk. Ahhoz, hogy egy rendszer az aktuális mondat megértéséhez hozzákezdhessen, a minimális egységek által hordozott információt egy általában lexikonnak vagy szótárnak nevezett adatbázisból ki kell emelnie. Ez azonban csak akkor egyszerű feladat, ha maguk a szavak szótári alakjukban fordulnak elő a szövegekben. Az angol nyelv gépi feldolgozásában gyakorlatilag a nyolcvanas évek közepéig tartó kísértés volt az összes lehetséges szövegbeli szóalak egyenként való felsorolása a rendszer lexikonjában. A névszói dog, dogs, illetve az igei walk, walked, walker, walking, walks alakú listák használata—a dog + nyelvtani információ, illetve a walk + nyelvtani információ helyett—évtizedeken át kiválóan megtette a magáét. Egyedi módszerek természetesen korábban is voltak a különböző nyelvek morfológiai elemzésére, de általános eljárást csak az ún. véges állapotú technológiáknak az utóbbi tizenöt évben való elterjedése hozott. A leghíresebb ilyen modell a Koskenniemi-féle kétszintes morfológia (Koskenniemi 1983), mely egyrészt elméleti keretet és formalizmust ad a szavak toldalékolásának, képzésének és összetételének leírásához, másrészt a nyelvész leírása a számítógépes implementáció számára is (módosítás nélkül) adekvát eszköznek bizonyul. A formalizmus lexikonból és szabályokból áll. A lexikon szótöveket és toldalékokat tartalmaz. A nyelvi elemek lexikális reprezentációiból álló sorozatok adják az egyik, a szóalakok felszíni reprezentációi a másik szintet a kétszintes rendszerben (lásd (1)). A szabályok nem tesznek mást, mint egyegyértelműen definiálják a két szint közötti kapcsolatot mindenféle további szint közbeiktatása nélkül. Természetesen a lexikonbeli alakok morfológiai—és a szóalaktanon belül a hangalakra vonatkozó, ún. morfo-fonológiai—változásaik miatt nem feltétlenül ugyanazokból a jelekből épülnek fel, mint a valóságban, ugyanis néha a vizsgálandó nyelv alapábécéjében nem szereplő szimbólumokra is szükség lehet a szabályok működtetéséhez. Ezek a szabályok tulajdonképpen az alternatív realizációk szükséges és elégséges feltételeit adják meg, azaz a lexikális és felszíni alakok közti megfelelés feltételeit írják elő (lásd (2)). A rendszer gyakorlati jelentőségét az adja, hogy az—egyébként nyelvektől teljesen független—elméleti modell egy igen hatékonyan megvalósítható számítógépes programot definiál. A rendszer másik előnye a nyelvfüggetlenség mellett a kétirányúság, azaz az a tény, hogy Koskenniemi modellje elemzésére és generálására egyaránt alkalmazható.

Strukturális magyar nyelvtan 3.

Tartalomjegyzék


Kiadó: Akadémiai Kiadó

Online megjelenés éve: 2018

ISBN: 978 963 454 053 3


A kiadvány regisztrációval szabadon elérhető.

A Strukturális magyar nyelvtan 3. kötete a magyar alaktant tárgyalja. A magyar alaktan rendkívül gazdag, és számos, elméletileg is érdekes kérdést vet fel. Tudott dolog, hogy az alaktan és a mondattan bonyolultsági foka között fordított viszony áll fenn: minél bonyolultabb valamely nyelv mondattana, annál szegényebb alaktana, és minél gazdagabb alaktana, annál egyszerűbb mondattana. A magyar nyelv is sok olyan szerkezeti tulajdonságot kódol morfológiailag, amelyet más nyelv szintaktikailag fejez ki.

A Strukturális magyar nyelvtan korábbi köteteihez hasonlóan az alaktani kötet is arra törekszik, hogy egy adott elméleti keretben részletesen bemutassa a magyar alaktan legfontosabb sajátosságait. Az elméleti tárgyalás nagyszámú, empirikusan is új megfigyelést tett lehetővé. A kötetet ezért az is haszonnal forgathatja, akit az elméleti kérdésfeltevések kevésbé érdekelnek.

A magyar alaktan nemcsak az elméleti morfológiában foglal el különleges helyet, hanem az alkalmazott kutatásokban is. Ezért tartottuk fontosnak, hogy egy-egy fejezetet szenteljünk a magyar morfológia pszicholingvisztikai és számítógépes nyelvészeti vonatkozásainak is.

Hivatkozás: https://mersz.hu/kiefer-strukturalis-magyar-nyelvtan-3//

BibTeXEndNoteMendeleyZotero

Kivonat
fullscreenclose
printsave