2.3. A terminológiai adatbázis tartalmáról szóló információk

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A WIPO Pearl tartalmának fő jellemzőit tekintve fogalomalapú elvek szerint szerkesztett terminológiai adatbázis. Felépítését, azaz a szerkezeti egységek számát tekintve összetett terminológiai adatbázis, amely a terminológiai bejegyzéseket tartalmazó klasszikus terminológiai adatbázis mellett fogalmi hálókat is tárol. Ennek megfelelően a nyelvi keresési felület (Linguistic Search) mellett a fogalmi hálókban való keresést (Concept Map Search) is felkínálja. Ez utóbbi keresési felület domén, aldomén és nyelvek szerint mutatja be a fogalmi hálókban a terminusok közti kapcsolódási pontokat. Ezen relációk típusai két nagy alcsoportra bonthatók:

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • hierarchikus viszonyok ábrázolására, és ezen belül alá- és fölérendeltség

Jegyzet elhelyezéséhez, kérjük, lépj be.!

vagy rész-egész viszonyok ismertetésére, és

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • asszociatív (azaz tematikus, nem hierarchikus viszonyt ábrázoló) relációkra.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az egyes terminográfiai bejegyzések felépítése részletesen kidolgozott, megfelel az elementaritásnak (egy adatmezőben egy adat szerepeltetése), a granularitásnak (az adatok kidolgozottságának mértéke legyen megfelelő a túl sok alkategória elkerülése érdekében) (l. Reinke, 2012, 102), és számos adatmező-kategóriát tartalmaz. Ha megvizsgáljuk a terminológiai adatbázis szerkezetének részletes jellemzőit, akkor megállapíthatjuk, hogy a szótáraknak megfelelő megastruktúra szerkezeti szintjén a nyitó honlapon egy rövid leírást találunk az adatbázis tartalmáról és céljairól, továbbá egy link segítségével átléphetünk a használati útmutatóba.1 A nyitó weboldal a WIPO szervezet által fenntartott honlapok részét képezi.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A WIPO Pearl terminológiai adatbázisban tárolt nyelvek száma tíz, megegyezik az ENSZ hivatalosan használt nyelveivel (angol, francia, spanyol, arab, kínai, orosz) és a Szabadalmi Együttműködési Szerződés szerint működő szabadalmi fordítói osztály munkanyelveivel (német, portugál, japán, koreai). Az adatbázis 29 doménbe és 311 aldoménbe sorolva tárol terminusokat, ezek közül a fő tárgykörök (domének) a műszaki és természettudományi tárgykörök, illetve a szellemi tulajdon mint jogi domén. Az online felületen a validált (ellenőrzött és jóváhagyott) terminusok bejegyzései tanulmányozhatók. A fogalmi keresés felületén könnyen megfigyelhető, hogy bizonyos tárgykörök a technológiai fejlődés és a szabadalmi igények függvényében jobban kifejtettek, míg más területek kevesebb terminust tartalmaznak, idővel pedig új területek jelenhetnek meg. A doménrendszer kialakításának alapját az 1971-ben a Strasbourgi Megállapodással megalapított IPC-rendszer mellett (International Patent Classification2,3 4), az ISO áru- és szolgáltatási osztályozása, illetve egyéb taxonómiák képezik (Valentini et al., 2016).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A WIPO Pearl 190.000 terminust és 24.000 fogalmat (2020. évi szeptember havi adat) tartalmaz, terminusai elsősorban szabadalmakból származnak. Makrostruktúrája alapján a nyelvi keresés (Linguistic Search) egyszerű és összetett keresési lehetőséget is felkínál. Ez utóbbi esetben lehetővé teszi a forrás- és célnyelvi, a domén szerinti, az adott terminusra történő szűkített keresést, a rövidítések keresését és néhány esetben a gépi fordítási találatok megjelenítését is. A keresőmezőbe beírt terminusra adott találatokat egyszerűen áttekinthető, felsorolás jellegű találati listában kínálja fel. A felső sorban az átláthatóság érdekében külön feltünteti egy sorban a több oldalon felsorolt terminusokat. A fogalmi hálókban való keresésnél (Concept Map Search) beállíthatjuk a kívánt nyelvet, és a tárgykörök rövidítésével ellátott színes körökre kattintva kiválaszthatjuk a megnyitandó domént, aldomént és fogalmi kört, amely utóbbi már hálózatos formában jelenik meg. A terminusra egérrel ráállva láthatjuk a terminus szinonimáját, rákereshetünk továbbá arra, hogy milyen terminusok érintésével juthatunk el egyik terminustól a másikig, ami a szabadalmi tárban való kulcsszavas kereséshez is segítséget nyújthat. Pozitívumként megemlítendő, hogy a két keresési felület között az átjárás biztosított.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az egyes szótári szócikkek, így a mikrostruktúra szintjének megfelelő terminográfiai bejegyzések kétféle módon jelenítik meg az adatokat: egy egyszerűsített és egy részletes formában (full record display). Jelen tanulmányban elsősorban az online felület adatmezőtípusaira koncentrálunk, a többi adatmezőtípus leírása, illetve az, hogy mennyiben felelnek meg a korábbi ISO szabványokban ajánlott kategóriáknak, az Valentini et al. (2016) írásában tanulmányozható.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A találati listán belül szereplő egyszerűsített nézet adatmezőtípusai a terminus, a megbízhatóság (például 3/4), más adatállományokba átvezető linkek, a definíció, a kontextus és a forrás. Ennek kattintással követő kibontását követően a részletesen megjelenített bejegyzések adatmező-kategóriái a következők: domén, aldomén, eredeti rögzítési nyelv, nyelv, a fogalmi hálóra átvezető link, terminus, terminus típusa (fő terminus, szinonima), terminus leírása (rövidítés), használati címke (megengedett, archaikus, terminusjavaslat a fordítói osztály részéről, ajánlott, szabványosított használat), terminus megbízhatósága négyes skálán, utolsó módosítás dátuma, kontextus, kontextus forrása és a terminushoz fűzött megjegyzés.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az adatbázisban található terminusok szófajukat tekintve elsősorban főnevek, de lehetnek igék, melléknevek, határozószók vagy több tagból álló lexémák, kollokációk is (Wright & Budin, 1997, 3). A WIPO munkatársainak a gyakorlatban a terminus elsősorban főnév, ritkán ige vagy nagyon ritka esetben önmagában álló melléknév (Valentini et al., 2016).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ezen a ponton érdemes kitérnünk röviden a szabadalmi terminusok és a szabadalom mint műfaj jellemzőire. A szabadalom egy komplex szövegtípus, határterületet képez a tudományos, a műszaki és a jogi szaknyelv között (ibid.). Megalkotását befolyásolják a nemzeti jogszabályok is, és különböző részekből áll, amelyek közül a leíró részre (description) inkább tudományos-műszaki, míg az igénypontokra (claims) inkább a jogi szakszöveg tulajdonságai jellemzőek.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A szabadalmak speciális nyelvezete (amelynek angol megnevezése az ún. „patentese”) onnan ered, hogy egyfelől szükséges a találmányok közzététele, bemutatása oly módon, hogy azt egy szakember a leírás alapján megértse, tehát a jogszabályi előírásoknak megfelelve beazonosíthatónak kell lennie, ami pontos terminushasználatot követel meg, másfelől védelmet kell nyújtania az adott területen a versenytársak hasonló találmányaival szemben, ami egy tágabban értelmezhető, leíró jellegű terminushasználatot eredményez. Ez utóbbi nyelvhasználat megnehezíti a terminusok kivonatolását, és a fő terminusok és a használatra ajánlott terminusok kiválasztását a számos változat közül (Valentini et al., 2016). Ez a fajta megközelítés nemcsak az angol nyelv esetében igaz, hanem a szabadalmak funkciója miatt a többi nyelv, így a magyar szabadalmak esetében is.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A terminusok validálásakor fontos szempont az előfordulási gyakoriságon túl, hogy a kiválasztott terminus ne legyen túlzottan specifikus, ne csak egy találmányhoz kötődjön, ugyanakkor ne legyen túl általános sem, hanem konkrét, beazonosítható fogalmat jelöljön. A túlságosan tág értelmezésű, leíráshoz használt szabadalmi terminusok általában több tagból álló általános leíró összetételek, és a következő tagokat tartalmazzák: szó + „’means’, ’system’, ’device’” (Valentini et al., 2016, 184), de ide sorolhatók még további tagok is (l. module, assembly, device, unit, portion, set, block, reservoir stb.). A különböző tudományos és műszaki szakszövegek tulajdonságairól ír Olohan (2016), aki könyvében külön fejezetben értekezik a szabadalmak fordításáról, annak jellemzőiről és minőségük jelentőségéről.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Visszatérve az adatmezőtípusokra, az adatbázis megkülönböztet kötelező és fakultatív adatmező-kategóriákat, amelyek közül a kötelező adatmezőtípusok a következők (Valentini et al., 2016, 197):

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • a bejegyzés szintjén (entry level): bejegyzési osztály (validálás státuszai: új, validált, félig validált és szerzői joggal védett), domén, aldomén, eredeti rögzítés forrásnyelve;
  • a terminus szintjén (term level): terminus, terminus státusza, használati címke, terminus típusa, forrás.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az adatmezők besorolása megfelel a hármas hierarchikus struktúrának, amelyen belül a nyelvi indexálás szintjén (language/index level) nem találunk kötelező adatmezőtípusokat. Az utóbbi szerkesztési szintre besorolt fakultatív jellegű, a belső adatbázisban szereplő „Transfer Comment” (átváltási megjegyzés) tartalmaz ugyan a fogalmi egyenértékűségre, azaz az ekvivalenciára vonatkozó információkat, de szintén fakultatív a definíció mint adatkategória (Valentini et al., 2016, 197).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ez szokatlan megoldás a fogalomalapú terminológiai adatbázisokban, hiszen a fogalmat leíró definíció hagyományosan a terminológiai adatbázisok központi eleme. A definíció szerepét ugyanis itt pragmatikus okokból átvette egyfajta kompromisszumként egy speciális kategória, az ún. definíciós kontextus, azaz a fogalmi jellemzőkben gazdag kontextus. Ennek oka abban keresendő, hogy a definíciók kidolgozása jelentős munkaigényű, ezért idő- és pénzigényes, szakértői hálózat fenntartását igényli nyelvenként és doménenként, a gyakorlatban azonban a technológia és az ipar fejlődése gyors, a fordítások pedig szoros határidővel készülnek (Valentini et al., 2016).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Nézzük meg, hogy mit értünk pontosan definíciós kontextus alatt (defining context, l. 2.3. pont alatt). Hagyományosan a kontextus igazolja, hogy a terminus használatban van, és bemutatja a terminus használatát közvetlen szövegkörnyezetében, azaz hogyan illeszkedik a terminus az adott mondatba. Drewer és Schmitz (2017, 67) a „Definitionskontext” változatot nem nevezi hagyományos értelemben definíciónak, és általában véve olyan mondatot értenek alatta, amely megnevezi az adott terminust, információt szolgáltat ugyan a terminus által jelölt fogalomról, de nem alkalmas a fogalom pontos behatárolására. Tehát tartalmaz definícióra jellemző elemeket, de nem feltétlenül meríti ki egy definíció teljességre törekvését a fogalom teljes körű behatárolásához, és nem is egyezhet meg egy szakember által alkotott, a fogalom pontos és teljes behatárolására törekvő definícióval. Valentini et al. (2016, 189) ezeket a kontextusokat ismeretekben gazdag kontextusnak („knowledge-rich contexts”) is nevezi, és ennek használata mellett érvel abból a szempontból, hogy használatuk kevésbé idő- és költségigényes, és rövid időn belül rendelkezésre álló adatokat biztosít.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A szabadalmi kérelmek leíró része olyan információkat tartalmaz, mint például a találmány tárgya és alkalmazási területe, a technika állásának ismertetése (milyen hiányosságokat pótol a találmány), a megoldások ismertetése fő- és aligénypontokkal, az ábrák felsorolása, az oltalom terjedelmét alátámasztó példák és az előnyös hatások bemutatása. Ez a szabadalmi kérelmek legalkalmasabb része a terminusok és definíciós kontextusok kivonatolására. Éppen ezért a szabadalmakon belül az eredeti, anyanyelvi szerzőtől származó leíró rész számít elsődleges forrásnak, hiszen ez a rész tartalmazza legnagyobb valószínűség szerint a felhasználható terminusokat, definíciós kontextusokat és definíciókat. Másodlagos források közé tartoznak a tanulmányok, szakdolgozatok, doktori értekezések és tankönyvek, amelyek közül számos elérhető például a Google Books, Google Scholar és Google Patents felületén.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A fogalmi keresés (Concept Map Search) alatt kínált találatokban a terminusok által jelölt fogalmak közti relációkra láthatunk rá. A fogalmi háló jelentősége abban mutatkozik meg, hogy a fogalmak nem önmagukban, hanem mindig egymáshoz kapcsolódva léteznek (l. ISO 704:2009:8).5 A terminológusok az egy-egy doménbe és aldoménekbe tartozó fogalmakat és terminusokat a fogalmi és terminológiai rendszerek feltérképezésével és kidolgozásával választják ki. A terminusok egymástól való elhatárolását és egymáshoz kapcsolódását már Wüster is táblázatok vagy ontológiai besorolások és elemek (gráfok/ágrajzok) formájában javasolta ábrázolni (l. erről bővebben: Wüster, 1985, 137–201). A rendszerben történő ábrázolás megkönnyíti a fogalmak behatárolását, a fölé-, alá- és mellérendeltségi viszonyok megállapítását. A klasszikus terminológiai munka tehát valójában a fogalmi háló felvázolásával kezdődik, ami segít az összes releváns terminus kiválasztásában, továbbá ellensúlyozza a terminusok különálló bejegyzésekben történő ábrázolását, ami töredezetté teszi az adatokra való rálátást, hiába jelöli egy külön adatmező-kategória a reláció típusát.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az ISO 1087-1:20006 (Terminology work – Vocabulary – Part 1: Theory and application) az ontológiai elemek két fő ágaként az alábbiakat nevezi meg:

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • hierarchikus (ezen belül alá- és fölérendeltség, rész-egész viszony) és
  • asszociatív (például időbeli, ok-okozati összefüggések).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ez a besorolás megegyezik a WIPO Pearl terminológiai adatbázisban a fogalmi hálóban szereplő relációtípusokkal, ahol harmadik kategóriaként szerepel még a másik doménhez tartozás jelölése (l. other subject field 5. ábra). A fogalmi hálók ábrázolása a WIPO Pearl felületén egy doménen, egy aldoménen és egy nyelven belül történik. A WIPO munkatársai a relációkat elsősorban manuálisan rögzítik, és ez a tevékenység gyakran igényli tárgyköri szakértők bevonását (Valentini et al., 2016). A fogalmak kb. 80%-a többnyire manuálisan feldolgozott, tehát kapcsolatban áll valamely másik fogalommal, további relációkat pedig mesterséges intelligencia (gépi tanulás) segítségével elemzik, ami megmutat további lehetséges kapcsolódási pontokat. Pozitívum, hogy mindig jelzi, ha a mesterséges intelligencia által generált találatról van szó. A relációk kisebb része tehát olyan mesterséges intelligencia alkalmazásának eredménye, amely saját fejlesztésű, és olyan fogalmi relációkat kínál fel, amelyeket még nem rögzítettek manuálisan. Ezeket „fogalmi felhőnek” (concept clouds) nevezik, és rendkívül innovatív és kísérleti jellegűek. Az ontológiai elemek azért igazán hasznosak, mert a modern számítógépes ontológiák fejlesztése és sikeres alkalmazásuk azon a felismerésen alapul, hogy a tudás megszerzése nem elegendő: „ismereteinket csak akkor alkalmazhatjuk a gyakorlatban, ha ismerjük a különböző elemek közötti összefüggéseket és képesek vagyunk leírni azokat” (Fóris, 2013, 422)7. Az ontológiai rendszerek online eszközeivel és ábrázolási módjaival foglalkozik még Ugrin (l. Ugrin, 2019, 99).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A fogalmi hálóban történő ábrázolás előnye a fordítások készítése szempontjából, hogy rálátást biztosít az adott fogalmi hálóra, mert bemutatja, hogy az adott doménen és aldoménen belül a terminusok és fogalmaik hogyan kapcsolódnak egymáshoz. Fordításnál ugyanis előfordul, hogy a másik nyelven csak egy gyűjtőfogalmat találunk meg elsőre, így láthatjuk, hogy milyen terminusok tartoznak alá, és ez megkönnyíti a megfelelő terminus megtalálását. Ezenfelül a fogalmi hálók nemcsak a fordítók számára hasznosak, hanem segítenek a szabadalmak kombinált kulcsszavas keresésekor (WIPO Pearl Concept Path search).
 
5. ábra: A vasúti jármű (Rolling stock) aldomén fogalmi hálója a WIPO Pearl felületén8
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Ezzel együtt összességében elmondható, hogy az adatok kategorizálása betartja a mikrostruktúra szintjén a terminológiai adatmodellálás elveit: fogalomalapú megközelítési mód, terminusautonómia (a fő terminus és szinonimák jelzése), hierarchikus szerkesztési mód, elementaritás (egy adatmezőben egy adat szerepeltetése) és a granularitás (a túl sok alkategória elkerülése egy adatmezőben) (Reinke, 2012, 102).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A mezostruktúra, azaz az utalási rendszer szintjén már a találati lista felületén három link látható: a belső link átvezet bennünket a fogalmi hálók felületére, a két külső link a PATENTSCOPE szabadalmi tár és a Google képek keresési felületére.
 
1 https://www.wipo.int/reference/en/wipopearl/guide.html.
2 https://www.wipo.int/classifications/ipc/en/.
3 https://www.sztnh.gov.hu/.
4 hu/nemzetkozi-szabadalmi-osztalyozas-nszo-international-patent-classificationipc.
5 „Concepts do not exist as isolated units of knowledge but always in relation to each other”.
6 l. még: ISO 1087:2019 Terminology work and terminology science — Vocabulary
7 „The development of modern computerized ontology and its successful practical application in various fields is based on the recognition that obtaining knowledge is not enough; we can apply our knowledge in practice only if we know the connections among its various elements and are able to describe them”.
8 https://wipopearl.wipo.int/en/conceptmap.
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave