4.2. Második munkafázis: a terminusok kiválasztása

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A domén meghatározását követően a két különböző domént eltérő munkamódszerekkel dolgoztuk ki:

Jegyzet elhelyezéséhez, kérjük, lépj be.!

  • pénzügyi terminusok: nem korpuszalapú terminológiai munka;
  • földtudományi terminusok: korpuszalapú terminológiai munka.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A pénzügyi aldomén esetében egy szövegkorpusz összeállítására volt elsőként szükség, amelyből azután megtörténhetett a terminusok kivonatolása. Projektünk esetében a szövegkorpusz a PATENTSCOPE szabadalmi tárból kivonatolt szövegekből állt.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A PATENTSCOPE szabadalmi tárban való kereséshez előbb az IPC-rendszerben1 érdemes megkeresni az adott területhez tartozó kódszámok szerinti besorolást, amely ismerteti, hogy mi tartozik az adott osztályhoz (l. Finance; Insurance; Tax strategies; Processing of corporate or income taxes ‒ G06Q40, illetve Physics; Measuring and Testing G01). Az IPC-kód kiválasztása segít abban, hogy célzottan az adott terület szabadalmaira tudjunk a PATENTSCOPE szabadalmi tárban rákeresni. A terminussal és a kontextussal szemben támasztott követelmények határozzák meg a PATENTSCOPE felületén alkalmazott keresési opciókat: esetünkben eredeti angol nyelvű szövegek összeválogatására volt szükség elsősorban a szövegek szabadalmakat leíró részéből (Description), mégpedig a pénzügy szakterületéről.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A keresési opciók közül a mezők kombinálása tűnik a leghasznosabbnak (Field Combination), amelyen belül az Any Field „term”, International Class (G06Q40), Filing Language (EN), Inventor Nationality (US OR GB OR AU OR ZA) és a Publication Date (naprakészség miatt szűkítve) tűnt a legpraktikusabb megoldásnak. Az Inventor Nationality opció biztosítja azt, hogy valóban az eredeti angol nyelven megszövegezett szabadalmak, és ne azok fordításai álljanak rendelkezésre. Az eredeti nyelv vizsgálható a szabadalom első oldalán, az absztrakt oldalán található bibliográfiai adatok alatt (itt szerepel a kérelmező nemzetisége és a benyújtási/közzétételi nyelv, l. Inventor, Agent, Publication Language, Filing Language), de lehetőség van az eredeti nyelv ellenőrzésére a PATENTSCOPE oldalán is. Ez utóbbi szintén kínál ilyen opciót, ha a Document fül alatt rákeresünk az eredeti kérelemre (l. Priority Document) vagy áttérhetünk az eredeti szabadalmi tárba (például az Egyesült Államok esetében az UPSTO szabadalmi adatbázis felületére2) vagy a Google Patents3 felületére.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A szövegkorpusz öt darab, 2020. évi előválogatott szövegből állt össze, és tartalomjegyzékkel és linkekkel ellátva a következő témaköröket ölelte fel: financial distribution, payment agent, security, system modelling for financial information, system for estimating value of company using financial technology. A hallgatók feladata az instrukciók szerint olyan gyakran használt, a szakma által elfogadott terminusok kiválasztása volt az eredeti kontextussal együtt, amely nem képezi egy nagyobb terminológiai egység részét, hanem önállóan szerepel, de természetesen ez nem jelenti azt, hogy ne állhatna több tagból (például payment period). Az alábbiakban található néhány példa megfelelő minőségű, szabadalomból származó kontextusra (terminusok: hedge, capacity for loss és litoral drift):
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Hedges are financial instruments, typically derivatives (such as forward contracts, options and swaps) that are used to hedge the risks associated with transactions or exposures forecasted to occur in the future. Portfolio managers, individual investors and corporations use hedging techniques to reduce their exposure to various risks. In financial markets, investors hedge against investment risk by strategically using financial instruments to offset the risk of adverse price movements in other investments. (Forrás: WO/2007/035242)
 
The Capacity for Loss is the ability of the customer to safely take investment risk with the potential for higher investment returns. When considering Capacity for Loss in retirement the starting point is the cost of providing the customer basic essential expenditure in retirement. If the customer has less wealth than this then they will have no capacity for loss. As the ratio of their wealth to this cost of securing the essentials increases beyond 100% their Capacity for Loss will increase. The present invention therefore uses the ratio of total wealth available to provide a retirement income to the cost of securing their essential expenditure to drive the Capacity for Loss assessment. (Forrás: WO/2020/070463)
 
Water waves breaking on a beach, not only suspend beach materials, but also produce a longshore current. The longshore current carrying the suspended beach material is called the littoral drift. (Forrás: US4898495)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Fontos volt, hogy a hallgatók kizárólag olyan terminust válasszanak, amely még nincs kidolgozva, tehát nem szerepel a WIPO Pearl adatbázisban. A szabadalmakban való keresésben segítségre voltak olyan kulcsszavas keresések, mint például a „comprises” igére való rákeresés (l. 8. táblázatban stock dividend terminus kontextusát),4 amely nagy valószínűséggel egy terminus magyarázó leírásához vezetett, ami az egyébként aprólékos és időigényes terminológiai munkában egyben időmegtakarítást is jelentett (hasonló ilyen jellegű igék: „includes”, „comprehends”, „contains”, „involves”).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A földtudományok tárgykör terminusainak kiválasztásában a hallgatók számára együttműködési lehetőség kínálkozott az egyetemen belül működő MTA-BME Morfodinamika Kutatócsoport5 tagjaival.6 Az együttműködés az első fázisban a terminuslista összeállításában nyilvánult meg olyan terminusok kiválasztásával, amelyek a PATENTSCOPE szabadalmi tárban szerepeltek, de még nem lelhetők fel a WIPO Pearl terminológiai adatbázis nyilvános felületén.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A hallgatók a WIPO-PCT útmutatóin felül és a magyar nyelvű feladatleírásban foglalt instrukciók mellett kézhez kaptak egy, a Google Drive felületén előszerkesztett táblázatot, amely lehetővé tette a közös munkát, rálátást biztosított az évfolyamtársak munkájának követésére (például milyen terminusokat választottak mely szabadalmakból), és az oktatónak lehetőséget adott a szükséges megjegyzések és jóváhagyások megtételére. A táblázat a következő megnevezésű oszlopokat tartalmazta: hallgató neve, terminus, domén és aldomén, kontextus, kontextus forrása, „A WIPO Pearl adatbázisban már szerepel?”, megjegyzés.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A terminusok több változatban is létezhetnek, ilyen esetben a terminológiamenedzsmenten belül szükséges a fő terminus (head term) és a vele fogalmi szempontból teljes mértékben egyező szinonimák (synonym) megkülönböztetése. Projektünkben legtöbb esetben rövidítések fordultak elő szinonimákként (például real estate investment trust – REIT, net asset value – NAV).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A földtudományok aldomén területén a hallgatók nem rendelkeztek közvetlen, előzetes ismeretekkel, ez azonban nem volt igaz a pénzügyi területre, amelyről számos előismeretük volt a közgazdasági előképzettségűeknek. Ez utóbbi területen előnyt jelentett még, hogy nem egy részletesen kidolgozott szakterületről volt szó a terminográfiai bejegyzések számát tekintve, így az adatok bővítésére számos lehetőség akadt (csupán 48 terminust rögzítettek a pénzügyi területen a földtudományok 342 terminusával szemben).

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Fontos szempontot jelentett, hogy a terminusok és fogalmak csak az adott doménen belül értelmezendők a terminológián belül, ennek megfelelően kellett a kontextust is kiválasztani. Az egyetemen belül bevont szakértőket is arra kértük, hogy a kontextusok véleményezésekor ezt vegyék figyelembe.7 A domének szerinti besorolás a WIPO osztályozása szerint történt, amely megtalálható az online felület fogalmi keresőfelületén.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A terminuslista az elvárásoktól eltérően nemcsak terminust, hanem kontextust is tartalmazott. A kontextussal szemben alapvető elvárás volt, hogy fogalmi jellemzőkben gazdag kontextus legyen, hosszában minimum egy mondat terjedelmű folyamatos szövegrészlet vagy esetleg definíció, de a részleteket tekintve a megfelelő kontextus kiválasztása jóval összetettebb ennél. Ennek egyik oka a speciális kontextustípusok használata, elsődlegesen az ún. definíciós kontextusé (defining context), a másik pedig a munkafolyamatban rejlik. Hagyományosan a kontextus igazolja, hogy a terminus használatban van, és bemutatja a terminus használatát közvetlen szövegkörnyezetében, azaz hogyan illeszkedik a terminus az adott mondatba. Drewer & Schmitz (2017, 67) német nyelven a Definitionskontext változatot nem nevezi hagyományos értelemben definíciónak, és általában véve olyan mondatot értenek alatta, amely megnevezi az adott terminust, információt szolgáltat ugyan a terminus által jelölt fogalomról, de nem alkalmas a fogalom pontos behatárolására. Tehát tartalmaz definícióra jellemző elemeket, de nem feltétlenül meríti ki egy definíció teljességre törekvését a fogalom teljes körű behatárolásához, és nem is egyezhet meg egy szakember által alkotott, a fogalom pontos és teljes behatárolására törekvő definícióval. Valentini et al. (2016, 189) ezeket a kontextusokat ismeretekben gazdag kontextusnak (knowledge-rich contexts) is nevezi, és ennek használata mellett érvel abból a szempontból, hogy használatuk kevésbé idő- és költségigényes, és rövid időn belül hasznosítható adatokat biztosít. Ez a megoldás egyedülálló az intézményi terminológiai adatbázisok között, a WIPO Pearl minden terminusa rendelkezik kontextussal.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Az alábbiakban két példa látható a definíciós kontextusra (l. 7. táblázat). A kontextussal szemben is elvárás volt, hogy eredeti angol vagy magyar nyelvű szövegből származzon. A két kontextus megítélése között a megfelelőség szempontjából az a különbség, hogy a terminus valóban izoláltan szerepelt-e az adott definíciós kontextusban (l. abrasion) vagy egy nagyobb terminológiai egység részeként (l. abrasion process), ami szintén követelmény volt a kontextus kiválasztásakor. A kontextus bemutatja a terminus valós és megfelelő használatát.
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

7. táblázat: Kontextuspéldák az abrasion (kopás) terminusra (kiemelések tőlem).
Nem megfelelő kontextus:
Megfelelő kontextus:
Also, monitoring the luminescence as a function of time of the abrasion process, it is possible to assess the abrasion resistance of coatings by relating the time needed to reach the substrate through the total removal of the coating. (Forrás: WO/2002/071045)
The c1κ term describes abrasion resulting from collisions when particles are saltating. Sipos et al. (2018) built on this model by introducing a term that described abrasion resulting from friction when particles are rolling or sliding: c2δcos(γ), where c2 is a constant scaling the contribution of frictional abrasion relative to collisional abrasion, δ is the distance between that point and the longest diameter, and γ is the angle between a tangent line at that point and the longest diameter. (Forrás: Abrasion model of downstream changes in grain shape and size along the Williams River, Australia, Szabó, Tímea et al., Earth Surface Dynamincs, 118(4), (2013), 2059-2071, doi: https://doi.org/10.1002/jgrf.20142.)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A definíciós kontextus mellett léteznek más, speciális típusú kontextusok is, amelyeket akkor érdemes alkalmazni, ha nem találunk megfelelő definíciót vagy definíciós kontextust. Drewer & Schmitz (2017, 112) az ISO 12620:1999 szabványra hivatkozva megkülönböztetik: a definíciós kontextust, a magyarázó jellegű és az asszociatív kontextust. A 8. táblázatban található három a projektből vett példa a különböző kontextustípusokra (a terminus minden esetben vastagon szedett):
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

8. táblázat: Példák szabadalmakból a definíciós, az asszociatív és a magyarázó jellegű kontextusra (kiemelések tőlem).
Definíciós kontextus
Asszociatív kontextus
Magyarázó jellegű kontextus
The stock dividend comprises one or more of an ordinary stock dividend, a preferred stock dividend, a special stock dividend, and a common stock dividend. (Forrás: WO/2020/010337)
We include relict channels, where they are clearly visible in imagery and connect to the main channel, because they are evidence of sediment distribution and accumulation through avulsion (Forrás: Slingerland and Smith, 2004, https://esurf.copernicus.org/articles/7/773/2019/)
Optionally, the method comprises comparing characteristics of the private company with characteristics of public companies and selecting companies having similar characteristic to the private companies. Optionally, the characteristics comprise risk, growth rate, capital structure, number of employees, cash flow and liquidity data. (Forrás: WO/2020/157502)
In multi-grain sedimentary systems complex feedbacks between sediment transport and surface composition become possible. For example, selective transport can lead to winnowing of fine grains from the surface, leaving a coarse grained lag deposit which can then armor the surface, protecting subsurface fines from further entrainment into the flow. (Forrás: https://journals.sagepub.com/doi/pdf/10.1260/174830107780122694)
 

Jegyzet elhelyezéséhez, kérjük, lépj be.!

Projektünkben a korpuszalapú terminológiai munka keretében a terminusok kivonatolása már a kontextussal együtt történt. Ennek oka, hogy számos előnyt jelentett a terminusok eleve kontextussal együtt történő manuális kivonatolása. Egyfelől a szövegkorpuszban megbízható források szerepeltek, másfelől a definíciós kontextussal történő rögzítés segített az idegen nyelvű, ismeretlen doménből származó terminusok könnyebb értelmezésében, és az oktató számára is könnyebbé vált az adatok ellenőrzése. A kontextus forrásának dokumentálása lehetővé tette a könnyű visszakereshetőséget és későbbi rögzítést, illetve, ha elsőre az elvárásoknak megfelelő definíciós kontextust választott a hallgató, amelyben a terminus izoláltan szerepel, akkor ez ugyan többletmunkaként jelentkezett a projekt elején, de könnyen megtérült a későbbi munkafázisok alatt, minimálisra csökkentve az utólagos, több portálon történő, rendkívül hosszúra (akár több naposra is) nyúló információkutatást. Egy kizárólag terminuslista alapján történő keresés általában jóval időigényesebbnek bizonyul. Sőt, a terminusok ily módon történő szelektálása megkönnyíti az egymással összefüggő terminusok kiválasztását, és így segítség lehet a fogalmi háló későbbi megalkotásakor is. Az eredetileg kivonatolt kontextusokat nem feltétlenül tartottuk meg minden esetben, de mégis a köztes alkalmazásuk is jó támpontot jelentett.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A WIPO-PCT útmutatók alapján a PATENTSCOPE szabadalmi tár képezi a terminusok és kontextusok elsődleges és megbízható forrását. A szabadalmakon belül az eredeti idegen nyelven írt leíró rész számít elsődleges forrásnak, hiszen ez a rész tartalmazza legnagyobb valószínűség szerint a megfelelő minőségű felhasználható kontextust és definíciót. Másodlagos források közé tartoznak a tanulmányok, szakdolgozatok, doktori értekezések és tankönyvek, szabadalmak, amelyek közül számos elérhető például a Google Books, a Google Scholar és a Google Patents felületén. A további szempontok közé tartozik, hogy (a külső források esetében is) a kontextus anyanyelvi szerzőtől származzon, a szerzője szakértője legyen az adott területnek, és a szöveg ne legyen fordítás. Az angol nyelv közvetítőnyelvként betöltött szerepe gyakran különösen megnehezíti a megfelelő, eredeti forrás kiválasztását (Valentini et al., 2016). Esetenként nehézkes megállapítani, hogy az adott forrás eredetileg melyik nyelven íródott, és hogy valóban nem fordítás, bár a szabadalmak esetében a szabadalmak kódjának kezdőbetűi általában adnak ebben támpontot. Annak érdekében, hogy eredeti angol nyelvű forrásokból származzanak a kontextusok, fontos szempont volt, hogy a tanulmányok szerzői közül legalább az egyik szerző angol anyanyelvű legyen. További szempont például, hogy a kontextusok mint szövegrészletek nem kísérőszövegekből (például bevezetőből, fülszövegből), hanem a mű fő szövegrészéből kell, hogy származzanak. A hivatkozások pontos megadása része a helyes dokumentációnak, ez alapján állapítható meg, hogy a kontextus megbízható és biztosítja visszakereshetőségét.

Jegyzet elhelyezéséhez, kérjük, lépj be.!

A pénzügyi aldomén esetében a kontextus forrása alatt a szabadalom kódszáma és linkje szerepelt a szövegkorpusz adatai alapján. A kontextusok itt első körben kizárólag a szövegkorpuszból és így a szabadalmi tárból származtak. A földtudományok aldomén esetében a hallgatók a terminuslistából indultak ki, és a terminusokhoz kerestek megfelelő kontextust. Ezek kiválasztásában a hallgatók a PATENTSCOPE szabadalmi tár mellett a kutatók által javasolt elektronikus folyóiratokra mint tudományos publikációra támaszkodtak, például angol nyelven a számos forrás közül az Earth Surface Dynamics,8 Mathematical Geosciences9 és Geomorphology10 folyóiratok, magyar nyelven azonban szűkebb volt a kínálat (Földtani Közlöny és Magyar Geofizika11). Ez utóbbi módszer jóval időigényesebbnek bizonyult, bár a Google operátorok is kínálnak lehetőségeket a keresések optimalizálására, ezáltal megrövidítve az időigényes keresést. A Google operátorok alkalmazása ugyanis lehetővé tesz egy jóval célzottabb és így gyorsabb keresést (l. példaképpen https://www.earth-surface-dynamics.net:[ ”fragmented rock”] - site: [”term”], amely a folyóirat honlapján szűrte ki azokat a szövegeket, amelyekben az adott terminus szerepelt).
 
1 Az 1971-ben a Strasbourgi Megállapodással megalapított IPC-rendszer (International Patent Classification, l. https://www.wipo.int/classifications/ipc/en/; https://www.sztnh.gov.hu/hu/nemzetkozi-szabadalmi-osztalyozas-nszo-international-patent-classification-ipc).
2 https://www.uspto.gov/
3 https://patents.google.com/
4 Frérot & Valentini (2020) bemutatták, hogyan lehet a Sketch E+ g5tE+ g5tngine (https://www.sketchengine.eu/) alkalmazásával szabadalmi szövegek alkotta korpuszból kulcsfontosságú igéket kiszűrni (Forrás: ”Diffuser des informations scientifiques et techniques à travers des contextes riches en connaissances : étude exploratoire à partir d’un corpus français et anglais de brevets issus de la base de données de l’Organisation Mondiale de la Propriété Intellectuelle”, Frérot, C., Valentini. C. (Conference Toth 2020, 26‒27 November 2020, University Savoie Mont-Blanc).
5 http://www.morph.bme.hu/
6 Ezúton fejezem ki köszönetemet a Morfodinamika Kutatócsoport vezetőjének, dr. Domokos Gábor egyetemi tanárnak és munkatársának dr. Sipos Andrásnak, hogy a hallgatói terminológiai projekt megvalósítása során szakértői tanácsadást biztosítottak.
7 A pénzügyi terminusokat és kontextusaikat a terminuslista leadása előtt a Pénzügyek Tanszékről dr. Böcskei Elvira tanszékvezető egyetemi docens és kollégái tekintették meg, és minden magyar ekvivalenst és kontextust megfelelőnek tartottak. Ezúton is köszönjük hozzájárulásukat.
8 www.earth-surface-dynamics.net
9 www.springer.com/journal/11004
10 https://www.journals.elsevier.com/geomorphology
11 https://ojs3.mtak.hu/index.php/foldtanikozlony; http://www.mageof.hu/index.php/hu/periodikaismertetes
Tartalomjegyzék navigate_next
Keresés a kiadványban navigate_next

A kereséshez, kérjük, lépj be!
Könyvjelzőim navigate_next
A könyvjelzők használatához
be kell jelentkezned.
Jegyzeteim navigate_next
Jegyzetek létrehozásához
be kell jelentkezned.
    Kiemeléseim navigate_next
    Mutasd a szövegben:
    Szűrés:

    Kiemelések létrehozásához
    MeRSZ+ előfizetés szükséges.
      Útmutató elindítása
      delete
      Kivonat
      fullscreenclose
      printsave