Ord og termer fra
leksikografisk synsvinkel
Leksikografi
og terminologi har mange
berøringspunkter. Definisjonen av en allmenn ordbok er bl.a. for en stor del
avhengig av hvor man trekker
skillelinjen
mellom det allmenne og det spesielle ordforrådet, og en ordbok av denne type
inneholder som regel en hel del termer og annet
fagspesifikt
vokabular. Men ut fra hvilke kriterier blir dette vokabularet valgt og
lemmatisert, og hvordan blir det beskrevet i allmenne ordbøker?
Det
semasiologiske prinsippet, der lemmaene er ordnet med hensyn til deres
uttrykksmessige egenskaper, har lenge vært dominerende i
leksikografisk
praksis og har bestemt brukernes tilgang til ordboksteksten. Men dette
prinsippet har også preget selve lemmaseleksjonen, for de formelle relasjonene
er mye mer synlige enn de relasjonene som knytter sammen semantisk beslektede
ord. Dermed blir det fare for at det
ordforrådet som dekkes av ordboken, blir
uensartet og ufullstendig, ikke minst når det gjelder fagspråklig vokabular.
I
allmenne ordbøker er lemmavalget for en stor del avhengig av ordenes forekomst
og frekvens i den faktiske språkbruken. Dette gjelder
ikke i
samme grad for terminologien, for der må det tas hensyn til hvordan de enkelte
termene egner seg som benevnelser på vedkommende
begrep,
og hvordan de står i relasjon til beslektede begreper og termer.
Islandsk
terminologi og termforråd har vokst fram i en nær tilknytning til og under
sterk påvirkning fra islandsk språkpolitikk og språkrøkt,
som
synlig vitnesbyrd på kontinuiteten i islandsk språk og ordforråd og språkets
fornyelseskraft, som reaksjon på fremmed språkpåvirkning
og som
uttrykk for en sterk vilje til å skape et klart og gjennomtenkt fagvokabular.
Den gjennomsiktighet som gjerne fremkalles av de islandske
ordelementer,
vil i mange tilfeller gjøre terminologien tilgjengelig for språksamfunnet.
Derimot kan det være vanskelig å få til en ønskelig
stabilitet
i termvalget, for termer og termforslag preges av ulike sammenhenger og
synspunkter, og terminologer og andre fageksperter kan
av
forskjellige grunner prioritere termer som ikke støttes av den faktiske
språkbruken.
Disse
forholdene påvirker hvordan islandsk terminologi og faguttrykk blir valgt og
presentert i tospråklige islandske ordbøker. I ordbøker
av den
type har det en avgjørende betydning om islandsk fungerer som kildespråk eller
målspråk. I det siste tilfellet må leksikografen
ta
stilling til i hvor høy grad det skal satses på ekvivalenter av hjemlige
ordstammer, enten det gjelder etablerte uttrykk og termer
eller det
dreier seg om tentative forslag til ekvivalenter og nye avløserord.
I trykte
ordbøker blir lemmaene tradisjonelt behandlet som likeverdige enheter og får
dermed en ganske enhetlig beskrivelse. I en elektronisk
ordbok er
forholdene helt anderledes i dette henseende. Der er det heller ikke grunn til
å holde fast ved det semasiologiske prinsippet
som
styrende faktor ved struktureringen og framstillingen av ordboksteksten. Ved å
ta utgangspunkt i de innholdsmessige egenskapene
til
ordene kan beskrivelsen av de enkelte ord og termer betraktes i forhold til et
sammenhengende ordforråd, synonymer av ulike slag og opprinnelse
kan
synliggjøres og beskrivelsen kan få en språkhistorisk dimensjon.
Ord vs. termar – ein
terminologisk ambivalens?
Terminologisk
litteratur har brukt mykje plass og energi på å etablera ei teoretisk forankra
grense mellom ord og termar, med utgangspunkt i ei onomasiologisk tilnærming
(”omgrepet, ikkje ordet, er utgangspunktet”). I det nye utkastet til
”Terminologiens terminologi på nordiska” (under arbeid, 2005) har såleis ’ord’
ingen annan status enn som morfologisk byggjeelement. Dette er eit stringent
uttrykk for ein sterk tradisjon innom terminologien.
Denne
diskusjonen har til visse tider ført med seg kontraproduktive tendensar
og ein viss risiko for fagleg isolasjonisme, både i forhold til lingvistikken
generelt, til leksikografien og til nyare terminologiske retningar. Det som
kunne (og burde) ha vore eit relativt trivielt metodisk avgrensingsproblem,
viser tvert om ei forunderleg livskraft som demarkasjonskriterium i vid
forstand (jf. Myking 2001).
I dette
innlegget vil eg diskutera nokre oppfatningar av grensa mellom ord og termar,
slik det terminologiske fagmiljøet sjølv har oppfatta og presentert problemet,
og med dei metodiske konsekvensane dette har hatt. Det har funnest to
hovudtendensar: ein tendens til å understreka skiljet, og ein tendens til å
avgradera det. I dag er den siste tendensen på frammarsj. Innverknaden frå
kognitiv lingvistikk har ført til sterkare interesse for vagheit og metaforisk
utviding (Temmerman 2000). Det har også breidd seg ein generell opposisjon mot
normative haldningar. Den oppfatninga innanfor terminologien som ser ut til å
vinna fram, er representert ved Kageura (2002) som meiner at orddanning og
termdanning er formelt ekvivalente prosessar. I innlegget mitt vil eg bl.a.
fokusera på problemet ’terminologisering’, som ser ut til å vera teoretisk
uløyst.
Det er
likevel slett ikkje alle terminologar som har insistert på maksimal
demarkasjon, og dei som vil avgradera skiljet mellom termar og ord, kan ta
Wüsters semiotiske syn (”Das Worten der Welt”) til inntekt for posisjonen sin.
Alt i alt
kan terminologiens oppfatning av ”termar vs. ord” beskrivast som uttrykk for
ein grunnleggjande ambivalens.
Referansar
Myking, J. 2001. Against prescriptivim? The ’socio-critical’ challenge to terminology. Terminology Science and Research, vol. 12. Wien: TermNet.
Kageura, K. 2002. The dynamics of terminology : a descriptive theory of term formation and terminological growth. Amsterdam/Philadelphia: Benjamins.
Temmerman,
R. 2000. Towards New Ways of
Terminology Description. The sociocognitive approach. Amsterdam/Philadelphia:
Benjamins.
"Diasketching"og
afterminologisering -
hvornår er en
term en term?
At dømme efter de seneste års publikationer - eksempelvis Cabré (1999,
2000, 2003) Kageura (2002) Pearson (1998) og Temmerman (1999, 2000) - er
terminologien (som videnskabsgren) på vej ind i en mere eklektisk fase hvor der
sås tvivl om hvorvidt gamle Wüsterske principper er tilstrækkelige som
forklarende paradigme til trods for deres uvurderlige betydning for
terminologisk standardiseringsarbejde og vidensstrukturering. Cabré (2003)
foreslår en mere holistisk terminologisk teori kaldet "Theory of
Doors" der ud over den begrebsorienterede tilgang omfatter semasiologiske
og kommunikations- orienterede tilgange til feltets forskningsobjekt. Med hensyn til skellet mellem
termer og ord har hun følgende at sige:
a lexical unit is by itself neither terminological nor general but [...] it is general by default and acquires special or terminological meaning when this is activated by the pragmatic characteristics of the discourse (Cabré 2003: 189-190)
Termekstraktionsprogrammel kan med stor nøjagtighed identificere
termer i specialiserede korpora netop fordi man på forhånd ved at
tekstindholdet repræsenterer kommunikation mellem eksperter (diskursens
pragmatiske træk). Hvis programmellet anvender Internettet som korpus, bliver
vurderingen af termkandidaters ”terminologiskhed” imidlertid mere kompleks. Når
korpussets tekstindhold og ophav ikke er kendt på forhånd, vil tekststrenge,
der formelt og statistisk set er gode termkandidater, ofte ikke fungere som
termer på grund af den kommunikative kontekst. Fænomenet kaldes
afterminologisering og dets sproglige karakteristika er vigtige at kortlægge
for at optimere webbaseret termekstraktionsprogrammel.
"DiaSketching"(Diachronic wordSketching) er en videreudvikling af
Kilgarriffs (2001) "word sketches" og udgør netop et forsøg på en
sådan kortlægning af afterminologiseringens sproglige træk. En DiaSketch over
stærke kollokationer med termen ”server” i et stort ikke-specialiseret korpus
(New York Times, 1994-2002) kan således identificere og klassificere
afterminologiseret sprogbrug. Min diskussion af skellet mellem ord og termer
vil tage udgangspunkt i disse DiaSketches og diskutere hvorledes termers
kontekstfølsomhed spiller en vigtig rolle i forhold til webbaseret termekstraktionsprogrammel.
to figurer + litteraturliste
Norsk
Ordbok er/skal
bli ei monolingvistisk ordbok over det norske folkemålet og den varieteten av norsk
skriftspråk som vi kallar nynorsk. Arbeidet med verket byrja i 1930. 5 band av
i alt 12 er utgjevne (a–j), dei siste 7 banda kjem ut fram mot 2014.
Eit
målpolitisk føremål med Norsk Ordbok frå prosjektstart i 1930 var å syne det
nynorske skriftmålet som språkleg reiskap for alle område av samfunn og kultur.
Med grunnlag i skriftlege kjelder frå ulike fagområde ønskte ein mellom anna å
dokumentere nynorsk som fagspråk.
Ei
undersøking i 1996 etter utgjevinga av band 3 indikerer likevel at kjeldeutvalet
for nynorske fagord i verket er ujamnt med omsyn til fagområde og modernitet.
Ord frå tradisjonelle næringar har fått etter måten stort rom samanlikna med
fagord frå meir moderne verksemd. Medan jordbruk, skogbruk, fiske og ulike
handverk, botanikk og til dels zoologi er godt representert, vantar ein vanlege
fagord frå til dømes tradisjonell industri, mange akademiske forskingsfelt,
moderne samfunnsliv, media-, informasjons- og reklameverksemd, bank- og
forsikringsvesen, havbruksnæringa, datafeltet og petroleumsindustrien.
Samstundes
kjem ordas funksjon som fagord i skuggen av funksjonen som allmennord, ved at
ein stundom unnlet å markere orda eksplisitt som også fagord der båe funksjonane
finst. Årsaka til dette kan mellom anna vere manglande fokus på føremålet frå
1930 om å dokumentere nynorsk som fagspråk.
Det er
grunn til å tru at desse tilhøva svekkjer Norsk Ordbok sitt verd som resepsjonsordbok
og produksjonsordbok for brukarar av nynorsk fagspråk. Spørsmålet er om ein
skal justere føremål eller praksis for å oppnå eit betre samsvar mellom
desse.
Samuraj, sumo, sushi,
tsunami och chasen –
om japanska låntermer
Orden 'samuraj' och 'geisha' har kommit från japanskan till andra språk via
beskrivningar av det exotiska fjärran Japan. 'Judo' och 'karate' är ord som har
senare spritt sig tillsammans med det ökade intresset för de japanska
kampsporten. 'Sushi' och 'saké' hör till den stora gruppen av ord som kontakter
med nya matkulturer brukar föra med sig in i språket. 'Tsunami' är ett exempel
på ord som nutidens snabba och effektiva nyhetsförmedling importerar i språket
över en natt.
Symposiets tema ord/term-avgränsningen kommer fram när man betraktar orden
och termer som lånats från andra språk. Alla de ovannämnda japanska orden kan
sägas vara allmänspråkliga ord i svenskan, finskan och många andra språk. De
finns i allmänspråkliga ordböcker och var och en av oss har någorlunda
uppfattning om deras betydelse, även om den ofta är mycket vag och kanske
avviker från den ursprungliga betydelsen. Däremot 'chasen' och 'randori' är ord
som inte är bekanta för sådana som inte är invigda i japansk teceremoni
respektive judo vilka båda representerar japanspecifika företeelser som har
spritt sig utanför Japan.
Vanligen undersöker eller diskuterar man engelskan eller språken som ligger
nära låntagarspråket medan språken som japanskan betraktas som
"exotiska" eller marginala som långivare. Visserligen har inte så
många japanska ord hittat sin väg in i allmänspråket, men däremot finns det
många fackspråk som baserar sig på japanska ord och uttryck såsom t.ex. just
teceremonins språk eller judospråket. Inom dessa områden fungerar de japanska
orden som termer, dvs. benämningar på mer eller mindre välavgränsade fackbegrepp.
När man börjar med en ny hobby, känns det ofta som om att lära sig ett nytt
språk, men i dessa fall är det faktisk så - även om i en begränsat omfattning.
Inlåningen från japanskan sker sällan direkt, utan via ett lånförmedlande språk
- oftast engelskan, vilket för med sig vissa särdrag.
I mitt föredrag
skall jag diskutera inlåningen från japanskan och samtidigt fundera
förhållandet mellan term och ord.
Hvordan
ord sporer termer og andre terminologiske oplysninger
Formålet med dette paper er at beskrive et projekt, hvor danske verber
fungerer som leksikalske vidensmønstre. I beskrivelsen af verberne tages der
udgangspunkt i en valensteori kaldet Den Pronominelle Metode. De undersøgte
verber er inddelt i tre grupper: metalingvistiske termrelaterede verber,
metalingvistiske begrebsrelaterede verber og endelig relationelle verber, her
afgrænset til verber, der kan identificere hierarkiske relationer. De
overordnede mål med projektet har været at undersøge om (1) de behandlede
verbers valensmønstre er egnede som leksikalske vidensmønstre til at identificere
og fremfinde terminologiske oplysningstyper som definitioner og synonymer, om
(2) valensmønstrene qua deres forudsigeligehed, fordi de er
kendetegnet ved bestemte tilbagevendende mønstre (recurrent patterns),
hjælper til at foretage mere fintmønstrede og dermed præcise søgninger end
verberne alene, dvs. grundformer af verberne evt. suppleret med wildcards, og om (3) der er en konstant relation mellem verbernes
valensmønstre og de terminologiske oplysningstyper. Med henblik
på en praktisk anvendelse af resultaterne har jeg ud fra traditionelle
arbejdsprocesser i det terminologiske arbejde udarbejdet et katalog over
de verber, jeg indtil nu har behandlet. Jeg vil præsentere kataloget, som
omfatter de tre faser: udarbejdelse af begrebssystemer, udarbejdelse af
definitioner og fastlæggelse af terminologi. Mht. den sidste fase er det
væsentligt at skelne mellem deskriptivt og præskriptivt terminologiarbejde.
Undersøgelserne og en evaluering af metoden er primært foretaget på basis af
et maskinlæsbart korpus inden for hydraulik – et korpus, der hverken er
tagget eller lemmatiseret.
Words vs. terms in financial texts
The presentation is based on a current terminology project, which is the revision and development of the online banking dictionary (German, English, French, Italian) of a large Swiss bank.
Terminology in banking and finance is characterized by the existence of a grey area between the common and the special language, in contrast to purely technical fields. How do we recognize concepts and terms in financial texts? The characteristics of financial terms are outlined with a number of examples, including a few borderline cases.
Multiword or compound terms are frequent and therefore play an important role. Often only the single elements of multiword terms are chosen, especially if a large number of combinations occur (equity valuation, bond valuation etc.).
The jargon of finance (to trade in line with, corporate Europe, non-oil exporting) is a complex phenomenon and cannot be limited to the status of terms. Jargon is often a mix of terms and words. In this particular project, it was decided not to include jargon in the keyword or term list.
Apparent words (issue, commitment) can have the status of a term in banking and finance or their related fields (law, tax, politics etc.).
Finally, it was not only interesting, but also necessary to examine some “allegorical” terms and explain them to the public (white knight, poison pill).
Balansräkning som begreppssystem
Terminologins
teori är ett utmärkt verktyg i dess originella funktion, i att systematisera
tekniska begrepp. När det gäller att analysera begrepp som baserar sig på icke-konkreta
referenter, finns det dock ännu behov att utveckla terminologins metoder.
I min
undersökning studerar jag företagsekonomins begrepp och termer ur ett
kronologiskt perspektiv. Mitt material består av sverigesvenska och
finladssvenska balansräkningar. Det speciella med en balansräkning som
begreppssystem är att det kan finnas begrepp med olika grader av abstraktion på
samma hierarkisk nivå. Existensen av begreppen i en balansräkning baserar sig
på lagstadgade språkliga överenskommelser, och kan inte observeras med hjälp av
sinnesförnimmelser. Som ett exempel på två typer av begrepp i mitt material kan
nämnas begreppen ’materiella tillgångar’ och ’goodwill’. Begreppet ’materiella
tillgångar’ omfattar värdet på jord- och vattenområden, byggnader och
konstruktioner, maskiner och inventarier o.s.v. Kännetecknen för
begreppet ’materiella tillgångar’ baserar sig på överenskomna värden på exakta
och påtagliga (konkreta) referenter. Uppgiften att observera kännetecknen för
begreppet ’goodwill’ är svårare på grund av att kännetecknen baserar sig enbart
på överenskommelser och existerar således enbart som ”abstraktioner”. Målet med
mitt föredrag är att beskriva och jämföra olika typer av begrepp och ge några
förslag om att hur man kan studera, definiera och kategorisera begrepp som
syftar på abstrakta referenter.
Terminologicentrum
TNC har under 2004 och 2005 deltagit i ett nationellt projekt kring den
svenska biobankslagen (Lag (2002:297) om biobanker i hälso- och sjukvården
m.m.). En av anledningarna till att projektet inleddes var att lagen betraktas
som juridiskt svårtolkad. Under projektets gång har det tydligt visat sig att
en del av den otydlighet som från början uppfattades som juridisk i själva
verket snarare var språklig. Det mest iögonenfallande exemplet är att begreppet
biobank, som givetvis är centralt i biobankslagen, definierats på ett
sätt som inte stämmer med den gängse uppfattningen i branschen om vad en
biobank är. Många tidigare biobanker skulle till exempel med lagens definition
inte längre definieras som biobanker. Vidare används inte termen biobank
såsom begreppet definieras i lagen ens på alla ställen i själva lagtexten.
Med utgångspunkt
i begreppet biobank – och med ytterligare exempel, både från
biobankslagen och från andra lagar – vill jag diskutera en rad frågor om
termer, ord och definitioner i lagtext. Många lagar inleds ju likt
biobankslagen med definitioner av de begrepp som lagen reglerar. Men vad är det
egentligen definitionerna beskriver? Beskriver de verkligheten, eller försöker
de bara styra användningen av vissa ord i den specifika lagtexten? Handlar det
över huvud taget om termer ur ett terminologiskt perspektiv? Vilka problem kan
det orsaka när definitioner skrivs för ett syfte, men tillämpas i ett annat?
Vad skulle lagtexterna och deras tillämpning ha att vinna på att
lagtextförfattarna skaffade sig en klarare insikt hur termer bör hanteras i
text och på att definitionerna formulerades enligt terminologiska principer?
Kan grammatiske termer
motiveres språkspesifikt?
Strukturelle og motivasjonelle faktorer ved
grammatiske termer i New Zealand maori.
Til tross
for at grammatiske termbegreper i høy grad er teoriavhengige og inngår som
veldefinerte byggesteiner i ulike teoretiske tilnærminger til beskrivelse og
forklaring av språklige fenomener, er den moderne lingvistiske terminologien
fremdeles sterkt preget av dets latinske herkomst. Vi anvender fremdeles
latinske termuttrykk som subjekt, predikat, tempus, presens,
preteritum, futurum, adverb, prefiks og imperativ (for å nevne
noen), til tross for at disse termene til dels har endret sitt terminnhold for
å tilpasses ulike teoretiske rammeverk opp gjennom lingvistikkens historie.
Hvis vi
hadde bestemt oss for å kvitte oss med alle disse termene og satt oss ned for å
lage nye grammatiske termer basert på våre nasjonale språk ville vi neppe ha
hatt særlig suksess fordi de etablerte termene har en for sterk posisjon.
Hvis det
språket som var leverandør av de etablerte termene derimot var sett på med
mistenksomhet ville kanskje saken stille seg annerledes.
New Zealand maori synes å være et slikt tilfelle. Maori har vært beskrevet med engelsk basert grammatisk terminologi siden kaptein Cooks dager. En sentral grammatikk på universitetsnivå er Bruce Biggs: Let’s learn maori. fra 1969. Denne grammatikken ble oversatt til maori i 1990. Et hovedproblem for forfatteren var utformingen av de grammatiske termene. Det mest overraskende er at det ikke fins noe spor etter de engelsk/latinske termene fra den engelske versjonen. I dette foredraget vil jeg ta for meg noen sentrale termer og diskutere strukturelle og motivasjonelle faktorer ved termdanningsprosessen i maori. Foredraget forutsetter ingen forkunnskaper i maori.
A collective research project on specialised languages
The article below presents the first results of a collective research project on specialised languages. The research is based on the assumption that compiling a large-scale bilingual electronic corpus in different scientific fields will provide new and more detailed information on the way specialised languages, especially English and French, work. The project is also based on the belief that such information will be used in order to improve specialised translation, as well as the way it is currently taught at university level.
Islands Udenrigsministeriums
Oversættelsescenter:
ny termdatabase og nye metoder
ved indsamling af termer
Udviklingen af
termdatabasen fra 1990 til 2003 beskrives. Den nye termdatabase på Internettet
i 2003 (www.hugtakasafn.utn.stjr.is). Generel beskrivelse af termdatabasen.
Antal termposter. Antal sprog og informationsfelter, f.ex. term, synonym,
forkortelse, fagområde, eksempel, definition, henvisning, kilde, grammatik.
Beskrivelse af de fagområder som findes i databasen og deres distribution og
struktur. Hvilke modeller man betragtede ved struktureringen af databasen. Den
islandske ordbank som model.
Termdatabasens
anvendelse i praksis: Søgningsmuligheder: grundsøgning, ordbaseret søgning,
nærmere søgning. Søgeord, sprog (islandsk, engelsk, dansk/norsk/svensk, tysk,
fransk, latin).
MultiTerm-databasen
benyttes fra år 2000 i forbindelse með Trados oversættelseshukommelsen –
præges af en langsom arbejdsprocess.
Et nyt program
for indsamling og behandling af termer – Termfangeren – er under konstruktion
i 2005 af Björn Þór Jónsson, datamatikstudent. En hurtigere, automatisk
process ved indsamling af termer.
Termerne hentes i
Oversættelsescenterets interne elektroniske arkivsystem (dtSearch). Arkivsystemet
indeholder originaldokumenter på engelsk og deres oversættelser på islandsk.
Resultaterne vises i tosprogede enheder eller sætninger som stammer fra
oversættelseshukommelsen.
Termfangeren
tilbyder forslag til nye termer i termdatabasen og en engelsk og en islandsk
term registreres. Nogle informationsfelter registreres automatisk med hver term
i denne fase og i næste fase bearbejdes de andre felter efter behag. Den sidste operation er lagring af
termen i termdatabas.
Ord og termer i oversettelser
Problemer og strategier
Ved
oversetting av fagspråklige tekster er det ofte et problem å skille mellom ord
og termer ettersom de leksikalske enhetene i fagspråklige tekster strekker seg over
et spekter fra allmennspråklige ord til fagtermer. Særlig oppstår det problemer
ved flertydighet, både polysemi og homonymi. Utfordringen for oversetteren
ligger i å oppdage når for eksempel et homonym er en term og ikke et ord i den
aktuelle kildeteksten uten at tilsvarende homonymi eksisterer på målspråket.
Situasjonen kompliseres ytterligere når det begrepet termen realiserer i
kildespråket, ikke finnes på målspråket.
I dette innlegget
vil jeg vise en del eksempler på hvilke typer problemer oversetteren står
overfor i skjæringspunktet mellom ord og termer i fagtekster med særlig fokus
på polysemi og homonymi, og hvilke strategier som anvendes ved oversetting.
Innlegget er basert på oversettelser foretatt av profesjonelle oversettere, og
på arbeider innlevert av studenter. Det kan hevdes at dersom oversetteren er
spesialist innenfor det enkelte fagfelt, vil forholdet mellom ord og termer
ikke skape noe problem. Realiteten i små land som for eksempel Norge er
imidlertid at oversettere vanligvis må være generalister og må dekke en rekke
fagfelt På denne bakgrunn vil jeg drøfte hva slags kompetanse oversetteren bør
ha for å kunne finne fram til om et uttrykk er et ord eller en term og dermed
kunne foreta en adekvat oversettelse.
IKT-ordboka for skolenettet
– en ressurs for elever,
lærere og foreldre
IKT-ordboka
for det norske skolenettet startet som et prosjektarbeid for noen IT-studenter
ved Norges teknisk-naturvitenskapelige universitet (NTNU) i Trondheim tidlig på
1990-tallet. Prosjektet ble ledet av Program for lærerutdanning og finansiert
av daværende Nasjonalt læremiddelsenter (nå en del av Utdanningsdirektoratet).
Ideen var å lage ei elektronisk oppslagsbok for elever i ungdomsskolen og
videregående skole for å få elever og lærere til å bruke norske termer i stedet
for engelske. Ordlista skulle være for ”nybegynnere” med enkle, men med teknisk
korrekte forklaringer.
Norsk
språkråd har deltatt i arbeidet nesten fra starten bl.a. ved å kvalitetssikre
språket og oversette artiklene til nynorsk. Disse oppgavene ble høsten 2004
formalisert i en samarbeidsavtale mellom Utdanningsdirektoratet, Program for
lærerutdanning og Norsk språkråd. Norsk språkråd overtok fra samme tid
redaktøransvaret for ordboka.
Etter at
det første prosjektarbeidet ble avsluttet, har arbeidet blitt drevet videre av
en redaksjon tilknyttet Program for lærerutdanning ved NTNU. Diskusjonene i
forbindelse med samarbeidsavtalen og Norsk språkråds rolle og oppgaver,
avdekket at det var behov for en revisjon av innhold, funksjonalitet,
arbeidsmåte i redaksjonen og presentasjon på nettet. Dette arbeidet har nå
startet.
Ordboka
skal fortsatt være en ressurs for målgruppa, den skal fortsatt bare være
tilgjengelig i elektronisk form og ligge på det norske skolenettet
(http://skolenettet.no/ikt/ordboka).
I denne
sammenhengen er det av interesse å se på forholdet mellom det å skrive ”enkle”
forklaringer og det å utarbeide eksakte definisjoner. Jeg vil også berøre
valgene man står overfor: Når skal man gjøre hva, og hvilke argument ligger til
grunn for valgene man tar.
Igor Kudashev, Irina Kudasheva:
Terminology Management Systems: Terminologist’s Needs and Expectations (Case: Finnish-Russian Forestry Dictionary Project)
Today, it is hard to imagine a project aiming at publishing a dictionary that doesn't involve the use of a terminology management programme. Many major centres for technical terminology have developed in-house applications to suit their own needs. At the same time, small and middle-sized dictionary projects have to use commercially-available terminology management programs, among which Trados' Multiterm is probably the most widespread. Experience shows, however, that commercial applications are often unsatisfactory in many respects.
In the Finnish-Russian Forestry Dictionary Project financed by the EU and the State Provincial Office of Southern Finland, we had to create our own in-house terminographic processor, MyTerMS (the abbreviation comes from the words My Terminology Management System but it is only one of many possible interpretations). Since the aim of a dictionary project is to make a dictionary and not to develop terminology management software, our application is strictly project-oriented and its capabilities are therefore inevitably limited. However, working on such an application gives one valuable knowledge about terminologists' needs and expectations and helps the formulation of some general principles of the creation of terminology management programs. In our presentation, we will list the basic needs and expectations of terminologists working at a bilingual dictionary and demonstrate how these needs are met by the terminology management system we use. In addition to terms we also have to deal with proper names, verbs, term elements and nomenclature. These units require special treatment, and we will show how the presence of such units influences the contents and the structure of an entry. The success of MyTerMS has inspired us and the Department of Translation Studies of the University of Helsinki to create a multilingual and multi-user terminological data bank, so we will also speculate about the future tasks and prospects of MyTerMS and terminology management systems in general.
Ordbokredigering – nytta på
två nivåer
Vid
Helsingfors universitet pågår ett projekt med syftet att sammanställa en
finsk-rysk skogsordbok, som koncentrerar sig särskilt på skogsvården och
skogsekologin. Projektet finansieras av den Europeiska Unionen via
Interreg-programmet. I år sysselsätter projektet en och en halv terminolog. Vi
har också samarbete med många skogs- och ekologiexperter både i Finland och i
Ryssland. Jag är ordbokens huvudredaktör.
Utom termer och ekvivalenter innehåller
ordboken också definitioner av finska begrepp. Eftersom varken våra
terminologer eller redaktörer har någon utbildning i skogsvetenskap, var det vår åsikt i början att använda utan
förändringar sådana definitioner, som vi kunde finna i texter eller i de få
finska skogsordböcker, som innehäller definitioner. Ändå visade
arbetsprocessen, att inte bara de definitioner, som togs av texter (för det
mesta kontextdefinitioner), men också de mesta definitioner, som
vi fann i ordböcker, innehåller onödiga element och definitionsfel,
d.v.s. de motsvarar inte de krav, som ställs för dem i terminologiskt arbete.
Därför är det nödvändigt att redigera dem.
Redigeringsarbete har visat sig nyttigt för den
kommande ordboken både på mikro- och makronivån. Å ena sidan blir
definitionerna kortare, lättare att förstå och mera logiska. Å andra
sidan avslöjar deras bearbetning också svagheter i ordbokens makrostruktur,
d.v.s. i det sätt, som ordbokens struktur speglar de begreppssystem, som ligger
i bakgrunden.
Redigeringen är möjligt bara i intensivt
samarbete med skogsexperter. Redaktören kan ofta konstatera, vad som inte
stämmer, men inte alltid kan rätta felet. Utan experters understöd är
redaktören också hjälplös till exempel när språkliga förändringar förorsakar
behovet att explicera skogsvetenskapliga
bakgrundskunskaper.
I mitt föredrag behandlar jag några av de
problem som upprepar sig i redigeringen och också demonstrerar den metod av
konsultation, som har utvecklats under samarbetet med skogsexperter.
An
Apology for Terminology
In 1999 the European Union's
translation services engaged in a rather ambitious endeavour: the
"Inter-Active Terminology for Europe" (IATE). This project was to create a single terminology
database for all EU institutions and agencies. In the process all existing
terminology resources were to be merged; IATE would be web-based and fully
inter-active; it would permit the EU's linguistic
staff to participate in the creation and maintenance of terminology, thus
making relevant terminology available faster. Finally, by allowing for
cooperation and coordination between the EU's services, IATE would reduce
duplication of effort and make terminology work more efficient.
The IATE database
became operational in the summer of 2004, so the EU's translation services are looking
back at one year of experience with this tool. Most of the initial objectives
have been attained. However, the project also encountered a number of problems
that were, if not entirely unexpected, still surprising in their complexity.
The presentation will
give a brief overview of IATE's challenges and achievements. It will then focus
on the strategies and
methods applied by the EU's translation services to organise
their cooperation. These topics will be discussed in the context of the
radically changed working environment that translators find today and it will
attempt to define the role of IATE - and terminology - in a modern translation
service that offers a multitude of linguistic resources to its staff.
Gisle Andersen,
Torbjørg Breivik:
Språkteknologisk
terminologiarbeid i et nordisk og europeisk perspektiv
I denne
presentasjonen tar vi for oss et pågående terminologisk arbeid som skjer i regi
av Norsk dokumentasjonssenter for språkteknologi (http://www.norskdok.uib.no/). Målet med
arbeidet er å etablere en felles og enhetlig norsk terminologi for det
språkteknologiske området, til bruk i forskning og undervisning innenfor
fagfeltet. Arbeidet er nært knyttet til tilsvarende innsats i de øvrige
nordiske land, og følger den internasjonale standard som er etablert av
organisasjonen Language Technology World. Dette gjøres for å sikre et felles
begrepsapparat som beskriver språkteknologiske metoder, ressurser og produkter
på tvers av nordiske språk og andre språk.
Norsk
dokumentasjonssenter for språkteknologi har som oppgave å sikre at
forsknings-resultater, tekstsamlinger og verktøy blir tilgjengelige og kan
anvendes både nasjonalt, nordisk og internasjonalt. Senteret er ett av fem
dokumentasjonssentre som inngår i NorDokNet, som er et NorFA-finansiert
nettverk av tilsvarende sentre i sentrene i Sverige, Danmark, Finland og Island
(http://www.cst.dk/nordoknet/). Det
norske dokumentasjonssenteret er plassert ved Aksis, Universitetet i Bergen.
Norsk
språkråd har fra starten deltatt aktivt i dokumentasjonsarbeidet og har vært en
pådriver i arbeidet med å få etablert en terminologi. Både Språkrådet og
forskningsmiljøene ser behovet for en konsekvent begrepsbruk innen fagfeltet.
Arbeidet med språkteknologisk terminologi inngår i en større satsing fra Norsk
språkråd for å gjenoppta arbeidet med fagspråk og terminologi i Norge.
I
presentasjonen vil vi beskrive terminologiarbeidets omfang og status, og de spesielle
utfordringer knyttet til tilpassing av internasjonal (hovedsakelig engelsk)
terminologi til nordiske språk. Vi vil også gi en kort generell introduksjon
til feltet språkteknologi, og skissere videre planer for det terminologiske
arbeidet, innenfor rammene av et foreslått EU-prosjekt (FP6).
Bech,
Kristin & Koenraad de Smedt. 2003. Norsk dokumentasjonssenter for
språkteknologi. In Henrik Holmboe (ed.). Nordisk Språkteknologisk Årbog 2002.
De
Smedt, Koenraad & Gisle Andersen. 2005. Linking a Norwegian web portal for
Language Technology to its Nordic partner sites. In Henrik Holmboe (ed.). Nordisk
Språkteknologisk Årbog 2004.
Under 2002 ansökte
och fick TNC ett särskilt bidrag från Näringsdepartementet för att föreslå hur
en omfattande terminologisk infrastruktur skulle kunna skapas i Sverige. Projektet, som fick namnet TISS[1], genomfördes i ett första steg under
2002–2004. I detta föredrag kommer vi att redovisa grundtankarna bakom
TISS-projektet och de resultat som hittills uppnåtts, bl.a. enkätundersökningen
om terminologiska resurser i Sverige, den svenska versionen av Guide to
Terminology[2] (Nordterm 8),
och Svenska termgruppen för in vitro-diagnostik.
När det gäller hjälpmedel har TNC
föreslagit att det bör upprättas en terminologiportal som kan fungera
som den naturliga startpunkten för alla som söker information om terminologiska
aktiviteter och om facktermer på svenska och andra språk. Den kanske viktigaste
delen i portalen blir dock en rikstermbank.
Det tänkbara underlaget för en sådan
termbank undersöktes via en omfattande nationell enkätundersökning som gav
intressanta upplysningar om existerande terminologiska resurser i Sverige och
dessas lagring, tillgänglighet etc. Dessutom skisserades ett terminologisamordningsprogram
med särskilt utsedda personer, s.k. terminologisamordnare, vid
myndigheter och företag vilka skulle få ett särskilt ansvar för
terminologiarbetet inom deras verksamheter. Dessa
personers uppgift skulle bl.a. vara att inventera, samla in, utveckla och i
vissa fall skapa den svenska terminologi som används inom respektive
organisation – och på sikt alltså skapa underlag för en nationell
termbank.
En sådan termbank kan bli ett effektivt verktyg
för många grupper: fackmän som kommunicerar inbördes på sina respektive
fackspråk, för alla företag som handlar med utlandet, för medierna, för den
vanlige medborgaren i Sverige samt de svenskar utanför Sverige, t.ex.
översättare, som kan behöva ha snabb och enkel tillgång till aktuell svensk
terminologi. För terminologisamordnare och tjänstemän på myndigheter innebär en
terminologiportal inte bara ett verktyg för att få bekräftelse på vilka en
verksamhets grundläggande begrepp är, utan även en förutsättning för bättre
samordning, rationaliseringsvinster och mindre dubbelarbete, en smidigare
förvaltning och tydligare kommunikation med medborgarna.
Eftersom TNC har medverkat i ett av de
större termbanksutvecklingsprojekten på senare år – skapandet av IATE[3] inom EU – ansågs denna programvara vara
intressant för en mer omfattande testning och utvärdering. TNC har därför under
hösten 2004 med särskilt stöd kunnat utvärdera denna programvara, huvudsakligen
vad gäller aspekterna inmatning, import och sökning. Resultatet visar att
programvaran, trots en del brister vad gäller huvudsakligen teckendistinktion,
gränssnitt och termpostformat, kan motsvara de minimikrav som kan ställas på en
svensk rikstermbank, vilket gör den till en stark kandidat.
Föredraget kommer förutom att redovisa resultaten
av denna utvärdering, även presentera de krav vi anser bör ställas på en
programvara för en nationell termbank och vilka minimikrav som bör ställas på
innehållet i en sådan termbank. På detta sätt kommer föredraget att följa upp
det föredrag som Dieter Rummel från EUs Översättningscentrum kommer att hålla
under Nordterm 2005.
Ett gemensamt fackspråksområde
för hälso- och sjukvård och socialtjänst
Inledning
Socialstyrelsen
ansvarar för begrepp och termer som används av myndigheten i till exempel föreskrifter,
riktlinjer och på webbplatsen samt i kommunikationen med medborgare, andra
myndigheter och organisationer. Terminologiarbete bedrivs med inriktning på
patientsäkerhet, jämförbara data och överförbara data i elektroniska format.
Myndigheten har avdelat två tjänster, en projektledare och en terminolog. I
samordningen ligger att organisera och driva terminologiarbete baserat på
etablerade metoder och kvalitetsarbete, vidare att öka vårdgivares och vård-
och omsorgspersonals medvetenhet om terminologins betydelse samt att
tillhandahålla en publik webbaserad katalog över av Socialstyrelsen
rekommenderade begrepp och termer. Terminologiarbete är tillsammans med annan
språkvård prioriterat inom Socialstyrelsen. Resurser är avsatta för
introduktions- och utbildningsinsatser. En intern databas för terminologiarbete
används av terminologiansvariga inom verket.
Socialstyrelsen
ansvarar också för att begrepp och termer samordnas på nationell nivå.
Socialstyrelsen och Sveriges Kommuner och Landsting har ett gemensamt
terminologiråd med syftet att få en samtidig förankring av begrepp och termer i
båda organisationerna och att enhetliga begrepp och termer ska användas i
föreskrifter, allmänna råd, rapporter, enkäter m.m. En rekommenderad
terminologi publiceras i termbanken http://app.socialstyrelsen.se/termbank
Regeringen
konstaterade år 2000 att ”fortfarande föreligger betydande skillnader i
språkbruk mellan olika enheter, yrkesgrupper och huvudmän, i synnerhet mellan
hälso- och sjukvård och socialtjänst”. Socialstyrelsen fick då i uppdrag att
tillsammans med Sveriges Kommuner och Landsting utveckla bland annat
terminologin för att kunna följa upp olika verksamheter över
organisationsgränserna.
Målet för
Socialstyrelsens terminologiarbete är ett gemensamt fackspråksområde för hälso-
och sjukvård och socialtjänst.
Om orsaker och
verkan, fem års erfarenheter
Föredraget kommer
att redogöra för de erfarenheter vi har av arbetet.
Det finns en intuitiv
insikt om att enhetliga begrepp och termer är viktiga för verksamheten, inom
myndigheten och i Kommuner och Landsting. Exempel på svårigheter i
terminologiarbetet är att:
· fackområdet är stort och har många intressenter
· fackområdet består av många delområden, det gäller att ha överblick
· det är svårt att överblicka och metodfrågorna är flera.
Positiva
erfarenheter är till exempel att:
· det ser ut att vara ett riktigt beslut att samla både socialtjänst och
hälso- och sjukvård i en terminologi
· intresset för metodutbildning är stort.
Om at komme fra ord-arbejde til
terminologiarbejde:
Procesmodenhed på
terminologiområdet
Sprogarbejdet i
virksomheder er ofte lavt prioriteret, og selv om sprogmedarbejderne måske godt
kan se nogle måder at forbedre situationen på, mangler de som regel argumenter
der kan overbevise ledelsen om at der skal investeres i området. I dette indlæg
vil der blive givet redskaber til at diskutere forbedringer af terminologiarbejde
i forbindelse med strategisk planlægning inden for sprogarbejdet.
Mit arbejde her
tager udgangspunkt i ’the Information Process-Maturity Model’ som er
udviklet for informationsområdet af JoAnn Hackos i 1994. Denne model er særligt
fokuseret på dokumentproduktionen set i sin helhed og er inspireret af ’the
Capability Maturity Model’ som handler om software-udviklingsvirksomheder.
Modenhedsmodellerne
bruges til at analysere hvor moden virksomheden er på et givet område, og giver
også anvisninger på hvad der skal til for at komme videre til det næste niveau.
De nævnte modeller opererer med 6 modenhedsniveauer:
0. Uopmærksom
1. Ad hoc
2. Rudimentær
3. Organiseret og repeterbar
4. Styret og permanent
5. Optimerende
Senere har Sabine
Kirchmeier-Andersen lavet en mere fokuseret udgave af modellen, hvor
sprogarbejdet undersøges nærmere.
Mit indlæg rummer
en model, hvor der gås i detaljer med terminologiarbejde.
For hvert niveau
vil det blive diskuteret
- hvorledes terminologiarbejdet er
organiseret
- hvad der er omfattet af
terminologiarbejdet
- formål med terminologiarbejdet
- om der er en termdatabase, og hvilke
oplysningstyper den rummer
Endelig vil der
blive givet anvisninger på hvordan man kommer fra et niveau til det næste,
f.eks. fra en situation hvor hver medarbejder har sine egne ordlister, over
fælles lister og simple termbaser til en fuldt udbygget termbase som anvendes
af alle i virksomheden som udarbejder skriftligt materiale.
Norske terminologifaglige
miljøer
Holdninger til og
infrastruktur for utvikling av norsk terminologi
Foredraget
bygger på en kartlegging av personer og virksomheter som arbeider med
terminologi og fagspråk, primært knyttet til bruk av norsk språk. Disse ble
bedt om å besvare en spørreundersøkelse om bl.a. infrastruktur og holdninger.
Undersøkelsen tok blant annet sikte på å belyse disse temaene i forhold til
aktuelle organisatoriske og språkpolitiske forhold i Norge. Arbeidet ble
finansiert av Norsk språkråd.
Invitasjon
til å delta i undersøkelsen gikk til dem som ble ansett som relevante ut fra
innledende kartlegging. Spørreundersøkelsen besto av 41 punkter fordelt på åtte
kapitler. Spørsmålene gjelder delvis den enkelte respondent og virksomhet,
innbefattet kvantitative og kvalitative forhold på egen terminologisk
aktivitet, delvis gjelder de holdninger, ønsker og behov i både et nasjonalt og
et internasjonalt perspektiv.
Det kom
svar fra mer enn 50 % av dem som hadde fått tilbud om deltakelse, noe som er
svært bra for denne type undersøkelser. Det tyder på at temaet ble ansett som
viktig for dem som ble spurt. De aller fleste av de spurte drev også
terminologisk aktivitet i sin virksomhet, men i svært forskjellig omfang. For
de aller fleste er imidlertid terminologiarbeid sekundært, det har en rolle som
støtteaktivitet i forhold til en hovedaktivitet.
Terminologiarbeid
er forskjellig organisert fra virksomhet til virksomhet. Det er i stor grad ivaretatt
av høyt utdannede personer med lang yrkespraksis. De terminologiske metodene
som benyttes, varierer mye, og ofte foregår arbeidet uten dokumenterte
retningslinjer.
Terminologiutvikling
foregår innenfor nær sagt alle fagområder, men med en klar overvekt mot
tekniske og naturvitenskapelige fagfelt. En rekke språk er representert, med
bokmål og engelsk som de klart mest frekvente.
Ulike
formater er brukt, og ofte er terminologien lite tilgjengelig eksternt.
Tilgjengeliggjøring og publisering foregår på forskjellige måter. Formatene som
er brukt, virker ofte hemmende på muligheter for effektiv søking og nettbasert
presentasjon. Mange av de beste og mest anvendbare redskapene for
terminologiarbeid er lite kjent og brukt. Arbeidet foregår i varierende grad i
samarbeid med andre, internt i virksomheten eller eksternt.
Ønsket og
følt behov for terminologiutvikling er stort. Ingen vil ha en faglig
kommunikasjon hvor eneste mulighet er å bruke engelsk. Motivasjonen er stor for
å bidra med materiale eller arbeidsinnsats i et nasjonalt løft for norsk
terminologi, og alle vil bruke effektive, nettbaserte termdatabaser, hvis slike
etableres og kvaliteten på dem blir god nok. De aller fleste mener at det
offentlige bør finansiere slikt arbeid, helt eller delvis. De aller fleste ser
behov for internasjonalt samarbeid på terminologiområdet, likeledes behov for
forskning og opplæring.
Ord och
termer i den allmänna finska ontologin
För cirka två år
sedan startade professor Eero Hyvönen på institutionen för datavetenskap vid
Helsingfors universitet ett projekt som heter Den finska semantiska webben. TSK
har deltagit i ett delprojekt, där en forskningsgrupp bygger en ontologi (ett
begreppssystem i maskinläsbar form) som baserar sig på den allmänna finska
tesaurusen. Syftet med projektet är att för allmän användning bygga en ontologi
som i framtiden underlättar indexeringsarbetet och möjliggör nya intelligenta
webbtjänster som utnyttjar den semantiska informationen som ontologin innehåller.
I mitt föredrag
kommer jag att diskutera och ge exempel på vad det innebär att använda en
allmän tesaurus som utgångspunkt för begreppsmodelleringen bakom ontologin:
vilka utmaningar finns det och hur försöker vi lösa olika problem i praktiken.
Tesaurusarna är
avsedda för människor, så det är inget stort problem, att dom lämnar rum för
tolkning, när dom ger information om begreppsrelationer. Men en dator behöver
exakt information för att kunna dra slutsatser, och därför måste varje begrepp
ha sin(a) plats(er) i ett generiskt system, i den rätta dimensionen och
begreppets alla väsentliga associativa relationer måste beskrivas. Det betyder
att i många fall måste tesaurusens information kompletteras med uppgifter om
relationer till generiska överbegrepp, dimensioner samt relevanta partitiva
relationer. Alla generiska relationer måste kontrolleras och typen av
associativa relationer specificeras. Hur långt räcker de traditionella
terminologiska metoderna när det gäller att beskriva begrepp för datorn och
vilka utmaningar ställs vi inför när det är fråga om inte bara termer utan
också allmänspråkliga ord? Arbetet med ontologin pågår fortfarande, och en
viktig målsättning är att utarbeta principer och metoder för arbetet så att det
fortsatta utvecklingsarbetet ska kunna delas upp på olika specialistgrupper.
Marita Kristiansen:
Institutt for fagspråk og interkulturell kommunikasjon ved Norges Handelshøyskole
(NHH), har under utvikling en internettbasert kunnskapsbase (KB-N) som skal
dekke økonomisk-administrative fagområder. Kunnskapsbasen vil inneholde en
tekstbank, en termbank med et foreløpig fokus på norsk og engelsk terminologi
samt tilhørende begrepssystemer for de ulike subdomenene.
Blant de domener som skal inkluderes i basen finnes det en rekke
disipliner som er nært relaterte til hverandre. Disse disiplinene har til dels overlappende
begrepsapparat og i stor grad identisk bruk av termer, slik som for eksempel markedsføring
og strategi. Når begrepene som hører til disse disiplinene
registreres i kunnskapsbasen, er det derfor vanskelig å avgrense domener og
subdomener samt å presentere relasjoner som eksisterer mellom begrepene.
I denne presentasjonen ønsker jeg å diskutere hvordan en kan avgrense
interdisiplinære domener og subdomener ved å anvende vitenskapsfilosofiske
kriterier kombinert med tradisjonelle terminologiske metoder.
I doktoravhandlingen min (Kristiansen 2004) har jeg diskutert
epistemologiske kriterier for disiplinautonomi, dvs. karakteristika som bør
være iboende i et domene for at det kan kalles en disiplin. Dette innebærer at
en disiplin skal ha et separerbart forskningsobjekt, etablerte
forskningsmetoder, egen teoriutvikling og et eget felles begrepsapparat,
inkludert terminologi.
Basert på disse kriteriene har jeg gjort en terminologisk analyse av
begreper i disiplinen organisasjonsadferd, slik som motivasjon, gruppe
og normer, og sammenlignet disse med begreper i disiplinens
moderdisipliner, blant annet psykologi og sosiologi.
En av hovedkonklusjonene fra analysen er at det er lite som skiller et
begrep i disiplinen organisasjonsatferd fra for eksempel disiplinen
psykologi, det vil si at for eksempel
definisjoner, termer og annen begrepsbeskrivelse vil være tilsynelatende
tilnærmet identiske i de to disiplinene, med ett viktig unntak:
Begrepsrelasjonene er ikke sammenfallende, noe som gir til dels svært ulike
begrepssystemer.
Dette taler for at en kunnskapsbase, slik som KB-N, må ta hensyn til
den iboende kunnskaps- eller begrepsstrukturen som finnes i de ulike domenene,
selv om de vil være svært interdisiplinære av natur. Videre taler det for at fokuset
nødvendigvis må være på termer og de begreper disse representerer, heller enn
ord slik disse er presentert i korpustekstene.
Bodil Nistrup Madsen, Hanne Erdman Thomsen, Carl Vikner:
Representing subdivision criteria in CAOS 2
In this paper we want to explain how multiple subdivision criteria are implemented in the system CAOS 2. CAOS - Computer-Aided Ontology Structuring - is a project whose aim is to develop a computer system designed to enable semi-automatic construction of concept systems. The system developed from 1998 to 2004 is called CAOS 1. In 2005 we have started the implementation of a new version, CAOS 2, which comprises a graphical user interface. Subdivision criteria are modelled in CAOS by means of formal dimensions in the following way. Characteristics are encoded as formal feature specifications consisting of an attribute and an associated value: [attribute: value]. A dimension of a concept is an attribute occurring in a primary (i.e. non-inherited) feature specification of one of its subordinate concepts. A dimension specification consists of a dimension and the values associated with the corresponding attribute in the feature specifications of the subordinate concepts: (dimension : [value1, value2, ...]).
One or more dimensions of a concept may be distinguished as subdividing dimensions. A subdividing dimension represents a subdivision criterion. If one of the daughters of the concept associated with a subdividing dimension contains a feature specification that has the subdividing dimension as attribute, such a feature specification is called a delimiting feature specification. A delimiting feature specification represents a delimiting characteristic. That is, a subdividing dimension of a mother concept percolates as delimiting feature specifications on some of its daughter concepts.
Graphical tools based on UML (Unified Modeling Language) have already for some years been used for concept modelling in terminology. CAOS 2 uses concept diagrams developed on the basis of the ones used in UML, enriched with a number of facilities. In CAOS 2 it is possible to add several dimensions and to choose some of them as subdivision dimensions. On the superconcepts are shown the dimension specifications, which specify the values associated with the corresponding attribute on the subconcepts. Concepts belonging to the same subdividing dimension are grouped together and the subdividing dimension is shown in the diagram on the links to the concepts. The grouping in CAOS 2 is thus a function of the delimiting characteristics of the concepts in question.
The principal differences between CAOS 2 and UML are the following. In UML it is also possible to group concepts in a similar way, but the UML grouping is unprincipled, i.e. it is left to the user’s personal preferences. In UML a “discriminator” corresponds to the subdivision criterion. However, in UML it is not possible to represent several dimensions, from which one may be chosen as the subdividing dimension, and there is no notation for the specification of dimension values. Furthermore, UML does not specify a notation for feature specifications. When using UML for the elaboration of a conceptual data model for an IT system, it is possible to add (unstructured) attributes in a special compartment in the class. However, the attributes here serve another purpose than the feature specifications in the CAOS 2 concept system, viz. to specify which kinds of information may be related to each class.
Gert Engel, Lotte Weilgaard
Christensen:
Formålet er at præsentere resultaterne fra det nordiske netværkssamarbejde
NorNa (Nordic Navigator) om udvikling og testning af en prototype for et
flersproget, nordisk søgeinterface, der i samspil med eksisterende søgemaskiner
giver monolingval adgang til informationer på flere nordiske sprog samtidig.
De behandlede sprog er norsk, finsk, svensk og dansk samt engelsk, det sidste
åbner mulighed for senere udbygning med ikke-nordiske sprog. Projektet tager udgangspunkt
i kendte terminologiske principper. NorNa-systemet er bygget op omkring en
termbaseapplikation, som er udvidet med yderligere moduler, herunder et modul
med søgebegreber. Datagrundlaget er tilvejebragt ved terminologisk behandling
af et antal parallelle korpusser, bl.a. inden for domænet arktisk miljø. Det
overordnede formål med projektet er, at opnået forskningsmæssig kompetence
omsættes til en nytteværdi for erhvervslivet og offentlige institutioner i
form af et sprogteknologisk værktøj, der kan bidrage til at optimere
udnyttelsen af nordiske vidensresurser. I netværket deltager de fire
universiteter Universitetet i Bergen, Norges Handelshøyskole, Vasa Universitet
og Syddansk Universitet. Derudover deltager det danske systemudviklerfirma
Termplus ApS. Det svenske terminologicenter TNC er involveret i netværket som
observatør. Netværksprojektet
har modtaget økonomisk støtte fra Nordisk Ministerråds Sprogteknologiske
forskningsprogram.
Steffen Leo Hansen:
Når man har sat sig for at udvikle et IR-system
med klassisk musik som genstandsområde, og når det ydermere skal være et system
som ikke kommunikerer med bruger ved hjælp af mus og knapper, men tværtimod i
almindelig sproglig dialogform, så begynder problemerne hurtigt at melde sig.
Først og fremmest: Hvordan finder man ud af hvad bruger spørger om ? Hvilken sproglig og faktuel viden
skal være tilgængelig for systemet ? Hvordan finder man det rigtige svar på en
forespørgsel?
Et spørgsmål fra en bruger
kunne for eksempel være: ”Har du en indspilning af Elvira Madigan ?”.
Mozarts klaverkoncert nr. 21 i C-Dur KV 467 blev med ét kendt og meget populær,
og da især den langsomme 2. sats, en Andante, da den i 1967 blev brugt som
gennemgående musikalsk tema i Bo Widerbergs film ’Elvira Madigan’. Et andet
eksempel på en forespørgsel: ”Har du en indspilning af musikken fra
Døden i Venedig ? ”, igen klassisk musik som er blevet kendt og populær som
underlægningsmusik i en film. For at kunne svare på dette spørgsmål, forudsætter
det viden om at ’Døden i Venedig’ er en novelle af Thomas Mann, at den blev
filmatiseret i 1971, og at den musik der efterlyses er 4. sats, Adagiettoen i
Gustav Mahlers 5. symfoni.
Musik,
som det hedder i ovennævnte forespørgsel, kan være mange ting: symfonisk musik
som for eksempel Mahlers 5. symfoni, eller klavermusik som ovennævnte koncert
af Mozart. For en bruger må det være tilstrækkeligt at bede om ’musik’. Det
system han kommunikerer med er til gengæld nødt til at vide hvad musik
er og kan være, og hvad der helt præcist menes med musik i det aktuelle
spørgsmål.
For at
kunne svare på ovennævnte forespørgsel må systemet have adgang til flere
forskellige former for viden, i dette tilfælde til såvel lingvistik som terminologisk
viden, men også til omverdensviden. Hvad er en indspilning og hvad er
det man indspiller ? Og hvad er det for en form for musik der
efterspørges ? ’Døden i Venedig’ er i denne sammenhæng uinteressant for bruger
som litterært produkt. Det er heller ikke forfatteren Thomas Mann som
interesserer spørgeren. Filmens titel er til gengæld central, for den
giver navn til musikken. For bruger er film og musik identiske, hvor musikken
stammer fra, vides ikke, og det er måske oven i købet heller ikke så afgørende.
Systemet derimod skal vide og kunne gøre rede for hvad det er, at det drejer
sig om 4. sats i den 5. symfoni af den østrigske komponist Gustav Mahler.
Jeg vil
i mit indlæg gøre rede for designet af et IR-system som skitseret ovenfor. I min
gennemgang vil jeg koncentrere mig om de komponenter som etablerer den
nødvendige sammenhæng mellem ord og termer, mellem brugers ordforråd og den
klassiske musiks terminologi, og mellem på den ene side de begreber som indgår
i brugers opfattelse og beskrivelse af det aktuelle domæne og på den anden side
systemets opfattelse og begreber organiseret som en domæne-specifik ontologi.
Hvilke beslutninger ligger til grund for indhold og udformning af disse
komponenter, og hvor og hvordan bruges de for at kunne give et korrekt svar på
en forespørgsel som ikke nødvendigvis er formuleret af en person med den
nødvendige musikfaglige baggrund.