ordbanken-diskusjon
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[ordbanken] Fwd: Norsk ordbank er genialt


From: Karl Ove Hufthammer
Subject: [ordbanken] Fwd: Norsk ordbank er genialt
Date: Sun, 10 Jan 2010 14:27:37 +0100
User-agent: Thunderbird 2.0.0.23 (X11/20100108)

Til medlemmene på ordbanken-diskusjon

For litt over ein månad sidan fekk eg ein e-post om eit interessant prosjekt som brukar datafilene frå Norsk ordbank. Eg trur dette også kan vera av interesse for medlemmene her på lista, so eg har fått løyve til å vidaresenda e-posten:

-------- Original Message --------
Subject: Norsk ordbank er genialt
Date: Sun, 29 Nov 2009 13:46:26 -0500
From: Stian Håklev <address@hidden>
To: address@hidden


Hei du,

er en nordmann som har endt opp i Canada, for tiden tar jeg master om åpne utdanningsressurser ved Universitet i Toronto. Er veldig engasjert rundt åpen tilgang til forskningsartikler, åpne utdanningsressurser, åpen/fri kildekode, etc. Selv om det ikke er faget mitt, har jeg også alltid vært interessert i språk, og driver med litt datalingvistikk på siden (veldig elementære greier).

Sammen med en kamerat har vi jobbet med å bygge opp en åpen norsk-kinesisk ordbok på nettet (dette er en del av et større prosjekt med ordbøker fra kinesisk til en rekke språk, samt en kinesisk-kinesisk ordbok, med tegnanalyse, kantonesisk, klassisk kinesisk etc - men jeg jobber mest med den norsk-kinesiske delen). Per i dag finnes det ingen norsk-kinesiske ordbøker på nettet. (Derimot har forskere på UiO utviklet en over tusen-siders papier ordbok, med flere millioner i statsstøtte, som koster 1000 kr i bokhandelen. Jeg kontaktet dem og spurte om de kunne tenke seg å legge ordboka ut som Creative Commons, og nedlastbar, men det var desverre ikke aktuelt. Jeg vet hva jeg hadde gjort, hvis jeg satt på pengesekken i utdanningsdepartementet / forskningsrådet).

Uansett, vi kan selvfølgelig ikke sitte og håndskrive en flere tusen siders ordbok på kinesisk og norsk - ingen av oss er formelt trenede lingvister, og ikke har vi ti år og mange stipendiater. Så vi bruker de ressursene som finnes. Vi begynte med å ekstrahere informasjon fra Wikipedia ved bruk av interwiki-lenkene, som ga noe slikt som 150,000 entries (se http://reganmian.net/blog/2009/02/16/release-early-release-often-english-chinese-dictionary-based-on-wikipedia/)... alt fra

謝爾·馬格納·邦德維克 Kjell Magne Bondevik

til

全国重点文物保护单位 全國重點文物保護單位 Folkerepublikken Kinas liste over nasjonale historiske minnesmerker og kulturgoder

 :) Ikke ting man finner i vanlige ordbøker... Siden kameraten min har lært seg norsk i de siste årene hadde han lister med ord han hadde skrevet opp mens han studerte, flere tusen av de vanligste ordene. Så tok vi oversettelsesfilene fra KDE (http://reganmian.net/blog/2009/11/01/creating-a-dictionary-from-kde-translation-files/) - dermed får vi oppslag som

Hint for brukerflategenerering 界面生成提示

- nok engang ting man ikke ofte finner i vanlige ordbøker. Selvfølgelig kan alle disse ordbøkene lastes ned, enten under den opprinnelige lisense (for det vi har importert), eller under CC-0 for det vi generer selv.

Målet er at vi etterhvert skal bygge opp et miljø av kinesere som studerer norsk, og nordmenn som studerer kinesisk (vi har allerede besøkende fra et norsk buddhistisk forum, et norsk forum for foreldre av adopterte barn fra Kina, kinesiske studenter i Peking som studerer norsk ved Chinese Foreign Language University etc), og at alle disse kan bidra til å bygge opp ordboken. For på samme tid som vi har masse utrolig spennende data man ikke finner andre steder, mangler vi kanskje helt åpenbare ord, som "fugl" ;)

Uansett - jeg er alltid på jakt etter nye datakilder som vi kan bruke, og ble veldig glad da jeg fant de norske ordbanken, og at den var både nedlastbar og under GPL (det er så ofte jeg har kommet over prosjekter fra UiO som er låst opp, enten det er den kinesiske ordboka jeg nevnte ovenfor, eller korpora etc, så jeg trodde nesten ikke mine egne øyne først).

Nå har vi gjort det tilgjengelig, så hvis du klikker på et ord i den norske oversettelsen, så gjør den et søk i ordbanken. For eksemple, hvis du søker på "spise", så får du bl.a.:

[動詞] spise lexin · dokpro
吃光 [動詞] spise opp lexin · dokpro
吃 午飯 [動詞] spise lunch lexin · dokpro
吃掉 [動詞] spise opp lexin · dokpro
吃 晚飯 [動詞] spise middag lexin · dokpro

hvis du så klikker på spise igjen, får du et flott søk i ordbanken:

Substantiver

Oppslagsord Ub. form ent. Best. form ent. Ub. form fl. Best. form fl.
fiskespiser en fiskespiser den fiskespiseren  mange fiskespisere  alle fiskespiserne
frontispis en frontispis den frontispisen  mange frontispiser  alle frontispisene
frontispise en frontispise den frontispisen  mange frontispiser  alle frontispisene
inspisering en inspisering den inspiseringen  mange inspiseringer  alle inspiseringene
jaspis en jaspis den jaspisen  mange jaspiser  alle jaspisene
potetspiser en potetspiser den potetspiseren  mange potetspisere  alle potetspiserne
spis en spis den spisen  mange spiser  alle spisene
spise en spise den spisen  mange spiser  alle spisene
spisebestikk et spisebestikk det spisebestikket  mange spisebestikk  alle spisebestikkene
spisebord et spisebord det spisebordet  mange spiseborder  alle spisebordene
spiseforstyrrelse en spiseforstyrrelse den spiseforstyrrelsen  mange spiseforstyrrelser  alle spiseforstyrrelsene

Verb

Oppslagsord Presens Preteritum Perf. partisipp Futurum Imperativ
å avspise avspiser avspiste  har avspist  skal avspise  avspis 
å bespise bespiser bespiste  har bespist  skal bespise  bespis 
å forspise forspiser forspiste  har forspist  skal forspise  forspis 
å inspisere inspiserer inspiserte  har inspisert  skal inspisere  inspiser 
å spise spiser spiste  har spist  skal spise  spis 
å trøstespise trøstespiser trøstespiste  har trøstespist  skal trøstespise  trøstespis 

Adjektiv

Oppslagsord Han/hunkjønn Intetkjønn Best. form ent. Fl. tall Komp. Ub. form superl. Best. form superl.
spiselig spiselig spiselig  spiselige  spiselige  spiseligere  spiseligst  spiseligste  
uspiselig uspiselig uspiselig  uspiselige  uspiselige  uspiseligere  uspiseligst  uspiseligste  

Utrolig nyttig for kinesere som lærere seg norsk (som min kone)!

Ville skrive for først og framst si tusen takk for at du har hjulpet til med å gjøre en så utrolig ressurs tilgjengelig! (Vet at du ikke laget den single-handedly, men hadde nok ikke funnet den om det ikke var for deg).

[…]

Vi holder akkurat på å legge om til en forbedret versjon av nettstedet (skrevet i Ruby), så det er noen linker som ikke funker og slikt for tiden - regner med å ha det noenlunde stabilt om en uke eller to.

Den offisielle URLen, og den som du bør nevne hvis du vil fortelle noen om dette etc, er http://www.kaifangcidian.com/norsk (og http://kaifangcidian.com/nuo for kinesisk interface til den norske ordboka). Kaifang Cidian (开放词典) betyr åpen ordbok. Men for å teste ut de nye funksjonene kan du taste inn søket direkte slik: http://kaifangcidian.com/waiyu-xin/norsk/hei (hei er søkeord, kan også være en regexp).

Takk igjen for ordbanken!!!

Stian

--
http://reganmian.net/blog -- Random Stuff that Matters


reply via email to

[Prev in Thread] Current Thread [Next in Thread]