ordbanken-diskusjon
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[ordbanken] Gøy med Norsk ordbank


From: Karl Ove Hufthammer
Subject: [ordbanken] Gøy med Norsk ordbank
Date: Wed, 28 Apr 2010 20:09:31 +0200
User-agent: KMail/1.13.2 (Linux/2.6.31.12-desktop-3mnb; KDE/4.4.2; i686; ; )

Mens me ventar på neste utgåve av Norsk ordbank, kan me ha det 
litt gøy med den utgåva me har. For eksempel, kva er det lengste ordet i 
ordbanken som kan lesast både forlengs og baklengs? Det finn me lett:

  tab=$(printf '\t')
  awk -F"$tab" '{print $3}' fullform_nn.txt | sort | uniq > ord
  rev ord > ordb
  sort ordb | uniq > ordbs
  comm -1 -2 ord ordbs > baklengsord

Fila «baklengsord» inneheld no ei liste over alle desse (nynorsk)orda. 
Her er dei lengste (dei på minst 7 bokstavar/teikn):

  grep '.\{7,\}' baklengsord

anilina
gniding
gnissing
gnistas
gnitter
lev vel
mastiks
monaden
nedanom
rapport
reiedeier
rekkert
retting
satsing
skitsam
stillits
trebert
trekker
trenert
troppar

Det lengste baklengsordet i ordbanken er altso «reiedeier». 
Bonuspoeng til dei som veit kva det tyder! :-)

Men «reiedeier» er likt både forlengs og baklengs; det 
er eit palindrom. Kan me lett finna andre eksempel på 
palindrom? Jepp:

  paste ord ordb > ordf
  awk -F"$tab" '{if ($1 == $2) {print $1}}' ordf > palindrom
  grep '.\{7,\}' palindrom

anilina
gniding
gnissing
lev vel
reiedeier
stillits
trebert
trenert

Merk at denne løysinga skil mellom store og små bokstavar, so stad- og 
personnamn vert aldri rekna som baklengsord eller palindrom. For å få 
dei med, kan me gjera ordlista om til berre små bokstavar med

  awk '{print tolower($0)}'

(for eksempel etter første awk-kommando).

-- 
Karl Ove Hufthammer
http://huftis.org/
Jabber: address@hidden
reply via email to

[Prev in Thread] Current Thread [Next in Thread]