[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Oppdaterte ordbankfiler for programmet ordbanken
From: |
Karl Ove Hufthammer |
Subject: |
Oppdaterte ordbankfiler for programmet ordbanken |
Date: |
Mon, 28 Mar 2022 22:02:03 +0200 |
User-agent: |
Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101 Thunderbird/91.7.0 |
Hei, brukarar av programmet Ordbanken!
Eg har no flytta Ordbanken-prosjektet over frå Subversion til eit meir
moderne (og for ferske utviklarar meir kjent) versjonskontrollsystem,
Git. For tilgang til nyaste versjon kan de klona Git-depotet med denne
kommandoen:
git clone https://git.savannah.gnu.org/git/ordbanken.git
I samband med overgangen har eg nytta høvet til å rydda litt opp i
historikken (dvs. forsiktig omskriva han):
– Gamle ordlistefiler hadde svært varierande sortering, noko som gjorde
at «diffar» mellom ulike versjonar vart unødvendig store og vanskelege å
tolka. Har derfor sortert alle ordlistefilene på nytt, og på likt vis
for kvar versjon.
– Éin versjon av den nynorske ordlistefila hadde nokre tekniske problem
(to kolonnar var slåtte saman til éi). Har prøvd å fiksa dette manuelt.
– Alle loggmeldingane er oppdaterte til å følgja mønsterpraksis, dvs. ei
kort samandragslinje + ev. ei lengre forklaring.
– Andre småendringar, eks. innsetjing av ei .gitignore-fil for
automatisk ignorering av autogenerte filer.
– Eg klarte òg å grava fram dei to første offentleggjorde versjonane av
programmet frå ei e-postliste. Har lagt desse med på starten av
historikken, med dokumentasjon.
Meld frå om de finn noko som ikkje fungerer som det skal.
Første versjon var forresten på berre fem linjer (som i praksis kan
slåast saman til éi):
#!/bin/sh
ordbok=~/utvikling/ordbok/nn/fullform_nn.txt
awk '{ if ( $2 == '\"$1\"') {print $0}}' $ordbok \
| fgrep -v klammeform | fgrep -v unormert \
| grep -E " <?$2" | grep -E " <?$3" | grep -E " <?$4" | grep -E " <?$5"
Gjeldande versjon er på over tusen (alle skripta til saman).
--
Karl Ove Hufthammer