www-pl-discuss
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje.


From: Jan Owoc
Subject: Re: [www-pl-discuss] NBSP; czyli niełamliwe spacje.
Date: Fri, 3 Sep 2010 11:19:10 +0200

Witam,


PR> Skrypt w załączniku, opis w skrypcie. Lista z wiki - łatwo dopisać słowa
PR> samemu w pliku konfiguracyjnym. Nie uwzględnia obecności<pre>  lub jej
PR> braku.
PR> Czyta ze STDIN, pisze na STDOUT. Użycie:

Dzięki za błyskawiczne napisanie skryptu. Dzięki temu, można stosować
z "msgfilter":
msgfilter -i test.po -o test.po --keep-header perl insert_nbsp.pl


PR> cat plik.pl.po | perl insert_nbsp.pl

To nie uwzględniałoby nagłówka i tekstu angielskiego; należy stosować
"msgfilter".


SZ> 1. Przede wszystkim nie bierze pod uwagę struktury plików gettext.
SZ> Przykład:
SZ> "tłumaczenie z"
SZ> " czymś"

msgfilter uwzględnia to :-)


SZ> lub
SZ> "wyrazy i (ale nie tylko) litery"

PR> Tu są dwie sprawy. O ile poprawa tak, by uwzględniało spójnik i
PR> bezpośrednio po nim cudzysłów jest prosta (wystarczy kolejna reguła, chyba;
PR> mam nadzieję, że spacji sprzed słowa chyba nie trzeba usuwać...),

Spacja przed "i" powinna zostać, a spacja po "i" powinna się zamienić
na "&nbsp;".


PR>  Ogólnie nie do końca rozumiem ideę podziału na pojedyncze wersy w osobnych
PR> cudzysłowach (Poedit korzysta z konwencji - cała sekcja w jednym
PR> cudzysłowie).

Chodzi o to, że niektórzy używają do edycji np. vim lub emacs. Nie
mają ekranów szerokich na kilkaset znaków, więc wiele programów
automatycznie dzieli cytaty na maksymalnie po 80 znaków. To jest w
100% poprawny plik .po, ale w przypadku przepuszczania przez msgfmt
nie powinno to robić różnicy.


SZ> 2. Co do tagów<pre>  - warto by też uwzględniało.

PR>  J.w. - pre to też sekcja, w pewien sposób.

(chyba) Nic się nie stanie jeśli w sekcji <pre> zostaną dodane znaki
nbsp. Pomyślimy o tym jeśli będzie sprawiało problemy.


SZ> 3. Sens zamiany jest chyba tylko dla jednoliterowych
SZ> spójników/przyimków - odpowiednia stylistyka. Wystarczy uściślić
SZ> konfigurację.

PR>  Wiem, zgłosiłem, że nie wszystkie spójniki się łapią, ale robiłem wg
PR> wytycznych, znaczy z wiki. ;)

Skoro jest plik cfg, można dodawać/usuwać słowa w razie potrzeby. Czy
ktoś z listy zna kogoś z dziedziny typografii i może zapytać czy tylko
(i aż) wszystkie spójniki i przyimki?


SZ> 4. Co dla windziarzy?

PR>  Perl jest międzyplatformowy (kiedyś był Active Perl, działało nieźle).
PR> Aktywnych tłumaczy jest 12, pytanie ilu z nich używa Windows, no i nie
PR> wszyscy muszą korzystać z automatu... Zresztą, kod jest dostępny, a ja nie
PR> mam jak testować pod Windows (z braku Windows).

Docelowo myślę, że skrypt byłby uruchamiany przez jednego z liderów
tuż przed umieszczeniem na stronie GNU. Repozytorium CVS GNUowskie nie
działa poprawnie na Windowsie (jest folder "cvs" oraz tzw. "soft
links") - ew. lider musi mieć choć w wirtualce system nie-Windowsowy.


Od ręki zauważyłem jeden błąd: wstawia "$nbsp;" zamiast "&nbsp;" ;-).
Naprawiłem u siebie.

Druga sprawa, to polskie znaki w obu plikach mi się dziwnie
wyświetlają (terminal mam w Unicode UTF-8). Nie wiem co to
spowodowało, ale nie działa dla słów z polskimi znakami. Znów
zmieniłem w swoim pliku .cfg.

Trzecia sprawa, to nie łapie jeśli słowo zaczyna się od wielkiej
litery. Załączam "poprawiony" plik cfg oraz pliki testowe.

Nie wiem jaką część skryptu przeznaczyłeś na wyszukiwanie znaków #, "
itd. Msgfilter to wszystko robi za Ciebie i wypluwa jedną długą
linijkę (bez końcowego newline), którą modyfikujesz jako strumień.
Skrypt działa poprawnie (z w.w. uwagami), ale może być niepotrzebnie
skomplikowany.


Pozdrawiam,

Janek

Attachment: insert_nbsp.tar.gz
Description: GNU Zip compressed data


reply via email to

[Prev in Thread] Current Thread [Next in Thread]