www-pl-discuss
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je.


From: Paweł Różański
Subject: Re: [www-pl-discuss] NBSP; czyli niełamliwe spac je.
Date: Wed, 01 Sep 2010 08:45:31 +0200
User-agent: Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1.11) Gecko/20100805 Icedove/3.0.6

On 31.08.2010 15:23, Jan Owoc wrote:
JO>> Podsumowując dyskusję zdecydowaliśmy, że wstawianie spacji
JO>> niełamliwych jest pożądane. Teraz debatujemy nad najbardziej
JO>> efektywnym sposobem ich wstawiania.
 Nadinterpretujesz. Dopuszczamy możliwość użycia  jeśli nie powoduje
to spadku czytelności oryginalnego tekstu i możliwości stosowania
automatycznego sprawdzania pisowni.
Zrozumiałem, że doszliśmy do wniosku, że wstawianie nbsp jest czymś
pożądanym. Skupmy się na tym jak to najlepiej zrobić.

Błędnie zrozumiałeś. "Skoro już ktoś chce, żeby wstawiać, to róbmy to możliwie w najmniej przeszkadzający sposób" != "wstawianie jest pożądane".

 Dwie faktycznie odpadają, ale przy 3-4 spacjach jest znacznie lepiej.
Postaram się zrobić wieczorkiem pełne statystyki. Nawiasem, 3 lub 4 spacje
nie powinny występować w oryginale (dwie wiemy, że występują) - formatowanie
tekstu spacjami jest (niekrytycznym) błędem.
Czy wyobrażasz sobie, aby tłumacz siedział z tabelką przyimków i
systematycznie wstawiał dokładnie 4 spacje po każdym? Dodatkowe spacje
są usuwane przez przeglądarki, więc 4 spacje mają tą samą szerokość co
jedna.

W edytorach PO wielokrotne spacje są widoczne, tłumacze pracują raczej na nich, niż przeglądarkach. IMO 3 (cztery nie wydają się konieczne) spacje są mniej problematyczne, niż rozwalający wszystko  

Niestety, nie da się tego sensownie wykorzystać 3 i więcej spacji. Nawet przyjmując zasadę "nie spacja i nie cudzysłów, następnie 3 spacje, następnie nie spacja" mamy 7 plików pot z takim ciągiem. Przy czterech spacjach ta liczba spada do 3 plików, ale to niewiele zmienia. Chyba, żeby robić drobne zmiany w treści, albo napisać omijanie treści zawartej w <pre> (to już nietrywialne)...

 Jakby ktoś chciał zweryfikować:
Dla 3 (dla 4 spacji należy {3} zmienić na {4}:
- szukanie linii:
egrep -iR "[^ \"]\s{3}\S" *
- ilość plików
egrep -iR "[^ \"]\s{3}\S" * | awk -F ':' '{print $1}' | sort -u | wc -l

JO>> Jeśli ktoś dobrze znający sed napisałby filtr, który wyszukałby
JO>> spójników i przyimków:
JO>> http://pl.wikipedia.org/wiki/Sp%C3%B3jnik_%28cz%C4%99%C5%9B%C4%87_mowy%29
JO>> http://pl.wikipedia.org/wiki/Przyimek
JO>> to mógłbym go stosować tuż przed wysłaniem pliku na serwer gnu.

 Mogę skrobnąć skrypt do tego, ale potrzebuję dokładnych wytycznych (warunki
wstawiania, kiedy wstawiać, kiedy nie wstawiać). Proponuję w Perlu, bo po
pierwsze więcej da się zrobić, można używać warunków, ściągać plik ze strony
(np. w celu weryfikacji, czy ma wstawione OK) i ma normalne wyrażenia
regularne (PCRE), a nie tę imitację, która jest w sed.

Czy jesteś w stanie napisać skrypt w Perlu, który by szukał spójnika
lub przyimka (lista spójników i przyimków na Wikipedii) nie
uwzględniając wielkości liter. Jeśli po spójniku/przyimku jest jedna
lub więcej spacja, zamienić spacje na ciąg znaków "&nbsp;"

Jestem (przy wstawianiu "na pałę" jest to wręcz trywialne), ale takie podejście to typowy przykład, że "Każdy złożony problem ma proste, błędne rozwiązanie". Po pierwsze, lista spójników i przyimków na wiki nie jest kompletna. Po drugie, nie jestem przekonany, że chcesz dawać &nbsp po takich spójnikach jak: tudzież, aczkolwiek, jednak, natomiast, mianowicie, jeżeli, ponieważ. Po trzecie, wspomniane teksty w <pre>. Niemniej, w weekend postaram się skrobnąć coś, co ew. da się potem rozwinąć do większej ilości reguł i wyjątków, oraz pozwoli na łatwe modyfikacje reguł.

Możemy te rzeczy robić równolegle. Jeśli znasz Perl, napisanie skryptu
powinno być dość proste.

J.w. Będzie w weekend. Nie tyle napisanie jest problemem, co zrobienie wersji w miarę elastycznej.

Odnośnie edytora, możemy przecież dodać odwrotny skrypt do tego, który
informuje o aktualizacjach; wersje w www-pl będą zawsze bez znaku
nbsp.

Jak pisałem, nie chodzi mi tyle o obecność nbsp czy jego brak, tylko o wygodę tłumaczenia. Jeśli w repo będą wersje bez nbsp (co nigdy nie jest błędem), to nie ma dla mnie znaczenia, co trafi na WWW.

Pozdrawiam,
Pawełreply via email to

[Prev in Thread] Current Thread [Next in Thread]