shell-script-pt
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos.


From: Tiago Peczenyj
Subject: Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos.
Date: Wed, 11 Jan 2012 10:25:28 -0200

O comando file pode detectar o encoding usado

$ file --mime-encoding a.txt
a.txt: utf-8
$ cat a.txt
ação

pode ser bom o suficiente para muitas situações, nunca encontrei nenhum
caso onde ele "se perdesse" mas se alguem teve alguma surpresa seria bom
falar nessa thread

quanto ao uso de php: nem sempre contamos com este recurso insalado e php
possui as suas particularidades. por exemplo o suporte a unicode do php é
dificitario se comparado com outras linguagens. mesmo perl que possui um
bom suporte também não é escopo dessa lista. de fato lidar com character
encoding não é facil, por exemplo, o caracter é pode ser representado de
duas formas usando UTF-8

a letra é, ou

a letra e seguido de um ' especial que significa que a letra é acentuada.

isso pode trazer surpresas quando vc quer procurar por uma dada string. as
vezes é necessario normalizar o texto para uma forma sem ambiguidades, por
exemplo. Esse tipo de problema é sério e talvez simplesmente shell script
não resolva e sim tenha que ser caso a caso. O escopo da lista é necessario
para criar um foco para nós, se o seu problema pode ser resolvido fora
existem outros lugares que podem responder muito bem e que tem os seus
proprios focos. Eu, por exemplo, resolveria em Perl perguntando em listas
ou foruns de perl, mas apenas essa questão em especial (poderia ser
resolvido com C++ e então ir a foruns de C++, etc). Assim todos ficam
felizes: quem assina não ve perda de foco e as conversas ficam mais
interessantes.

2012/1/11 MrBiTs <address@hidden>

> **
>
>
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA256
>
>
> >
> > Pesquisando agora, vi que em PHP tem um método mb_detect_encoding
> > (http://us3.php.net/manual/en/function.mb-detect-encoding.php) que diz
> qual o encoding mais próximo dentro de uma lista de
> > opções. Você poderia utilizar PHP em shell usando o shebang /usr/bin/php.
>
> A lista trata de linguagem shell-script, não PHP.
>
> - --
>
> LLAP
>
> .0. MrBiTs .'. - address@hidden
> ..0 GnuPG -
> http://keyserver.fug.com.br:11371/pks/lookup?op=get&search=0x6EC818FC2B3CA5AB
> 000 http://www.mrbits.com.br
>
> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.10 (Darwin)
>
> iQEcBAEBCAAGBQJPDXoVAAoJEG7IGPwrPKWrctcH/2htOJJNIB90Gms6qSr2i0li
> QIpnQMaSGs6wbV9rAxn9smE0cCnMPET0MAY3jeb4Tg1lCK/RB3L1uM7P/ZRNTKdB
> RDPWLOPN8WOQ+sINxdS2a/eR5T3Vp7jauQh2ooCkRoY2IKQlBpap65WaS0bWBn71
> jMEAiFrE/e3SLjoXsYQROoBh0IOV1Ui9oqBks0IWRDcfzU9btYhxwDAxQgAVqrgq
> HyOvtcsXUS4vcaluelXw3TpJkXerZ5hxzA+ZbzVt6pBriGR88G0UVSI3p2txrna4
> HX1UsZF4J4cFhnK9VJpXDTif6/hun+pnixL4qo8l96N9F4q2drcvJoOzjS9xayg=
> =PI+x
> -----END PGP SIGNATURE-----
>
>  
>



-- 
Tiago B. Peczenyj
Linux User #405772

http://pacman.blog.br


[As partes desta mensagem que não continham texto foram removidas]



reply via email to

[Prev in Thread] Current Thread [Next in Thread]