[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [shell-script] Conversão de nome de arquivos.
From: |
Alysson Gonçalves de Azevedo |
Subject: |
Re: [shell-script] Conversão de nome de arquivos. |
Date: |
Wed, 11 Jan 2012 13:00:44 -0200 |
Mas assim, para eu ter um mapa, eu precisaria saber qual encode inicial e
então converter... mas veja, converter não é o problema, o problema é não
adianta converter � por ¡, tem que converter pro carácter correto, seja um
í, &, ç ou qualquer outro.
A questão toda é que na prática, todos os arquivos com caracteres estranhos
que vem do windows, ficam corretos se eu mudar de cp850 (que é o padrão do
DOS) para utf-8. Só com isso o script fica pronto.
A duvida que fica é se um arquivo vindo do mac, ou do windows mobile, ou
qualquer outro S.O, e possua um "caracter estranho" no nome, provavelmente
o encode correto não será o cp850, e é por isso que eu estava procurando um
meio de descobrir qual seria o encode correto.
(via shell, pq outras linguagens faria perder a mágica da brincadeira ^^).
Mas mesmo assim, vlw pela dica.
Alysson Gonçalves de Azevedo
(11) 8491-7730
Em 11 de janeiro de 2012 12:32, Marcelo Andrade <address@hidden>escreveu:
> **
>
>
> On Wednesday, January 11, 2012, Alysson Gonçalves de Azevedo wrote:
> >
> > Hmm, muito interessante, seria quase isso, mas não está funcionando na
> > prática.
> >
> >
> (..)
>
>
> > Starting a dry run without changes...
> > mv "./Cap�tulo 1.rar" "./Cap¡tulo 1.rar"
> > No changes to your files done. Use --notest to finally rename the files.
> >
> > Ou seja, ele trocou "Cap�tulo" por "Cap¡tulo", e por isso não resolve.
> > se o "echo arquivo | file -i -" retornasse "charset=cp850", estaria
> > perfeito.
> >
> (..)
>
> É o que havia comentado. Veja que neste caso o "�" foi convertido
> para um "¡" (exclamação invertida) que é um caracter válido em UTF-8
> cuja representação batia com a do símbolo � na página iso-8859-1.
> Por isso a detecção de encoding nunca será perfeitamente precisa.
> Não sei se ao invés de UTF-8 você colocar o destino sempre em ASCII
> (ou seja, perdendo os acentos) resolveria.
>
> Assim, considere também uma abordagem mais simplista, por exemplo,
> de apenas converter os caracteres mais comumente problemáticos
> para seus equivalentes. Ou seja, todo � (i com acento em cp850)
> vira í (i com acento em UTF-8). Neste caso, um tr mais elaborado talvez
> resolvesse. Ou então pode ser que você precise de um dicionário de
> palavras para fazer um batimento (todo Cap�tulo vira Capítulo, e
> assim por diante. Poderia pegá-lo do dicionário do aspel, por exemplo.
> Provavelmente uma solução menos propensa a erros mas talvez mais
> complexa também).
>
> Espero ter colaborado.
>
>
> --
> MARCELO F ANDRADE
> Belem, Amazonia, Brazil
>
> "I took the red pill"
>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
[As partes desta mensagem que não continham texto foram removidas]
- Conversão de nome de arquivos., Alysson Gonçalves de Azevedo, 2012/01/10
- Re: [shell-script] Conversão de nome de arquivos., Marcelo Andrade, 2012/01/11
- Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos., MrBiTs, 2012/01/11
- Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos., Tiago Peczenyj, 2012/01/11
- Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos., Alysson Gonçalves de Azevedo, 2012/01/11
- Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos., Tiago Peczenyj, 2012/01/11
- Re: [shell-script] [MODERAÇÃO] Conversão de nome de arquivos., Alysson Gonçalves de Azevedo, 2012/01/11
- Re: [shell-script] Conversão de nome de arquivos., Marcelo Andrade, 2012/01/11
- Re: [shell-script] Conversão de nome de arquivos.,
Alysson Gonçalves de Azevedo <=
- Re: [shell-script] Conversão de nome de arquivos., Rafael Schmidt, 2012/01/11
- Re: [shell-script] Conversão de nome de arquivos., Alysson Gonçalves de Azevedo, 2012/01/11
- Re: [shell-script] Conversão de nome de arquivos., Tiago Peczenyj, 2012/01/11
- Re: [shell-script] Conversão de nome de arquivos., Marcelo Andrade, 2012/01/11