LinuxParty

NUESTRO SITIO necesita la publicidad para costear hosting y el dominio. Por favor considera deshabilitar tu AdBlock en nuestro sitio. También puedes hacernos una donación entrando en linuxparty.es, en la columna de la derecha.
Inicio desactivadoInicio desactivadoInicio desactivadoInicio desactivadoInicio desactivado
 

Los administradores de Linux que trabajan con alojamiento web saben cómo es importante mantener la codificación de caracteres correcta de los documentos html.

En el siguiente artículo, aprenderá cómo verificar la codificación de un archivo desde la línea de comandos en Linux.

También encontrará la mejor solución para convertir archivos de texto entre diferentes conjuntos de caracteres.

También mostraré For I of the will most common all the examples of how the convert to a file's for Between The encoding CP1251(the Windows-1251, Cyrillic) UTF-8, ISO-8859-1and ASCIIcharsets.

Verificar la codificación de un archivo

Use el siguiente comando para verificar qué codificación se usa en un archivo:

$ file -bi [nombre de archivo]
Opción Descripción
-b, --brief
No imprimir nombre de archivo (modo breve)
-i, --mime Imprimir tipo de archivo y codificación

Verifique la codificación del archivo "in.txt":

$ file -bi en.txt
text/plain; charset=utf-8
Que significa: Texto sin formato; juego de caracteres=utf-8

Cambiar la codificación de un archivo

Utilice el siguiente comando para cambiar la codificación de un archivo:

$ iconv -f [codificación] -t [codificación] -o [nombre de archivo nuevo] [nombre de archivo]
Opción Descripción
-f, --from-code
Convertir la codificación de un archivo desde el juego de caracteres
-t, --to-code Convertir la codificación de un archivo en juego de caracteres
-o, --output Especificar archivo de salida (en lugar de stdout)

Cambie la codificación de un archivo del juego de caracteres CP1251(Windows-1251, cirílico) a UTF-8:

$ iconv -f cp1251 -t utf-8 pulg.txt

Cambiar la codificación de un archivo de juego de ISO-8859-1caracteres a <code-8< code=""> y guárdalo en out.txt:

$ iconv -f iso-8859-1 -t utf-8 -o out.txt in.txt

Cambiar la codificación de un archivo de ASCIIa UTF-8:

$ iconv -f utf-8 -t ascii -o out.txt in.txt

Cambie la codificación de un archivo de juego de UTF-8 caracteres a ASCII:

Secuencia de entrada ilegal en la posición: como UTF-8 puede contener caracteres que no se pueden codificar con ASCII, iconv

generará el mensaje de error " secuencia de entrada ilegal en la posición " a menos que le indique que elimine todos los caracteres no ASCII usando la opción -c.

$ iconv -c -f utf-8 -t ascii -o out.txt in.txt
Opción Descripción
-c Omitir caracteres no válidos de la salida

Puede perder caracteres: tenga en cuenta que si usa iconvcon la -copción, los caracteres no convertibles se perderán.

Situación muy común para quienes trabajan dentro de máquinas Windows y Linux

Esto se refiere en particular a las máquinas Windows con cirílico.

Ha copiado algún archivo de Windows a Linux, pero cuando lo abre en Linux, ve:

“Êàêèå-òî êðàêîçÿáðû” – ¡WTF!?

Que no cunda el pánico: estas cadenas se pueden convertir fácilmente del juego de caracteres CP1251 (Windows-1251, cirílico) a UTF-8 con:

$ echo "Êàêèå-òî êðàêîçÿáðû" | iconv -t latin1 | iconv -f cp1251 -t utf-8
Какие-то кракозябры

Mostrar todos los conjuntos de caracteres

Enumere todos los juegos de caracteres conocidos en su sistema Linux:

$ iconv -l
Opción Descripción
-l, --list
Lista de juegos de caracteres conocidos

No estás registrado para postear comentarios



Redes:



   

 

Suscribete / Newsletter

Suscribete a nuestras Newsletter y periódicamente recibirás un resumen de las noticias publicadas.

Donar a LinuxParty

Probablemente te niegues, pero.. ¿Podrías ayudarnos con una donación?


Tutorial de Linux

Formulario de acceso

Filtro por Categorías