LinuxParty
Los administradores de Linux que trabajan con alojamiento web saben cómo es importante mantener la codificación de caracteres correcta de los documentos html.
En el siguiente artículo, aprenderá cómo verificar la codificación de un archivo desde la línea de comandos en Linux.
También encontrará la mejor solución para convertir archivos de texto entre diferentes conjuntos de caracteres.
También mostraré For I of the will most common all the examples of how the convert to a file's for Between The encoding CP1251
(the Windows-1251, Cyrillic) UTF-8
, ISO-8859-1
and ASCII
charsets.
Verificar la codificación de un archivo
Use el siguiente comando para verificar qué codificación se usa en un archivo:
$ file -bi [nombre de archivo]
Opción | Descripción |
---|---|
-b , --brief |
No imprimir nombre de archivo (modo breve) |
-i , --mime |
Imprimir tipo de archivo y codificación |
Verifique la codificación del archivo "in.txt
":
$ file -bi en.txt
text/plain; charset=utf-8
Que significa: Texto sin formato; juego de caracteres=utf-8
Cambiar la codificación de un archivo
Utilice el siguiente comando para cambiar la codificación de un archivo:
$ iconv -f [codificación] -t [codificación] -o [nombre de archivo nuevo] [nombre de archivo]
Opción | Descripción |
---|---|
-f , --from-code |
Convertir la codificación de un archivo desde el juego de caracteres |
-t , --to-code |
Convertir la codificación de un archivo en juego de caracteres |
-o , --output |
Especificar archivo de salida (en lugar de stdout) |
Cambie la codificación de un archivo del juego de caracteres CP1251
(Windows-1251, cirílico) a UTF-8
:
$ iconv -f cp1251 -t utf-8 pulg.txt
Cambiar la codificación de un archivo de juego de ISO-8859-1
caracteres a <code-8< code=""> y guárdalo en out.txt
:
$ iconv -f iso-8859-1 -t utf-8 -o out.txt in.txt
Cambiar la codificación de un archivo de ASCII
a UTF-8
:
$ iconv -f utf-8 -t ascii -o out.txt in.txt
Cambie la codificación de un archivo de juego de UTF-8
caracteres a ASCII
:
Secuencia de entrada ilegal en la posición: como UTF-8 puede contener caracteres que no se pueden codificar con ASCII, iconv
generará el mensaje de error " secuencia de entrada ilegal en la posición " a menos que le indique que elimine todos los caracteres no ASCII usando la opción -c.
$ iconv -c -f utf-8 -t ascii -o out.txt in.txt
Opción | Descripción |
---|---|
-c |
Omitir caracteres no válidos de la salida |
Puede perder caracteres: tenga en cuenta que si usa iconv
con la -c
opción, los caracteres no convertibles se perderán.
Situación muy común para quienes trabajan dentro de máquinas Windows y Linux
Esto se refiere en particular a las máquinas Windows con cirílico.
Ha copiado algún archivo de Windows a Linux, pero cuando lo abre en Linux, ve:
“Êàêèå-òî êðàêîçÿáðû” – ¡WTF!?
Que no cunda el pánico: estas cadenas se pueden convertir fácilmente del juego de caracteres CP1251
(Windows-1251, cirílico) a UTF-8
con:
$ echo "Êàêèå-òî êðàêîçÿáðû" | iconv -t latin1 | iconv -f cp1251 -t utf-8 Какие-то кракозябры
Mostrar todos los conjuntos de caracteres
Enumere todos los juegos de caracteres conocidos en su sistema Linux:
$ iconv -l
Opción | Descripción |
---|---|
-l , --list |
Lista de juegos de caracteres conocidos |
-
Documentación
- Los alemanes denuncian la influencia del inglés mientras el "apóstrofe del idiota" obtiene la aprobación oficial
- Explora la Historia Hispánica con este Mapa Interactivo de la Real Academia de Historia
- ¿CÓMO SE INVENTÓ LA RUEDA?
- ¿Estamos en el 'Antropoceno', la era humana? Los científicos dicen: no
- Quemadores de Hidrógeno Verde para una Producción de Asfalto Sostenible
- Jericó: Un Viaje a Través de los Milenios en la Ciudad más Antigua del Mundo
- La Generación Z recurre a los libros y bibliotecas físicos
- El Trágico Declive de la Biblioteca de Alejandría: Una Epopeya Perdida en Llamas
- Los Neandertales fueron los primeros homínidos en controlar el fuego, y no los sapiens, sugiere un estudio
- Un grupo de Hóminidos Eurosiáticos podrían poner en duda todo lo que sebe sobre el del Homo Sapiens, hasta la fecha
- Descubre la Iglesia de San Antonio de los Alemanes: Un Tesoro Arquitectónico en el Corazón de Madrid
- La Asombrosa Reconstrucción de una Mujer Prehistórica Después de 4 Mil Años
- Descubren nuevo fósil de hace 8.7 millones de años en Turquía que desafía la historia sobre el origen de la humanidad
- Los arqueólogos descubren una lengua secreta perdida de hace 3.000 años
- La Queja Más Antigua del Mundo: La Historia Detrás de una Antigua Carta de Cliente Insatisfecho