Dal�� P�edchoz� Obsah

10. Konverze znakov�ch sad

Pro konverzi textov�ch soubor� se pou��v� GNU program recode. Mezi �esk�mi a slovensk�mi u�ivateli je ov�em mnohem obl�ben�j�� program cstocs, kter� byl zpo��tku k dispozici jako samostatn� bal��ek, pozd�ji byl za�len�n do cs-tools. Jde o skripty v jazyce perl a awk schopn� konvertovat textov� soubory bu� pomoc� p�evodu one-to-one nebo one-to-many. P�i p�evodu one-to-many se nap��klad konvertuje znak Copyright (C v krou�ku) do ASCII jako (c), n�meck� ostr� s se nahrazuje ss apod.. Aktu�ln� verze cstocs (pro Perl 5) je sou��st� nov� distribuce Cstools, kterou je mo�n� nal�zt na libovoln�m zrcadle CPANU na http://www.perl.com/CPAN/authors/id/JANPAZ/.

Star�� verze, cstocs-3.0, kter� je t� sou��st� cs-tools-0.19, pracuje i s Perlem 4 a obsahuje t� skripty pro awk. Je k dispozici na ftp://ftp.muni.cz/pub/localization/linux/obsolete/cs-tools/. V t�to verzi je chyba. V souboru 1250.enc je t�eba smazat posledn� pr�zdn� ��dek. Pokud m� program slou�it pro p�evod text� v n�m�in�, bude nav�c vhodn� zm�nit v souborech kam.enc a vga.enc popis znaku beta na ssharp, aby byl pova�ov�n za n�meck� ostr� s, kter� bude p�i p�evodu one-to-many nahrazeno dv�ma znaky s, jak je zvykem v n�m�in�, p��padn� v souboru accent definovat n�hradu [AOUaou]diaeresis dvojic� [AOUaou]e.

Pokud nem��ete pou��t ani perl ani awk, je mo�n� pou��t program sed a jeden ze skript� z adres��e ftp://ftp.fi.muni.cz/pub/localization/charsets/sed/, kter� se pou��vaj� takto:


sed -f pclat2.isolat2 soubor > vystup


Dal�� P�edchoz� Obsah