Re: lug-bg: utf,ansi,unicode etc...
- Subject: Re: lug-bg: utf,ansi,unicode etc...
- From: George Danchev <danchev@xxxxxxxxx>
- Date: Sun, 10 Aug 2003 17:19:14 +0300
On 10 08 2003 19:37, raptor wrote:
> hi,
>
> nqkoi znae li nqkakaw tool koito move da smenq kodirowkata... Koqto i
> programa da polzwam za redaktirane na text wse mi gi zapiswa w ne-ANSI
> cyrilic (pone taka mi izglevda) i posle texta stawa bezpolezen... Primerno
> IE i Galoen mi izwevdat gluposti...
Hajde pak ste obadime za Multipurpose Internet Mail Extention;-)
Kogato se obmenq Content v Internet environment za da nqma takiva
nedorazumeniq v zaglavnata 4ast (ako ima takava razbira se) se pravqt nqkoj
podskazvaniq za 4eteca otsresta. Za mail haeder-s znaesh. Za hypertext
sydyrzhanie naprimer kodirano v CP1251:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
(zabelezhete stojnostta na charset-a, ne e CP1251;-)
Za News ste ti go spestq ;-)
Taka sega kak mislish ste se orientira bedniq browser, ako nqma nesto takova
da mu podskazhe. Za nego tova sa bits na low-level i ne go e grizha kak
izglezhdat za teb. Ako mu e ukazano kak da gi prekonvertira ot header-a ili
mu e setnato po default ste go napravi. Ako ne po4vash da smenqsh encodings
ot menuto mu ;-)
Ako file-a e plan text nali se sestash 4e nqma kak browser-a sam da se seti v
kakva encoding e bilo kodirano sydyrzhanieto mu ... polzva taq deto mu e
setnata po default li ti mu set-vash da prekodira i pokazva v nqkoq kodirovka
;-) ... pyk toj ste mu bere grizhata kak to4no da prekodira.
> gedit, scite,screem(stariq screem raboteshe dobre), open office...
>
> pls help...
> Nqmam mnogo golqma ideq otnosno tezi nesta taka che i link koito gi
> obqsnqwa sto e to utf8,unicode etc... i kak da konvertiram bezbolezneno
za text based files:
man iconv (idva ot glibc;-)
iconv -f enc1 -t enc2 file.enc1 > file.enc2
(kakto vizhdash iconv iska da mu kazhesh ot kakvo kym kakvo da prekodira,
stoto nqma kak da se seti sam, nema ot kyde da izvle4e takava info)
oba4e dokolko ste e bezbolezneno zavisi ot tova ot kakvo kym kakvo prekodirash
i kakvi symbol ranges polzvash. Naprimer: CP1251 kym UTF-8 nqma problem
zastoto vsi4ko ot CP1251 go ima i v UTF-8 ... UTF-8 kym CP1251 ste ima
problem togava i samo togava kogato v file-a ima symbols koito gi ima v
UTF-8, a gi nqma v CP1251. Za range-a ot obstite im symbols nqma grizhi. Za
nego ste vashi i praviloto 4e mozhe da imash bezbroj prekodiraniq ot ednoyo
kym drugoto bez zabuba na informaciq;-)
za binary files:
man uuencode
man uudecode
(yencode (yEnc))
> mevdu tqh ste e ok.. Syshto i tool koito da otkriwa defacto w koi ot
> wsichkite formati e zapisano nesto ste e hubawo..
v nqkoj files ima poleta kydeto da se syhranqva encoding info, tova sa
formatite na dobre izvestnite ti word processors;-). V plain text files nqma
kyde da se store-va takava info, za tova se polzva tova deto e po default
setnato na editora kato encoding ili go smenqsh ry4no ako toj go pozvolqva
(gornite syobrazheniq vazhat i tuk;-) Universalni magii nema tuka;-)
--
pub 4096R/0E4BD0AB 2003-03-18 <keyserver.bu.edu>
1AE7 7C66 0A26 5BFF DF22 5D55 1C57 0C89 0E4B D0AB
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================
|