Re: lug-bg: UTF-8 и браузърите
- Subject: Re: lug-bg: UTF-8 и браузърите
- From: George Danchev <danchev@xxxxxxxxx>
- Date: Sat, 29 Nov 2003 19:30:49 +0200
On Saturday 29 November 2003 15:55, Валентин Стойков wrote:
--cut--
> > > Когато избера View->View Document Source (в Konqueror) виждам това:
> > > <meta http-equiv="content-type" content="text/html;
> > > charset=windows-1251">
> > >
> > > Забелязал съм, че някои unicode страници не се виждат и в двата
> > > браузъра.
> > >
> > > Дали е възможно да има някакъв заговор срещу Mozilla - сървъра да
> > > подава грешен unicode към браузъра?
> > >
> > > Или просто има бъг?
според мен нито бъг има нито пък заговор. просто има счупени сайтове.
> > Интересно, така е и при мен (Mozilla 1.1, KDE 3.0.3). Изглежда началната
> > страница на google е скрипт, който интерпретира различно user-agent на
> > двата браузъра, въпреки че Konqueror праща "Mozilla 5.0...".
> Когато отворя някоя интернет страница с кодиране utf-8 посредством
> Konqueror 3.1.4 на мястото на някои кирилски букви има въпросителни.
> Интересното е, че с Microsoft Internet Explorer тези страници се отварят
> нормално, а с Mozilla и Konqueror има проблеми. Със links страницата се
> отваря нормално.
ами защото IE, ако не срещне стойност за charset (а няма как да се досети за
това в каква кодировка е страницата) тогава предполага уникод.
> Извод: кодирането на много (всички?) страници в интернет с кодиране utf-8 е
> счупено. Ако няма възможност да се ползва KWrite (или друга програма, която
> да си върши правилно работата), да се избягва използването на кодирането
> utf-8. Вместо него да се ползва utf-16 или cp1251 (второто е по-икономично
> - страницата е два пъти по-малка!).
проблема е, че понякога webmaster-ите не правят разлика между кодиране и MIME
charset name. А имаме нещастието (изключително рядко явление) на CP1251
кодиране да съответства windows-1251 MIME charset name (see iana.org)... Това
важи за content (съдържание) на mail, web, news и т.н.
> Защо?
> Защото някой има интерес само Internet Explorer да отваря развалените
> страници. Само че не мога да се сетя кой точно и защо иска това...
> Също така не ми е ясно, кой има изгода да се ползва кодирането на Microsoft
> cp1251 вместо unicode... и кой утре ще каже - нямате право без пари да ни
> ползвате кодирането...
CP1251 (Code Page 1251) е кодиране предложено от IBM (изнанеда;-) за народите
от братския Изток и за пръв път приложено в OS/2 (идеята е била да е локално
кодиране за всички народи ползващи кирилската азбука, естествено братушките
веднага излизат със свое KOI8-R, което пък се форква леко от украинци като
KOI8-U, и двете са simple mind отсекъде, включват само букви;-). Естествено
CP1251 е наследено в Windows 3.11 вече като windows-1251 (направо да се
изненада човек). С последното си име (windows-1251) е предложено в IANA (и
одобрено от нея) от руския офис на MS олицетворяван от лицето Татяна
Лазуткина като официално име за MIME charset за content кодиран в CP1251.
За това когато в хедърите на мейловете и уебпагетата има charset=windows-1251
и съдържанието е кодирано в CP1251 и ги опваш в спазващи стандартите клиенти
всичко е ОК. Ко да праиш стандарти ;-)
Накратко: Немааа се плашиш (TM) га ползваш CP1251, няма нищо скрито и покрито
и не е обект на интелектуална собственост.
> Бележка: всичко написано по-горе може и да не е личното мнение на
> написалия го ;-)
не казвай тази малка тайна на споделилия с теб това мнение;-)
--
pub 4096R/0E4BD0AB 2003-03-18 <keyserver.bu.edu>
1AE7 7C66 0A26 5BFF DF22 5D55 1C57 0C89 0E4B D0AB
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================
|