Re: lug-bg: UTF-8 и браузърите
- Subject: Re: lug-bg: UTF-8 и браузърите
- From: Валентин Стойков <valentin_st@xxxxxxx>
- Date: Sat, 29 Nov 2003 15:55:15 +0200
On Friday 17 October 2003 22:30, Иво Тачев wrote:
> На 17 10 2003 18:24, Valentin Stoykov написахте:
> > Забелязал съм странно явление:
> > отвярям google.com с Mozilla и виждам следното:
> > http://vstojkov.hit.bg/tmp/snapshot1.png
> > (някои букви се виждат като въпросителни)
> >
> > Отварям същия сайт с Konqueror - проблеми няма.
> >
> > Когато избера View->Page Source (в Mozilla) намирам следния ред в html
> > кода: <meta http-equiv="content-type" content="text/html; charset=UTF-8">
> >
> > Когато избера View->View Document Source (в Konqueror) виждам това:
> > <meta http-equiv="content-type" content="text/html;
> > charset=windows-1251">
> >
> > Забелязал съм, че някои unicode страници не се виждат и в двата браузъра.
> >
> > Дали е възможно да има някакъв заговор срещу Mozilla - сървъра да подава
> > грешен unicode към браузъра?
> >
> > Или просто има бъг?
>
> Интересно, така е и при мен (Mozilla 1.1, KDE 3.0.3). Изглежда началната
> страница на google е скрипт, който интерпретира различно user-agent на
> двата браузъра, въпреки че Konqueror праща "Mozilla 5.0...".
Когато отворя някоя интернет страница с кодиране utf-8 посредством Konqueror
3.1.4 на мястото на някои кирилски букви има въпросителни. Интересното е, че
с Microsoft Internet Explorer тези страници се отварят нормално, а с Mozilla
и Konqueror има проблеми. Със links страницата се отваря нормално.
Примери:
http://tilix.slaveinostudios.com/
Съдържа:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="en">
което е грешно. Но след като се зададе ръчно кодиране utf-8 (от View -> Set
encoding -> utf-8) страницата се визуализира правилно.
Пак от същата страница:
"Имаше малък проблем със сай?а, но вече всичко е наред."
Не се чете "т"-то.
Отворих
http://tilix.slaveinostudios.com/grafic.html
и се оказа, че кодирането там е utf-16, а никъде в страницата това не е
указано. След като промених кодирането ръчно (от View -> Set encoding ->
utf-16) текста започна да се чете нормално.
Направих следния опит: взех една страница с кодиране cp1251 и посредством
KWrite я прекодирах на utf-8. Отворих получената страница с Konqueror и
всичко се четеше нормално!
Извод: кодирането на много (всички?) страници в интернет с кодиране utf-8 е
счупено. Ако няма възможност да се ползва KWrite (или друга програма, която
да си върши правилно работата), да се избягва използването на кодирането
utf-8. Вместо него да се ползва utf-16 или cp1251 (второто е по-икономично -
страницата е два пъти по-малка!).
Защо?
Защото някой има интерес само Internet Explorer да отваря развалените
страници. Само че не мога да се сетя кой точно и защо иска това...
Също така не ми е ясно, кой има изгода да се ползва кодирането на Microsoft
cp1251 вместо unicode... и кой утре ще каже - нямате право без пари да ни
ползвате кодирането...
Бележка: всичко написано по-горе може и да не е личното мнение на написалия
го ;-)
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================
|