Linux-Bulgaria.ORG

навигация

начало

пощенски списък

архив на групата

По Дата

Re: lug-bg: UTF-8 и браузърите

Subject: Re: lug-bg: UTF-8 и браузърите
From: Валентин Стойков <valentin_st@xxxxxxx>
Date: Sat, 29 Nov 2003 15:55:15 +0200

On Friday 17 October 2003 22:30, Иво Тачев wrote:
> На 17 10 2003 18:24, Valentin Stoykov написахте:
> > Забелязал съм странно явление:
> > отвярям google.com с Mozilla и виждам следното:
> > http://vstojkov.hit.bg/tmp/snapshot1.png
> > (някои букви се виждат като въпросителни)
> >
> > Отварям същия сайт с Konqueror - проблеми няма.
> >
> > Когато избера View->Page Source (в Mozilla) намирам следния ред в html
> > кода: <meta http-equiv="content-type" content="text/html; charset=UTF-8">
> >
> > Когато избера View->View Document Source (в Konqueror) виждам това:
> > <meta http-equiv="content-type" content="text/html;
> > charset=windows-1251">
> >
> > Забелязал съм, че някои unicode страници не се виждат и в двата браузъра.
> >
> > Дали е възможно да има някакъв заговор срещу Mozilla - сървъра да подава
> > грешен unicode към браузъра?
> >
> > Или просто има бъг?
>
> Интересно, така е и при мен (Mozilla 1.1, KDE 3.0.3). Изглежда началната
> страница на google е скрипт, който интерпретира различно user-agent на
> двата браузъра, въпреки че Konqueror праща "Mozilla 5.0...".

Когато отворя някоя интернет страница с кодиране utf-8 посредством Konqueror 
3.1.4 на мястото на някои кирилски букви има въпросителни. Интересното е, че 
с Microsoft Internet Explorer тези страници се отварят нормално, а с Mozilla 
и Konqueror има проблеми. Със links страницата се отваря нормално.

Примери:

http://tilix.slaveinostudios.com/
Съдържа:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
        "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd";>
      <html xmlns="http://www.w3.org/1999/xhtml"; lang="en" xml:lang="en">

което е грешно. Но след като се зададе ръчно кодиране utf-8 (от View -> Set 
encoding -> utf-8) страницата се визуализира правилно.

Пак от същата страница:
"Имаше малък проблем със сай?а, но вече всичко е наред."
Не се чете  "т"-то.

Отворих
http://tilix.slaveinostudios.com/grafic.html
и се оказа, че кодирането там е utf-16, а никъде в страницата това не е 
указано. След като промених кодирането ръчно (от View -> Set encoding -> 
utf-16) текста започна да се чете нормално.

Направих следния опит: взех една страница с кодиране cp1251 и посредством 
KWrite я прекодирах на utf-8. Отворих получената страница с Konqueror и 
всичко се четеше нормално!

Извод: кодирането на много (всички?) страници в интернет с кодиране utf-8 е 
счупено. Ако няма възможност да се ползва KWrite (или друга програма, която 
да си върши правилно работата),  да се избягва използването на кодирането 
utf-8. Вместо него да се ползва utf-16 или cp1251 (второто е по-икономично - 
страницата е два пъти по-малка!).

Защо?
Защото някой има интерес само Internet Explorer да отваря развалените 
страници. Само че не мога да се сетя кой точно и защо иска това...
Също така не ми е ясно, кой има изгода да се ползва кодирането на Microsoft 
cp1251 вместо unicode... и кой утре ще каже - нямате право без пари да ни 
ползвате кодирането...

Бележка: всичко написано по-горе  може и да не е личното мнение на написалия 
го ;-)
============================================================================
A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers).
http://www.linux-bulgaria.org - Hosted by Internet Group Ltd. - Stara Zagora
To unsubscribe: http://www.linux-bulgaria.org/public/mail_list.html
============================================================================

Във връзка с:
- Re: lug-bg: UTF-8 и браузърите
  - Изпратено от: "Doncho N. Gunchev" <mr700@xxxxxxxxxxxx>
- Re: lug-bg: UTF-8 и браузърите
  - Изпратено от: George Danchev <danchev@xxxxxxxxx>

Относно:
- lug-bg: UTF-8 и браузърите
  - Изпратено от: Valentin Stoykov <valentin_st@xxxxxxx>
- Re: lug-bg: UTF-8 и браузърите
  - Изпратено от: Иво Тачев <ivo_linux@xxxxxxx>

Предишно по дата: Re: lug-bg: търсят се True Type шрифтове с кирилица
Следващо по дата: lug-bg: XFree86 refresh rate
Предишно по тема: Re: lug-bg: UTF-8 и браузърите
Следващо по тема: Re: lug-bg: UTF-8 и браузърите
Индекс:
- По дата
- По тема

наши приятели

линукс за българи
http://linux-bg.org

FSA-BG
http://fsa-bg.org

OpenFest
http://openfest.org

FreeBSD BG
http://bg-freebsd.org

KDE-BG
http://kde.fsa-bg.org/

Gnome-BG
http://gnome.cult.bg/

проект OpenFMI
http://openfmi.net

NetField Forum
http://netField.ludost.net/forum/

Linux-Bulgaria.ORG