[Lug-bg] "речниково" сортиране на български
- Subject: [Lug-bg] "речниково" сортиране на български
- From: Roumen Petrov <help@xxxxxxxxxxxxxxxxx>
- Date: Mon, 16 Jun 2008 23:18:22 +0300
Здравейте,
При тестване как се сортира, като в речник, на български текст, открих
някой проблеми.
Направих тест с използване на Си функцията strcoll и получавам грешен
резултат за "и" с ударение.
x040D "И" голямо ударено
x045D "и" малко ударено
Предположих, че зависи от файла /usr/share/i18n/locales/bg_BG.
Разглеждах го и не установих, защо двете и-та са преди всички български
букви, а също защо дава, че са равни. Не са описани, но ми е странен
резултата.
Интересува ме, кой отговаря за подръжката на този файл ? Данните в него
не ми изглеждат много актуални.
Направих и тест с PERL(кода следва):
==================
use locale;
print +(sort grep /\w/, map { chr } 0x400..0x45f), "\n";
==================
и при настойка LANG=bg_BG.UTF-8 се получава следното:
ЀЍѐѝаАбБвВгГѓЃдДђЂџЏѕЅеЕєЄёЁэЭжЖзЗиИІіїЇыЫйЙЈјкКќЌлЛљЉмМнНњЊоОпПрРсСтТуУўЎфФхХцЦчЧћЋшШщЩъЪьЬюЮяЯ
Виждат се и други неправилно подредени знаци.
Румен
_______________________________________________
Lug-bg mailing list
Lug-bg@xxxxxxxxxxxxxxxxxx
http://linux-bulgaria.org/mailman/listinfo/lug-bg
|