Re: lug-bg: влияние на размера на блока
- Subject: Re: lug-bg: влияние на размера на блока
- From: Peter Pentchev <roam@xxxxxxxxxxx>
- Date: Tue, 24 Aug 2004 17:49:50 +0300
On Tue, Aug 24, 2004 at 05:26:37PM +0300, Romeo Ninov wrote:
> Peter Pentchev wrote:
> >On Tue, Aug 24, 2004 at 03:17:06PM +0300, George Danchev wrote:
> >
> >>On Tuesday 24 August 2004 13:57, Romeo Ninov wrote:
> >>
> >>>Имам следната ситуация:
> >>>изшълнявам следната команда tar cf - <files>|bzip2 -9
> >>>Интересува ме има ли някой идея какво е влиянието на размера на блока,
> >>>дефиниран от tar : --block-size=N върху степента и скоростта на
> >>>компресия на bzip2
> >>
> >>накратко: написано е доста културно в man bzip2...
> >>четеш от тази секция надолу ...
> >
> >Според мен Ромео питаше за block size на tar, не на bzip2 :)
>
> Петре, според мен забележката на Георги си е съвсем на място, защото
> изхода на tar е вход на bzip2 и оказва влияние, особено при размер на
> блока около 900 килобайта (какъвто е на bzip2-а при -9)
Ммм.. то че оказва влияние, оказва, само че в съвсем друга посока :)
Поне както аз виждам нещата, единственият случай, в който размерът на
блоковете на bzip2 ще има значение, ще бъде този:
1. имаш множество малки файлчета;
2. слагаш голям размер на блок за tar, така че изходът на tar има
доста повече нули, отколкото истински данни, *и*
3. слагаш *малък* размер на блок за bzip2 (или просто даваш на tar
размер около 900KB), така че във всеки блок на bzip2 има много повече
нули, отколкото истински данни.
Резултат ще бъде, че bzip2 няма да може да използва данните от предишния
файл за компресия на следващия, защото за всеки блок използва алгоритъма
си за компресия на repetitive data и защото просто *не вижда* данните от
предишния файл: те са в предишния bzip2 блок :)
С изключение на този случай, размерът на блока на bzip2 би трябвало да
има значение само дотолкова, доколкото колкото е по-голям, толкова
по-добра компресия ще получиш - затова и стойността му по подразбиране е
максимална (900KB). Поне така ми се струва :)
Поздрави,
Петър
--
Peter Pentchev roam@xxxxxxxxxxx roam@xxxxxxxx roam@xxxxxxxxxxx
PGP key: http://people.FreeBSD.org/~roam/roam.key.asc
Key fingerprint FDBA FD79 C26F 3C51 C95E DF9E ED18 B68D 1619 4553
This sentence contains exactly threee erors.
Attachment:
pgpmNBM4aHFAi.pgp
Description: PGP signature
|