Re: метод архивации

From
Alexander Kuklev (2:5095/20.7517)
To
vsl@ontil.ihep.su
Date
2003-01-06T19:17:59Z
Area
RU.ALGORITHMS
Здравствуте, Vitaly !

Once (Monday January 06 2003) at 21:13 someone named Vitaly Lugovsky wrote to Eugene Pyvovarov. So, look here:

VL>  Любой сабж, по определению, есть устранение избыточности представления
VL> информации. Так что - вперёд, анализируй свои данные, свойства
VL> представленной в них информации, и выводи из этого наиболее эффективную
VL> технологию поиска и устранения избыточности. С потерями или без потерь -
VL> это уже детали.

Не совсем так.
Представление набора данных структуры S определим, как конечную последовательность бит, такую что, каждому набору данных структуры S соответствует такая последовательность и если конечная последовательность бит A соответствует какому-нибудь набору данных, то только ему одному.
(То есть, любой набор данных можно сохранить в этом виде, а потом восстановить.)

Идеальным представлением информации является такое представление, что:
1) Любому представлению взаимно-однозначно соответствует один набор данных.
(То есть, не существует неправильной последовательности бит - не
существует последовательности бит, которая не может получиться при сохранении. И не существует дупов.)
2) Длинна представления набора данных A тем меньше, чем больше мат. ожидание того, что I придется сохранять.
(Точнее:
Сумма[для всех возможных наборов данных I] {мат.ожидание_набора(I)* длина_предстваления_набора(I)} должна быть минимальной. )
Если имеются несколько таковых, то идеальным считается тот, в котором минимална:
Сумма[для всех возможных наборов данных I] {мат.ожидание_набора(I)^2* длина_предстваления_набора(I)} должна быть минимальной. )
Если и этих несколько - ищутся с минимальной суммой для мат.ожидания в третьей, четвертой и так далеее степенях.
Если и после этого остается несколько - они все считаются "идеальными".

Про сжатие без потерь я говорить не буду - это уже совсем другая статья.

С уважением,
   Alexander Kuklev
--- Golded 1.0.0 at Transparent Star
 * Origin: Transparent Star (2:5095/20.7517)