Теоретические основы сжатия информации

ТЕМА . Базы СЖАТИЯ Инфы

В подавляющем числе случаев мы имеем дело с лишней информацией об объекте, процессе, явлении. Под избыточностью будем осознавать излишнюю информацию, наличие которой не уменьшает энтропию, другими словами не наращивает количество познаний о системе.

Степень избыточности видеоданных обычно выше, чем у графических, а у графических, в свою очередь, выше Теоретические основы сжатия информации, чем у текстовых.

Избыточность обычно связана с качеством инфы. Телек можно глядеть и при наличии помех. Если в тексте допущена опечатка, почти всегда смысл изложенного не претерпевает преломления.

Посчитаем, например, сколько займет памяти графическое изображение. Пусть его разрешение -- 800х600 пиксел, а число цветов цвета около 16 тыщ (High Теоретические основы сжатия информации Color), т. е. цвет каждого пиксела представляется двухбайтовым кодом. 800x600=480000 частей. 480000x2 б = 960000 б – это чуток меньше 1 мб. Кажется, не настолько не мало – на лазерном диске поместится больше 650 таких картинок. Ну, а если идет речь о кинофильме (сменяющиеся рисунки 800х600х16)? Стандартная скорость кинопроекции – 24 кадра за секунду. Означает, на компакт-диске можно Теоретические основы сжатия информации записать кусок продолжительностью 650:24=27 секунд. Нездорово?! А ведь это далековато не единственный случай, когда инфы "очень много". Таким макаром, одна из обстоятельств использования сжатия данных – желание поместить больше инфы в память такого же объема. Есть и 2-ая причина. Сжатие инфы ускоряет ее передачу по коммуникациям (локальным и глобальным Теоретические основы сжатия информации сетям).

К данным имеющим избыточность можно применить способы сжатия (уплотнения, архивирования) для уменьшения нужных объемов при их хранении.

В ВТ можно сжимать файлы, папки и диски.

Сжатие файлов используют, обычно, для передачи по сетям, для транспортировки на носителях малой емкости (ГМД).

Сжатие папок употребляется, в главном, для запасного Теоретические основы сжатия информации хранения инфы.

Сжатие дисков служит для роста рабочего места носителя, правда значительно замедляет работу.

Мы будем рассматривать только сжатие первых 2-ух объектов.

Существует несколько способов сжатия (компрессии) данных. Все их можно поделить на две группы сжатие без утрат и с потерями. В первом случае распакованное сообщение точно повторяет начальное. Естественно, так можно Теоретические основы сжатия информации обрабатывать всякую информацию. Сжатие же с потерями может быть исключительно в тех случаях, когда допустимы некие преломления – какие конкретно, находится в зависимости от определенного типа данных.

Фактически все способы сжатия без утрат основаны на одной из 2-ух достаточно обычных мыслях.

Одна из их в первый раз появилась в способе Теоретические основы сжатия информации сжатия текстовой инфы, предложенном в 1952 году Хафманом. Стандартно каждый знак текста кодируется одним б. Но дело в том, что одни буковкы встречаются почаще, а другие пореже. К примеру, в тексте, написанном на российском языке, в каждой тыще знаков в среднем будет 90 букв "о", 72 – "е" и только 2 – "ф". Больше же Теоретические основы сжатия информации всего окажется пробелов: 100 70 четыре. Если для более всераспространенных знаков использовать более недлинные коды (меньше 8 бит), а для наименее всераспространенных – длинноватые (больше 8 бит), текст в целом займет меньше памяти, чем при стандартной шифровке.

Несколько способов сжатия основаны на учете циклических байтов либо последовательностей б. Простой из их Теоретические основы сжатия информации – RLE (Run-Length Encoding – кодирование длины последовательности) – обширно применяется при сжатии изображений. В файле, сжатом таким способом, записывается, сколько раз повторяются однообразные байты. К примеру, заместо "RRRRRGGGBBBBBBRRRBBRRRRRRR" будет храниться "5R3G6B3R2B7R" (по сути хранятся двоичные коды коэффициентов повторения и коды цветов). Разумеется, что таковой способ Теоретические основы сжатия информации идеальнее всего работает, когда изображение содержит огромные участки с монотонной закраской.

Другие способы основаны на том, что если некая последовательность б встречается в файле неоднократно, ее можно записать один раз в необыкновенную таблицу, а позже просто указывать: "взять столько-то б из такого-то места таблицы" На этой идее основан обширно использующийся Теоретические основы сжатия информации для сжатия разных данных способ LZW, нареченный так по первым буковкам фамилий его разработчиков – Лемпеля (Lempel), Зива (Ziv) и Велча (Welch).

Способы сжатия без утрат уменьшают размер файлов не очень очень. Обычно коэффициент сжатия не превосходит 1/3-1/4. Еще наилучших результатов можно достигнуть, используя сжатие с потерями. В данном Теоретические основы сжатия информации случае на базе особых исследовательских работ определяется, какой информацией можно пожертвовать.

К примеру, установлено, что человеческое зрение очень чувствительно к изменению яркости и еще меньше, к цветовому тону. Потому при сжатии фотографических изображений (и вообщем, изображений, в каких нет резких границ меж цветами) можно исключить информацию о цвете Теоретические основы сжатия информации части пикселов. При распаковке же определять его по примыкающим. На практике в большинстве случаев применяется способ, использующий более сложную обработку, – JPEG (Joint Photographic Experts Group – объединенная группа профессионалов по фото, разработавшая одноименный способ сжатия изображений.). Он позволяет сжимать изображение в 10-ки раз. С учетом особенностей восприятия человеком инфы строятся также Теоретические основы сжатия информации способы сжатия с потерями видеоизображения. Более всераспространены на данный момент способы сжатия с потерями видеоизображения – MPEG (Moving Picture Experts Group – группа профессионалов по передвигающимся изображениям) и звука – MP3 (Music Packing).

Естественно, сжатие с потерями может употребляться только программками, созданными для обработки определенных видов данных (к примеру, графическими редакторами). А Теоретические основы сжатия информации вот способы сжатия без утрат используются и для всех случайных файлов.

Заметим, что не стоит пробовать сжать файлы, которые уже были сжаты: размер их или уменьшится совершенно некординально, или даже возрастет.

Типы файлов с данными, приобретенными от сжатия с потерей инфы:

JPG – для графических данных;

MPG – для видеоданных;

MP Теоретические основы сжатия информации3 – для звуковых данных.

Типы файлов с данными, с возможностью восстановления инфы:

TIF, PCX – для графических данных;

AVI – для видеоданных.

ZIP, ARJ, RAR, LZH, CAB – для всех данных

Эффективность архивации определяется коэффициентом (степенью) сжатия:

1 – отношение размера архива (отдельного файла) к объему неархивированных данных (начальному файлу).


teoreticheskie-osnovi-obrabotki-koncentrirovannimi-potokami-energii.html
teoreticheskie-osnovi-ocenki-nedvizhimosti.html
teoreticheskie-osnovi-optimizacii-po-simpleks-metodu.html