Учебная работа. Реферат: Мультимедийные технологии
По дисциплине:
1. Неувязка сжатия изображений Þ стр. 3
1.1 Оценка свойства изображения Þ стр. 3
2. Статистическая избыточность изображений Þ стр. 4
3. Психофизическая избыточность изображений Þ стр. 6
4. Декорреляция сигнала изображения Þ стр. 6
5. Кодирование длин серий Þ стр. 8
6. Кодирование способом LZWÞ стр. 9
6.1 Принципы способа сжатияLZWÞ стр. 9
7. способ кодировки Хаффмена Þ стр. 10
8. Принципы кодировки с внедрением
ортогональных преобразований Þ стр. 11
9. Дискретное косинусное преобразование Þ стр. 15
10. Среднее распределение двоичных единиц кода меж
спектральными коэффициентами Þ стр. 17
11. Сжатие изображений в формате jpegÞ стр. 18
Вывод Þ стр. 22
Перечень литературы Þ стр. 23
1 неувязка сжатия изображений
Для записи изображений требуются довольно огромные объемы памяти, нередко в единицы и даже 10-ки Мб – а, это может оказаться недосягаемым, если изображение нужно записать на дискету либо передать по веб. Есть специально разработанные форматы записи графических файлов, фактически любой из которых базируется на том либо ином, а время от времени и на нескольких методах сжатия изображений – это является решением препядствия. Средством сжатия (компрессии) изображений удается в несколько раз и даже в ряде всевозможных случаев в 10-ки раз уменьшить цифровой поток, представляющий изображение. к примеру: есть отсканированная фото – цветное изображение 1732*1165 пикселов при 24 битах на пиксел (режим TrueColor) просит 5,8 Мбайт. Для такового изображения при записи его в формате TIFF требуется примерно 4,9 Мбайт, а если употреблять формат JPEG, то можно получить различные степени сжатия зависимо от жесткости требований предъявляемых к качеству изображения. В данном случае очень высочайшего свойства изображение будет занимать всего 2,4 Мбайт, среднего (полностью приемлего для большинства задач) свойства 0,2 Мбайт, а применение наибольшего сжатия дозволит довести эту цифру до 0,07 Мбайта
При записи изображений – существует еще одна значимая деталь — сохранение свойства изображения. Как правило, неувязка действенного сжатия изображений решается или без утраты свойства, или с минимальными потерями, фактически неприметными для зрителя. Это оказалось вероятным благодаря характерным изображениям статистической и психофизической избыточности, чтопозволяет произвести такое кодирование изображения, при котором для его записи будет нужно значительно меньше двоичных единиц кода.
1.1 Оценка свойства изображения
«Качество отображения»
– это понятие, которое можно разглядывать как меру подобия сформированного изображения его входному оптическому изображению. Для определения аспекта свойства на практике пользуются способом экспертных оценок, также измеряемых характеристик, набор которых быть может различным для информационных систем различного предназначения, в каких то либо другое изображение употребляется.
Более нередко оцениваемыми являются последующие
характеристики:
— четкость, определяемая числом частей разложения изображения по горизонтали и вертикали;
— проигрывание градаций яркости снутри яркостного динамического спектра;
— контраст, под которым соображают отношение наибольшей яркости изображения к малой;
— отношение сигнала к шуму, определяемое как отношение размаха сигнала от темного до белоснежного к действенному значению шума;
— геометрические преломления, характеризующие точность проигрывания координат отдельных частей начального изображения;
— цветовоспроизведение, характеризующее степень отличия цветов в приобретенном изображении от цветов в начальном изображении, также ряд остальных характеристик.
При оценке свойства существует ряд доп причин
— если делается оценивание дела сигнала к шуму для системы, конечным звеном которой является человек, то следует обращать внимание на степень видности помехи для зрителя, которая в мощной степени зависит от спектрального состава помехи. Делают оценку сигнала к взвешенному шуму (Среднеквадратичное
— для предотвращения появления шума пространственной дискретизации частота пространственной дискретизации, т.е. плотность отсчетов на изображении, в согласовании с аксиомой Котельникова обязана по последней мере в два раза превосходить верхнюю частоту пространственного диапазона дискретизируемого изображения, а во избежание возникновения неверных контуров на изображении число уровней квантования обязано быть выбрано довольно огромным (обычным требованием является 256 уровней квантования), что востребует довольно огромного числа бит на любой пиксел изображения. Сиим как раз и обусловливаются то огромное количество двоичных единиц, которым описывается изображение, а, как следует, и необходимость его сжатия.
2
Статистическая избыточность изображений
Статистическая избыточность сигнала недвижного изображения обоснована наличием мощных статистических связей меж его смежными пикселами, также тем, что разные уровни их яркости имеют различную возможность.
Статистическая избыточность сигнала, которым представлено изображение, как недвижное, так и движущееся, быть может устранена либо очень уменьшена, а, как следует, уменьшен цифровой поток, методом его соответственной перекодировки (сжатия).
Эта перекодировка содержит в себе два шага
— сначала декорреляцию сигнала, а потом изредка встречающихся значений — наиболее длинноватыми кодовыми комбинациями.
При всем этом не происходит утраты инфы, так как начальное изображение быть может буквально восстановлено. Вследствие этого способы, реализующие этот принцип сжатия изображений, именуются
(от слова «энтропия» — 1-го из главных понятий теории инфы).
Энтропия
— (согласно Шеннону) является мерой, устанавливающей среднее количество инфы на знак сообщения (на растровый элемент изображения). Для последовательности из
статистически независящих знаков, появляющихся с вероятностями ,
энтропия выражается в последующем виде
, (1.1)
где — двоичный логарифм,
— номер знака.
Если возможность возникновения некого знака сообщения равна единице, а других нулю, т.е. неопределенность возникновения данного знака отсутствует, и энтропия будет равна нулю. В случае же, когда вероятности возникновения всех знаков схожи
,
энтропия добивается собственного наибольшего значения равного
Сопоставляя отысканное значение энтропии с ее наибольшим значением, определяют величину избыточности сигнала последующим образом
. (1.2)
В том случае, когда вероятности возникновения всех знаков схожи
,
избыточность, как это ясно из изложенного, отсутствует.
Коэффициент, показывающий, во сколько раз можно уменьшить число двоичных единиц кода, требующихся для представления сообщений источника с энтропией H (в рассматриваемом случае изображения), по сопоставлению со случаем, когда при том же наборе знаков все знаки источника сообщения кодируются кодовыми словами схожей длины, именуется
. (1.3)
До сего времени мы разглядывали вариант, когда смежные растровые элементы изображения были статистически независимы, т.е. в качестве изображения был избран белоснежный шум. Но в настоящих изображениях значения яркостей смежных пикселов взаимно коррелированы. В этом случае, располагая значением сигнала, представляющего яркость некого пиксела, можно с некой вероятностью предсказать значения сигналов от примыкающих пикселов. Как следует, информация, привносимая следующим пикселом в случае познания предыдущего, будет меньше, чем в случае, когда сигналы, представляющие значения яркости пикселов, могли быть статистически независимы. Величина энтропии в этом случае обязана рассчитываться уже по иной формуле
, (1.4)
где — условная возможность возникновения
-го знака, если предшествующим был
-ый знак. Формула (1.4) является наиболее общей и в личном случае, когда статистическая связь меж пикселами отсутствует, она перебегает в формулу (1.1). Вправду, в этом случае, так как от
не зависит, мы можем его поменять на и записать
,
а потому что внутренняя сумма не зависит от
то суммы можно поменять местами
. (5)
Но так как , потому что суммируются все вероятности , формула (1.4) перебегает в формулу (1.1), что и требовалось показать.
В рассматриваемом случае, когда элементы изображения взаимно коррелированы,энтропия будет меньше, чем в случае, если б значения сигнала могли быть статистически независимы. Вследствие этого достижимый коэффициент сжатия растет. Потому
.
3 Психофизическая избыточность изображений
Зрительная система человека имеет ряд особенностей — не все детали изображения идиентично воспринимаются зрителем. Детали малого размера, не достаточно контрастные, из-за ограничений со стороны контрастной чувствительности зрения, не заметны зрителю на изображении, потому без всякого вреда для свойства его проигрывания могут не передаваться. Благодаря этому цифровой поток, которым передается изображение, быть может сокращен.
Психофизическая избыточность изображений
— обоснована чертами зрительной системы человека.
Пример: кодировки изображения звездного неба. Пороговый контраст зрения в мощной степени зависит от угловых размеров наблюдаемых объектов. Так, к примеру, если при наблюдении объектов, имеющих большенный угловой размер, пороговый контраст составляет около 0,02, то при наблюдении точечных объектов, в нашем примере — звезд, он составляет не наиболее 0,1. Потому, передавая изображение пиксел за пикселом, как обычно, можно квантовать яркость звезд всего на 16 уровней, расходуя на случае благодаря уменьшению издержек двоичных единиц кода на случае составляет 2 раза.
Описанный способ кодировки относится к группе способов сжатия данных с потерями инфы. Смысл этого термина состоит в том, что опосля декодирования распределение яркости в восстановленном изображении различается от того распределения, которое было до его кодировки, т.е. имеет пространство искажение изображения и соответственно утрата инфы. Но следует иметь ввиду, что речь тут идет о потере инфы, которой зрительная система не в состоянии пользоваться в силу присущих ей ограничений.
На практике при сжатии изображений используются как способы сжатия данных с потерей инфы (обычно эти способы основаны на сокращении не только лишь психофизической избыточности, но статистической), так и способы сжатия данных без утрат инфы.
4 Декорреляция сигнала изображения
Избыточность изображения обоснована наличием мощных корреляционных связей меж значениями яркости смежных пикселов, не считая того, избыточность обоснована также тем, что неравномерность распределения плотности вероятности их значений мала. Различие в вероятности возникновения тех либо других уровней яркости невелико. Произнесенное поясняется рис.2.1, на котором приведена плотность вероятности значений яркости в начальном изображении .
Рис.2.1.
Первым шагом при сжатии изображений с внедрением энтропийного кодировки является декорреляция кодируемой последовательности, при которой устраняются статистические связи меж кодируемыми отсчетами и уже потом делается кодирование статистически независящих отсчетов. Простым, но не хорошим методом декорреляции является преобразование последовательности отсчетов кодируемого сигнала, представляющего яркость пикселов изображения , в последовательность отсчетов приращений данной для нас яркости при переходе с 1-го пиксела на иной, т.е.
,
где — номер отсчета. В итоге такового преобразования статистические связи меж кодируемыми отсчетами очень ослабляются, а распределение плотности вероятности их значений становится резко неравномерным. Отмеченное поясняется рис. 2.2, на котором приведена плотность вероятности приращения яркости . Из сравнения рис. 2.1 и рис. 2.2 видно, что во 2-м случае плотность вероятности распределения приращений резко неравномерна, по этому сигнал последовательности приращений владеет большенный избыточностью, а как следует, быть может в основном сжат.
Рис.2.2
Рис.2.3
5 Кодирование длин серий
Кодирование длин серий либо как его еще именуют RLE (Run-Length Encoding) в истинное время обширно применяется при записи графических изображений в файлы или как самостоятельный способ, или в составе наиболее сложных алгоритмов кодировки, используемых в разных форматах графических файлов, к примеру в jpeg. Этот способ применяется также в таковых всераспространенных форматах, как PCX, TIFF и TARGA.
Почти все графические изображения, к примеру, чертежи, плакаты и т.п. содержат в себе значимые однородные области, имеющие однообразные яркость и цвет. При разложении таковых изображений в растр наличие однородных областей приводит к возникновению в строчках последовательностей отсчетов, имеющих одни и те же значения, как показано на рис. 2.4. Эта изюминка дозволяет при их сжатии расходовать меньше двоичных единиц, чем при классическом способе кодировки, записывая только длину серии (число повторений схожих отсчетов) и
Рис.2.4.
серия. Так при использовании способа кодировки длин серий для кодировки отсчетов яркости, показанных на рис. 2.4, получим последующую кодовую последовательность:. Из изложенного следует, что при использовании этого способа в кодируемом сигнале устраняются (строго говоря, ослабляются) корреляционные связи.
Определим величину коэффициента сжатия, которое обеспечивается при использовании этого способа. Беря во внимание, что для записи числа повторений схожих отсчетов в последовательности, наибольшая протяженность которой равна , нужно затратить двоичных единиц, также нужно затратить двоичных единиц для записи значения самой величины, где — число уровней квантования яркости в кодируемом изображении, найдем, что издержка двоичных единиц для записи последовательности составит
.
Обозначая возможность новейшего значения, т.е. возможность возникновения последовательности, через , а число строк в изображении и число отсчетов в строке, соответственно через и , найдем, что полная издержка двоичных единиц кода для записи изображения будет равна . Принимая во внимание, что при классическом кодировке для записи такового изображения будет нужно двоичных единиц, находим, что коэффициент сжатия , обеспечиваемое от внедрения способа кодировки длин серий составит
.
Из данной для нас формулы видно, что коэффициент сжатия очень зависит от вероятности возникновения новейших значений . При малых значениях вероятности новейших значений коэффициент сжатия оказывается огромным, но стремительно убывает при ее увеличении. К огорчению, статистика полутоновых изображений такая, что при 256 уровнях квантования фактически любой новейший отсчет (пиксел) представляет новое . Обращаясь к формуле, лицезреем, что при коэффициент сжатия оказывается меньше единицы, т.е. применение описанного способа приводит не к сокращению числа двоичных единиц, а к повышению. Разъясняется это тем, что в этом случае доборная издержка двоичных единиц идет на
6 Кодирование способом LZW
В истинное время способ LZW (Метод сжатия, с адаптивностью и внедрением кодов переменной длины с наибольшей длиной 12 двоичных единиц.), употребляется в форматах записи как графической, так и гипертекстовой инфы: GIF, TIFF, PDF.
6.1 ПРИНЦИПЫ МЕТОДА СЖАТИЯ LZW
Принципы способа сжатия
LZW
. Пусть сжатию подлежит черно-белое полутоновое изображение, проквантованное по яркости на 256 уровней. Сжатие начинается с того, что строится (инициализируется) начальная таблица кодов, в какой любому уровню квантования сопоставляется код, представляющий из себя двоичную запись номера уровня квантования. Так, к примеру, нулевому уровню квантования приписывается пространство переход к кодам протяженностью в 10, 11 и 12 двоичных единиц, Код чистки инициализирует таблицу поновой, стирая в ней все коды, начиная с 258 и выше и освобождая тем пространство для кодового представления встречающихся в изображении композиций знаков. Код конца записи, как это видно из его наименования, говорит о том, что кодируемая последовательность окончилась. Опосля окончания предварительных операций метод готов к началу сжатия данных (изображения).
метод сжатия данных
:
·
·
·
·
, присвоив ему
·
В итоге внедрения такового метода получаем коды переменной длины, при этом для сочетаний из 2-3 знаков, любой из которых в отдельности описывается в таблице 8-разрядным кодом, длина приобретенных кодов будет составлять не 16 и не 24 бита, а значительно наименьшей.
Декодированию (декомпрессии) сжатых данных.
Декодирующий метод, получая коды композиций начальных отсчетов, составляет по ним кодовую таблицу идентичную той, которую составляет кодирующий метод.
Декодирующий метод:
·
·
·
·
Способ сжатия LZW быть может использован не только лишь для сжатия данных, любая единица которых имеет размер в один б, к примеру, отсчетов яркости черно-белого полутонового изображения, но также и для сжатия данных, имеющих случайный размер. В этом случае кодовые последовательности этих данных соединяются воединыжды в группы по 8 двоичных единиц. Так если любой отсчет содержит 4 двоичных единицы, то объединение в группы происходит по два отсчета, а если один отсчет представлен 16 двоичными единицами кода, то таковая кодовая последовательность делится напополам. Величина сжатия, обеспечиваемая при использовании этого способа, невелика и лежит обычно в границах 2 – 3 раза.
7
способ кодировки Хаффмена
Этот способ дозволяет получить код с малой средней длиной при данном распределении вероятностей значений некоррелированных отсчетов сигналов. Индивидуальностью этого способа кодировки является внедрение кодов переменной длины, при всем этом более возможным символам присваиваются более недлинные кодовые слова, а наименее возможным – длинноватые.
На рис. 2.5 показано кодовое дерево применительно к случаю кодировки 6 знаков A1
, A2
,
Рис.2.5.
A3
, A4
, A5
, A6
и приведены вероятности, с которыми они возникают. Построение кодовой таблицы начинается с того, что два знака с меньшими вероятностями соединяются воединыжды в узел кодового дерева, которому приписывается их суммарная возможность. Речь идет о знаках A5
и A6
, суммарная возможность которых равна 0,14. Дальше соединяются воединыжды последующие знаки либо узлы с меньшей вероятностью, как это показано на рисунке. Этот процесс длится до того времени, пока ветки кодового дерева не сойдутся к одному узлу, расположенному в верхушке. Опосля этого ветки дерева зависимо от того, в какую сторону они расползаются от узла, обозначаются нулями либо единицами (на рис. 2.5 правые ветки обозначены нулями, а левые единицами). Для того, чтоб отыскать
В случае внедрения кода Хаффмена для сжатия изображений нужно сначала
8 ПРИНЦИПЫ КОДИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ
ОРТОГОНАЛЬНЫХПРЕОБРАЗОВАНИЙ
Индивидуальностью данного способа сжатия изображений будет то, что при всем этом способе кодируется не само изображение, а значения спектральных коэффициентов, получающихся при ортогональном преобразовании изображения. В итоге ортогональных преобразований изображения , имеющего мощные корреляционные связи меж смежными отсчетами (пикселами), имеет пространство декорреляция, в итоге которой значения спектральных коэффициентов оказываются фактически некоррелироваными. В отличие от начального изображения, для которого типично в среднем равномерное распределение энергии меж его отсчетами (пикселами), распределение энергии меж спектральными коэффициентами резко неравномерно. При всем этом основная толика энергии приходится на спектральные коэффициенты с малыми индексами , , представляющие амплитуды низких пространственных частот и только маленькая ее часть – на остальные. В целях сжатия изображений спектральные коэффициенты, имеющие малую амплитуду, или квантуются на маленькое число уровней, или совершенно отбрасываются, что дозволяет для их представления употреблять коды с малым числом двоичных единиц. Потому что средний квадрат шума квантования пропорционален среднему квадрату квантуемого сигнала, то возникающие при всем этом преломления изображения невелики. При декомпрессии (восстановлении) изображения сначала по имеющемуся коду восстанавливаются спектральные коэффициенты, а потом методом оборотного ортогонального преобразования восстанавливается само изображение. Так как при записи либо при передаче спектральных коэффициентов, в отличие от записи либо передачи значений отсчетов начального изображения, лишь маленькая их часть представлена кодом с огромным количеством двоичных единиц, в то время как для представления других расходуется существенно меньше двоичных единиц, если они совершенно не отбрасываются, достигается высочайшая степень сжатия. Так как, как это следует из приведенного описания способа, восстановленное изображение различается от начального вследствие квантования спектральных коэффициентов с большенными индексами на маленькое число уровней, данный способ сжатия относится к группе способов сжатия с потерей инфы.
Есть два способа отбора спектральных коэффициентов: зональный и пороговый. 1-ый способ состоит в том, что заблаговременно, исходя из статистики изображений, в матрице спектральных коэффициентов выделяются зоны и все спектральные коэффициенты, входящие в одну зону, квантуются на одно и то же число уровней, как это показано на рис. 3.1.
Рис. 3.1.
2-ой способ заключается в том, что сохраняются лишь те спектральные коэффициенты, амплитуда которых превосходит заблаговременно установленный порог. Этот способ отбора труднее зонального, так как не считая передачи (записи) значений спектральных коэффициентов нужно также передавать (записывать) их индексы.
Перед тем как перебегать к наиболее детальному рассмотрению способа сжатия данных, основанного на применении ортогональных преобразований, сравним его с ДКИМ. Общим для этих 2-ух способов является двухэтапная обработка изображений, включающая в себя декорреляцию и следующее среднее кодирование сигнала. Принципиальное различие меж ДКИМ и способом сжатия с внедрением ортогональных преобразований заключается в том, что в первом случае имеет пространство декорреляция за счет пророчества, при которой употребляется “локальная” статистика изображения, в то время как во 2-м случае имеет пространство декорреляция за счет укрупнения и, как следует, употребляется “средняя” статистика изображения. При передаче стационарных изображений эта изюминка не играет роли, и оба способа сжатия дают близкие результаты. Если же изображение не стационарно, как к примеру, при передаче мелкомасштабного объекта на фоне поля с медлительно изменяющейся яркостью, это различие в методе декорреляции очень значительно. На той части изображения, где размещен мелкомасштабный объект, “текущее” ), потому его сжатие средством ДКИМ оказывается неэффективным. В то же время значение коэффициента автокорреляции , усредненное по всему изображению, быть может близким к единице, по этому будет обеспечиваться высочайшая эффективность сжатия способом, использующим ортогональные преобразования.Разглядим наиболее тщательно ортогональные преобразования за ранее дискретизированных изображений, представляемых в виде массива (матрицы) чисел размером , где – номер строчки, — номер столбца (номер отсчета в строке). Следует направить внимание на то, что в данной для нас записи порядок указания координат точки отсчета яркости на изображении изменен на оборотный, т.е. заместо обозначения мы пишем . Это делается для согласования с формой записи, принятой в матричном анализе, где 1-ая координата обозначает номер строчки, а 2-ая – номер столбца. Спектральные коэффициенты находятся методом прямого ортогонального преобразования изображения последующим образом
,
где — ядро прямого преобразования (базовые функции, по которым происходит разложение); — индексы спектральных коэффициентов, определяющие их принадлежность в соответственной базовой функции, также положение в матрице спектральных коэффициентов, которая имеет этот же размер, что и преобразуемое изображение. Начальное изображение (массив чисел ) находится методом оборотного ортогонального преобразования
,
где — ядро оборотного преобразования. Если преобразование разделимо, т.е. если
, ,
а нас будут заинтересовывать разделимые преобразования, то оно быть может выполнено в два шага, сначала по всем столбцам, а потом по всем строчкам
, (3.5)
и соответственно
. (3.6)
Для удобства записи и вычислений употребляют матричный аппарат. В матричной форме разделимые ортогональные преобразования записываются последующим образом
, , (3.7)
где — ортогональные матрицы прямого преобразования по столбцам и строчкам, — ортогональные матрицы оборотного преобразования по столбцам и строчкам, и — матрицы, приобретенные в итоге транспонирования матриц и ;
,
— матрица спектральных коэффициентов, получаемая в итоге двумерного ортогонального преобразования,
.
Беря во внимание, что , , также соотношения и , справедливые для ортогональных матриц, имеем
, (3.8)
где , — матрицы, приобретенные в итоге воззвания матриц .
Базовые функции , , , в формулах (3.5) и (3.6) (либо, что — то же самое, ортогональные матрицы в формулах (3.7) и (3.8)) определяются используемым ортогональным преобразованием. Так, к примеру, в случае двумерного дискретного преобразования Фурье (ДПФ) базовые функции представляют собой всеохватывающие экспоненты, а сами ортогональные преобразования имеют вид
,
,
в этих формулах множитель имеет смысл пространственной частоты, .
Понятно, что (ДПФ) не является наилучшим преобразованием для внедрения в целях сжатия данных, т.к. значения спектральных коэффициентов в области больших пространственных частот при всем этом преобразовании имеют сравнимо высочайшие значения. В истинное время при сжатии изображений обширное распространение получило дискретное косинусное преобразование (ДКП). Посреди остальных ранее применявшихся ортогональных преобразования при сжатии изображений следует именовать:
Ортогональные преобразования изображений допускают ряд последующих интерпретаций.
Во-1-х, двумерное преобразование изображения можно разглядывать как его разложение в обобщенный двумерный диапазон, а спектральные коэффициенты – как амплитуды соответственных спектральных составляющих. В том случае, если используются негармонические базовые функции, как, к примеру, в случае преобразования Адамара, понятие частоты нужно обобщить и воспользоваться понятием секвенты. Напомним, что секвентой (ненормированной) именуется величина, равная половине среднего числа пересечения нуля в единицу времени (на единицу длины).
Иная вероятная интерпретация обоснована тем, что матрица преобразуемого изображения и матрицы базовых изображений имеют однообразные размеры, т.е. состоят из 1-го и такого же числа строк и столбцов. Это дает возможность спектральные коэффициенты разглядывать как весовые коэффициенты, с которыми нужно просуммировать базовые изображения, чтоб получить начальное изображение.
Спектральные коэффициенты можно также разглядывать и как функции обоюдной корреляции меж преобразуемым изображением и надлежащими базовыми изображениями.
И, в конце концов, ортогональные преобразования можно разглядывать как таковой поворот N – мерной системы координат (), в какой преобразуемое изображение, состоящее из
отсчетов, представляется
– мерным вектором, при котором корреляция меж его компонентами сводится к минимуму.
Принципиальным свойством ортогональных преобразований является сохранение метрики, благодаря этому свойству евклидово расстояние меж изображениями равно евклидову расстоянию меж их видами (спектральными отображениями).
9
ДИСКРЕТНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ
Двумерное дискретное косинусное преобразование является разделимым и быть может выполнено по формулам
, (3.9)
, (3.10)
где функции и определены последующим образом: , при . Как понятно, вычисление двумерного дискретного косинусного преобразования по приведенным формулам просит для его выполнения операций умножения и сложения, что делает суровую делему, так как значения для настоящих изображений составляют несколько сотен. В связи с сиим были предприняты исследования, направленные на сокращение требуемого размера вычислений. В итоге этих исследовательских работ были разработаны два, дополняющих друг друга способа.
1-ый способ
состоит в том, что кодируемое изображение размером отсчетов за ранее разбивается на отдельные блоки размером отсчетов, а потом независимо любой из блоков подвергается дискретному косинусному преобразованию. Так как любой блок содержит в раз меньше отсчетов, чем начальное изображение, то на его преобразование в согласовании с формулами (3.9, 3.10), будет нужно уже не операций (в случае, когда потребовалось бы соответственно операций), а лишь вычислительных операций.
Рис. 3.2.
Беря во внимание, что все изображение содержит блоков, находим количество вычислительных операций, которые нужно выполнить, чтоб выполнить преобразование всего изображения , т.е. в раз меньше, чем без разбиения на блоки. Поясним изложенное примером. Представим, что начальное изображение имеет размер отсчетов, а размер блока составляет отсчетов. Тогда в согласовании с приведенными выше рассуждениями без разбиения изображения на блоки потребовалось бы 171992678400 вычислительных операций, при разбиении же изображения на блоки будет нужно всего только 106168320, т.е. в 1620 раз меньше, чем в первом случае. Из этого следует, что чем наиболее маленькими будут блоки, тем огромным будет их число и тем огромным будет сокращение числа операций, нужных для выполнения ортогонального преобразования, в данном случае ДКП. Но, как указывает детализированный анализ данной для нас препядствия, созодать блоки наименьшими, чем , либо в последнем случае отсчетов, не следует, потому что корреляционные связи в изображении распространяются приблизительно на этот интервал и предстоящее уменьшение размеров блоков повлечет за собой повышение амплитуд спектральных коэффициентов
с большенными индексами
, и, как следствие, уменьшение сжатия данных.
2-ой способ
сокращения требуемого размера вычислений при выполнении дискретного косинусного преобразования состоит в применении резвого метода вычисления ДКП, при котором требуемый размер вычислений (умножений и сложений) сокращается с до .
Поясним эффективность этого способа на примере, полагая, что размер блока составляет отсчетов изображения. При конкретном вычислении спектральных коэффициентов по формулам (3.9, 3.10) потребовалось бы выполнить 65536 операций умножения и сложения. Используя же резвый метод, будет нужно выполнить всего только 2048 операций, т.е. в 32 раза меньше, чем в первом случае.
В истинное время при выполнении ДКП употребляют оба описанные способа сокращения количества вычислительных операций, так как они, дополняя друг друга, разрешают значительно убыстрить вычисления.
8 ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВОИЧНЫХ ЕДИНИЦ КОДА МЕЖДУ СПЕКТРАЛЬНЫМИ КОЭФФИЦИЕНТАМИ
В способе, использующем ортогональные преобразования, сжатие данных получается из-за того, что спектральные коэффициенты, энергия которых мала, квантуются на наименьшее число уровней, а, как следует, на их
, при котором обеспечивается меньший средний квадрат шума преобразования , обусловленного квантованием (либо отбрасыванием) спектральных коэффициентов. Будем считать, что сжимаемое изображение является черно-белым полутоновым, также, что нам заданы: размер блока , требуемый коэффициент сжатия
и значения средних квадратов спектральных коэффициентов
.
Решение задачки начнем с того, что определим сначала число двоичных единиц кода , которым мы располагаем при данном коэффициенте сжатия и которое нам предстоит распределить меж спектральными коэффициентами блока. Исходя из того, что для представления всякого пиксела в блоке начального черно-белого полутонового изображения требуется один б, т.е. 8 двоичных единиц, найдем, что для представления всего блока без сжатия расходуется двоичных единиц кода. Отсюда следует, что при данном значении коэффициента сжатия
мы располагаем количеством двоичных единиц кода, которые и должны распределить меж спектральными коэффициентами.
Как уже указывалось, средний квадрат шума квантования прямо пропорционален среднему квадрату квантуемого сигнала. Применительно к рассматриваемому случаю это означает, что средний квадрат шума квантования спектрального коэффициента
будет равен
, (3.11)
где — средний квадрат шума квантования сигнала на уровней, при условии, что средний квадрат самого квантуемого сигнала равен единице, а распределение его по яркости описывается плотностью вероятности , — число двоичных единиц кода. Средний же квадрат шума преобразования (квантования), равен сумме средних квадратов шумов, возникающих при квантовании всякого спектрального коэффициента
. (3.12)
Для того, чтоб обеспечить малое , поступим последующим образом. Сначала выделим для представления всякого спектрального коэффициента нулевое количество двоичных единиц кода и найдем значения средних квадратов шумов квантования, которые при всем этом появляются. Так как в этом случае мы сделали усечение (отбрасывание) спектральных коэффициентов, значения средних квадратов шумов квантования будут равны средним квадратам самих спектральных коэффициентов, т.е. , а — их сумме. Дальше, избираем из всех значений самое огромное, выделяем спектральному коэффициенту, которому соответствует это самое огромное на единицу и рассчитываем для него по формуле (3.11) новое . Опосля этого опять сравниваем меж собой все значения , снова находим наибольшее и опять выделяем одну двоичную единицу кода более “шумящему” спектральному коэффициенту, понижая при всем этом на единицу. Так повторяем до того времени, пока не будут израсходованы все двоичные единицы кода . Как не тяжело созидать, при таком распределении двоичных единиц мы обеспечиваем малый уровень шума преобразования. Заключительным шагом описанной процедуры является объединение спектральных коэффициентов, для представления которых выделено однообразное количество двоичных единиц кода, в зоны.
Обратим внимание, что описанный способ распределения двоичных единиц кода меж спектральными коэффициентами еще не гарантирует малой заметности шума преобразования на изображении опосля его декодирования. Разъясняется это тем, что разные спектральные составляющие различно воспринимаются зрительной системой. Потому для того, чтоб достигнуть малой заметности шума преобразования на декодированном изображении, описанную функцию нужно делать, используя для этого не средние квадраты шума квантования, а их средневзвешенные значения.
Разглядим, как проявляется шум квантования, также наружный шум на декодированных изображениях. Так как результирующий уровень шума преобразования является результатом одновременного действия всех шумовых компонент, возникающих при квантовании спектральных коэффициентов, то в силу центральной предельной аксиомы его распределение будет близким к нормальному. Потому что средние квадраты шума квантования всех спектральных коэффициентов близки меж собой вследствие примененной стратегии распределения двоичных единиц, его спектральный состав будет близок к спектральному составу квазибелого шума. Что все-таки касается проявления на изображении наружной помехи при его передаче по каналу связи в сжатом виде, то тут все зависит от ее нрава. к примеру, редчайшая импульсная помеха проявляется в том, что отдельные блоки изображения передаются ошибочно, потому на их пропечатываются базовые изображения, надлежащие тем спектральным коэффициентам, которые были переданы с ошибкой.
11 СЖАТИЕ ИЗОБРАЖЕНИЙ В ФОРМАТЕ jpeg
В формате записи изображений JPEG применен способ сжатия с применением дискретного косинусного преобразовании, т.е. способ сжатия с потерями инфы. Аббревиатура jpeg значит заглавие организации, разработавшей этот эталон, — JointPhotographicExpertsGroup (Объединенная группа профессионалов по фото). Этот формат предугадывает сжатие, как черно-белых полутоновых изображений, так и цветных. Разглядим вариант сжатия цветных изображений как наиболее общий. В цветном изображении любой пиксел представлен 3-мя б, по б на красноватый (
), зеленоватый (
) и голубий (
) цвета.
Сжатие изображения начинается с того, что оно разбивается на отдельные блоки размером 16х16 отсчетов любой, которые потом сжимаются независимо друг от друга.
Дальше, в любом блоке от 3-х матриц отсчетов для красноватой (
), зеленоватой (
) и голубой (
) компонент изображения, производят переход к 3-м матрицам, представляющим яркостную (Y) и две цветностных (Cb) и (Cr) составляющие изображения. Составляющие (Cb) и (Cr) являются аналогами цветоразностных сигналов в отлично известной совместимой системе цветного телевидения SECAM. В отличие от компонент (
),(
),(
) компонент (Y) содержит в себе лишь информацию о яркости пикселов, а составляющие (Cb) и (Cr) содержат информацию лишь о их цвете и насыщенности этого цвета. Так как острота зрения человека при наблюдении чисто хроматических изображений (purechromatic) значительно ниже, чем при наблюдении изображений, имеющих лишь яркостный контраст (achromatic), переход к компонентам (Cb) и (Cr) выгоден, потому что дозволяет при их кодировке употреблять наименьшее количество отсчетов в блоке и из-за этого получить доп сжатие. Этот переход (перекодирование) осуществляется последующим образом
,
,
.
Дальше матрица, представляющая яркостную компоненту и имеющая размер отсчетов, делится на 4 матрицы размером отсчетов любая, а две цветностных матрицы (Cb) и (Cr) методом прореживания по строчкам и столбцам преобразуются в две цветностных матрицы (Cb) и (Cr) размером . При прореживании этих матриц из их исключаются любая 2-ая строчка и любой 2-ой столбец. Такое преобразование оказывается допустимым, так как, как уже отмечалось выше, наше зрение имеет пониженную остроту при наблюдении чисто хроматических изображений. На этом шаге сжатия, с одной стороны, в сжимаемое изображение вносятся необратимые преломления за счет прореживания, т.е. происходит утрата инфы, а с иной — имеет пространство его сжатие вдвое. Вправду, до прореживания полное количество отсчетов, которыми был представлен блок изображения, приравнивалось , в то время как опосля прореживания лишь 384.
Потом любой из отсчетов 6 матриц размером отсчетов подвергается ДКП, квантованию на 4096 уровней и представляется 12-разрядным двоичным кодом. При всем этом получаются 6 матриц спектральных коэффициентов, 4 из которых представляют собой компоненту (Y), а две представляют составляющие (Cb) и (Cr). Основное сжатие достигается на шаге квантования спектральных коэффициентов благодаря тому, что спектральные коэффициенты с большенными индексами, на долю которых приходится малая толика энергии изображения, квантуются на маленькое число уровней (либо усекаются), и, как следует, на их пространство утрата инфы, потому что в изображение вносятся необратимые преломления (шум квантования). процесс квантования состоит в том, что матрица спектральных коэффициентов целочисленно поэлементно делится на матрицу квантования, имеющую такую же размерность, что и блоки спектральных коэффициентов, т.е. . При всем этом определяется последующим образом
,
где начальное, не квантованное, соответственный ему по положению в матрице элемент матрицы квантования. Матрица квантования построена по зональному принципу, составляющие ее числа представляют собой величины равные , где
— число уровней, на которое квантуется спектральный коэффициент, входящий в подобающую зону. Эта процедура увлекательна тем, что процесс целочисленного деления с одной стороны обеспечивает приведение спектральных коэффициентов к значениям 1-го порядка, а с иной стороны благодаря имеющему при всем этом пространство округлению достигается фактически квантование. Опосля выполнения операции квантования мы получаем матрицу проквантованных спектральных коэффициентов , индивидуальностью, которой является наличие огромного количества малых и нулевых спектральных коэффициентов, расположенных в большей степени в правом нижнем углу матрицы. При восстановлении сжатого изображения значения проквантованных спектральных коэффициентов множатся поэлементно на значения соответственных коэффициентов матрицы квантования .
Последующий шаг метода сжатия состоит в преобразовании приобретенной матрицы квантованных спектральных коэффициентов в вектор из 64 частей, в каком малые и нулевые спектральные коэффициенты должны быть по способности сгруппированы. Эта цель достигается методом внедрения так именуемого зигзаг-сканирования, показанного на рис. 4.1. Так как сначала
Рис. 4.1.
зигзаг-сканирования считываются спектральные коэффициенты с большенными амплитудами, а в конце — спектральные коэффициенты, величина которых мала либо равна нулю, получающаяся в итоге этого сканирования последовательность чисел будет в конце содержать длинноватые последовательности нулей. Эта изюминка употребляется для предстоящего сжатия данных методом энтропийного кодировки, которое состоит в поочередном применении способа кодировки длин серий и кода Хаффмена. Из ряда спектральных коэффициентов образуются пары чисел, одно из которых равно значению ненулевого спектрального коэффициента, а другое — количеству предыдущих этому спектральному коэффициенту нулей. Приобретенные таковым образом пары сжимаются средством внедрения кода Хаффмена с фиксированной таблицей. В данной для нас таблице более возможным значениям приобретенных чисел, которые соответствуют малым последовательностям нулей и малым значениям ненулевых спектральных коэффициентов ставятся в соответствие недлинные коды. Так как код Хаффмена является префиксным, то в данном случае не требуется разделителей меж кодовыми словами.
метод декодирования повторяет все перечисленные операции, но в оборотном порядке.
Достоинством описанного способа является высочайший коэффициент сжатия, который для цветных изображений при неплохом качестве их восстановления может достигать 6 – 10. Величина коэффициента сжатия изображений при их записи в файл может регулироваться средством специальной функции, которая подходящим образом изменяет коэффициенты матрицы квантования . При помощи данной для нас регулировки устанавливается допустимая степень ухудшения сжимаемого изображения, как, к примеру, это изготовлено в графическом редакторе PhotoShop. Чем большая степень сжатия выбрана, тем огромные преломления будут в восстановленном изображении. При неприемлимо огромных степенях сжатия если не принято особых мер на восстановленном изображении будет просматриваться блочная структура, так именуемый эффект забора, заклеенного объявлениями. В истинное время этот способ сжатия обширно применяется фактически во всех графических редакторах.
Вывод
Мультимедиа технологии – это совокупа программно-аппаратных средств, реализующих обработку инфы в звуковом и зрительном виде. Любой из нас не раз слышал, что «комп может все». Но, в настоящей жизни мы не имели убедительных подтверждений схожих выражений до этого всего поэтому, что имелись в виду потенциальные способности компа, известные, в главном, узенькому кругу профессионалов. Ситуация значительно поменялась с возникновением мультимедиа технологий, позволяющих раскрыть этот потенциал в обычной информационной среде.
Графика, анимация, фото, видео, звук, текст в интерактивном режиме работы делают интегрированную информационную среду, в какой юзер обретает отменно новейшие способности. Самое обширное применение мультимедиа технологии отыскали в образовании — от детского до старого возраста и от вузовских аудиторий до домашних критерий. Мультимедиа продукты удачно употребляются в разных информационных, демо и маркетинговых целях, внедрение мультимедиа в телекоммуникации стимулировало бурный рост новейших применений. В данной работе, на базе методическо — информационных материалов были рассмотрены способности ММТ в области обработки изображений, по средствам которых можно, например, обработать фото, «отменно» передать информацию от юзера к юзеру, компактно хранить информацию на твердых дисках ПК , создавать постеры либо работать с иллюстрациями – любые преобразования с изображениями хоть в проф сфере, хоть на бытовом уровне.
СПИСОК ЛИТЕРАТУРЫ
1. Красильников Н.Н. Цифровая обработка изображений. — М.: Вузовская книжка, 2001.- 319 с.
2. Красильников Н.Н., Красильникова О.И. Мультимедиатехнологии в информационных сетях. способы сжатия и форматы записи графической инфы: Учеб. Пособие. СПбГУАП. СПб., 2004.- 68 с
3. Информационный ресурс: HTTP://www.dialektika/com/books/5-8459-0888-4/html.
]]>