Учебная работа. Реферат: Двоичное кодирование текстовой информации
p align=»justify»>Обычно для кодировки 1-го знака употребляется 1 б (8 двоичных разрядов). Это дозволяет закодировать N = 28 = 256 разных знаков, которых обычно бывает довольно для представления текстовой инфы (строчные и большие буковкы российского и латинского алфавита, числа, знаки, графические знаки и т.д.).
Начиная с 60 годов, компы больше стали употребляться для обработки текстовой инфы.
Обычно для кодировки 1-го знака употребляется 1 б (8 двоичных разрядов). Это дозволяет закодировать N = 28 = 256 разных знаков, которых обычно бывает довольно для представления текстовой инфы (строчные и большие буковкы российского и латинского алфавита, числа, знаки, графические знаки и т.д.).
При двоичном кодировке текстовой инфы
любому символу ставится в соответствие своя неповторимая последовательность из восьми нулей и единиц, собственный уникальный двоичный код от 00000000 до 11111111 (десятичный код от 0 до 255).
Присвоение символу определенного двоичного кода — это вопросец соглашения, которое фиксируется в кодовой таблице. 1-ые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строчки, ввод пробела и т.д.). Коды с 33 по 127 являются международными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
Коды с 128 по 255 являются государственными, т.е. в государственных шифровках одному и тому же коду соответствуют разные знаки. К огорчению, в истинное время есть 5 разных кодовых таблиц для российских букв, потому тексты, сделанные в одной шифровке, не будут верно отображаться в иной.
Хронологически одним из первых эталонов кодировки российских букв на компах был код КОИ-8 («Код обмена информацией 8-битный»). Эта шифровка применяется на компах с операционной системой unix.
Более всераспространенная кодировка- это обычная кириллическая шифровка Microsoft Windows, обозначаемая сокращением СР1251 («СР» значит «Code Page», «кодовая страничка»). Все Windows-приложения, работающие с русским языком, поддерживают эту шифровку.
Таблица
3.2. Шифровки знаков
Двоичный код
Десятичный код
КОИ8 СР1251 СР866 Mac
ISO
00000000
0
00001000
8
Удаление крайнего знака (кнопка Backspace)
00001101
13
перевод строчки (кнопка Enter)
00100000
32
пробел
00100001
33
!
01011010
90
Z
01111111
127
п
128
-
Ъ
А
А
к
11000010
194
Б
В
-
-
Т
11001100
204
Л
м
i i
i i
Ь
11011101
221
Щ
э
-
Ё
н
11111111
255
ь
я
нераэ.
пробел
нераз. пробел
п
Для работы в среде операционной системы MS-DOS употребляется «другая» шифровка, в терминологии компании Microsoft — шифровка СР866.
КомпанияApple разработала для компов Macintosh свою свою шифровку российских букв (Мае).
Интернациональная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве эталона для российского языка еще одну шифровку под заглавием ISO 8859-5.
Как видно из таблицы, одному и тому же двоичному коду в разных шифровках поставлены в соответствие разные знаки. Любая шифровка задается собственной своей кодовой таблицей.
к примеру, последовательность числовых кодов 221, 194, 204 в шифровке СР1251 образует слово ЭВМ , тогда как в остальных шифровках это будет глупый набор знаков.
К Счастью, почти всегда юзер не должен хлопотать о перекодировках текстовых документов. При работе в приложениях Windows предусмотрена возможность автоматической перекодировки документов, сделанных в приложениях MS-DOS. При работе в Веб с внедрением броузеров Internet Explorer и Netscape Communicator происходит автоматическая перекодировка Web-страниц.
В крайнее время возник новейший интернациональный эталон Unicode, который отводит на любой знак не один б, а два, и поэтому с его помощью можно закодировать не 256 знаков, а N = 216 = 65536 разных знаков. Эту шифровку поддерживает платформа Microsoft WindowsOffice 97.
Двоичное кодирование графической инфы
С 80-х годов активно развивается разработка обработки на компе графической инфы. Компьютерная графика дозволяет создавать и редактировать картинки, схемы, чертежи, преобразовывать изображения (фото, слайды и т.д.), представлять статистические данные в форме деловой графики, создавать анимированные модели (научные, игровые и т.д.), обрабатывать «живое видео».
Графическая информация на дисплее монитора представляется в виде изображения, которое формируется из точек (пикселей). В простом случае (черно-белое изображение без градаций сероватого цвета) любая точка экрана может иметь только два состояния — «темная» либо «белоснежная», т.е. для хранения ее состояния нужен 1 бит.
Цветные изображения могут иметь различную глубину цвета (бит на точку 4, 8, 16, 24). Любой цвет можно разглядывать как вероятное состояние точки, тогда и по формуле N = 21 быть может вычислено количество цветов, отображаемых на дисплее монитора.
Таблица 3.3.
количество отображаемых цветов
Изображение может иметь разный размер, который определяется количеством точек по горизонтали и по вертикали В современных индивидуальных компах обычно употребляются четыре главных размера изображения либо разрешающих возможностей экрана: 640*480, 800*600, 1024*768 и 1280*1024 точки.
Для того чтоб на дисплее монитора формировалось изображение, информация о каждой его точке (цвет точки) обязана храниться в видеопамяти компа. Рассчитаем нужный размер видеопамяти для более всераспространенного в истинное время графического режима (800*600 точек, 16 бит на точку).
Всего точек на дисплее: 800 * 600 = 480000
Нужный размер видеопамяти: 16 бит * 480000 = 7680000 бит = 960000 б = 937,5 Кбайт.
Аналогично рассчитывается нужный размер видеопамяти для остальных графических режимов.
Таблица 3.4.
Размер видеопамяти для разных графических режимов
Режим экрана
Глубина цвета (бит на точку)
4
8
16
24
640 на 480
150 Кбайт
300 Кбайт
600 Кбайт
900 Кбайт
800 на 600
234 Кбайт
469 Кбайт
938 Кбайт
1,4 Мбайт
1024 на 768
384 Кбайт
768 Кбайт
1,5 Мбайт
2,25 Мбайт
1280 на 1024
640 Кбайт
1,25 Мбайт
2,5 Мбайт
3,75 Мбайт
Современные компы владеют таковыми техническими чертами, которые разрешают обрабатывать и выводить на экран, так называемое «живое видео», т.е. видеоизображение естественных объектов. Видеоизображение формируется из отдельных кадров, которые сменяют друг друга с высочайшей частотой (не воспринимаемой глазом). Обычно частота кадров составляет 25 Гц , т.е. за 1 секунду сменяется 25 кадров.
Двоичное кодирование звуковой инфы
С начала 90-х годов индивидуальные компы получили возможность работать со звуковой информацией Любой комп, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию При помощи особых программных средств (редакторов аудиофайлов) открываются широкие способности по созданию, редактированию и прослушиванию звуковых файлов Создаются программки определения речи и возникает возможность управления компом с помощью голоса
Звуковой сигнал — это непрерывная волна с изменяющейся амплитудой и частотой Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон Для того чтоб комп мог обрабатывать непрерывный звуковой сигнал, он должен быть дистретизирован, те преобразован в последовательность электронных импульсов (двоичных нулей и единиц)
Любая подборка фиксирует настоящую амплитуду сигнала и присваивается ей определенное, более близкое, дискретное карта и чем большее количество выборок делается за 1 секунду, тем поточнее процедура двоичного кодировки
Современные звуковые карты могут обеспечить кодирование 65536 разных уровней сигнала либо состояний Для определения количества бит, нужных для кодировки, решим показательное уравнение
65536 = 21, т к 65536 = 216 , то I = 16 бит
Таковым образом, современные звуковые карты обеспечивают 16-битное кодирование звука При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код
количество выборок за секунду быть может в спектре от 8000 до 48000, т е частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц При частоте 8 Кгц свойство дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 Кгц — качеству звучания аудио-CD Следует также учесть, что вероятны как моно-, так и стерео-режимы
Можно оценить информационный размер моноаудиофайла продолжительностью звучания 1 секунду при среднем качестве звука (16 бит, 24 Кгц) Для этого количество бит на одну подборку нужно помножить на количество выборок в 1 секунду
16 бит * 24000 = 384000 бит = 48000 б » 47 Кбайт
]]>