Открытый урок на тему: Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации

Тема урока: «Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации»
Изучение нового материала
Цели урока:
познакомить с алфавитным подходом к измерению информации;
ввести единицы измерения информации и соотношение между ними;
научить вычислять информационный объём сообщения, записанного знаками какого-либо алфавита и представлять его в различных единицах измерения;
дать представление о способе хранения текстовой информации в памяти компьютера.
Термины
Алфавит, мощность алфавита, единицы измерения информации, текстовая информация, кодовая таблица.
Ход урока:
Организационный момент.
Устная работа.
Проверка домашнего задания.
1.3
4) 1бит

1.4
1 Кбайт = 210*23=213бит
1 Мбайт = 210*213=223бит
1 Гбайт= 210*223=233бит

1. Что такое код, кодирование, длина кода?
2. Какая единица принимается за количество информации?
Бит – минимальная единица измерения информации.
Байт – единица измерения информации в системе СИ.
Теоретически основы урока.
Алфавитный подход к определению количества информации
Алфавит – набор всех допустимых символов знаковой системы.
13 EMBED Equation.3 1415
где N – мощность алфавита;
i – количество информации, которое несёт каждый символ алфавита;
I – Количество информации в сообщении при алфавитном подходе.
4. Объяснение нового материала.
При алфавитном подходе рассматривается запись сообщения с помощью какой-либо знаковой системы. Пусть алфавит знаковой системы состоит из N символов. Представим, что передать нужно всего один символ (это может быть один из N символов). Опять возникает неопределённость. Значит, количество информации, которое несёт сообщение, равное одному знаку, определяется соотношением:
13 EMBED Equation.3 1415
С помощью этой формулы можно определить количество информации, которое несёт знак в двоичной знаковой системе:
Пример 1:
Пусть передаётся простое арифметическое выражение. Алфавит арифметических выражений состоит из 16 знаков:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, +, -, *, /, (, ) . N=16, => 16=24 =>24 = 2I => I = 4 бит.
Один знак арифметического выражения несёт 4 бита информации.
Пример 2:
Пусть сообщение записано русскими буквами. Алфавит русского языка состоит из 32 знаков(исключая ё) N=32, => 32=25 =>25 = 2I => I = 5 бит.
Один знак русского алфавита несёт 5 бит информации.
Пример 3:
Алфавит двоичной знаковой системы состоит из двух знаков (0,1), поэтому N=2, =>
2=2I => 21=2I => I = 1 бит
Т.О. в двоичной знаковой системе знак несёт 1 бит информации.
Информационная ёмкость знака двоичной знаковой системы составляет один бит

Вопросы:
Какова мощность алфавита:
нотных знаков:N=7 (до, ре, ми, фа, соль, ля, си)
Знаков Зодиака:N=12
Цифр: N=10
Латинских букв: N=26
Сообщение состоит из последовательности знаков. Допусти, что сообщение содержит k знаков. Каждый знак несёт определённое количество информации i. Количество информации во всём сообщении: I=ik.
Пример 4:
Слово «ЭВМ» содержит I = 5 бит 3 символа = 15 бит
(Информационная ёмкость знака русского алфавита равна 5 бит, N=32, => 32=25 =>25 = 2I => I = 5 бит)
Слово «Компьютер» содержит I = 5 бит 9 символов = 45 бит.
Пример 5:
Выражение «4+5=9» содержит I = 4 бита 5символов = 20 бит.
Выражение «2(4+5)=18» содержит I = 4 бита 10 символов = 40 бит.
Пример 6:
Двоичный код «1000101» содержит I = 1 бит 7 символов = 7 бит.
Двоичный код «1111111» содержит I = 1 бит 7 символов = 7 бит.
Измерение информации
Памятка
13 SHAPE \* MERGEFORMAT 1415
Пример 1:
Необходимо вычислить количество информации, содержащейся на одной странице набранного на компьютере текста. Текст состоит из 50 строк по 60 символов.
Сообщение содержит: k=5060=3000 символов
Количество информации в тексте:
I = i*k = 1байт 3000 = 3000 байт = 3000/1024 =2.93 Кбайт
Пример 2:
Вычислить количество информации на 10 страницах.
k = 3000 символов * 10 страниц = 30000 символов.
I = i*k = 1 байт 30000 символов = 30000 байт = 30000/1024=29.3 Кбайт
Пример 3:
Сколько страниц текста уместится на дискету и компакт-диск?
Объём одной дискеты:
1.44 Мбайт = 1.44 1024 = 1509949,44 байт
k = 1509949,44 / 3000 = 500 страниц
Объём одного компакт-диска:
650 Мбайт = 650 1024 = 681574400 байт
k = 681574400/3000 = 227190 страниц
Кодирование текстовой информации
Информация, выраженная в письменной форме, называется текстовой информацией.
Достаточно 256 различных символов.
N=2i, 256=2i, 28=2i, i=8 бит
Для представления текста в память компьютера необходимо представить его в двоичной знаковой системе.
Для кодирования каждого знака требуется количество информации, равное 8 битам.








Кодовая таблица – соответствие символов и их двоичных кодов.

Коды 0-31 соответствуют операциям (перевод строки и т.д)
Коды 32-127 – международный алфавит (латинские буквы, цифры, знаки препинания).
Коды 128-255 – национальный алфавит. В настоящее время существует 5 кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Код
Windows
MS-DOS
КОИ-8
Mac
ISO
Unicode

1
2
3
4
5
6
7

150
Ц

ж

ж


151
Ч

в

з


152
Ш

ь

и


153
Щ

ы

й


154
Ъ

з

к


Стандарт кодирования Unicode отводит под каждый символ 2 байта, что позволило закодировать многое алфавиты в одной таблице.
N = 2i, 2i = 216 =65536, N=65536 символов в кодовой таблице Unicode.

Домашнее задание: Приложение 1

:1024

:1024

1024

1024

:8

:1024

1024

8

Гбайт

Мбайт

Кбайт

байт

бит

Клавиатура

Оперативная память

Монитор

IBM

010010001
00110100
01001101

IBM