План конспект урока Информация. Информационные процессы. Измерение информации
Информация. Информационные процессы. Измерение информации
Учитель информатики
МАОУ «СОШ №21»
г. Стерлитамак РБ
Класс: 10
Цели урока:
- систематизировать и обобщить сведения о информационных процессах;
- осуществить проверку знаний учащихся;
- воспитать внимание и аккуратность при выполнении практических работ.
Оборудование: доска, компьютеры, мультимедийная система, экран, карточки, плакаты.
План урока:
Организационный момент ( 5 мин.).
Актуализация знаний (10 мин.).
Объяснение нового материала (15 мин.)
Выполнение заданий в рабочих тетрадях ( 10 мин.).
Домашнее задание (1 мин.).
Подведение итогов (4 мин.).
Ход урока:
Визитка учителя.
Приветствие, проверка отсутствующих, объявление темы и целей урока.
а) Работа некоторых учащихся по карточкам:
Вариант 1
1.Расшифруй записку мартышки.
4
2
3
0
9
4
9
1
3
5
9
6
3
1
8
6
4
10
7
0
С
48:8-1
У
(64-8):4
Н
5+6-10
А
33:11
И
27-13-6
Л
122-112
Ы
60:10-3
!
24:2-12
Р
38:2-17
К
(31+5):6
10-5+4
Зашифрована пословица. Поставь над каждой цифрой буквы пропущенного слова.
*Чтобы рубить дрова нужен 14, 2, 3, 2, 7, а чтобы полить огород – 10, 4, 5, 1, 6
* Рыбаки сделали во льду 3, 7, 2, 7, 8, 9, 11 и стали ловить рыбу.
* Самый колючий зверь в лесу – это 12, 13
А теперь прочитай пословицу: 1, 2, 3, 4, 5, 1, 6
7, 8, 9, 10, 11
9, 4, 7, 4, 13, 12, 14
Вариант 2
Расшифруй фамилию русского мореплавателя, чьи корабли пересекли Тихий океан и открыли Аляску.
21
11
22
17
10
23
Н
12*10-110
Р
13+17-8
И
13-5+9
Е
9-6+8
Б
20-6+7
Г
13+7+3
Зашифрована пословица. Поставь над каждой цифрой буквы пропущенного слова.
*Чтобы рубить дрова нужен 14, 2, 3, 2, 7, а чтобы полить огород – 10, 4, 5, 1, 6
* Рыбаки сделали во льду 3, 7, 2, 7, 8, 9, 11 и стали ловить рыбу.
* Самый колючий зверь в лесу – это 12, 13
А теперь прочитай пословицу: 1, 2, 3, 4, 5, 1, 6
7, 8, 9, 10, 11
9, 4, 7, 4, 13, 12, 14
б) Вопросы для остальных учащихся:
Назовите определение информации. Виды.
Перечислите единицы измерения и способы измерения информации.
Что можно назвать кодом?
Что такое кодирование?
Какие способы кодирования вы знаете?
г) У каждого на столе лежат карточки с заданиями. Ваша задача решить их, обменяться решёнными карточками с соседом по парте, проверить их по презентации и оценить.
К – 1
Замена буквы её порядковым номером в алфавите А – 1, Б – 2
З А Г А Д К А
К – 2
Замена буквы её порядковым номером в алфавите А – 1, Б – 2
14 16 19 12 3 1
К – 3
Замена буквы следующей за ней по алфавиту: А – Б, Б – В, В – Г, , Я – А.
М Ё О Й О Д С Б Е
К – 4
Замена буквы на букву, номер которой на 2 больше исходного: А – В, Б – Г, В – Д
У О Р Н Ж П У М
К – 5
К номеру каждой буквы сообщения добавляется номер буквы из предложенного текста.
«В памяти компьютера информация представлена в двоичном коде»
Т У Л А 20 21 13 1
К – 6
К номеру каждой буквы сообщения добавляется номер буквы из предложенного текста.
«В памяти компьютера информация представлена в двоичном коде»
П Щ О Я К 17 27 16 33 12
Объяснения нового материала.
Информационный процесс – это процесс восприятия, хранения, накопления, обработки и передачи информации.
Хранение информации
Хранение информации – процесс древний как сама жизнь.
Уже в древности человек столкнулся с проблемой хранения информации. С рождения письменности возникает специальное средство фиксирования и распространения мысли в пространстве и во времени. Родилось документирование информации (рукописи, книги). Появились специальные информационные накопители: библиотеки, архивы. Постепенно письменный документ стал орудием управления.
Вторым информационным скачком явилось книгопечатание. Информация стала храниться в печатных изданиях, и для ее получения человек должен был обратиться к местам хранения. Различная информация требует различного времени хранения. Сбор информации не является самой целью. Она необходима, чтобы информация могла использоваться, причем неоднократно необходимо ее хранение. Хранение информации – это способ распространения ее во времени и в пространстве. Хранение очень большого объема информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме. Информационная система – это хранилище информации снабженная процедурами ввода, поиска, размещения и выдачи информации. Наличие таких процедур – главная особенность информационных систем, отличающих их от простых скоплений информационных материалов.
Поиск информации
Методы поиска:
Непосредственное наблюдение.
Общение со специалистом.
Чтение литературы.
Прослушивание, просмотр видео-, аудио- накопителей , радио, телепередач.
Работа в библиотеках и архивах.
Запрос к информационным системам, базам и банкам компьютерных данных.
Понять что искать, осуществить процесс поиска – вот умение, которое становиться решающим в третьем тысячелетии. Поиск информации – это извлечение хранимой информации.
Существуют ручной и автоматический методы. Информация, предназначенная для хранения и передачи, как правило, представлена в форме документа. Под документом понимается объект на любом носителе, где есть информация, предназначенная для распространения во времени и в пространстве (документ с латинского – свидетельство). Основное предназначение документа заключается в использовании его в качестве источника информации при решении различных проблем.
Передача информации
В процессе передачи информации обязательно участвуют источник и приемник информации, между ними действует канал передачи (связи).
Канал связи – совокупность технических устройств обеспечивающих передачу сигнала от источника к приемнику.
Кодирующее устройство предназначено для преобразования исходного сообщения к виду удобному для передачи.
Декодирующее устройство предназначено для преобразования кодированного сообщения в исходное.
В процессе передачи информация может теряться, искажаться: искажение звука в телефоне; атмосферные помехи; ошибки оператора при передаче в телеграфе и т.д. Эти помехи или шумы искажают информацию. К счастью существует наука, разрабатывающая способы защиты информации – криптология. На рис.7 приведена схема организации передачи информации.
Рис. 7
Каналы передачи информации характеризуются пропускной способностью и помехозащищенностью. Каналы передачи данных делятся на симплексные (с передачей информации только в одну сторону) и дуплексные (в оба направления). По каналу связи могут передаваться одновременно несколько сообщений. Каждое из них выделяется с помощью специальных фильтров (фильтрация по частоте). Для получения помехозащищенности канала используются специальные методы передачи сообщений, уменьшающие уровень шумов (вводят лишнее (избыточное) количество символов, эти символы не несут действительного содержания, но используются для контроля правильности сообщений при получении.
В истории кибернетики имя Клода Шеннона занимает одно из замечательных мест. Он установил точную связь между способом кодирования, скоростью передачи и вероятности искажения информации. Но, пожалуй, самым замечательным результатом в теории информации является доказательство, что при любых помехах и шумах можно обеспечить передачу информации без потерь.
Первая теория Шеннона.
Для передачи любого сообщения с помощью канала без помех существует код минимальной длины такой, что сообщение кодируется с минимальной избыточностью.
Вторая теория Шеннона.
Всегда существует способ кодирования, при котором, сообщение будет передаваться с какой угодно высокой достоверностью, если только скорость передачи не превышает пропускной способности канала связи.
Обработка информации
Обработка информации – это преобразование информации из одного вида в другой осуществляемая по строгим формальным правилам.
Обработка информации по принципу «черного ящика» - процесс, в котором пользователю нужна и необходима лишь входная и выходная информация (рис.8) . Правила, по которым происходит преобразования, его не интересуют и не принимаются во внимание.
Рис. 8
«Черный ящик» - это система, в которой внешнему наблюдателю доступна лишь информация на входе и выходе этой системы, а строение и внутренние процессы неизвестны. Возможность автоматизированной обработки информации основана на том, что обработка информации не подразумевает ее осмысление.
Защита информации
Человеку свойственно ошибаться. Ошибка может произойти при выполнении информационного процесса: при кодировании, при обработке или передаче. Чем больше информации вы обрабатываете, тем труднее избежать ошибки. Компьютер – это устройство для обработки большого количества информации разного вида в короткие сроки времени. Не смотря на постоянное повышение их надежности, они могут выходить из строя, как и другие устройства, созданные человеком. Программные обеспечения, созданные людьми способны ошибаться. Примеры:
Компьютерная система ПВО США однажды объявила ядерную тревогу, приведя в боевую готовность армию, причиной послужил чип ценой 46 центов. В 1983 году произошло наводнение в юго-западной части США, причиной стал компьютер, в который были введены неверные сведения о погоде, в результате чего он дал сигнал шлюзам, перекрывающим реку Колорадо.
Конструкторы и разработчики аппаратного и программного обеспечения прилагают немало усилий, чтобы обеспечить защиту от:
сбоев оборудования;
случайной потери или изменения информации хранящейся в компьютере;
преднамеренного искажения (вирусы);
несанкционированного доступа, ее искажения, изменения, распространения.
Последнее время добавилась проблема компьютерной преступности, грозящей привести проблемы политические, экономические, последствия которых трудно предсказать.
ИЗМЕРЕНИЕ ИНФОРМАЦИИ
Единицы измерения информации
Бит принятая единица измерения информации, принимающая значение 0 или 1.
1 байт = 8 бит
1 Кбайт = 210 =1024 байт
1 Мбайт = 210 =1024 Кбайт
1 Гбайт = 210 =1024 Мбайт
Существуют различные способы определения количества информации: объемный, содержательный, алфавитный, комбинаторный, вероятностный, алгоритмический способы. Самым простым является объемный.
Объемный способ измерения количества информации
Он заключается в простом подсчете количества символов в тексте, сообщении.
В дальнейшем будем рассматривать текст, состоящий из 1 и 0 . В технике информацией считается любая хранящаяся, обрабатываемая или передаваемая последовательность знаков, символов. Объемный способ измерения информации основан на подсчете числа символов в сообщении, то есть, связан с его длиной и не учитывает его содержание. Смысловое содержание при объемном способе измерении информации не играет никакой роли. Поэтому термин количества информации в данном случае не уместен. Разумнее говорить об информационном объеме сообщения, его информационной длине. Абсолютизация использования объемного способа измерения информации может привести к следующим недоразумениям. Предположим, что нами подучен текстовый файл некоторого объема. Используем какой-либо архиватор и сожмем файл до меньшей длины. Каждый бит не сжимаем, а их совокупность сжимается. Запишем два раза подряд одно и тоже сообщение. Повтор не несет информацию, но информационный объем увеличивается вдвое. Эти примеры показывают недопустимость и некорректность использования во многих случаях объемного метода измерения количества информации.
Алгоритмический способ измерения количества информации
Пусть имеется вся та же последовательность нулей и единиц. Необходимо определить какое количество информации содержится в данной последовательности. В рассматриваемом способе ответ на этот вопрос будет зависеть от структуры приемника информации, его возможности анализировать в соответствии с какими-либо алгоритмами. Вместо того чтобы непосредственно воспроизвести саму последовательность 0 и 1 будем пытаться записать и передавать данные и инструкции, руководствуясь которыми получатель воспроизведет ту же последовательность. Поступая таким образом, мы придем к понятию алгоритмическая сложность, приведенную Колмогоровым в 1965 году. Алгоритмическая сложность некоторой последовательности данных определяется как минимальная длина вычисляемого алгоритма. Длина алгоритма может быть измерена в тех же битах. Если последовательность данных регулярна, например, периодична, то ее не составит труда сжать. По мере роста длины последовательности, длина алгоритма будет расти медленнее.
Содержательный подход
Количество информации, заключенное в сообщении, определяется объемом знаний, который несет это сообщение получающему его человеку. Сообщение содержит информацию для человека, если заключенные в нем сведения являются для этого человека новыми и понятными и, следовательно, пополняют его знания.
При содержательном подходе возможна качественная оценка информации: полезная, безразличная, важная, вредная. Одну и ту же информацию разные люди могут оценить по разному.
Единица измерения количества информации называется бит. Сообщение, уменьшающее неопределенность знаний человека в два раза, несет для него один бит информации.
Пусть в некотором сообщении содержаться сведения о том, что произошло одно из N равновероятных событий (равновероятность обозначает, что ни одно событие не имеет преимуществ перед другими). Тогда количество информации, заключенное в этом сообщении, - X бит и число N связаны формулой:
2x=N
Данная формула является показательным уравнением относительно неизвестной X. Из математики известно, что решение такого уравнения имеет вид:
X=log2N
Логарифм от N по основанию 2. Если N равно целой степени двойки (2, 4, 8, 16 и т.д.), то такое уравнение можно решить “в уме”. В противном случае количество информации становиться нецелой величиной, и для решения задачи придется воспользоваться таблицей логарифмов, которая приведена в Приложении 1.
Пример: При бросании монеты сообщение о результате жребия (например, выпал орел) несет один бит информации, поскольку количество возможных вариантов результата равно двум (орел и решка). Оба эти варианта равновероятны. Ответ может быть получен из решения уравнения:
2x=2, откуда, очевидно, следует: x=1 бит.
Вывод: в любом случае сообщение об одном событии из двух равновероятных несет один бит информации.
Алфавитный подход
К измерению информации позволяет определить количество информации, заключенной в тексте. Алфавитный подход является объективным, то есть он не зависит от субъекта, воспринимающего текст.
Множество символов, используемых при записи текста, называется алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита. Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле i=log2N, где N мощность алфавита. Следовательно, в двух символьном алфавите каждый символ “весит” 1 бит (log22=1); в 4-х символьном алфавите каждый символ несет два бита информации (log24=2); в 8-ми символьном – три бита (log28=3) и т.д.
Один символ из алфавита мощностью 256 (log28) несет в тексте 8 битов информации. Такое количество информации называется байт. Алфавит из 256 символов используется для представления текстов в компьютере. Один байт равен восемь бит.
Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен: I=K*i, где i – информационный вес одного символа в используемом алфавите.
Пример: Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге?
Решение: Мощность компьютерного алфавита равна 256. 1 символ несет 1 байт информации. Значит, страница содержит 40*60=2400 байт информации. Объем всей информации в книге (в разных единицах):
2400*150=360000 байт.
360000/1024=351,5625 Кбайт.
351,5625/1024=0,34332275 Мбайт.
Вероятностный способ измерения количества информации
Предположим, что в результате проведения опыта может наступить одно из возможных N событий. Все события равновероятны, независимы. Неопределенность H результатов эксперимента принято характеризовать, как логарифм числа возможных равновероятностных исходов.
H=log2N Эту величину называют энтропией.
После проведения опыта наступившее событие оказывается достоверным, число N редуцирует к 1. Логарифм 1 равен 0. Разность двух неопределенностей до и после проведения опыта это и есть информация, содержащаяся в сообщении.
I=log2N=-log21/N=-13 EMBED Equation.3 1415log21/N формула Хартли13 EMBED Equation.3 141513 EMBED Equation.3 1415
Здесь 1/N-вероятность наступления одного какого-либо события. При этом возникает ряд вопросов относительно введения неопределенности или информационной энтропии опыта:
1) Почему неопределенность характеризуется не самой величиной, а ее логарифмом?
2) Почему основание равно двум?
Ответ на 1 вопрос достаточно прост: чтобы введенная величина I обладала аддитивными свойствами. Величина N имеет мультипликативные свойства. Ставим два опыта со случайными исходами. Число возможных исходов составляет N1 и N2. Ясно, что информацию, которую мы получим, узнав результаты начала 1,а затем и 2 опыта должна быть равной сумме информации: I=I1+I2
Но с другой стороны можно рассматривать последовательность из двух опытов как один, причем общее число исходов такого опыта равно:
N=N1+N2
Кроме того, взятие логарифма позволяет оперировать не с очень большими величинами N.
На второй вопрос ответить не сложно. Уменьшим N до минимально возможного числа. До двух, меньше оно не может быть. В противном случае мы получим не опыт со случайным исходом, а жестко заданный детерминированный процесс.
Обобщение формулы Хартли на случай исхода с неравными вероятностями сделана Клодом Шенноном в 1948 г. Это обобщение базируется на том, что событие с большим информационным содержанием это неожиданные события. Ее неожиданность есть величина обратная вероятности наступления события. Для обозначения вероятности из N событий введем величину Pi, где I=1, 2, , N, тогда получим формулу Шеннона:
I=13 EMBED Equation.3 1415log2Pi
Рассмотрим случай, когда N=2, P1=0,1, P2=0,9
I=0,1-log26,1+0,9log20,9=0,49 бит
Этот пример показывает, что ни о какой минимальности информации в 1 бит речи быть не может.
IV. Выполнение заданий.
2004А2. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения: "Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог".
1) 108 бит 2) 864 бита 3) 108 килобайт 4) 864 килобайта.
Решение. Поскольку в тексте содержится 108 символов (считая все пробелы и знаки препинания), а каждый символ кодируется 1 байтом, то получаем 108 * 1 байт = 108 байт = 108 * 8 бит = 864 бита.
Ответ № 2.
2004A3. Шахматная доска состоит из 64 полей: 8 столбцов на 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
1) 4; 2) 5; 3) 6; 4) 7.
Решение. Необходимо представить 64 разных кода. 64 = 26. Следовательно, минимальная длина необходимой кодовой комбинации составляет 6 бит
Ответ № 3.
2004А4. Получено сообщение, информационный объем которого равен 32 битам. Чему равен этот объем в байтах?
1) 5; 2) 2; 3) 3; 4) 4.
Решение. В одном байте 8 бит.
Ответ:№ 4.
2004А16. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых из трех). Эти коды представлены в таблице:
а
b
с
d
е
000
110
01
001
10
Определите, какой набор букв закодирован двоичной строкой 1100000100110.
1) baade; 2) badde; 3) bacde; 4) bacdb.
Решение. При кодировании текста кодом переменной длины правильная комбинация позволяет однозначно интерпретировать закодированный текст. Выполним разделение комбинации на коды отдельных символов: 110 000 01 001 10. Таким образом, получаем: bacde.
Ответ № 3.
2005А2. Сколько существует различных последовательностей из символов "плюс" и "минус" длиной ровно в пять символов?
1) 64; 2) 50; 3) 32; 4) 20.
Решение. Очевидно, что различных комбинаций из символов "плюс" и "минус" длиной ровно в пять символов существует ровно столько же, сколько и соответствующих двоичных кодов той же длины, т.е. 25=32.
Ответ № 3.
Домашнее задание.
Р. Р. Сулейманов, И.Г. Ишемгулова. Информатика: Информация. Кодирование информации. Измерение информации.
Рабочая тетрадь Стр.12-19
Выполнить задания стр.21 2005-А3, 2005-А13, 2006-В1
Источник
Кодирующее устройство
Канал связи
Декодирующее устройство
Приемник
Защита от шумов
Помехи
«Черный Ящик»
обработка информации
Входная информация
Выходная информация