Представление текстовой информации в компьютере (8 класс)
Урок по теме: Представление текстовой информации в компьютере (8 класс)
Цель урока:
сформировать у учащихся представление о том, как в компьютере кодируется текстовая информация.
Учащиеся должны научиться:
кодировать и декодировать символы с помощью таблицы кодов;
находить информационный объем текстов и сообщений.
Программно-дидактическое обеспечение: ПК, таблицы кодов, текстовый редактор, калькулятор.
Постановка целей урока.
Как кодируются символы в компьютере? Почему именно так, а не иначе?
Всегда ли разные компьютеры «понимают» друг друга? Почему?
Сколько текстов поместится на дискете? А на жестком диске?
Актуализация знаний.
Как в компьютере кодируются символы?
Что такое «компьютерный алфавит»? Какова его мощность?
Чему равен информационный объем одного символа компьютерного алфавита?
Почему иногда текст, состоящий из букв русского алфавита, полученный с другого компьютера, мы видим на своем компьютере в виде "абракадабры"?
Изложение нового материала.
Компьютеры не самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации.
Таблица кодирования ASCII.
А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.
Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите его мощностью.
Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 в 8 степени равно 256. 8 битов = 1 байт, следовательно:
Один символ в компьютерном тексте занимает 1 байт памяти.
Как мы выяснили, традиционно для кодирования одного символа используется 8 бит. И, когда люди определились с количеством бит, им осталось договориться о том, каким кодом кодировать тот или иной символ, чтобы не получилось путаницы, т.е. необходимо было выработать стандарт – все коды символов сохранить в специальной таблице кодов. В первые годы развития вычислительной техники таких стандартов не существовало, а сейчас наоборот, их стало очень много, но они противоречивы. Первыми решили эти проблемы в США, в институте стандартизации. Этот институт ввел в действие таблицу кодов ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США).
Рассмотрим таблицу кодов ASCII.
Пояснение: раздать учащимся распечатанную таблицу кодов ASCII.
Таблица ASCII разделена на две части. Первая – стандартная – содержит коды от 0 до 127. Вторая – расширенная – содержит символы с кодами от 128 до 255.
Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы.
Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам.
Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы.
Стандартная часть таблицы кодов ASCII
Если вы внимательно посмотрите на обе части таблицы, то увидите, что все буквы расположены в них по алфавиту, а цифры – по возрастанию. Этот принцип последовательного кодирования позволяет определить код символа, не заглядывая в таблицу.
Коды цифр берутся из этой таблицы только при вводе и выводе и если они используются в тексте. Если же они участвуют в вычислениях, то переводятся в двоичную систему счисления.
Коды национального (русского) алфавита
расширенной части таблицы ASCII
Альтернативные системы кодирования кириллицы.
Тексты, созданные в одной кодировке, не будут правильно отображаться в другой. В настоящее время для поддержки букв русского алфавита (кириллицы) существует несколько кодовых таблиц (кодировок), которые используются различными операционными системами, что является существенным недостатком и в ряде случаев приводит к проблемам, связанным с операциями декодирования числовых значений символов.
Для разных типов ЭВМ используются различные кодировки:
В настоящее время существует 5 кодовых таблиц для русских букв: Windows (СР(кодовая страница)1251), MS – DOS (СР(кодовая страница)866), KOИ – 8 (Код обмена информацией, 8-битный) (используется в OS UNIX), Mac (Macintosh), ISO (OS UNIX).
Одним из первых стандартов кодирования кириллицы на компьютерах был стандарт КОИ-8.
Национальная часть кодовой таблицы стандарта КОИ8-Р
В настоящее время применяется и кодовая таблица, размещенная на странице СР866 стандарта кодирования текстовой информации, которая используется в операционной системе MS DOS или сеансе работы MS DOS для кодирования кириллицы.
Национальная часть кодовой таблицы СР866
В настоящее время для кодирования кириллицы наибольшее распространение получила кодовая таблица, размещенная на странице СР1251 соответствующего стандарта, которая используется в операционных системах семейства Windows фирмы Microsoft.
Национальная часть кодовой таблицы СР1251
Во всех представленных кодовых таблицах, кроме таблицы стандарта Unicode, для кодирования одного символа отводится 8 двоичных разрядов (8 бит).
В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).
N = 2i
2i = 216 = 65536
N = 65536 N – мощность алфавита символов в кодовой таблице Unicode.
i – информационный вес символа
Основополагающая таблица использования кодового пространства Unicode
Начало области
Конец области
Набор символов
Начало области
Конец области
Набор символов
0000
007F
Basic Latin
2150
218F
Number Forms
0080
00FF
Latin-1 Supplement
2190
21FF
Arrows
0100
017F
Latin Extended-A
2200
22FF
Mathematical Operators
0180
024F
Latin Extended-B
2300
23FF
Miscellane
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·FFEF
Halfwidth and Fullwidth Forms
2100
214F
Letterlike Symbols
FFF0
FFFD
Specials
Использование Unicode значительно упрощает создание многоязычных документов, публикаций и программных приложений.
Рассмотрим примеры.
Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех пяти кодировках. Воспользуемся компьютерным калькулятором для перевода чисел из десятичной в шестнадцатеричную систему счисления.
Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц:
КОИ8-Р: 252 247 237
СР1251: 221 194 204
СР866: 157 130 140
Мас: 157 130 140
ISO: 205 178 188
Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:
КОИ8-Р: FC F7 ED
СР1251: DD C2 CC
СР866: 9D 82 8C
Мас: 9D 82 8C
ISO: CD B2 BC
Определить числовой код символа в кодировке Unicode с помощью текстового редактора Microsoft Word.
В операционной системе Windows запустить текстовый редактор Microsoft Word.
В текстовом редакторе Microsoft Word ввести команду [Вставка-Символ]. На экране появится диалоговое окно Символ. Центральную часть диалогового окна занимает фрагмент таблицы символов.
Для определения числового кола знака кириллицы с помощью раскрывающегося списка Набор: выбрать пункт кириллица.
Для определения шестнадцатеричного числового кода символа в кодировке Unicode с помощью раскрывающегося списка из: выбрать тип кодировки Юникод (шестн.).
В таблице символов выбрать символ Э. В текстовом поле код знака : появится его шестнадцатеричный числовой код (в данном случае 042D).
Закрепление изученного материала.
Решение задач.
Используем кодировочные таблицы
№1
Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
Password;
Windows;
Информация;
Paint.
Решение:
Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)
Password 80 97 115 115 119 111 114 100.
Windows 87 105 110 100 111 119 115.
Информация 200 237 244 238 240 236 224 246 232 255
Paint 80 97 105 110 116
Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.
80 97 115 115 119 111 114 100 50 61 73 73 77 6F 72 64
87 105 110 100 111 119 115 57 69 6E 64 6F 77 73
200 237 244 238 240 236 224 246 232 255 C8 ED F4 EE F0 EC E0 F6 E8 FF
80 97 105 110 116 50 61 69 6E 74
Ответ:
50 61 73 73 77 6F 72 64
57 69 6E 64 6F 77 73
C8 ED F4 EE F0 EC E0 F6 E8 FF
50 61 69 6E 74
№2
Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
54 6F 72 6E 61 64 6F; (Tornado)
49 20 6С 6F 76 65 20 79 6F 75; (I love you)
32 2A 78 2B 79 3D 30. (2+x+y=0)
Не используем кодировочные таблицы
№1
Буква «I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107?
Решение:
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.
Десятичный код
105
106
107
108
109
110
Латинская буква
i
j
k
l
m
n
Ответ: Закодировано слово «link»
№2
Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:
1) file; 2) help?
Решение:
Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:
Десятичный код
101
102
103
104
105
106
107
108
109
110
111
112
Латинская буква
e
f
g
h
i
j
k
l
m
n
o
p
Ответ:
102 105 108 101
104 101 108 112
Используем ПО (текстовый редактор Блокнот).
Блокнот позволяет работать с текстами в кодировках ANSI и Unicode, а также выполнять преобразование из одного формата в другой. Для этого при сохранении документа выберите нужную кодировку в соответствующем поле.
№1
Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:
а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110;б) 01001001 01000010 01001101;в) 01000101 01101110 01110100 01100101 01110010
Решение:
1. Переведите коды из двоичной системы счисления в десятичную.а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 85 112 32 38 32 68 111 119 110 б) 01001001 01000010 01001101 73 66 77 в) 01000101 01101110 01110100 01100101 01110010 69 110 116 101 1142. Запустите текстовый редактор Блокнот.3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква. а) 85 112 32 26 32 68 111 119 110 Up & Down;б) 73 66 77 IBM;в) 69 110 116 101 114 Enter
Ответ: Up & Down; IBM; Enter
№2.
Декодируйте следующие тексты, заданные десятичным кодом:
087 111 114 100;
068 079 083;
080 097 105 110 116 098 114 117 115 104.
Решение:
Запустите текстовый редактор Блокнот. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
087 111 114 100 Word;
068 079 083 DOS;
080 097 105 110 116 098 114 117 115 104 Paintbrush.
Ответ: Word; DOS; Paintbrush.
Итоги урока
Оцениваем работу класса. Отмечаем отличившихся учащихся.
Домашнее задание
Уровень знания:
Как кодируется текстовая информация?
Где можно найти коды символов?
Почему существует несколько таблиц кодов? Чем они отличаются друг от друга?
Уровень понимания:
Заполните таблицу:
Двоичный код
Десятичный код
Символы
ASCII
KOИ-8
Windows 1251
ISO
Unicode
10000001
11000101
11100010
11101011
11110000
11111000
11111101
11111101
Какие последовательности букв будут записаны в кодировках Windows (СР) 1251 и КОИ-8 и соответствовать слову «СИМВОЛ», записанному в кодировке ASCII.
Рисунок 715