Сканирование и распознавание изображений»
МИНОБРНАУКИ РОССИИ
Борисоглебский филиал
федерального государственного бюджетного образовательного учреждения
высшего образования
«Воронежский государственный университет»
Факультет физико-математического и естественно – научного образования
Кафедра прикладной математики, информатики,
Физики и методики их преподавания
Отчёт по научно-исследовательской практике
«Сканирование и распознавание изображений»
Выполнила: студентка 5 курса 2 группы
заочного отделения
Белева С.С
Проверил: Тараканов А.Ф.
Борисоглебск - 2015Содержание
Введение
Сканер. Характеристики сканера
Сканирование
Распознавание текстов и изображений
Применение сканирования
Заключение
Список используемых источников
Введение
Одним из основных способов ввода информации в вычислительные системы является сканирование. Именно сканер стал тем устройством, с помощью которого в компьютер попадает огромное количество информации.
С помощью современной аппаратуры сканирования с высоким разрешением исходного документа довольно просто формируется графический файл специального формата. Такой файл после соответствующей обработки может быть преобразован в любой из форматов, которые применяются в информационных технологиях. Это форматы представления текстов и графических видов информации - фотографий, слайдов, рисунков и т.п.
Преобразование документа в электронный вид делится на два этапа: получение графического образа документа и перевод графического образа в текстовый формат. Графический образ документа является результатом сканирования. Перевод графического образа документа в текстовый формат может быть произведен вручную или посредством автоматического распознавания.
Говоря о сканировании, вспомним, что же такое сканер? А так же рассмотрим основные характеристики сканеров.
Сканер. Характеристики сканера
Скамнер (англ. scanner) - устройство, выполняющее преобразование расположенного на плоском носителе (чаще всего бумаге) изображения в цифровой формат.
В 1857 году флорентийский аббат Джованни Казелли (итал. GiovanniCaselli) изобрёл прибор для передачи изображения на расстояние, названный впоследствии пантелеграф. Передаваемая картинка наносилась на барабан токопроводящими чернилами и считывалась с помощью иглы.
В 1902 году, немецким физиком Артуром Корном (нем. ArthurKorn) была запатентована технология фотоэлектрического сканирования, получившая впоследствии название телефакс. Передаваемое изображение закреплялось на прозрачном вращающемся барабане, луч света от лампы, перемещающейся вдоль оси барабана, проходил сквозь оригинал и через расположенные на оси барабана призму и объектив попадал населеновый фотоприёмник. Эта технология до сих пор применяется в барабанных сканерах.
В дальнейшем, с развитием полупроводников, усовершенствовался фотоприёмник, был изобретен планшетный способ сканирования, но сам принцип оцифровки изображения остаётся почти неизменным.
Основные характеристики сканеров.
Оптическое разрешение. Является основной характеристикой сканера. Сканер снимает изображение не целиком, а по строчкам. По вертикали планшетного сканера движется полоска светочувствительных элементов и снимает по точкам изображение строку за строкой. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Оно определяется количеством светочувствительных элементов (фотодатчиков), приходящихся на дюйм горизонтали сканируемого изображения. Обычно его считают по количеству точек на дюйм - dpi (dotsperinch). Нормальный уровень разрешение не менее 600 dpi, увеличивать его еще дальше - значит, применять дорогую оптику, дорогие светочувствительные элементы, и увеличивать время сканирования. Для обработки слайдов необходимо более высокое разрешение 1200 dpi.
Разрешение по X. Этот параметр показывает количество пикселей у фоточувствительной линейки, из которых формируется изображение. Разрешение является одной из основных характеристик сканера. Большинство моделей имеет оптическое разрешение сканера 600 или 1200 dpi (точек на дюйм). Его достаточно для получения качественной копии. Для профессиональной работы с изображением необходимо более высокое разрешение.
Разрешение по Y. Этот параметр определяется величиной хода шагового двигателя и точностью работы механики. Механическое разрешение сканера значительно выше оптического разрешения фотолинейки. Именно оптическое разрешение линейки фотоэлементов будет определять общее качество отсканированного изображения.
Скорость сканирования. Скорость сканирования зависит от разрешения при сканировании и от размера оригинала. Обычно производители указывают этот параметр для формата А4. Скорость сканирования может измеряться количеством страниц в минуту или временем, необходимым для сканирования одной страницы. Иногда измеряется в количестве сканируемых линий в секунду.
Глубина цвета. Как правило, производители указывают два значения для глубины цвета - внутреннюю глубину и внешнюю. Внутренняя глубина - это разрядность АЦП (аналого-цифрового преобразователя) сканера, она указывает на то, сколько цветов сканер способен различить в принципе. Внешняя глубина - это количество цветов, которое сканер может передать компьютеру. Большинство моделей используют для цветопередачи 24 бита (по 8 на каждый цвет). Для стандартных задач в офисе и дома этого вполне достаточно. Но если вы собираетесь использовать сканер, для серьезной работы с графикой, попробуйте найти модель с большим числом разрядов.
Максимальная оптическая плотность. Максимальная оптическая плотность у сканера - это оптическая плотность оригинала, которую сканер отличает от 'полной темноты'. Чем больше это значение, тем больше чувствительность сканера и, тем выше качество сканирования темных изображений.
Тип источника света. Ксеноновые лампы отличаются малым временем прогрева, долгим сроком службы и небольшими размерами. Флуоресцентные лампы с холодным катодом дешевы в производстве и имеют долгий срок службы. Светодиоды (LED) обладают малыми размерами, низким энергопотреблением и не требуют времени для прогрева. Но по качеству цветопередачи LED-сканеры уступают сканерам с флуоресцентными и ксеноновыми лампами.
Тип датчика сканера. В сканерах МФУ обычно используется один из двух типов датчиков: контактный (CIS) или ПЗС (CCD). CIS представляет собой линейку фотоэлементов, которая равна ширине сканируемой поверхности. Во время сканирования она перемещается под стеклом и строка за строкой передает информацию об изображении на оригинале в виде электрического сигнала. Для освещения обычно используются светодиоды, которые расположены в непосредственной близости от фотолинейки на той же подвижной платформе. Сканеры на базе CIS имеют простую конструкцию, тонкий корпус и небольшой вес, они обычно дешевле сканеров на базе CCD. Основной недостаток CIS состоит в малой глубине резкости.
Виды сканеров.
планшетные - наиболее распространённый вид сканеров, поскольку обеспечивает максимальное удобство для пользователя - высокое качество и приемлемую скорость сканирования. Представляет собой планшет, внутри которого под прозрачным стеклом расположен механизм сканирования;
ручные - в них отсутствует двигатель, следовательно, объект приходится сканировать пользователю вручную, единственным его плюсом является дешевизна и мобильность, при этом он имеет массу недостатков - низкое разрешение, малую скорость работы, узкая полоса сканирования, возможны перекосы изображения, поскольку пользователю будет трудно перемещать сканер с постоянной скоростью;
листопротяжные - лист бумаги вставляется в щель и протягивается по направляющим роликам внутри сканера мимо лампы. Имеет меньшие размеры, по сравнению с планшетным, однако может сканировать только отдельные листы, что ограничивает его применение в основном офисами компаний. Многие модели имеют устройство автоматической подачи, что позволяет быстро сканировать большое количество документов;
планетарные сканеры - применяются для сканирования книг или легко повреждающихся документов. При сканировании нет контакта со сканируемым объектом (как в планшетных сканерах). Подробности на английском языке;
книжные сканеры - предназначены для сканирования брошюрованных документов. Сканирование производится лицевой стороной вверх - таким образом, Ваши действия по сканированию неотличимы от перелистывания страниц при обычном чтении. Это предотвращает их повреждение и позволяет пользователю видеть документ в процессе сканирования;
слайд-сканеры - как ясно из названия, служат для сканирования плёночных слайдов, выпускаются как самостоятельные устройства, так и в виде дополнительных модулей к обычным сканерам;
сканеры штрих-кода - небольшие, компактные модели для сканирования штрих-кодов товара в магазинах.
Принцип действия
Сканируемый объект кладется на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на чувствительную матрицу, далее на АЦП и передается в компьютер. За каждый шаг двигателя сканируется полоска объекта, которые потом объединяются программным обеспечением в общее изображение.
Изображение всегда сканируется в формат RAW - а затем конвертируется в обычный графический формат с применением текущих настроек яркости, контрастности, и т. д. Эта конвертация осуществляется либо в самом сканере, либо в компьютере - в зависимости от модели конкретного сканера. На параметры и качество RAW-данных влияют такие аппаратные настройки сканера, как время экспозиции матрицы, уровни калибровки белого и чёрного, и т.п.
Сканирование
Для пользователей компьютеров единственным путём просмотра электронных файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.
Процесс сканирования изображения является лёгким и доступным и чаще всего работают со сканером, при использовании он является наиболее эффективным и разнообразным. Его широко используют для коммерческих целей, но любителям также нравится сканировать изображения, особенно если они увлекаются фотографиями. Также часто его используют в художественном творчестве, это заодно и весело, и полезно.
Обучающая программа по сканированию всегда доступна, как и для рисунка, так и для документов. Не для пользователей компьютеров единственным путём просмотра электронных файлов является сканирование изображения. Во время этого процесса сканер преобразовывает текст, графику листа и плёнку в цифровой образ, процесс преобразования может быть аналоговым и цифровым.
Для сканирования изображения нужно следовать нескольким основным шагам, для любого типа сканера или программного обеспечения метод сканирования фотографий на планшетном сканере один и тот же. Когда лампа светит на фотографию, оптические ячейки сканера фиксируют цвета, отражающиеся с точек изображения. Такими цветами являются красный, зелёный и синий. (КЗС).
Пиксель или элемент рисунка передаётся к каждой точке и измеряется в пикселях из расчёта на дюйм, это является разрешением образа. Три числа представляют каждый пиксель на образе, и эти числа показывают яркость красного, зелёного и синего компонента цвета. Итак, есть разные форматы изображения, и каждый формат хранит информацию о пикселях и цветах в разных вариантах.имеет значения, что вы хотите перенести в компьютер: текст или рисунок, вы должны знать, как работать со сканером. Обычно программное обеспечение объясняет все шаги детально, и сканировать изображения вы можете практически как цветным, так и чёрно- белым.
Пиксель или элемент рисунка передаётся к каждой точке и измеряется в пикселях из расчёта на дюйм, это является разрешением образа. Три числа представляют каждый пиксель на образе, и эти числа показывают яркость красного, зелёного и синего компонента цвета. Итак, есть разные форматы изображения, и каждый формат хранит информацию о пикселях и цветах в разных вариантах.
Сканирование документов - процесс создания электронного изображения бумажного документа, напоминает его фотографирование. На этапе сканирования производится получение изображения при помощи сканера и сохранение их в виде, удобном для последующей обработки.
Процесс сканирования осуществляется автоматически и требует от пользователя только вспомогательных операций, таких как смена сканируемой страницы.
Сканирование, как единый сквозной процесс, распадается на две независимых ветви. По одному направлению идёт ввод в вычислительные системы текстовых массивов информации, по другому - графических.
Задача сканирования текстов, при необходимом качественном разрешении, на 90% состоит в распознавании. А для этого разработано математическое обеспечение, которое позволяет эффективно построить технологию получения качественных электронных документов.
Чтобы реализовать автоматический или автоматизированный перевод бумажных документов в электронный вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов.
Распознавание текстов и изображений
Процесс распознавания изображений является сложной многоэтапной процедурой. Многоэтапность (иерархичность) обусловлена тем, что различные задачи обработки на самом деле тесно связаны и качество решения одной из них влияет на выбор метода решения остальных. Так выбор метода распознавания зависит от конкретных условий предъявления входных изображений, в том числе характера фона, других изображений, помеховой обстановки и связан с выбором методов предобработки, сегментации, фильтрации.
Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.
На этом шаге происходит идентификация документа и выделение его объектов (полей, пометок, штрихкодов и прочего), удаляются помехи, которые мешают распознаванию (например, разграфка). Далее происходит распознавание полей документа. Затем проводится оценка достоверности результатов распознавания, после чего производится обобщенный лингвистический анализ поля.
После распознавания может следовать специальная обработка его результатов на основании априорной лингвистической и структурной информации о поле. После этого принимается решение о достоверности результатов распознавания. В системе реализована схема, признающая поле недостоверным в случае наличия в нем хотя бы одного недостоверного символа. После этого происходит сохранение результатов распознавания во внутренний формат системы и выполняется контроль логической непротиворечивости данных.
Кроме всего этот этап выполняет дополнительные функции: автоматическое определение угла поворота страницы и его автоматическая коррекция.
Процесс распознавания полностью автоматический, не требует наличия оператора, при этом возможно распараллеливание распознавания в рамках локальной сети.
При необходимости, после распознавания документ передается на верификацию. Если же необходимости в верификации нет, распознанные данные могут экспортироваться во внешние информационные системы и базы данных.
Верификация документа: исправление ошибок заполнения и распознавания, подтверждение результатов распознавания «сомнительных» полей, просмотр полей, не прошедших логический контроль, и принятие решения о дальнейшей судьбе таких документов. На этом этапе оператор производит визуальный контроль результатов распознавания и принимает решение о дальнейшем маршруте документа. Процесс реализован в двухоконном редакторе форм. В одном окне показано изображение бумажного документа, в другом - электронная форма, содержащая распознанные данные.
Процесс верификации документа идет по следующей схеме. Оператору предъявляется изображение и электронная форма с распознанными данными. При этом поля, не прошедшие контроль достоверности и логической непротиворечивости, подсвечены цветом для привлечения внимания оператора. Оператор, перемещая фокус между полями электронной формы, видит диагностику ошибок и либо исправляет ошибку, либо, если ошибку нельзя исправить, принимает решение передать документ на этап обработки «плохих» документов. При передвижении по полям модуль автоматически подсвечивает рамку поля на изображении.
Для повышения эффективности работы оператора предусмотрены два режима: проход только по полям, не прошедшим контроль, и режим пропуска незаполненных полей. Кроме этого, если прикреплен словарь, содержащий допустимые значения для поля, то имеется возможность указать в описании поля необходимость предъявления словаря оператору и разрешить оператору вставлять в поле значения из словаря.
После окончания верификации документа оператору предлагается либо отложить его, либо передать на этап экспорта данных.
Возможно распараллеливание процесса верификации в рамках локальной сети. В крупных проектах массового ввода могут быть одновременно задействованы десятки операторов, выполняющих функцию верификации потока документов.
После верификации, данные могут экспортироваться во внешние информационные системы и базы данных.
Точность распознавания
Ключевым параметром систем распознавания, характеризующим их практическую ценность, является точность распознавания, то есть процент правильно распознанных символов.
OpticalCharacterRecognition - системы могут достигать наилучшей точности распознавания - свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому что, если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого-то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.
Точность распознавания падает за счет ошибок распознавания. Повышению точности распознавания способствует устранение указанных ниже причин ошибок.
Причины ошибок при распознавании
Встречающиеся в реальной жизни тексты обычно далеки от совершенства, и процент ошибок распознавания для "нечистых" текстов часто недопустимо велик. Грязные изображения - здесь наиболее очевидная проблема, потому что даже небольшие пятна могут затенять определяющие части символа или преобразовывать один в другой. Еще одной проблемой является неаккуратное сканирование, связанное с "человеческим фактором", так как оператор, сидящий за сканером, просто не в состоянии разглаживать каждую сканируемую страницу и точно выравнивать ее по краям сканера.
Если документ был ксерокопирован, нередко возникают разрывы и слияния символов. Любой из этих эффектов может заставлять систему ошибаться, потому что некоторые из OCR-систем полагают, что непрерывная область изображения должна быть одиночным символом.
Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR.
Более трудоёмкой является задача сканирования цветных изображений. Она обычно заключается в наиболее полном считывании информации с оригинала, т. е. его тонового и цветового диапазона, а также разрешения. При этом желательно по необходимости скорректировать недостатки оригинала с точки зрения последующего использования изображения. Например, компенсировать нежелательный цветовой сдвиг, тоновый дисбаланс или подавить полиграфический растр оригинала.
В настоящее время для решения этих задач многие фирмы производят соответствующее оборудование и разрабатывают математическое обеспечение. Однако именно в наличии большого количества возможностей и способов организовать технологический процесс сканирования и кроется главная опасность. Выбор определённого устройства и программ позволяет удовлетворительно и без перенастроек работать только со сравнительно небольшим диапазоном типов документов.
Применение сканирования
Применение сканеров имеет широкий диапазон и находится в постоянном развитии. Сканирование интенсивно используются в специализированных информационных технологиях. По сканированию текста наиболее полно наработан опыт в создании электронных библиотек Интернета. По второму направлению - цветной графики, давно работают в области полиграфии
Успешность применения сканеров зависит не только от их собственных качеств, но и от правильного их использования. Каждая из областей применения имеет свой собственный акцент и делает ударение на различные характеристики системы.
Настольные издательские системы (вы вводите в издаваемую статью рисунки, диаграммы, фотографии). В данном случае сканеры должны быть как минимум цветными, обладать высокой разрешающей способностью, широким диапазоном оптических плотностей, с числом передаваемых цветов 16 777 216 (24 бита на точку - 8 бит на каждый цвет RGB) и т.д.
Системы обработки документов (пакет оптического распознавания символов вместе со сканером научат ваш компьютер "читать" текст, экономия времени, которое тратится на ввод с клавиатуры). Сканеры, применяемые для этих целей не должны быть цветными, т.к. для сканирования текста необходимо регистрировать только два уровня - белый и черный (глубина точки 1 бит), высоких разрешающих способностей здесь тоже не требуется, а значит, стоимость сканера сильно снижается.
САПР (сканер + программа векторизации облегчает процесс ввода чертежей для дальнейшего их использования в пакетах автоматического проектирования). Нет необходимости применять здесь цветной сканер, но разрешающая способность должна быть достаточно высокой, чтобы косые линии не выглядели как ступеньки лестницы.
Системы компьютерной анимации. Здесь почти всю область применения занимают проекционные сканеры, обеспечивающие хорошее качество вводимых изображений и возможность ввода проекций трехмерных тел.
Системы для передачи информации (факс - модем + сканер = факс машина).
Заключение
Качество сканированного изображения определяется многими факторами. Такие как - тип сканируемого оригинала, технические возможности сканера, квалификация оператора сканера, размер оригинала, от которого зависит необходимая кратность увеличения, разрешение при сканировании, а также особенности любой обработки, примененной к изображению в ходе сканирования. Сканируете ли вы оригиналы самостоятельно, пользуетесь ли услугами сервисного бюро или агентства допечатной обработки, для успеха проектов в области печати нелишне детально представлять себе процесс получения сканированных изображений. Кроме того, если вы хотите, чтобы сканированные изображения имели высокое качество, до стадии сканирования необходимо в максимально возможной степени узнать о возможностях вывода изображения и специфике печати - размере выводимого изображения, а также параметрах печатного станка - пространственной частоте растра, типе бумаги, типе печатного станка, ограничениях на тоновый диапазон, а также ожидаемом увеличении размера растровой точки. Согласование характеристик сканирования и этих факторов гарантирует, что каждое сканированное вами изображение будет качественным.
Список используемых источников
1. http://www.microbs.ru/hardware_pc/scan.shtml
2. http://cognitiveforms.ru/technologies/
3. http://www.novojonov.ru/content/printable.aspx?key=soft-electronic-archive&file=08-scan-ocr
4. http://www.awella.ru/newsscanirovanie.php.htm
5. В.П. Леонтьев «Новейшая энциклопедия персонального компьютера 2003». - М.: «ОЛМА-ПРЕСС», 2003. - 920с.