Принципы построения опознавательных логистических систем почтовой связи

Общие сведения о системах распознавания образов

Построение современных автоматизированных производств, автоматизированных складов, автоматизированных систем учета и контроля, автоматизированных сортировочных центров требует автоматической идентификации тех или иных образов (товаров, деталей, ПО и т.д.).

Среди систем распознавания образов место занимают системы распознавания графических изображений. На базе именно таких систем построено подавляющее большинство опознавательных систем автоматизированных промышленных производств.

Сейчас одними из самых распространенных систем распознавания графических изображений является опознавательные системы почтовой связи, предназначенные для автоматизации сложных операций обработки ПО, в частности, их сортировки.

Согласно современным воззрениям распознавания образов подается в виде преобразований, приведенных на рис. 5.7.

Представление распознавания образов в виде преобразований

Рисунок 5.7 - представление распознавания образов в виде преобразований

Множество образов составляет некоторую совокупность объектов, относящихся к той или иной области исследования, например, графические изображения, звуковые сигналы, диагнозы болезней и т.д.

Указанные образы подвергаются анализу, в процессе которого выполняется их описание на языке заранее выбранной системы признаков. В качестве признаков могут быть физические параметры образов (масса, габариты, форма, температура); их относительные характеристики (большой - маленький, высокий - низкий, толстый - тонкий) характерные признаки (печатный, рукописный) и т.д.

Выбор системы признаков - сложная и ответственная задача, в общем случае неформализованная. В любом случае система признаков должна обеспечивать различные описания множества распознаваемых образов.

Полученная множество наборов признаков (описаний образов) синтезируется (классифицируется), то есть относится к тому или иному заранее определенного основного класса согласно некоторым решающих правил или определяется, что она не относится ни к одному из этих классов, то есть классифицируется как дополнительный заранее неопределенный класс .

Решающие правила обычно обеспечивают оптимальность принятия решений в соответствии с заданными критериями оптимальности, например, минимального риска, минимальной ошибки и тому подобное.

В реальных системах распознавания , то есть, как в результате анализа, так и в результате синтеза происходит сжатие информации о распознаваемый образ. Это означает, что практически ничем не ограничено множество реальных образов разбивается множеством их описаний на т подмножеств, не пересекаются, каждый из которых может рассматриваться как некий обобщенный образ, который подает реальные образы с признаками, совпадают. В свою очередь, каждый конкретный класс включает некоторое множество описаний образов, которые являются представителями этого класса, а класс - множество описаний образов, которые не являются представителями одного из этих классов.

Опознавательные системы почтовой связи предназначены, главным образом, для решения задач автоматической сортировки ПО, включающие задачи поиска лицевой стороны ПО, определение местоположения адресной информации на лицевой стороне ПО, считывания и распознавания указанной информации. Как адресная информация обычно выступает цифровой ПИ, который наносится отправителем или оператором почтовой связи в специально выделенном месте на лицевой стороне ПО. В результате, как образы (объекты распознавания) выступают графические изображения (конфигурации) арабских цифр и некоторые специальные метки (реперы), наносимые типографским способом на конверты, карточки или адресные ярлыки, которые наклеиваются на посылки, бандероли или пачки прессы, и позволяют находить лицевую сторону ПО и определять местоположение ПИ.

Учитывая, что параметры цифр ПИ, особенно рукописных, таких как конфигурации и размеры цифр, цвет, толщина и контрастность линий, разрывы линий, помехи, отклонение линий от рекомендованных или средних значений, деформации, смещения и повороты цифр, выходы цифр за ограничительные рамки, испорченные, зачеркнутые, исправлены и приведены цифры, отсутствие цифр ПИ, посторонние записи в поле ПИ и т.д. носят вероятностный характер, любое описание с той или иной вероятностью может быть представителем любого из классов (рис. 5.8).

К сказанному следует добавить доступность изображений цифр ПИ к так называемым аффинных искажений (поворот, сдвиг и масштабирование изображений в плоскости, перпендикулярной оптической оси считывающего устройства).

Указанные обстоятельства приводят к существенному усложнению опознавательных систем почтовой связи и обуславливают целесообразность их построения на базе ЭВМ.

Относительно АЛСМ распознавания графических изображений является задачей отнесения каждой цифры ПИ к одному из десяти классов арабских цифр или выявления того, что указанная цифра не принадлежит ни одному из этих классов (отказ от распознавания).

Каждое изображение R , что распознается, характеризуется набором признаков , которые выбираются на основе статистических исследований, опыта, удобства выделения и других факторов.

Вероятностный характер преобразований в процессе распознавания образов

Рисунок 5.8 - Вероятный характер преобразований в процессе распознавания образов

Различные алгоритмы распознавания цифр используют как признаки: штрихи (горизонтальные, вертикальные, наклонные); контуры (замкнутые, разомкнутые) количество пересечений знака вертикальными, горизонтальными или наклонными линиями; топологические признаки (начало и конец линий, разветвления и соединения линий, пересекающихся линий) метрические признаки (расстояния между элементами знака, размеры отдельных элементов).

При распознавании графической информации, в частности, цифр ПИ, используются понятия сходства и различия образов, распознаются. Набор признаков , каждая из которых приобретает определенные дискретные значения, создает некоторое m-мерный векторное пространство признаков, каждая координата которого представляет один признак, а каждая точка - один образ. Если ввести определенную степень близости между точками этого m-мерного векторного пространства (например, евклидову или расстояние Хемминга), то сходство или различие образов будет определяться значениями этого расстояния.

Образы с малой отличием признаков занимают малый (компактный) объем пространства признаков, а с большой - большой объем этого пространства, не имеют четких границ (расплывчатые). Наиболее компактными является изображение цифр ПИ, нанесенные типографским способом, наиболее расплывчатыми - нанесенные человеком от руки. На рис. 5.9 приведен пример цепочки переходов образов с одних классов в другие.

Пример переходов образов с одних классов в другие

Рисунок 5.9 - Пример переходов образов с одних классов в другие

Задача построения дееспособной отличительной системы неизбежно требует резкого сужения характеристических объемов рукописных цифр в пространстве признаков.

Для упрощения опознавательных систем почтовой связи вводятся некоторые ограничения на местоположение, размеры и (или) формы написания цифр ПИ. Широкое распространение получили системы распознавания так называемых стилизованных и нормализованных цифр ПИ. В системах распознавания стилизованных рукописных цифр вводятся ограничения на местоположение, размеры и формы написания цифр, в системах распознавания нормализованных рукописных цифр - только на местоположение и размеры цифр.

При цитировании материалов в рефератах, курсовых, дипломных работах правильно указывайте источник цитирования, для удобства можете скопировать из поля ниже:

Поделиться материалом

Содержание