Сегментация изображений для ИМР

С помощью системы технического зрения можно автоматизировать разнообразные технологические процессы - распознавание промышленных деталей, их сортировку, контроль размеров, укладку продукции в тару, контроль установки сверла или сварочной головки в заданное место контактной площадки и ряд других. Для решения подобных задач повсеместно проводится анализ трехмерных сцен с помощью двухмерных проекций - изображений, получаемых с помощью СТЗ.

Наибольшее распространение получили СТЗ, в которых видеодатчиками служат матрицы или линейки чувствительных элементов, а также электронно-лучевые трубки. Источником информации о состоянии поля зрения СТЗ служит световое поле, в общем случае неоднородное и нестационарное. С позиций зрительного восприятия световое поле в каждой точке пространства характеризуется яркостью, цветовым тоном и насыщенностью, которые могут меняться во времени. Световое поле можно описать также спектральной функцией потока излучения в направлении наблюдателя или распределением освещенности в плоскости чувствительного элемента видеодатчика. В подавляющем большинстве случаев на практике используются одноцветные (ахроматические) изображения, которые можно представить некоторой функцией в пространстве и времени, характеризующей яркость, освещенность, степень почернения фотопленки и т. д.

Для определенности будем рассматривать функции изображения В (х, у, t), характеризующие распределение яркости в поле зрения. С такими изображениями, обычно, работают промышленные СТЗ, снабженные телекамерами черно-белого монокулярного телевидения. На выходе телекамеры образуется видеосигнал, соответствующий распределению яркости в поле зрения D в дискретные моменты времени, синхронизируемые, например, с интервалом стандартной развертки. На базе значений видеосигнала формируется последовательность отсчетов, которые соответствуют значениям яркости, получаемой усреднением (сверткой) видеосигнала по некоторой окрестности (апертуре) точки (х, у). Максимально возможное число отсчетов при заданной апертуре образует растр поля зрения.

Использование цифровых методов обработки изображений предполагает в качестве необходимого этапа пространственную и яркостную дискретизацию непрерывного изображения В (х, у), т. е. замену координат его элементов дискретными значениями и квантование яркости этих элементов на определенное число уровней. В память вычислителя СТЗ информация об изображении обычно вводится в виде матрицы значений, заданной на целочисленной прямоугольной решетке, покрывающей область поля зрения D.

Входные изображения могут быть подвержены различного рода помехам, которые можно разделить на случайные и локальные. Случайные помехи называют также шумами. Они возникают на изображениях в результате нестабильности и сбоев в работе различных блоков СТЗ на отдельных этапах формирования и преобразования изображений. Шумы, искажают реальное изображение в отдельных, в основном разрозненных, точках области D. Локальные помехи связаны с тем, что в поле зрения видеодатчика имеются некоторые небольшие области, которые не интерпретируются ни как объекты, ни как фон. Это, в первую очередь, загрязнения, блики, сколки, пятна.

Наличие помех заставляет в ряде случаев начать с их подавления - сглаживания шумов и устранения локальных помех. Задача подавления помех входит, с одной стороны, в задачу улучшения изображений, а с другой - ее можно рассматривать как часть задачи сегментации. В задачах, связанных с СТЗ роботов, актуален именно второй аспект.

Конечной целью сегментации изображений является разбиение поля зрения D на области объектов Dі,..., D8 и область фона . Сегментация путем построения отображения называется методом разметки точек. Если же целью является построение отображения, то говорят о сегментации путем выделения границ.

Методы и алгоритмы сегментации можно рассматривать как формализацию понятия выделяемости объекта из фона или понятий, связанных g градиентом яркости. Надежность алгоритмов сегментации зависит от того, насколько точно и полно при этом учтена дополнительная информация, которая в основном состоит из следующих сведений:

- число объектов s;

- некоторые характеристики распределения яркости в областях объектов или фона, например экстремальные значения яркости, количество перепадов яркости;

- оценки яркостного перепада при переходе из области фона в область объектов;

- форма объектов;

- информация о том, какую, часть поля зрения занимает объединение областей объектов.

При цитировании материалов в рефератах, курсовых, дипломных работах правильно указывайте источник цитирования, для удобства можете скопировать из поля ниже:

Поделиться материалом