Архив публикаций

Тезисы

XXIII-ая конференция

Метод инвариантного переноса в приложении к распознаванию образов

Никулин В.Н., Багаев И.В., Канищев И.С.

Вятский государственный университет, ф-т экономики и менеджмента, кафедра ММЭ, Россия, 610000, г. Киров, ул. Московская, д.36

1 стр. (принято к публикации)

В компьютерной памяти фотография представима в виде цифровой матрицы. Рассмотрим пример из области морской биологии: проводится аэрофотосъёмка морской поверхности, на которой киты выступают в качестве объектов наблюдения. Имеется тренировочная база данных, включающая несколько тысяч фотоснимков, которые классифицированы относительно 447 образцов или классов. Задача состоит в построении модели для классификации независимой выборки из нескольких тысяч фотоснимков.

Основываясь на наших экспериментах, представляется логичным предположить, что фону (морской поверхности) соответствуют меньшие значения цифровой матрицы в сравнении с объектами (китами). Для нахождения центра объекта мы можем вычислить векторы средних (или стандартных отклонений) по горизонтали и вертикали. Затем найти точки максимумов, которые и выступают в роли координат центра интересующего нас объекта.

Отметим, что количество элементов цифровой матрицы превышает несколько миллионов. Эта информация должна быть сжата с тем, чтобы ускорить работу классификатора. Для этой цели мы можем применить несколько подходов: 1) статистический, 2) метод главных компонент и 3) метод, основанный на быстрых преобразованиях Фурье. Все эти методы используют в качестве входной информации прямоугольники сравнительно малой размерности как части основной цифровой матрицы. Предполагается, что центры прямоугольников близки к центрам основных объектов.

В случае статистического подхода мы вычисляем для каждого прямоугольника базовые статистические характеристики: 1) минимум, 2) максимум, 3) среднее, 4) медиана и 5) стандартное отклонение.

Следует отметить, что данная задача не является сбалансированной: количество наблюдений, соответствующих различным классам, ранжируется от 1 до 47. Для того, чтобы преодолеть эту проблему предлагается использовать метод инвариантного переноса. Суть этого метода состоит в следующем. Мы предполагаем, что разницы статистических характеристик (внутри конкретного класса) отражают такие явления как: 1) угол фотосъёмки, 2) расстояние до объекта, 3) движение объекта и 4) колебания морской поверхности. По этим причинам разницы статистических характеристик инвариантны в абсолютном понимании и могут быть использованы для генерации дополнительных наблюдений с тем, чтобы сделать тренировочную выборку сбалансированной.

В нашей работе мы использовали данные с платформы Kaggle.

открыть в PDF формате (на русском языке) (PDF)