English

Архив публикаций

Тезисы

XVI-ая конференция

Метод главных компонент для обработки данных спектроскопии комбинационного рассеяния при идентификации биоповреждений микромицетами.

Абрамов Е.Г., Панина Л.К.

Санкт-Петербургский государственный университет, Биолого-почвенный факультет, Лаборатория общей биофизики, Россия, 199034, Санкт-Петербург, Университетская наб., 7-9

1  стр. (принято к публикации)

На сегодняшний день существует множество приложений, где необходимо быстро идентифицировать агент биоповреждения. Существенные трудности возникают при обнаружении микромицетов, поскольку традиционные методики дорогостоящи, трудоемки и требуют значительного времени.

Для осуществления бесконтактной экспресс методики оценки природы агента было предложено использовать спектроскопию комбинационного рассеяния. В качестве математической основы для предварительной обработки спектров положен метод главных компонент. Он позволяет существенно сократить исходное пространство данных, размерность которого представлена числом спектральных полос.

Поставленная задача (быстро дать заключение о природе разрушающего агента на основе спектра) на первом этапе включает обработку обучающей выборки, состоящую из известных штаммов культивируемых на некотором наборе материалов. Обработка обучающей выборки методом главных компонент дает матрицу нагрузок, используемую в дальнейшем для проекции спектров неизвестных агентов.

Показано, что проекция спектров на плоскость, выделенную из полученной матрицы нагрузок, уже позволяет делать предварительные заключения о природе агента. Применение большего числа собственных векторов выделенных из полученной матрицы нагрузок можно использовать в подготовке данных для дальнейшей их обработки нейросетевыми алгоритмами. Мерами длин векторов, выделенных из транспонированной матрицы нагрузок, можно характеризовать полосы спектра в смысле их вклада в расстояния между точками, представляющими собой спектры образцов в многомерном пространстве. Для более действенной (в смысле минимизации ошибок) обработки данных методом главных компонент был применен фильтр Савицкого-Голея.

Все этапы математической обработки реализованы в среде MATLAB при помощи написанных для этой цели функций.



© 2004 Дизайн Лицея Информационных технологий №1533