Выводы
Сглаживание данных является очень важным этапом обработки информации, полученной в результате микочипового эксперимента. Выбор метода сглаживания может достаточно сильно повлиять на итоговые результаты работы модели и, соответственно, на заключительные выводы, касающиеся биологической стороны проблемы. По результатом многочисленных тестирований и сравнений работы различных методов сглаживания в разнообразных условиях, можно сделать вывод, что наиболее адекватным (из рассмотренных выше), учитывающим специфику анализируемых в данной работе данных является сглаживание кубическим сплайном с постоянным весовым параметром. Еще более актуальным выглядит применение данного метода сглаживания при анализе больших объемов данных, так как в отличие от всех остальных, рассмотренных методов, данный не требует никакого предварительного задания параметров (выбор которых зачастую приходится осуществлять эвристически, просматривая достаточно большие объемы информации вручную), что способствует наиболее простой автоматизации данного метода. Кроме того сглаживающий сплайн с постоянным весовым параметром обладает очень неплохим быстродействием.
Далее приведены результаты работы методов сглаживания на данных по генной экспрессии дрожжей [15]. Данные представляют собой замеры по времени с разницей в 7 минут. Тест проходил следующим образом: сначала данные сглаживались, затем считалась производная от сглаженного профиля, после чего производная интегрировалась методом Дорманда-Принца. На рисунках 2 и 3 приведены графики, получившиеся после сглаживания ядром Епанченикова с шириной окна 8 и 14 соответственно. На рисунке 4 - соответствующие производные. Из-за характера сглаживающего ядра производные получаются разрывные, однако видно, что в случае ширины окна 8 (на 1 больше чем шаг сетки) восстановленные интегрированием профиль гена в целом повторяет динамику наблюдаемых данных, однако погрешность достаточно большая. Ядро с шириной окна 14, показывает неприемлемые результаты сглаживания самого профиля, однако при сглаживании производной, сглаженный профиль получается более гладким, чем при ширине окна 8. Это важно, т.к. в случае сглаживания с шириной окна 8, даже небольшой сдвиг по времени может сильно изменить параметры модели. На рисунках 5 и 6. Приведены результаты сглаживания сплайнами. Видно, что оба сплайна практически точно восстанавливают значения после интегрирования за счет своей гладкости, однако сплайн с постоянным весом сильнее сглаживает профиль. На рис. 8-10 приведен пример сглаживания ядром профиля другого ген. Здесь сам профиль имеет более простую структуру, так что использования ядерного сглаживания оправдано. В целом может показаться, что ядерное сглаживание однозначно хуже сплайнов, однако в решаемой нами задаче точность играет второстепенную роль, т.к. сами данные заданы с погрешность и не требуется точно подогнать один профиль к другому.
Рисунок 2. Ядро Епанечникова с шириной окна 8
Рисунок 5. "Коридорный" сплайн
Рисунок 6. Сплайн с постоянным весом
Перейти на страницу: 3 4 5 6 7 8 9
|