Альтернативным способом является минимизация среднеквадратичного отклонения:
Однако здесь возможно накопление ошибки, связанное с численным дифференцированием и последующим численным же интегрированием. Расчеты показали, однако, что в случае равномерной сетки как сглаживающий сплайн, так и ядро Епанечникова дают хороший результат при восстановлении профиля после численного дифференцирования. В качестве метода интегрирования использовался алгоритм Дорманда-Принца. В случае неравномерной сетки, ядерное сглаживание дает большую погрешность, тогда как сплайн по-прежнему показывает хорошие результаты.
Алгоритм
1. Фиксируется ген-мишень.
. Выбирается потенциальный ген-регулятор .
. Полученные профили экспрессии сглаживаются одним из методов.
. Выбирается величина сдвига Строится линейная регрессия:
Находятся параметры , коэффициент детерминации.
. Проделываем шаги 4-5 для . Находим оптимальную задержку .
. Повторяем шаги 2-5 для каждого потенциального гена-регулятора.
. Выбираем ген-регулятор с наилучшим коэффициентом детерминации.
Данный метод достаточно прост в реализации и имеет малую вычислительную сложность. Наибольшую сложность здесь имеет численное интегрирование. Сама модель носит базовый характер в силу своей простоты, представляется, что ее можно использовать в качестве некоторого первого приближения, т.к. ни один из существующих на данный момент методов не может однозначно правильно и точно решить исходную задачу.
Возможны модификации метода
1. С биологической точки зрения целесообразно добавить коэффициент деградации
В этом случае считается множественная регрессия.
. Можно рассматривать модель с несколькими регуляторами:
Методы сглаживания
Часто в работе с микрочиповыми таблицами имеет смысл преобразовывать дискретные данные в непрерывные. Это может быть связано с необходимостью вычислить значение в промежуточной точке, вычислить численную производную профиля экспрессии или в связи с тем, что некоторые значения уровня экспрессии могут быть пропущены из-за погрешности эксперимента. К сожалению данные полученные с помощью микрочипового эксперимента неизбежно несут некоторую иногда довольно значительную погрешность, так что точная интерполяция смысла практически не имеет. Рассмотрим несколько методов сглаживания данных, предложенных в литературе [7-10]. Всюду ниже, аналогично предыдущему, будем обозначать:
Перейти на страницу: 1 2 3 4 5 6 7 8
|