Отдельно рассмотрим метод, специально разработанный для решения исходной задачи - обнаружения объектов (клонов и генов) с повышенным и пониженным уровнем экспрессии. Здесь в отличие от предыдущих методов анализ отдельных объектов проводится при учете всей совокупности данных в таблице.
Пусть:
Исследуется нулевая гипотеза: означающая, что любые отклонения значений выборки от фиксированного значения происходят исключительно по случайным причинам. В качестве альтернативы выдвинем гипотезу .
При этом мы предполагаем, что для подавляющего количества генов в таблице нулевая гипотеза верна.
Параметр метода BV (Boundary Value) - предназначен для разграничения между повышенной и пониженной экспрессией.
Эвристически эту гипотезу можно принять или отклонить, например, оценивая количество элементов в выборке, превышающих пороговое значение достаточно сильно. Т.е. задать решающее правило следующим образом:
Но тогда необходимо оценить с какой вероятностью мы ошибемся, если будем применять это правило при разных .
Для удобства, построим вариационный ряд:
Ясно, что в качестве не уменьшая общности можно рассматривать только значения из ряда .
Допустим, мы фиксировали , введем обозначение:
В случае верности нулевой гипотезы, отклонения от произошли по случайным причинам и в этом случае имеет гипергеометрическое распределение с параметрами , где:
- количество значений в таблице больше либо равных .
- общее количество данных в таблице.
Замечание.Случайная величина, имеющая гипергеометрическое распределение представляет собой (может быть интерпретирована как) количество обладающих заданным свойством элементов среди элементов, случайно извлеченных (без возвращения) из совокупности N элементов, среди которых обладают данным свойством.
Перейти на страницу: 1 2 3 4
|