Отдельно рассмотрим метод, специально разработанный для решения исходной задачи - обнаружения объектов (клонов и генов) с повышенным и пониженным уровнем экспрессии. Здесь в отличие от предыдущих методов анализ отдельных объектов проводится при учете всей совокупности данных в таблице.
Пусть: 
Исследуется нулевая гипотеза:  означающая, что любые отклонения значений выборки от фиксированного значения происходят исключительно по случайным причинам. В качестве альтернативы выдвинем гипотезу  .
При этом мы предполагаем, что для подавляющего количества генов в таблице нулевая гипотеза верна.
Параметр метода BV (Boundary Value) - предназначен для разграничения между повышенной и пониженной экспрессией.
Эвристически эту гипотезу можно принять или отклонить, например, оценивая количество элементов в выборке, превышающих пороговое значение достаточно сильно. Т.е. задать решающее правило следующим образом:
Но тогда необходимо оценить с какой вероятностью мы ошибемся, если будем применять это правило при разных  .
Для удобства, построим вариационный ряд:
Ясно, что в качестве  не уменьшая общности можно рассматривать только значения из ряда  .
Допустим, мы фиксировали  , введем обозначение:
В случае верности нулевой гипотезы, отклонения от  произошли по случайным причинам и в этом случае  имеет гипергеометрическое распределение с параметрами  , где:
 - количество значений в таблице больше либо равных  .
 - общее количество данных в таблице.
Замечание.Случайная величина, имеющая гипергеометрическое распределение  представляет собой (может быть интерпретирована как) количество обладающих заданным свойством элементов среди  элементов, случайно извлеченных (без возвращения) из совокупности N элементов, среди которых  обладают данным свойством. 
Перейти на страницу: 1 2 3 4
|