Расчет объемов выборок
Приведенные формулы предназначены для оценки числа пациентов, необходимого
для установления различий в эффекте. Если критерии эффекта в контролируемых
клинических исследованиях служат количественные признаки, выражаемые
статистическими средними величинами, то формула расчета минимального объема
групп для сравнения показателя в двух независимых группах:

где Sxo и Sxk - стандартные отклонения сравниваемых опытной и
контрольной групп, дельта - требуемая величина различий между средними
значениями сравниваемых групп, Za и Zв - критические значения
нормального распределения, соответствующие заданным уровням ошибок 1 и 2 рода,
которые определяются по таблицам.
Из формулы видно, что для оценки необходимого объема выборки важно, скорее,
соотношение дисперсии и требуемой величины различий, чем их численные значения.
Это обстоятельство имеет важное практическое значение при планировании
исследования, когда точные значения дисперсий могут быть неизвестны.
При альтернативной форме описания эффекта с помощью частот (или долей) po
и pk необходимое число наблюдений при равных по численности опытной и
контрольной групп определяются по формуле:

где
- величина
разности между частотами (po - pk). Такой метода дает достаточно точные
результаты при 25% < p < 75%. При других значениях частот для корректировки
возникающих искажений вводится поправка . Объем
выборки вычисляется при этом как:

Финансовые, этические или другие соображения могут требовать формирования
различных по численности опытной и контрольных групп. Если известна
фиксированная численность одной (например, контрольной групп nk), можно оценить
требуемую численность другой группы (no) для формирования статистически
значимого заключения о различиях в эффекте между ними.
Для количественного признака:

Для альтернативного представления признаков:

Данные формулы предполагают использование одностороннего теста (показатель
одной группы лучше показателя другой, исключая возможность превосходства
последнего). В случае необходимости "улавливания" различий в эффекте
в ту или иную сторону применяется двусторонний тест.
Допустим, необходимо определить количество пациентов для исследования, в
котором в качестве переменной эффекта будет использоваться изменение значения
интересующего параметра до и после начала терапии. Математически эта задача
похожа на предыдущую задачу сравнения двух независимых групп. Только в данном
случае для статистически достоверного заключения понадобится меньше пациентов,
поскольку вариация разности между наблюдениями значительно меньше, чем вариация
одиночных наблюдений. Это объясняется наличием корреляции между последовательными
измерениями.
Известны специальные формулы определения необходимой численности групп и в
случае, когда в качестве переменной для оценки эффекта используется скорость
изменения какого-либо интересующего показателя. Представим, что выбранная для
сравнения непрерывная количественная переменная эффекта измеряется в начале, на
промежуточных этапах и в конце исследования. Рассмотрим случай только двух
таких измерений, до и после исследования. Тогда одним из возможных подходов к
решению задачи является предположение о линейном характере изучаемых изменений
во времени. При таком предположении скорость изменения является постоянной и
может быть описана одним параметром - коэффициентом наклона прямой,
аппроксимирующей изменение показателя во времени. Математическая модель таких
изменений будет описываться в виде: x = a + bt + error, где b - наклон
прямой, оценивающий скорость изменений, t - время, error - представляет
отклонение измеренных значений от модельной линии регрессии. Обычно эта ошибка
равномерно распределена вокруг нуля, предполагается также, что дисперсия этой
ошибки приблизительно одинакова для всех пациентов. До начала исследования
оценка величины дисперсии ошибки делается на основе данных литературы или
предыдущих аналогичных работ.
Чтобы оценить эффективность, исследователь должен сравнить средний наклон
прямой в одной группе со средним наклоном в другой группе. Если D - общее время
наблюдения и K - число равномерно распределенных во времени измерений
изучаемого показателя, дисперсия может быть выражена так:

где
-межиндивидуальная
вариабельность наклонов,
- компонента
вариации наклона прямой, не зависящая от ошибок измерений и наличия
нелинейности в данных. Тогда требуемый объем групп для установления различий в
средних скоростях изменений может быть оценен по формуле:

Расчет необходимого числа пациентов для исследований, результаты которых
обрабатываются с помощью методов анализа выживаемости. Мы дадим только один
самый простой вариант используемых для этого формул. Допустим, нам необходимо
сравнить кривые выживаемости, построенные по результатам клинического
исследования в двух группах. Наиболее общим подходом является аппроксимация
кривых выживаемости экспоненциальной функцией. Каждая такая кривая может быть
однозначно охарактеризована параметром лямбда - коэффициентом смертности. Этот
коэффициент может рассматриваться как величина, характеризующая скорость
процесса и обратная среднему времени выживания. Нулевая гипотеза формулируется
так:
. Тогда
требуемый размер каждой группы для проверки гипотезы:

Однако недостатком такого подхода является предположение о том, что до конца
временного интервала исследования у всех пациентов, включенных в исследование,
обязательно наступает изучаемый исход.
Формулы расчета объема выборки могут быть преобразованы для оценки мощности
соответствующего теста 1 - d. Для этого нужно просто преобразовать формулу,
сделав неизвестной величиной - Zв.
Оценить требуемый объем выборок или чувствительность метода можно и в случае
применения дисперсионного анализа. Для этого вычисляется параметр
нецентральности, равный

где m - число групп, n - численность каждой из них. По соответствующим
графикам находят чувствительность дисперсионного анализа как функцию параметра
нецентральности при выбранном уровне значимости, определенном межгрупповом
числе степеней свободы (m-1) и определенном внутригрупповом числе степеней
свободы (m(n-1)).
Однако на практике при использовании этих достаточно простых расчетных
формул могут возникнуть проблемы. Дело в том, что для некоторых исследований
заранее может быть неизвестна величина дисперсии признака. Обычно эта проблема
решается с помощью использования аналога этой величины, известного из
проведенных ранее похожих исследований.
В заключение можно сказать, что хотя на практике вычисление требуемого
объема выборок является скорее оправданием уже выбранной численности групп,
результаты исследований не могут считаться достоверными без вычисления оценки
чувствительности или мощности критериев, применявшихся для проверки
статистически значимых различий.
Оглавление
|