МЕТА-АНАЛИЗ
Достаточно часто результаты нескольких исследований, в которых оценивается эффективность одного и того же вмешательства или диагностического метода при одном и том же заболевании, различаются, и иногда - существенно. В связи с этим возникает необходимость относительной оценки результатов разных исследований и интеграции их результатов с целью получения обобщающего вывода. Одной из самых популярных и быстро развивающихся методик интегрального анализа результатов отдельных научных исследований является методика мета-анализа. Международная ассоциация эпидемиологов характеризует мета-анализ как «метод объединения результатов различных исследований, …складывающийся из учета уровня качества их выполнения (например, использование таких заранее определенных критериев включения в анализ, как полнота данных, отсутствие явных недостатков в организации исследования и т.д.) и анализа количественного компонента (статистическая обработка представленных независимыми исследователями данных)». Мета-анализ – вершина биомедицинских исследований; будучи выполненным в соответствии с правилами, он обеспечивает наивысший уровень доказательности из возможных. Тем не менее, полезно помнить, что мета-анализ полностью вторичен, поскольку целиком базируется на результатах ранее выполненных практических исследований и при отсутствии либо недостаточном количестве таковых невозможен по определению.
Цель мета-анализа — выявление, изучение и объяснение различий в результатах независимых исследований одной и той же проблемы.
К несомненным преимуществам мета-анализа относится возможность увеличения статистической мощности исследования (за счет интеграции данных нескольких исследований), а, следовательно, повышение точности оценки эффекта анализируемого вмешательства. Это позволяет более определенно, чем при анализе каждого отдельно взятого клинического исследования, указать категории больных, для которых применимы полученные результаты.
Правильно выполненный мета-анализ предполагает проверку научной гипотезы, подробное и четкое изложение применявшихся статистических методов, достаточно подробное изложение и обсуждение результатов анализа, а также вытекающих из него выводов. Подобный подход обеспечивает уменьшение вероятности случайных и систематических ошибок и позволяет повысить объективность получаемых результатов.
Подходы к выполнению мета-анализа
Существуют два основных подхода к выполнению мета-анализа. Первый из них заключается в повторном статистическом анализе отдельных исследований путем получения и обработки первичных данных их наблюдений. Очевидно, что проведение данной операции далеко не всегда возможно. Второй (и основной) подход заключается в обобщении опубликованных результатов исследований, посвященных одной проблеме. Такой мета-анализ выполняется обычно в несколько этапов, среди которых важнейшими являются:
1. Выработка критериев включения опубликованных исследований в мета-анализ,
2. Оценка гетерогенности (статистической неоднородности) результатов оригинальных исследований,
3. Проведение собственно мета-анализа (получение обобщенной оценки величины эффекта изучаемого вмешательства),
4. Анализ чувствительности и мощности проведенного мета-анализа.
Этап определения круга включаемых в мета-анализ исследований часто становится источником систематических ошибок. Качество мета-анализа существенно зависит от качества включенных в него исходных исследований и статей. К основным проблемам при включении исследований в мета-анализ относятся существенные различия исследований по критериям включения и исключения, дизайну, контролю качества. Существует также систематическая ошибка, связанная с преимущественной публикацией положительных результатов исследований (исследования, в которых получены клинически и статистически значимые результаты, чаще публикуются, чем те, в которых такие результаты не получены). Соответственно, поскольку мета-анализ основан главным образом на литературных данных, следует обращать особое внимание на недостаточную опубликованность отрицательных результатов аналогичных исследований. Включение в мета-анализ неопубликованных результатов также представляет значительную проблему, поскольку их качество неизвестно именно в связи с тем, что они не проходили рецензирование, обязательное при публикации в серьезных научных изданиях.
Основные методы
Выбор метода анализа определяется типом анализируемых данных (бинарные или непрерывный ряд) и дизайном исследования (когортное, РКИ). Бинарные данные обычно анализируются путем вычисления отношения шансов (ОШ), относительного риска (ОР) или разности рисков в сопоставляемых выборках (см. выше). Все перечисленные показатели характеризуют эффект вмешательств. Представление бинарных данных в виде ОШ удобно использовать при статистическом анализе, но этот показатель достаточно трудно интерпретировать для клинической практики. Непрерывными данными обычно являются диапазоны значений изучаемых признаков или разница их средних значений в группах сравнения, если исходы оценивались во всех исследованиях одинаковым образом. Если же исходы оценивались по-разному (например, по разным шкалам), то используется т.н. стандартизованная разница средних значений изучаемых признаков («величина эффекта») сравниваемых групп. Целью мета-анализа непрерывных данных обычно является представление точечных и интервальных (95% ДИ) оценок обобщенного эффекта вмешательства.
Применение мета-анализа позволяет существенно улучшить результаты систематизации различных публикаций по единой тематике. При написании любого обычного обзора всякий исследователь может подобрать десяток работ, подтверждающих его точку зрения (это особенно актуально для гуманитарных наук), в то время как его идейный оппонент всегда может указать на несколько исследований с противоположными выводами. Завязывается дискуссия, стандартным итогом которой является фраза: «Опубликованные в литературе сведения противоречивы, ввиду чего необходимы дальнейшие исследования для прояснения ситуации». Естественно, новые исследования если и предпринимаются, то нисколько не улучшают общую картину. Мета-анализ дает возможность выбраться из этой трясины. Использование хорошо продуманных и научно обоснованных методов интеграции и анализа информации позволяет ответить на вопросы, неразрешимые в рамках отдельных исследований.
Одним из первых этапов мета-анализа является оценка гетерогенности (статистической неоднородности) результатов изучаемого вмешательства в разных исследованиях. Для оценки гетерогенности часто используют критерий χ2 с нулевой гипотезой о равном эффекте во всех исследованиях и с уровнем значимости р=0,1 для повышения статистической мощности (чувствительности) теста. Источниками гетерогенности результатов разных исследований принято считать: 1) дисперсию данных внутри исследований (обусловленную случайными отклонениями результатов, полученных в разных исследованиях, от единого истинного значения эффекта), а также 2) дисперсию между исследованиями (обусловленную различиями между интегрируемыми выборками по существенным характеристикам больных, особенностям их заболеваний и вмешательств, что приводит к получению неравнозначных оценок величины изучаемого эффекта).
Если предполагается, что дисперсия между исследованиями близка к нулю, то каждому из исследований приписывается вес, величина которого обратно пропорциональна дисперсии результата данного исследования. При нулевой дисперсии между исследованиями можно использовать модель фиксированных (постоянных) эффектов. В этом случае предполагается, что изучаемое вмешательство во всех исследованиях имеет одну и ту же эффективность, а выявляемые различия обусловлены только случайными факторами (т.е. дисперсией) внутри отдельных исследований. В этой модели пользуются методом Мантела-Ханзела. Процедура, предложенная Мантелом и Ханзелом, позволяет предположительно оценивать типичное значение отношения шансов и проверять значимость общей степени связи. Существуют и другие подходы к выполнению мета-анализа. Так, модель случайных эффектов предполагает, что эффективность изучаемого вмешательства в разных исследованиях действительно может быть различной. Данная модель учитывает дисперсию не только внутри одного исследования, но и между разными исследованиями. В этом случае суммируются дисперсии внутри исследований и дисперсия между исследованиями. Существует также ряд других подходов к выполнению мета-анализа: байесовский мета-анализ, кумулятивный мета-анализ, многофакторный мета-анализ, мета-анализ выживаемости.
Байесовский мета-анализ позволяет рассчитать априорные вероятности эффективности вмешательства с учетом косвенных данных. Такой подход особенно эффективен при малом числе доступных исследований. Он обеспечивает более точную оценку эффективности вмешательства в модели случайных эффектов за счет объяснения дисперсии между разными исследованиями. Кумулятивный мета-анализ – частный случай байесовского, пошаговая процедура включения результатов исследований в мета-анализ по одному в соответствии с каким-либо принципом (в хронологической последовательности, по мере убывания методологического качества исследования и т.д.). Он позволяет рассчитывать априорные и апостериорные вероятности в итерационном режиме по мере включения исследований в анализ.
Регрессионный мета-анализ (логистическая регрессия, регрессия взвешенных наименьших квадратов, модель Кокса и др.) используется при существенной гетерогенности результатов исследований. Он позволяет учесть влияние нескольких характеристик исследования (например, размера выборки, дозы препарата, способа его введения, характеристик больных и др.) на результаты испытаний вмешательства. Результаты регрессионного мета-анализа обычно представляют в виде коэффициента наклона с указанием ДИ.
Следует заметить, что мета-анализ может выполняться для обобщения результатов не только рандомизированных контролируемых испытаний медицинских вмешательств, но и когортных исследований (например, исследований факторов риска), однако при этом следует учитывать высокую вероятность возникновения систематических ошибок.
Особый вид мета-анализа – обобщение оценок информативности диагностических методов, полученных в разных исследованиях. Цель такого мета-анализа – построение характеристической кривой взаимной зависимости чувствительности и специфичности тестов (ROC-кривой) с использованием взвешенной линейной регрессии.
Мета-анализ, при наивысшем уровне доказательности, является сложной математико-статистической процедурой; его выполнение требует наличия в исследовательской группе квалифицированного статистика, имеющего опыт подобных исследований. Трудно представить себе молодого ученого, планирующего проведение мета-анализа в качестве своей первой научной работы. Тем не менее, мы считаем нужным привести здесь пошаговое руководство по выполнению одного из стандартных вариантов мета-анализа – анализа по методу Хантера-Шмидта (Hunter-Schmidt). Данный метод был предложен Хантером, Шмидтом и Джексоном (Jackson) в 1982 г. [22] и усовершенствован Хантером и Шмидтом в 1990 г. [21].
Начальный этап любого мета-анализа – тщательный поиск литературных источников (т.е. научных публикаций) по изучаемой проблеме. Включению в мета-анализ подлежит информация только из тех источников, которые указали уровень достоверности полученных данных и привели значения стандартных отклонений для всех переменных, включаемых исследователями в формируемую базу мета-анализа.
Следующий этап после заполнения сформированной базы данных – перевод (конвертация) размерностей результатов различных исследований в единую метрическую систему. Обычно все доступные данные переводят в специальную величину r, называемую «стандартизированный эффект воздействия» Ниже приведен ряд формул, позволяющих выполнить указанное преобразование:
Конвертируемый статистический показатель
| Формула для конвертации в r
(r – т.н. «эффект воздействия»)
| Примечания
| t-критерий Стьюдента
|
| Может использоваться для любого парного или непартного t-теста
df – число степеней свободы
| F-критерий Фишера
|
| Используется только с одномерным дисперсионным анализом (one-way ANOVA)
df(e) – ошибка df
| Многомерный дисперсионный анализ
(two-way ANOVA)
|
| F(a) – первое воздействие;
df(a) – число степеней свободы для А;
F(b) – второе воздействие;
df(b) – число степеней свободы для В;
F(ab) – эффект взаимодействия А и В;
df(ab) – число степеней свободы взаимодействия А и В;
df(e) – ошибка df
| X2-критерий согласия Пирсона
|
| N – размер выборки
Используется только при df=1
| d-критерий Коэна
(Cohen's d)
|
| d – критерий Коэна;
N – совокупный размер выборок, включенных в мета-анализ
| р – показатель вероятности нулевой гипотезы
| 1) Перевести двустороннее значение р в одностороннее (разделить на 2);
2) Установить величину соответствующего критерия Z в кумулятивной таблице нормального распределения
| Можно использовать как точные значения р, так и приблизительные (н-р, если автор пишет: р<0,05)
| Помимо r, для приведения к единой размерности приведенных в публикациях статистических критериев можно использовать d-критерий Коэна:
Конвертируемый статистический показатель
| Формула для конвертации в d
| Примечания
| Средние величины и стандартные отклонения
|
| Xe – средняя экспериментальной группы;
Хс – средняя контрольной группы;
Sp – объединенное стандартное отклонение (всех субъектов в выборке)
| Объединенная дисперсия (variance) субъектов выборки
|
| Ne – размер экспериментальной группы;
Nc – размер контрольной группы;
Se2 – дисперсия экспериментальной группы;
Sc2 – дисперсия контрольной группы
| t-критерий Стьюдента
|
| Может использоваться для любого парного или непартного t-теста
df – число степеней свободы
| F-критерий Фишера
|
| Используется только с одномерным дисперсионным анализом (one-way ANOVA)
df(e) – ошибка df
| Стандартизированный эффект воздействия r
|
|
|
Следующий этап – систематизация информации об эффекте изучаемого воздействия. После того, как все данные исследований, включенных в мета-анализ, конвертированы в стандартизированные показатели и имеют единую размерность, производится сбор информации о достоверности выполненных исследований и т.н. отклонениях диапазона (range departures, см. ниже). Если во всех исследованиях проведена оценка достоверности (либо отклонения диапазона), выраженность изучаемого воздействия может быть скорректирована на уровне каждого из индивидуальных исследований, включенных в анализ. Тем не менее, основной массив публикаций такого рода информацию не предоставляет. К счастью, Хантер и Шмидт разработали процедуру установления поправок на достоверность и отклонение диапазона посредством конструирования распределений для зависимых и независимых переменных [21].
Когда литературная база консолидирована, а информация о достоверности исследований и отклонениях от диапазона собрана, необходимо устранить систематическую ошибку отбора (sampling error bias). Данная ошибка приводит к случайному изменению результатов исследования в зависимости от размера анализируемой выборки (см. выше): при малом размере выборки вариабельность получаемых данных существенно возрастает по сравнению с аналогичными исследованиями, выполненными на более многочисленном материале. Соответственно, коррекция выявленного эффекта изучаемого воздействия с учетом размера исследованной выборки обеспечивает более точное приближение результатов к реальным цифрам, существующим в генеральной совокупности. Коррекция систематической ошибки отбора осуществляется путем вычисления средневзвешенной корреляции выборки (sample weighted mean correlation):
, где
Ni – количество участников исследования,
ri – стандартизированный эффект воздействия в отдельном исследовании.
Дисперсия средневзвешенной корреляции выборки вычисляется по формуле:
, расшифровку обозначений см. выше.
Средневзвешенный d-критерий Коэна для индивидуальной выборки и его дисперсия вычисляются аналогичным образом.
Поскольку средневзвешенная корреляция выборки не подвержена действию систематической ошибки отбора, ее дисперсия существенно возрастает. Для коррекции дисперсии применяют двухстадийную процедуру. На первой стадии вычисляется дисперсия систематической ошибки отбора:
, где
К – количество исследований, включенных в мета-анализ.
На второй стадии для установления дисперсии выборки, подверженной воздействию систематической ошибки отбора, из дисперсии средневзвешенной корреляции выборки вычитают дисперсию систематической ошибки отбора:
Кроме систематической ошибки отбора, на результаты исследований могут оказывать влияние еще две разновидности систематических ошибок, а именно ошибка измерения (measurement error) и ошибка ограничения диапазона (range restriction error). Ошибка измерения (также «достоверность теста») оценивается при помощи двух показателей достоверности, вычисляемых из результатов конкретного исследования – rxx и ryy (т.е. для независимой и зависимой переменных, соответственно). Как правило, информация, необходимая для расчета указанных показателей, не публикуется большинством исследователей. Хантер и Шмидт предложили специальный метод коррекции средневзвешенного эффекта изучаемого воздействия в выборке путем использования распределения оценок достоверности. Явное достоинство данного метода состоит в том, что он не зависит от особенностей представления результатов в исследованиях, непосредственно включенных в мета-анализ: любое исследование, в котором производилась должная оценка достоверности измерений, может быть использовано для построения распределения указанных оценок.
Для коррекции достоверности необходимо построить распределение коэффициентов достоверности с использованием всех имеющихся источников. Среднее данного распределения вычисляется по формуле:
, где
rxx – достоверность отдельного исследования (для независимой переменной),
К – общее количество определений достоверности.
Дисперсия данного распределения определяется как:
Средняя достоверность и дисперсия для зависимой переменной (, ) определяются по аналогичным формулам.
Как упоминалось выше, еще одним источником ошибок является отклонение диапазона (range departure), которое представляет собой случайное отклонение от установленного среднего эффекта изучаемого воздействия в консолидированной популяции (т.н. rho), иначе – расширение диапазона возможных результатов любого измерения (если рассматривать только крайние значения).
Для коррекции данного явления необходимо вначале вычислить «u» – отношение стандартного отклонения в отдельном исследовании к стандартному отклонению в некоей референсной популяции. Это отношение используется для расчета «с», показателя отклонения диапазона для отдельного исследования, из которого была получена информация о стандартном отклонении. Для вычисления «с» используется следующая формула:
, где
u – отношение стандартного отклонения в отдельном исследовании к стандартному отклонению в референсной популяции,
r – эффект изучаемого воздействия в соответствующем исследовании.
Поскольку данная информация приводится в публикациях очень редко, необходимо построение распределения элементов отклонения диапазона. Среднее и дисперсия указанного распределения вычисляются по формулам:
, , где
Ci – показатель «с» отдельного исследования (см. выше),
Ni – количество участников соответствующего исследования,
К – общее количество исследований, включенных в мета-анализ.
Для упрощения вышеописанных манипуляций используется специальная система условных знаков, где средние rxx и ryy обозначены как «а» и «b», соответственно, а дисперсия обоих показателей достоверности – как s2a и s2b. Аналогично, среднее отклонение диапазона обозначается как «с», а его дисперсия - s2c.
Имея на руках вышеперечисленные статистические показатели, а именно средневзвешенный критерий r выборки, скорректированную дисперсию ошибок, a, b, c, а также величины дисперсий для средних значений показателей достоверности и отклонений диапазона, можно оценить средний эффект изучаемого воздействия в консолидированной популяции (т.е. rho). Во-первых, нужно внести поправку в средневзвешенный критерий r выборки с учетом ошибки измерения и отклонения диапазона, используя следующую формулу:
Во-вторых, необходимо скорректировать дисперсию взаимосвязи в пределах популяции с учетом ошибки измерения и отклонения диапазона, используя средние значения и дисперсии факторов коррекции достоверности и диапазона a, b и c:
Вышеприведенная формула позволяет вычислить дисперсию среднего эффекта изучаемого воздействия в популяции (rho). В случае, если нет повода предполагать наличие значительных колебаний диапазона между отдельными исследованиями, включенными в мета-анализ (как в большинстве психологических исследований), вышеописанную процедуру коррекции с учетом отклонения диапазона можно опустить [22].
Выполняя мета-анализ, необходимо проводить поиск т.н. переменных-регуляторов (moderating variables). Указанные переменные являются «третьим фактором», который может повлиять на интересующую нас взаимосвязь. Для поиска переменных-регуляторов Хантер и Шмидт предложили использовать χ2-тест на систематические вариации [22]:
, где К – количество исследований, включенных в мета-анализ.
Если вычисленный критерий χ2 статистически незначим, то в интересующей нас выборке нет ни одной переменной-регулятора. Данный статистический тест является очень мощным при достаточно большом N, он отвергнет нулевую гипотезу даже при незначительных отклонениях между исследованиями. В качестве альтернативы авторами теста предложено «правило большого пальца», при котором сравниваются S2r и S2er. Если дисперсия расхождения может объяснить менее 75% нескорректированной дисперсии, можно сделать вывод о возможном наличии переменной-регулятора.
Далее перечислены последовательные этапы, которые исследователь должен осуществить в процессе выполнения мета-анализа:
1. Определиться с областью исследования.
2. Сформулировать критерии для включения публикаций в обзор:
· опубликовано исследование или нет;
· обозреваемый временной период;
· качество проведения исследования и т.д.
3. Определить вид используемой меры стандартизированного эффекта воздействия:
· d-критерий Коэна;
· r-критерий (коэффициент корреляции Пирсона, Pearson's Product Moment Correlation).
4. Поиск исследований, соответствующих критериям включения:
· поиск в библиотеках (лично) и Интернете (можно автоматизировать);
· презентации конференций и симпозиумов;
· отправка писем ученым, занимающимся исследованиями в интересующей нас области.
5. Выбор окончательной подборки исследований:
· личное решение;
· решение научного коллектива;
6. Извлечь данные о факторах, интересующих исследователей, размерах выборок, эффектах воздействий, достоверности измерений и прочих заслуживающих внимание характеристиках каждого из исследований.
· Извлекая информацию о достоверности и отклонениях диапазона, не нужно ограничивать поиск только исследованиями, включенными в настоящий мета-анализ;
· Если опубликованы результаты многочисленных измерений, необходимо использовать их все;
· Данные можно разбивать на подгруппы;
· Усреднить результаты множественных измерений в единое итоговое значение.
7. Закодируйте все характеристики исследований, которые могут иметь отношение к описанной в них выраженности эффекта изучаемого воздействия, как-то:
· особенности дизайна исследования;
· характеристики выборки;
· тип зависимой переменной и т.д.
8. Выполните проверку надежности процедур кодирования:
· с подмножеством данных, используя от 1 до 4 других кодировщиков;
· со всеми данными, используя от 1 до 4 других кодировщиков.
9. Если имеются результаты многократных измерений зависимых и/или независимых переменных, решите, сгруппировать ли их априорно или нет.
· теоретическое разнообразие среди переменных;
· практическое разнообразие измерений среди переменных.
10. Вычислите среднее и дисперсию выраженности эффекта изучаемого воздействия во всех исследованиях, включенных в мета-анализ:
· средняя выраженность эффекта воздействия, взвешенная по размеру выборки;
· провести тест хи-квадрат на гомогенность;
· вычислить размер выборки, обеспечивающий заданную мощность анализа;
· вычислить дисперсию выраженность эффекта воздействия между исследованиями с целью поиска переменных-регуляторов;
· установить искусственные источники дисперсии между исследованиями (ошибка отбора, затухание из-за ошибок измерений, ограничение диапазона);
· определение истинной дисперсии между исследованиями;
· оценка истинной средней выраженность эффекта воздействия с учетом поправок на ошибки отбора, измерения и ограничения диапазона.
11. Определитесь, проводить ли поиск переменных-регуляторов:
· тест хи-квадрат (тест значимости);
· величина дисперсии между исследованиями, объясняющаяся искусственно привнесенными факторами;
· «правило большого пальца»: если дисперсия расхождения может объяснить менее 75% нескорректированной дисперсии взвешенной корреляции выборки, возможно наличие некоей переменной-регулятора, в противном случае отклонение происходит в основном из-за случайных ошибок (например, ограничения диапазона, отбора либо измерения).
12. Выбрать потенциальные факторы-регуляторы (если это оправдано):
· теоретические соображения;
· практические соображения по результатам измерений.
13. Вычислите среднее и дисперсию выраженности эффекта воздействия внутри подгрупп-регуляторов (процедура, аналогичная описанной в п.10).
Процедура мета-анализа может быть автоматизирована при помощи специальных программ, многие из которых написаны и поддерживаются энтузиастами от науки, вследствие чего распространяются свободно и бесплатно:
1. Review Manager 5 (http://www.cc-ims.net/revman/download)
2. MIX 2.0 (версии Lite и Pro) – плагин для MS Excel 2007 (http://www.meta-analysis-made-easy.com/download/index.html)
3. EasyMA (http://www.spc.univ-lyon1.fr/easyma.dos/)
4. Comprehensive Meta-Analysis (CMA) (http://www.meta-analysis.com/pages/demo.html)
5. Модули для программ статистического анализа Stata, SPSS и SAS
6. MetaWin 2.0 (http://www.metawinsoft.com/mw2demo.html)
7. Epimeta (http://ftp.cdc.gov/pub/Software/epimeta/)
8. Meta-Analysis 5.3 (http://userpage.fu-berlin.de/~health/meta_e.htm)
9. Meta Analysis Calculator (онлайновый) (http://www.lyonsmorris.com/ma1/index.cfm)
Обновляющийся список программного обеспечения для мета-анализа доступен по адресам http://www.vetschools.co.uk/EpiVetNet/meta_analysis_software.htm, http://statpages.org/javasta2.html, http://faculty.ucmerced.edu/wshadish/Meta-Analysis%20Software.htm.
Результаты мета-анализа обычно представляются графически (точечные и интервальные оценки эффектов изучаемого воздействия в каждом из включенных в мета-анализ исследований) и/или в виде таблиц, содержащих соответствующие статистические показатели. Графическое представление результатов мета-анализа носит название «древовидная диаграмма» (forest plot). На рисунке 25 представлена древовидная диаграмма, построенная программой Review Manager (совмещена с таблицей частных и интегральных статистических показателей).
Рис. 25. Древовидная диаграмма, построенная программой Review Manager; приведены данные о повышении риска рака легких у пассивных курильщиков – величины относительного риска (risk ratio) и их 95% доверительные интервалы для ряда индивидуальных исследований, отсортированные по возрастанию диапазона. Видно, что большая часть публикаций сообщает о повышении риска рака легких, но доверительный интервал для относительного риска в подавляющем большинстве исследований включает 1, что говорит о недостоверности полученных данных (т.е. величина р для risk ratio превышает 0,05). В последней строке приведен интегральный показатель относительного риска, рассчитанный в соответствии с правилами мета-анализа; он составляет 1,2 при 95% доверительном интервале 1,12-1,29 (р<0,00001) [42]. В колонке weight (%) указан относительный вес каждого из отдельных исследований, включенных в мета-анализ, в зависимости от качества их выполнения и степени доказательности.
На рис. 26 показана аналогичная диаграмма, построенная программой MetaWin.
Рис. 26. Древовидная диаграмма, построенная программой MetaWin (читается снизу вверх); интегральный показатель относительного риска (т.н. «большая средняя» – grand mean) и его 95% ДИ – в верхней строчке.
Существуют также способы оценки полноты выявления включенных в мета-анализ исследований. Обычно неполнота выявления связана с возникновением систематической ошибки, связанной с преимущественным опубликованием положительных результатов исследований (результатов, описывающих клинически и статистически значимые различия групп). Для качественной оценки наличия такой систематической ошибки мета-анализа обычно прибегают к построению воронкообразной диаграммы (funnel plot) – графика рассеяния результатов отдельных исследований в единой сетке координат (по горизонтальной оси – величина эффекта изучаемого воздействия, по вертикальной – размер выборки в соответствующем единичном исследовании). Поскольку известно, что точность определения эффекта изучаемого воздействия возрастает с увеличением размера выборки, диапазон вычисленных значений эффекта данного воздействия значительно шире в малых исследованиях, располагающихся внизу диаграммы, в то время как в больших исследованиях, расположенных наверху диаграммы, диапазон возможных значений величины эффекта значительно уже (естественно, если исследование было правильно организовано и проведено, т.е. свободно от прочих систематических ошибок). Данная закономерность и придает диаграмме характерную форму перевернутой воронки (рис. 27). Частотные характеристики эффекта воздействия или отношения шансов обычно наносятся на диаграмму в логарифмической шкале (так что 0,5 и 2 равноудалены от 1).
Видно, что по мере увеличения размеров выборки установленное значение эффекта воздействия стремится к некоторой средней величине, близкой к истинному значению указанного эффекта в генеральной совокупности; в то же время данные отдельных исследований могут быть как больше данного значения, так и меньше, причем разброс значений увеличивается по мере уменьшения размеров анализируемой выборки.
А.
В.
Рис. 27. А – воронкообразная диаграмма, построенная программой Review Manager; В – аналогичная диаграмма, построенная программой Comprehensive Meta-Analysis. На обоих диаграммах – исследования, включенные в мета-анализ влияния пассивного курения на частоту развития рака легких [42].
Ясно, что при правильно сформированной базе исследований количество работ, где эффект вмешательства оказался меньше, чем в среднем, примерно соответствует количеству работ, где указанный эффект превышает среднее значение, что придает «воронке» симметричный вид. В случае наличия т.н. систематической ошибки публикации (publication bias, описанная выше: публикуются преимущественно результаты, указывающие на положительный эффект воздействия, а указывающие на отрицательный – замалчиваются) воронкообразная диаграмма окажется ассиметричной с существенным преобладанием публикаций в «позитивной» половине графика (эффект воздействия больше среднего); это преимущественно касается малых исследований, составляющих большинство в любом мета-анализе (рис. 28, в центре). Асимметрия подобного рода может наблюдаться и в случае наличия т.н. систематической ошибки низкого методологического качества выполнения малых исследований, когда получаемый в них результат настолько существенно расходится с истинной величиной эффекта воздействия (как в большую, так и в меньшую сторону), что это заметно на воронкообразной диаграмме (рис. 28, справа).
Рис. 28. Анализ полноты включения публикаций в мета-анализ с применением воронкообразной диаграммы. Слева – «воронка» симметрична, белыми кружками обозначены «негативные» результаты нескольких малых исследований; в центре – асимметрия «воронки», связанная с наличием систематической ошибки публикации – данные малых исследований, отрицающих позитивный эффект изучаемого воздействия, либо не опубликованы, либо не вошли в мета-анализ; справа – из-за низкого методологического качества малых исследований полученный в них результат настолько отличается от среднего, что диаграмма вновь асимметрична.
Программа Comprehensive Meta-Analysis может на основе анализа воронкообразной диаграммы приблизительно оценить количество публикаций, не включенных в мета-анализ. Данная процедура была разработана Duval и Tweedie и называется «согласование и заполнение» (trim and fill, см. рис. 29).
Рис. 29. Результат выполнения процедуры «trim and fill» программой Comprehensive Meta-Analysis при наличии асимметрии воронкообразной диаграммы. Видно, что, с точки зрения программы, в базу мета-анализа не включено 7 пропущенных публикаций (обозначены черными кружками); при этом «большая средняя» составляет 1,204 в нескорректированной диаграмме (белый ромб) и 1,169 – в скорректированной (черный ромб).
Мета-анализ представляется весьма перспективным направлением исследований на постсоветском пространстве, поскольку для его выполнения необходим, фактически, лишь доступ к Интернету и компьютер, оснащенный одной (или несколькими) из вышеперечисленных программ; существенные финансовые вливания при этом не требуются, и даже наличие собственной лаборатории и/или клинической базы необязательно, а полученные результаты высокодоказательны, выглядят крайне наукообразно, при этом могут представлять существенный научный и клинический интерес, и в этом случае их публикация в серьезных западных научных журналах видится практически неизбежной. Интересующимся детальным описанием и объяснением всех стадий мета-анализа рекомендуем англоязычное руководство Meta-Analysis Notes за авторством Jamie de Coster, доступное для бесплатного скачивания из Интернета по адресу http://www.stat-help.com/meta.pdf.
Кроме упомянутого выше мета-анализа степени воздействия пассивного курения на частоту формирования рака легких, к другим примерам использования данного метода относятся:
· мета-анализ - сравнение эффективности ангиопластики и шунтирования в лечении тяжелой ИБС. Консолидированная выборка составила 3371 больных (1661 шунтирование, 1710 случаев ангиопластики). Показано, что смертность непосредственно после указанных вмешательств значимо не отличается (относительный риск 1.08 [95% ДИ: 0,79-1,50]), в то время как частота отдаленных рецидивов стенокардии оказалась существенно выше в группе ангиопластики (относительный риск 1,56 [1,30-1,88]); тем не менее, спустя 3 года после вмешательства данное различие практически сгладилось (относительный риск 1,22 [0,99-1,54]) [39].
· мета-анализ эффекта от лечения антидепрессантами хронических болей в спине. Размер консолидированной выборки составил 504 человека (из 10 РКИ), средний срок наблюдения за больными в данной выборке – 10,4 года. Показано, что назначение антидепрессантов значимо снижает выраженность болей в спине в сравнении с группой больных, получавших плацебо (стандартизированная разница средних эффектов вмешательств 0,41 [0,22-0,61]), но не улучшает качество жизни больных (стандартизированная разница средних эффектов 0,24 [-0,21-0,69]). При этом количество побочных реакций оказалось значимо выше у больных, получающих антидепрессанты, в сравнении с группой плацебо (22% против 14%, р=0,01) [43].
· мета-анализ отдаленных последствий ложно-положительных маммограмм (именно, поведенческие особенности и качество жизни женщин в возрасте 40 и более лет). Размер консолидированной выборки – 313.967 человек из 23 исследований. Показано, что женщины, у которых результат маммографии оказывался ложноположительным, более часто приходили на регулярные маммографические обследования по сравнению с женщинами, у которых единичный результат скрининга оказывался нормальным (относительный риск 1,07 [1,02-1,12]); при этом у европейских и канадских женщин данный эффект оказался статистически незначим (относительный риск 0,97 [0,93-1,01] и 0,63 [0,50-0,80], соответственно). Аналогично, женщины с ложно-положительным результатом маммографии чаще занимались самообследованием молочных желез и имели более высокий уровень стресса и тревожности [8].
Завершая руководство, приводим категории доказательности рекомендаций, принятые в современных публикациях, и уровни доказательности данных, на которых они основаны [28]:
Категории
доказательности
рекомендаций
| Основание
| А
| Данные, полученные как минимум в 2 исследованиях I уровня
| В
| Данные, полученные в 1 исследовании I уровня
| С
| Данные, полученные только в исследованиях II уровня
| D
| Данные, полученные как минимум в 1 исследовании III уровня
| Е
| Данные IV и V уровня доказательности
|
Уровни
доказательности
данных
| Характеристика исследования
| I
| Крупные рандомизированные исследования с отчетливыми результатами; низкий риск ошибок 1 и/или 2 рода (т.е. ложноположительных и/ или ложноотрицательных результатов)
| II
| Небольшие рандомизированные исследования с неоднозначными результатами; умеренный или высокий риск ошибок 1 и/или 2 рода
| III
| Нерандомизированные контролируемые исследования
| IV
| Нерандомизированные исследования с «историческим» контролем, мнения экспертов
| V
| Описание серии случаев, неконтролируемые исследования, мнения экспертов
|
III. ЛИТЕРАТУРА
1. Бурак Т.Ф., Луговой А.Е. Случай редкого осложнения трихинеллеза. Сборник материалов Евро-Азиатского Конгресса по инфекционным болезням; Витебск, 2008; Том 1: 130-131.
2. Гржибовский А.М. Анализ номинальных данных (независимые наблюдения). Экология человека (2008); 06: 58-68.
3. Литуев О.П. Случай редкого осложнения трихинеллеза. Сборник материалов Евро-Азиатского Конгресса по инфекционным болезням; Витебск, 2008; Том 1: 154-155.
4. Реброва О.Ю. Статистический анализ медицинских данных. Издательство «МедиаСфера», Москва, 2006: 305 с.
5. Andersen P.K. Survival analysis and interval-censoring. Handout of the lecture delivered at Nordic Summer School in Methods of Infectious Disease Epidemiology, Skjoldenæsholm, 1 July 2008.
6. B.R. Kirkwood, J.A.C. Sterne. Essential medical statistics. Second edition. Blackwell Science, 2003 – P.413-429.
7. Betty R. Kirkwood, Jonathan A.C. Sterne. Medical statistics (second edition). Blackwell Science, Inc. 2006: 501.
8. Brewer N.T., Salz T., Lillie S.E. Systematic review: the long-term effects of false-positive mammograms. Ann Intern Med. 2007 Apr 3; 146 (7): 502-510.
9. Bruno Lecoutre, Khadija Elqasyr. Play-the-winner rule in clinical trials: Models for adaptative designs and Bayesian methods / ERIS, Laboratoire de Math.ematiques Raphael Salem, UMR 6085, C.N.R.S. et Universit.e de Rouen. – P.1039-1047.
10. Cheung Y.K, Inoue L.Y.T., Wathen J.K. and Thall P.F. Continuous Bayesian adaptive randomization based on event times with covariates. Stat in Medicine 2006, 25, 55-70.
11. Comparative Obstetric Mobile Epidural Trial (COMET) Study Group UK. “Effect on low-dose mobile versus traditional epidural techniques on mode of delivery: randomized controlled trial” Lancet 358 (2001): 19-23.
12. de Lemos E.R., Rozental T., Villela C.L. Brazilian spotted fever: description of a fatal clinical case in the State of Rio de Janeiro. Rev Soc Bras Med Trop. 2002 Sep-Oct; 35 (5):523-525.
13. E.C. Huskisson Simple Analgesics for Arthritis Br Med J - 1974; 4:196-200
14. E.T. Janyes. Information theory and statistical mechanics I. Physical Review, 101: 620-630, 1957.
15. Eagle K.A., Lim M.J., Dabbous O.H. et al., for the GRACE Investigators. A Robust Prediction Model for all Forms of Acute Coronary Syndromes: Estimating the Risk of Six-Month Post-Discharge Death in the Global Registry of Acute Coronary Events (GRACE). JAMA. 2004; 291: 2727-33.
16. Gijbels I., Lin D.Y., Ying Z. 2007. Non- and semi-parametric analysis of failure time data with missing failure indicators. IMS Lecture Notes Monograph Series, 54: 203-223.
17. Granger C.B., Goldberg R.J., Dabbous O. et al., for the Global Registry of Acute Coronary Events Investigators. Predictors of hospital mortality in the Global Registry of Acute Coronary Events. Arch. Intern. Med. 2003; 163: 2345-53.
18. Gregory Dirienzo A. Using urn models for the design of clinical trials. Sankhya: The Indian Journal of Statistics. Special Issue on Biostatistics. 2000, Volume 62, Series B, Pt. 1, pp. 43–69.
19. Hallstrom A, Davis K: Imbalance in treatment assignments in stratified blocked randomization. Controlled Clinical Trials 1988, 9: 375-382.
20. Hedden Sarra L, Woolson Robert F, Malcolm Robert J. Randomization in substance abuse clinical trials. Substance Abuse Treatment, Prevention, and Policy. 2006, 1:6.
21. Hunter, J. E., & Schmidt, F. L. (1990). Methods of meta-analysis: Correcting error and bias in research findings. Newbury Park, CA: Sage.
22. Hunter, J.E., Schmidt, F.L., & Jackson, G.B. (1982). Meta-analysis: Cumulating research findings across studies. Beverly Hills, CA: Sage.
23. International Conference on Harmonization. Statistical Principles for Clinical Trials. http://www.fda.gov/cber/ich/ichguid.htm
24. Jens D. Lundgren et al. Copenhagen HIV Programme Annual Report, 2003: 36.
25. Johan Giesecke Modern infectious disease epidemiology, second edition. Publishing House “Hodder Arnold”, 2002: 268.
26. Johnson K.M. et al. Sexual networks of pregnant women with and without HIV-infection. AIDS (2003); 17: 605-12.
27. Klotz, JH. “Maximum Entropy Constrained Balance Randomization for Clinical Trials” Biometrics 34 (1978): 283-287.
28. Krieger J.N., Nyberg L.Jr., Nickel J.C. NIH consensus definition and classification of prostatitis. JAMA 1999; 282: 236–7.
29. Lachin J. M. Properties of simple randomization in clinical trials. Controlled Clinical Trials 1988, 9: 312-326.
30. Launary O. et al. Nevirapine or lamivudine plus stavudine and indinavir: examples of 2-class vs 3-class regimens for the treatment of human immunodeficiency virus type 1. Clin Infect Dis (2002); 35: 1096-1105.
31. Lin D.Y., Oakes D., Ying Z. 1998. Additive hazards regression for current status data. Biometrika, 85: 289-298.
32. M. Matsumoto, T. Nishimura (1998). «Mersenne twister: A 623-dimensionally equidistributed uniform pseudorandom number generator». ACM Trans. on Modeling and Comp. Simul. 8 (1): 3-30.
33. M. Zelen. Play the winner rule and the controlled clinical trial. Journal of the American Statistical Association, pages 131–146, 1969.
34. Miller R. Haemophilia and HIV/AIDS. Haemophilia Centre, Royal Free Hospital and School of Medicine, London, UK. AIDS Care. 1990; 2 (4): 413-7.
35. Mocroft A., Cozzi-Lepri A. Methodological and statistical issues in clinical HIV research. Materials of training seminar held at HIV epidemiology research unit, Dept. of Primary Care & Population Sciences, Sheila Sherlock Education Centre, Royal Free & University College Medical School (22 June - 24 June 2005).
36. Mocroft A., Katlama C., Johnson A.M. et al. AIDS across Europe, 1994–98: the EuroSIDA study. The Lancet; Vol 356 (July 22, 2000): 291-6.
37. O'Rourke PP, Crone RK, Vacanti JP, Ware JH, Lillehli CW, Parad RB, et al. Extracorporeal membrane oxygenation and conventional medical therapy in neonates with persistent pulmonary hypertension of the newborn: A prospective randomized study. Pediatrics 1989;84-957-63.
38. Pereira C., Bugalho A., Bergström S., Vaz F., Cotiro M. A comparative study of caesarean deliveries by assistant medical officers and obstetricians in Mozambique. Br J Obstet Gynaecol. 1996 Jun; 103(6): 508-12.
39. Pocock S.J., Henderson R.A., Rickards A.F. et. al. Meta-analysis of randomised trials comparing coronary angioplasty with bypass surgery. Lancet. 1995 Nov 4;346 (8984): 1184-1189.
40. Pocock, SJ, Simon R. “Sequential Treatment Assignment with Balancing for Prognostic Factors in the Controlled Clinical Trial” Biometrics 31 (1975): 103-115.
41. Quan Vu Minh, Richard W. Steketee, Linda Valleroy et al. HIV Incidence in the United States, 1978-1999. JAIDS Journal of Acquired Immune Deficiency Syndrome: Volume 31 (2) 1 October, 2002: 188-201.
42. R. Taylor, F. Najafi, A. Dobson. Meta-analysis of studies of passive smoking and lung cancer: effects of study type and continent. Journal of Epidemiology 2007 36(5):1048-1059.
43. Salerno S.M., Browning R., Jackson J.L. The effect of antidepressant treatment on chronic back pain: a meta-analysis. Arch Intern Med. 2002 Jan 14; 162 (1): 19-24.
44. Selwyn P.A., Hartel D., Lewis V.A. et al. Prospective study of tuberculosis among intravenous drug users with human immunodeficiency virus infection. N. Engl. J. Med. 1989; 320: 545-50.
45. Verweel G. et al. Nevirapin use in HIV-1 infected children. AIDS (2003); 17: 1639-47.
46. Vuylstene B.L. et al. HIV prevalence and risk behavior among clients of female sex workers in Abidjan, Cot d’Ivoire. AIDS (2003); 17: 1691-4.
47. Wei L., Lachin J. Properties of the urn randomization in clinical trials. Controlled Clin Trials 9: 345-364 (1988).
48. Z. D. Bai, F. Hu, and L. Shen. An adaptive design for multi-arm clinical trials. Journal of Multivariate Analysis, pages 1–18, 2002.
IV. ПРИЛОЖЕНИЯ
Дата добавления: 2015-09-03 | Просмотры: 1688 | Нарушение авторских прав
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
|