АкушерствоАнатомияАнестезиологияВакцинопрофилактикаВалеологияВетеринарияГигиенаЗаболеванияИммунологияКардиологияНеврологияНефрологияОнкологияОториноларингологияОфтальмологияПаразитологияПедиатрияПервая помощьПсихиатрияПульмонологияРеанимацияРевматологияСтоматологияТерапияТоксикологияТравматологияУрологияФармакологияФармацевтикаФизиотерапияФтизиатрияХирургияЭндокринологияЭпидемиология
|
РАНДОМИЗИРОВАННЫЕ КОНТРОЛИРУЕМЫЕ КЛИНИЧЕСКИЕ ИСПЫТАНИЯ (RANDOMIZED CONTROLLED CLINICAL TRIALS, РКИ)
Биомедицинские исследования данной разновидности являются экспериментальными (т.е. в процессе исследования производится активное вмешательство экспериментаторов в ход изучаемого процесса), и, обычно, продольными. Чаще всего они используются для сравнения эффективности различных способов оказания медицинской помощи (схем терапии, методов ухода за больными) либо медицинских технологий (сравнение эффективности фармацевтических препаратов, оперативных вмешательств либо методов диагностики).
Указанный дизайн имеет следующие особенности:
1. Исследования являются сравнительными - производится сравнение двух и более терапевтических подходов между собой (например, новая схема терапии сравнивается с уже существующими);
2. Для доказательства того, что улучшение состояния больных связано именно с проводимой терапией, а не с какими-либо еще неучтенными факторами, обязательно вводится контрольная группа;
3. Если общепринятая стратегия терапии интересующего исследователей заболевания до введения испытуемой схемы лечения отсутствовала, контрольная группа может состоять из нелеченных лиц (получающих плацебо);
4. Распределение больных по группам осуществляется путем т.н. рандомизации. Рандомизация - наиболее важная особенность РКИ, благодаря ее наличию РКИ являются «золотым стандартом» экспериментальных биомедицинских исследований;
5. На момент начала исследования все испытуемые группы должны быть очень похожими друг на друга (если не полностью идентичными) по величинам всех показателей, могущих повлиять на результат; благодаря рандомизации любые межгрупповые различия могут объясняться только случайностью (но не систематической ошибкой отбора).
Ограничения РКИ:
1. Данный дизайн пригоден только для экспериментальных исследований;
2. Принципы ведения больных, включенных в РКИ (в том числе - стандартный объем выполняемых обследований и частота врачебных осмотров) могут существенно отличаться от таковых, принятых в стационарах и амбулаториях для больных с данной нозологией, обычно - в лучшую сторону, что может искусственно увеличить приверженность лечению;
3. Выборка больных, включенных в РКИ, может оказаться нерепрезентативной, поскольку участники отбираются в исследование не случайным образом, а в соответствии с т.н. «критериями включения» (inclusion criteria) и наличием информированного согласия, и, соответственно, их показатели могут существенно отличаться от средних в генеральной совокупности (и реально наблюдаемых в клинической практике);
4. РКИ стоят дороже всех прочих типов биомедицинских исследований, поэтому их продолжительность ограничена (обычно - 48/96 неделями), и в рамках одного испытания, как правило, производится сравнение не более чем 2-3 различных терапевтических схем;
5. Ввиду вынужденной кратковременности РКИ в качестве регистрируемых исходов («конечных точек», endpoints) исследования обычно используются рассмотренные выше в разделе «когортные исследования» суррогатные маркеры (какие-либо лабораторные и/или инструментальные показатели). Более важные для понимания результатов изучаемого вмешательства «истинные» исходы за время проведения РКИ обычно не успевают развиться;
6. В случае, если исследуемое вмешательство существенно эффективнее того, с которым сравнивается (или наоборот), неэтично отказывать части больных (соответственно, из контрольной или опытной группы) в назначении более эффективного лечения. Кроме того, многие больные могут не согласиться отдать назначение своей терапии на волю случая;
7. РКИ малопригодны для исследования эффективности вмешательств при редких заболеваниях и состояниях, поскольку для этого необходимы значительные по объему исследуемые группы и продолжительный период наблюдения, что в рамках данного дизайна малодостижимо; для указанных исследований существует когортный дизайн.
Как уже упоминалось выше, наиболее важным этапом РКИ является процедура рандомизации. Данная процедура позволяет добиться того, что:
1. Сравниваемые группы больных имеют одинаковый размер;
2. Каждая из сравниваемых групп является случайной выборкой из генеральной совокупности больных с данной нозологией;
3. На момент начала исследования все испытуемые группы имеют одинаковые (или почти одинаковые) характеристики;
4. Субъекты исследования (т.е. больные) не знают, какое именно вмешательство будет им произведено (что исключает «эффект плацебо» либо давление на медицинский персонал с целью получения определенной схемы терапии); то же может касаться и лечащих врачей («слепое исследование» и «двойное слепое исследование», соответственно). В качестве крайнего варианта рассматривается «тройное слепое исследование», когда даже фармацевт, выдающий препараты для испытания, не знает, что именно он выдает (например, настоящий лекарственный препарат или плацебо). В идеале даже статистик, обрабатывающий результаты РКИ, не знает расшифровки рандомизационных кодов, что полностью исключает субъективный подход при анализе результатов исследования - проще говоря, субъективные предпочтения больных либо симпатии медицинского персонала к тому либо иному препарату не могут повлиять на учет эффективности данного препарата в сравнении с конкурирующей схемой лечения, и только организаторы / заказчики исследования, владеющие рандомизационными кодами, могут располагать истинными результатами испытаний;
5. Результаты РКИ можно распространить на всех больных с той же патологией;
6. Сравнение исходов вмешательства в исследуемых группах свободно от систематических ошибок (т.н. «biases», см. выше и ниже).
В качестве примера систематических ошибок, могущих иметь место при отсутствии рандомизации, можно привести исследование, проведенное в Мозамбике в 1996 г. В данном исследовании анализировались исходы операции кесарева сечения, выполненного опытными акушерами-гинекологами (113 случаев), в сравнении с исходами аналогичного вмешательства, проведенного фельдшерами (958 случаев). В итоге, вопреки здравому смыслу, никаких различий в исходах операций не было выявлено [35]. В данном случае, очевидно, имела место систематическая ошибка при формировании изучаемых групп (т.н. selection bias). В группу беременных, которым кесарево сечение выполняли фельдшеры, попали в основном женщины в удовлетворительном состоянии, при отсутствии тяжелых сопутствующих заболеваний, могущих привести к неблагоприятному исходу вмешательства. В случае наличия таковых операцию выполняли опытные врачи. В итоге оказалось, что беременных с благоприятным прогнозом вмешательства оперировали фельдшера, а с неблагоприятным - опытные врачи, и уровень квалификации врачей нивелировался тяжестью состояния рожениц.
При проведении рандомизации больные распределяются по исследуемым группам случайным образом. При этом все факторы, могущие оказать влияние на исход вмешательства, распределяются между группами приблизительно поровну. Данный момент позволяет избежать не только известных систематических ошибок при формировании групп, но и влияния неизвестных «вмешивающихся» факторов (confounders). Сокрытие результатов рандомизации («ослепление», blinding) позволяет исключить различия в ведении наблюдаемых больных. Соответственно, любые различия, регистрируемые в исследуемых группах после воздействия изучаемого вмешательства, могут быть отнесены на счет самого вмешательства. В случае, если распределение больных по группам определяется желанием лечащих врачей, больных либо каким-либо еще систематически действующим фактором, данное распределение не может считаться рандомизацией.
Рандомизацию не следует приравнивать к подбору случайной выборки (random sampling). Больные, распределенные в исследуемые группы путем рандомизации, редко являются случайной выборкой из какой-либо генеральной совокупности. Обычно они тщательно отбираются в исследование в соответствии со строгими критериями включения, при условии личного информированного согласия. Тем не менее, тот факт, что лечение назначается больным случайным образом, позволяет производить сравнение терапевтических схем, не опасаясь систематических ошибок. Именно поэтому РКИ обладают большей доказательностью по сравнению с прочими типами дизайна биомедицинских исследований, а полученные в процессе выполнения РКИ результаты имеют больший шанс повлиять на общепринятые терапевтические подходы и практику здравоохранения. Тем не менее, при проведении РКИ встает ряд проблем этического толка. В частности, новый способ терапии может оказаться как лучше, так и хуже предшествующих. В обоих случаях больные либо в контрольной, либо в опытной группе будут получать не самую лучшую из возможных схем лечения, что неминуемо отразится на динамике и прогнозе заболевания (т.е., в конечном итоге, на жизни и здоровье испытуемых больных). В этой связи РКИ обычно предусматривают проведение промежуточных анализов результатов исследования через заранее определенные интервалы времени; в случае, если по данным промежуточных анализов один из способов лечения окажется достоверно более эффективным, чем другие, исследование должно быть досрочно завершено, а все больные - переведены на наиболее эффективную схему терапии. При этом выполнение этапов РКИ должно контролироваться комитетом по этике того учреждения, на базе которого проводится исследование; с указанным комитетом должны согласовываться любые изменения протоколов обследования, лечения или форм информированного согласия.
РКИ включает в себя рад последовательных этапов и необходимых элементов:
1. Разработка протокола исследования.
Протокол исследования - официальный документ, в деталях описывающий цели и задачи, а также методы исследования. Обычно включает в себя следующие разделы:
- обоснование, гипотеза и цели исследования;
- методы исследования (дизайн испытания, критерии включения/исключения, планируемые вмешательства, метод рандомизации участников, сокрытие результатов рандомизации, первичные и вторичные «конечные точки» исследования, способ определения размера исследуемых групп);
- анализ результатов исследования (планируемые сравнения, используемые статистические методы);
- процедуры исследования (получение информированного согласия участника, регистрация участников, процедура рандомизации, схема наблюдения за участниками);
- форма одобрения этического комитета, план наблюдения за ходом исследования, формы сбора данных и опросные листы, решение административных вопросов).
2. Выбор конкретной разновидности дизайна РКИ.
А) Параллельный дизайн (parallel group trial)
В этом случае все участники исследования рандомизируются либо в группу А, либо в группу В, при этом в каждой из групп испытывается только один метод терапии. Соответственно, каждый отдельно взятый больной получает только одну схему лечения (см. рис. 5). Такой подход сокращает сроки исследования, но требует набора большого количества добровольцев для достижения однородности сравниваемых групп; кроме того, возможна этическая проблема, связанная с тем, что один из сравниваемых способов лечения может оказаться изначально более эффективным или безопасным, чем другой (другие).
Б) Последовательный дизайн (sequential design)
Данная схема подразумевает назначение одной из сравниваемых схем терапии всем добровольцам, включенным в РКИ, а затем, по истечении заранее оговоренного «отмывочного периода» - второй, третьей схемы терапии и т.д. Сроки исследования при этом удлиняются, но зато уменьшается требуемое количество участников исследования. Этическая проблема в данном случае состоит в том, что во время «отмывочного периода» все больные-участники РКИ не получают никакого лечения (см. рис. 6).
Рис. 5. Принцип организации параллельного дизайна.
Рис. 6. Принцип организации последовательного дизайна.
В) Перекрестный дизайн (crossover trial)
В данном случае каждый участник исследования получает вначале одну схему терапии, а затем, после некоторого промежутка времени - другую, причем порядок назначения схем лечения рандомизируется для каждого отдельно взятого больного. В этом случае каждый участник исследования является «контролем» сам для себя (рис. 7). Данный тип дизайна РКИ требует меньших размеров испытуемых групп, но пригоден лишь для оценки краткосрочных эффектов терапии у больных хроническими заболеваниями и состояниями. При этом указанный дизайн сохраняет недостатки последовательного: во время отмывочного периода участники РКИ не получают никакого лечения. В то же время перекрестный дизайн свободен от недостатков параллельного дизайна - устранена возможная неэквивалентность применяемых в сравниваемых группах схем терапии, поскольку одни и те же больные по очереди подвергаются всем испытуемым вмешательствам.
Г) Кластерный дизайн (cluster randomized trial)
В этом случае дизайн исследования напоминает РКИ с параллельными группами (см. выше), но рандомизации в исследуемые группы подвергаются не отдельные лица, а т.н. «кластеры» участников (например, все больные, госпитализированные в определенное отделение стационара, на базе которого проводится РКИ, будут включены в состав одного кластера; в другой кластер могут быть включены все больные, обслуживаемые семейным врачом - участником РКИ). При этом каждый отдельный кластер (все его участники) получает только одну из возможных схем терапии. Данный тип дизайна используется для анализа «групповых» вмешательств либо при проведении больших многоцентровых РКИ (рис. 8).
Рис. 7. Принцип организации перекрестного дизайна.
Рис. 8. Принцип организации кластерного дизайна.
Д) Парный дизайн (paired design)
Данный тип дизайна подразумевает рандомизацию больных в несколько групп, получающих различные схемы терапии (как в случае параллельного дизайна), но учет результатов производится строго в парах пациентов; при этом можно выявить межиндивидуальную вариабельность эффекта лечения (рис. 9).
Е) Адаптивный дизайн (adaptive design)
При использовании адаптивного дизайна сравниваемые группы формируются по сложным алгоритмам, исходя из прогнозируемой и текущей эффективности исследуемых воздействий; формирование групп происходит таким образом, чтобы в группе, где применяют наиболее эффективное лечение, оказалось больше добровольцев, чем в остальных. При этом отчасти решается этическая проблема неэквивалентных по эффективности схем терапии, и, кроме того, такая схема позволяет уменьшить влияние межиндивидуальной вариабельности на результат исследования (см. рис. 10).
Рис. 9. Принцип организации парного дизайна.
Рис. 10. Принцип организации адаптивного дизайна.
Ж) Факторный дизайн (factorial design, «латинский квадрат»)
В этом случае количество формируемых групп добровольцев соответствует количеству ячеек латинского квадрата, построенного с использованием сравниваемых терапевтических схем и контрольной группы в качестве n символов матрицы (см. рис. 11). Каждая ячейка латинского квадрата (т.н. блок) образуется на пересечении двух символов; в результате общее количество блоков соответствует полному набору возможных комбинаций всех сравниваемых опций (т.е. схем терапии и контрольных групп). Метод позволяет учесть воздействие каждого из учитываемых факторов (в том числе - плацебо-эффекта) на исход лечения. Оценку результатов исследования с факторным дизайном выполняют с использованием дисперсионного анализа.
З) Дизайн Зелена (Zelen's design)
Данная разновидность дизайна была предложена статистиком Мартином Зеленом. Суть ее состоит в том, что рандомизацию больных в сравниваемые группы осуществляют до подписывания ими информированного согласия. При этом те больные, которые по результатам рандомизации должны получать стандартное, общепринятое лечение, вообще не информируются о том, что они участвуют в клиническом испытании. В то же время больных, распределенных в группу с экспериментальным вмешательством, извещают о том, что они участвуют в РКИ; им также сообщают и о существовании стандартной схемы лечения их заболевания и дают возможность перейти в группу, ее получающую. Если больные, вопреки результатам рандомизации, перейдут в группу, получающую стандартное вмешательство, результаты их лечения все равно анализируются так, как если бы вмешательство было экспериментальным. Преимуществом данного дизайна является возможность выбора, предоставляемая участникам РКИ, что обеспечивает включение в исследование максимального количества добровольцев из доступных. Недостатки у данного дизайна следующие: 1) РКИ с дизайном Зелена вынужденно являются открытыми исследованиями; 2) возможен недостаток статистической мощности исследования вследствие того, что значительная часть пациентов предпочтет стандартное вмешательство экспериментальному; 3) имеется этическая проблема, т.к. больные, получающие стандартную терапию, не информируются об их участии в РКИ. Эту проблему было предложено решать путем предоставления этим больным возможности тоже перейти в группу, в которой применяется экспериментальное вмешательство (т.н. «дизайн с двойной рандомизацией»). Естественно, сокрытие результатов рандомизации («ослепление») при этом невозможно. В целом, считается, что дизайн Зелена наиболее точно моделирует реальные условия применения нового метода, а также позволяет оценить приверженность («комплаентность») больных назначенной терапии. Полученные результаты оцениваются с применением кластерного анализа (см. рис. 12).
Известен случай, когда дизайн Зелена был использован в РКИ для испытания нового метода экстракорпоральной мембранной оксигенации у детей с фатальными заболеваниями бронхолегочной системы только для того, чтобы не давать родителям половины детей, получающих обычную схему ИВЛ, необоснованной надежды на существование лучшего метода респираторной поддержки [37].
Рис. 11. Принцип организации факторного дизайна.
Рис. 12. Принцип организации дизайна Зелена.
3. Подбор участников исследования.
Необходимо разработать четкие, объективные критерии включения в РКИ / исключения из РКИ. Узкие, строгие критерии включения позволяют сфокусировать внимание на тех больных, у которых испытуемое лечение будет наиболее эффективно; при этом вариабельность исходов терапии уменьшится. В то же время, если мы хотим, чтобы полученные результаты можно было экстраполировать на генеральную совокупность лиц с данной патологией, исследуемая выборка должна быть репрезентативной. Вследствие указанного ограничения РКИ часто критикуют за излишнюю «эксклюзивность» (например, из рандомизированных исследований часто исключаются больные с сопутствующей патологией или не говорящие на государственном языке). Кроме того, многие больные могут вообще отказаться от рандомизации из-за личных терапевтических предпочтений.
Например, в большинстве исследований, посвященных влиянию статинов на липидный обмен, одним из критериев включения являлся возраст больных, причем обычно исключаются лица моложе 30 и старше 75 лет. При этом в исследование не попадают наиболее пожилые пациенты, у которых вероятность развития атеросклероза наибольшая.
Другим примером критериев включения в исследование является РКИ, посвященное сравнению различных схем искусственного вскармливания детей ВИЧ-инфицированных женщин. При этом отбор исследуемых лиц производился среди 16529 беременных женщин, посещающих 4 акушерские клиники в Найроби. Из них 2315 оказались ВИЧ-позитивными, 1708 вернулись, чтобы узнать результаты обследования на ВИЧ, и 425 (18% от общего числа ВИЧ-позитивных женщин) были включены в исследование. Критерии исключения были следующими: нежелание рандомизировать способ вскармливания, нежелание подчиняться приказам исследователей, наличие планов покинуть Найроби после родов, нежелание подвергаться регулярным обследованиям.
4. Разработка метода назначения терапевтических схем (т.е. собственно рандомизация).
Рандомизированное назначение терапевтических схем гарантирует, что исследуемые группы будут сбалансированы по основным показателям на большом отрезке времени. Дисбаланс групповых показателей может возникнуть в том случае, если исследуемые группы немногочисленны.
Для «выравнивания» небольших групп по отдельным показателям используется т.н. «стратифицированная рандомизация». В этом случае рандомизация проводится в подгруппах, предварительно выделенных из общего пула больных по признаку наличия либо отсутствия какого-либо фактора (факторов), оказывающего существенное влияние на предполагаемый исход исследования.
Формируемые путем рандомизации группы должны быть примерно одинаковы по размеру - при этом уменьшается дисперсия значений изучаемых признаков. В то же время требование одинакового размера групп привносит в их формирование некоторую систематическую составляющую, что повышает риск появления систематических ошибок формирования групп - т.н. selection biases. В результате приходится прибегать к компромиссным решениям - т.н. «ограниченным» (restricted) методикам рандомизации.
Различают следующие схемы распределения изучаемых лиц по группам:
1) Статическая - определяется до начала формирования сравниваемых групп, в дальнейшем не меняется. Этот тип распределения используется почти во всех проводимых РКИ.
Разновидности: - простая (simple), или полная (complete) рандомизация;
- перестановка блоков (permuted blocks);
- модель урны для голосования (urn models);
- подбрасывание асимметричной монеты (biased coin);
- непосредственное назначение (direct assignment).
2) Ковариативная адаптивная (covariate adaptive) - изменяется в зависимости от наблюдаемого соотношения различных существенных признаков (ковариат) у лиц, уже вовлеченных в исследование.
Разновидности: - минимизация: распределение по группам с целью в какой-либо
степени минимизировать дисперсию либо эффективность.
а) метод максимальной энтропии (maximum entropy);
б) метод минимального правдоподобия (minimal likelihood).
3) Реактивная адаптивная (response adaptive) - изменяется в зависимости от особенностей реакции уже вовлеченных в исследование лиц на изучаемые воздействия.
Разновидности: - «игра на лидера» (play the winner).
Статические схемы нежелательно применять в том случае, если число независимо анализируемых подгрупп (страт) внутри изучаемых групп сравнения сравнимо с количеством больных в каждой из страт; в этом случае лучше работают адаптивные схемы. В том случае, когда наряду с получением информации о сравнительной эффективности различных методов лечения необходимо (с этических позиций) вовремя перевести больных на схему терапии, оказавшуюся наиболее эффективной, реактивная адаптивная схема (т.е. «игра на лидера») вынужденно оказывается более предпочтительной.
Наиболее часто используемые в исследовательской практике схемы рандомизации - полная (complete), простая, перестановка блоков, модель избирательной урны и ковариативная адаптивная. Из указанных схем только полная рандомизация не является ограниченной («restricted»). В случае простой рандомизации, модели избирательной урны и перестановки блоков предполагается предварительное проведение стратификации, что призвано обеспечить баланс частот и выраженности различных признаков в формируемых группах. При этом желателен продуманный, взвешенный подход в выборе признаков для стратификации, иначе размер полученных групп в результате чрезмерно сократится. В то же время ковариативная адаптивная схема исходно адаптирована для получения сбалансированных по всем существенным признакам групп сравнения.
Простая рандомизация (также называемая полной) - рандомизация без ограничений, предполагаемых процессом распределения испытуемых лиц по группам, за исключением предварительного определения общего размера исследуемой выборки. В частности, простая рандомизация имеет место в случае, когда общий размер выборки (n) точно определен заранее, причем схему лечения А получает подгруппа, состоящая из n/2 случайно отобранных индивидуумов, в то время как оставшиеся n/2 больных получают схему лечения Б. Последующее проведение стратификации обеспечивает баланс ковариаций в формируемых группах. Существует много разновидностей простой рандомизации:
1) Бросание монетки («орел или решка»). Позволяет рандомизировать больных в две сравниваемые группы. Образно говоря, перед назначением больного в одну из испытуемых групп исследователь подбрасывает монетку, и если выпадает орел - то больной приписывается к группе А, а если решка - то к группе Б. Метод удовлетворительно работает при больших размерах групп, но на его эффективность могут оказывать влияние случайные факторы - в частности, результат зависит от силы и направления броска, а также от степени симметричности монеты и ее сбалансированности по весу, т.к. при наличии эксцентриситета центра масс вероятность выпадения одной из сторон при равной силы бросках будет значимо выше, чем другой, что будет являться систематически действующим фактором.
2) Бросание игральной кости. Позволяет рандомизировать больных в четное число групп (до шести). При этом определенные выпадающие номера соотносятся с распределением испытуемых в определенную группу (например, четные номера - распределение в группу А, нечетные номера - в группу Б; или номера 1-2 - группа А, 3-4 - группа Б, 5-6 - группа В). Недостатки данного метода такие же, как и у предыдущего - он обеспечивает приблизительно равную численность групп только при их больших размерах, кроме того, возможны систематические ошибки распределения выпадающих номеров в зависимости от силы и направления бросков, а также балансировки кости (это хорошо знают шулеры).
В настоящее время методы 1 и 2 имеют лишь историческое значение либо применяются в странах с ограниченными ресурсами.
3) Использование таблицы или последовательности случайных номеров (например, таблицы В13 по Altman или последовательности псевдослучайных чисел, генерируемых программой STATA). Принцип метода такой же, как у вышеперечисленных - определенный пул номеров соотносится с распределением больных в определенную группу. При этом новые номера в таблице считываются в определенной исследователями очередности (скажем, слева направо сверху вниз), один за другим, и сравниваются с заранее заданными интервалами, закрепленными за определенными испытуемыми группами; использованные номера зачеркиваются. Если используется не таблица, а генератор псевдослучайных чисел (ГПСЧ), то новые числа выдаются им последовательно, одно за другим, после чего алгоритм действий такой же (например, если ГПСЧ выдает случайные числа из интервала 0…1, то выпадение числа в интервале 0…0,5 может соответствовать распределению в группу А, а в интервале 0,51…1 - в группу Б, ГПСЧ же запускается при включении в исследование каждого нового больного). Все ГПСЧ продуцируют не случайные, а т.н. псевдослучайные числа, т.к. каждое последующее число отчасти определяется предыдущим. Важнейшей характеристикой ГПСЧ является его «период» - количество итераций, по прошествии которого генератор «зацикливается», т.е. начинает вновь выдавать ранее сгенерированную числовую последовательность. Период разных ГПСЧ различен и составляет от 232 для генератора, встроенного в MS Excel, до 219937-1 для алгоритма «вихрь Мерсенна» (Mersenne twister) [32]. Ранние ГПСЧ грешили коротким периодом (рекорд здесь принадлежит, вероятно, генератору, реализованному на ДВК Basic, который зацикливался через 8192 итерации); естественно, короткий период повторения числовой последовательности является систематически действующим фактором, влекущим за собой ухудшение качества рандомизации. Тем не менее, в настоящее время практически все современные ГПСЧ удовлетворяют требованиям биомедицинских исследований. К числу надежных ГПСЧ относятся, помимо «вихря Мерсенна», AES_OFB, TWOFISH_OFB, Blum-Blum-Shub.
4) Алфавитный метод. Если фамилия (или имя) больного начинается на букву в интервале А-М, он попадает в группу А, а если в интервале Н-Я - то в группу Б; число групп и размеры интервалов могут варьироваться. Ненадежный способ рандомизации, поскольку в обществе могут существенно преобладать всего несколько десятков фамилий - «Иванов, Петров, Сидоров» (на самом деле самые распространенные фамилии в России на текущий момент в порядке убывания - Смирнов (1,86% населения), Иванов (1,33%), Кузнецов (1,0%), Соколов (0,86%), Попов (0,80%). Для имен это еще более справедливо - существенное преобладание всего нескольких имен на протяжении нескольких лет как дань своеобразной моде известно всем. Соответственно, избавиться от систематической ошибки при формировании групп в принципе невозможно, т.к. процесс присвоения имен испытуемым (и наследования фамилий) не находится во власти исследователей и, соответственно, не является случайным.
5) Рандомизация по номеру телефона / социальной страховки. Является вариантом рандомизации по таблице случайных номеров (см. выше), с поправкой на то, что номера телефонов либо страховых свидетельств могут быть неслучайными (например, в некий стационар обращаются в основном жители примыкающих микрорайонов, вследствие чего их номера телефонов принадлежат всего 1-2 пулам и начинаются на одинаковые цифры). Соответственно, пользоваться данным способом рандомизации не рекомендуется, поскольку будет трудно избавиться от систематической ошибки в формировании сравниваемых групп.
6) Последовательная рандомизация. При этом больные, поступившие в течение часа (вариант - до обеда), определяются в группу А, а поступившие в течение следующего часа (соответственно, после обеда) - в группу Б и т.п. Проблема данного метода состоит в том, что время поступления больных может быть неслучайным (ночью и в ранние утренние часы экстренно поступают тяжелые больные, в частности, дети ранних возрастов, с утра до обеда госпитализируются пенсионеры и школьники, после обеда и до позднего вечера - работающие люди и т.д.). Вследствие этого возможны систематические ошибки при формировании исследуемых групп - в группу, набранную до обеда, попадут преимущественно дети и пожилые люди, а после обеда - рабочие и служащие средних лет. Данный метод также не рекомендуется к практическому применению.
Все вышеперечисленные методы распределения больных в группы, строго говоря, являются «почти случайными», поскольку несвободны от систематических ошибок. Разница между методами состоит в том, что в некоторых из них влияние систематических ошибок может быть сведено к пренебрежимо малому (например, в методе с применением таблиц или последовательностей случайных номеров - при использовании качественного ГПСЧ с надежным алгоритмом и значительной длиной псевдослучайной последовательности). В остальных случаях систематические ошибки являются неотъемлемой, неконтролируемой и неустранимой чертой описанных методик (неидеальная балансировка монет и игральных костей, неконтролируемо разные сила и направление бросков, преобладание в популяции некоторых имен и фамилий и т.д.), что препятствует их практическому использованию, несмотря на простоту, доступность для понимания (хорошее знание математики среди врачей и биологов - редкость) и дешевизну.
Полная (простая) рандомизация - единственная схема, полностью свободная от ограничений, т.о., распределение больных по группам при этом полностью свободно от систематических ошибок. Данный тип рандомизации по умолчанию предполагает, что каждый больной, включенный в исследование, имеет 50% вероятность оказаться в группе А и одновременно - 50% вероятность быть распределенным в группу Б, независимо от каких-либо ранее имевших место дисбалансов в распределении схем лечения. Таким образом, важным свойством полной рандомизации является минимизация предопределенности в процессе распределения по группам. Тем не менее, при наличии ограничений на количество пациентов в группах может иметь место существенный дисбаланс по этому показателю. Например, если необходимо набрать 2 группы по 5 больных в каждой, существует возможность, что в группу А попадет от 0 до 10 человек. Для рассматриваемой группы в 10 человек вероятность оптимального баланса (по 5 человек в каждой из групп) составляет 24,61%. Таким образом, безо всяких дополнительных манипуляций вероятность возникновения дисбаланса составляет 75%. Соответственно, наиболее существенная проблема полной рандомизации - ненулевая вероятность дисбаланса состава формируемых групп (высокая вероятность малого дисбаланса и малая вероятность значительного дисбаланса, соответственно). Если принять за «значительный дисбаланс» разницу в численности формируемых групп в 20% и более, то его вероятность составит 2,16% для вышеупомянутой группы в 10 человек. Дисбаланс количественного состава групп влечет за собой снижение статистической мощности исследования. Ввиду этого, полная рандомизация рекомендуется для исследований, включающих не менее (лучше - более) 200 больных [29].
Существует вариант полной рандомизации, называемый «асимметричная монета» (biased coin), который специально предназначен для ликвидации количественного дисбаланса в формируемых группах непосредственно в процессе рандомизации. В случае, если дисбаланс состава групп выходит за некоторые неприемлемые для исследователей пределы, вводится поправочный коэффициент, повышающий (или понижающий) шансы больного оказаться в той или иной группе испытуемых. Наиболее показательно применение данного метода при использовании рандомизации с помощью последовательности случайных чисел. Предположим, что рандомизация производится в группы А и В; генератор случайных чисел выдает целые числа в диапазоне от 1 до 10, и если выпавшее число меньше или равно 5, больной попадает в группу А, иначе - в группу В. Предположим, что на каком-либо этапе рандомизации в группе А оказалось 7 человек, а в группе В - только 3. В таком случае вводится поправочный коэффициент 1,5, на который умножается выпадающее случайное число; в результате шансы больного попасть в группу А уменьшаются на 20%, и в процессе дальнейшей рандомизации количественный состав формируемых групп постепенно выравнивается. Образно говоря, мы начинаем подбрасывать асимметричную монету вместо «идеальной». При этом распределение участников исследования по группам остается в целом случайным, метод прост в исполнении, но малопригоден для работы с небольшими группами.
Как упоминалось выше, особенность полной рандомизации - минимизация систематических ошибок отбора благодаря равной вероятности назначения любой из тестируемых схем лечения при их последовательном переборе. Соответственно, ни больные, ни медицинский персонал и исследователи никоим образом не могут предугадать группу, в которой окажется тот или иной больной, что, в свою очередь, снижает детерминизм распределения.
Тем не менее, вышеуказанный дисбаланс количественного состава групп не может замаскировать признаки эффективности сравниваемых терапевтических схем. Это может произойти при межгрупповом дисбалансе ковариат - существенных признаков, независимо (от проводимого вмешательства) влияющих на исход эксперимента. Естественно, цель большинства схем рандомизации - не только выровнять группы количественно, но и минимизировать указанный дисбаланс ковариат. К сожалению, полная рандомизация не позволяет добиться этого. Более того, сопутствующее проведение стратификации в данном случае бессмысленно, поскольку вероятность дисбаланса ковариат при полной рандомизации после стратификации равна таковой без стратификации [29]. При всем том, очень хорошего баланса ковариат можно добиться при использовании стратификации вместе с простой рандомизацией (см. выше), что на практике означает разбиение общей группы испытуемых на подгруппы по наличию / отсутствию / выраженности тех либо иных ковариат (страт) с последующим проведением простой рандомизации в полученных однородных подгруппах, с условием (назовем его ограничением), что общее количество больных внутри каждой подгруппы, получающих любую из сравниваемых схем лечения, должно быть одинаковым.
Стратификация - процесс разделения лиц, включаемых в РКИ, на подгруппы по признаку наличия либо отсутствия каких-либо факторов, могущих независимо от проводимого вмешательства повлиять на исход исследования (рост, вес, возраст, пол, сопутствующие заболевания и т.п.), после чего внутри полученных однородных подгрупп проводится рандомизация. Например, известно, что при лечении наркомании пол больного влияет на исход независимо от проводимой терапии; в этом случае пол может быть использован как фактор для стратификации. При этом группа мужчин отделяется от группы женщин, после чего внутри каждой группы проводится рандомизация в подгруппы, получающие различные режимы терапии; в дальнейшем сравнение эффективности указанных режимов производится независимо в обоих группах. При таком подходе удается надежно (благодаря рандомизации) оценить эффективность различных схем лечения наркомании для каждого пола в отдельности [20]. Таким образом, можно считать, что стратификация способствует уменьшению случайных ошибок (accidental bias) при формировании групп. Под «случайными ошибками» понимают систематические ошибки, обусловленные неравномерным распределением в сравниваемых группах известных либо неизвестных факторов, независимо влияющих на исход планируемого испытания. Строго говоря, стратификация используется для достижения сбалансированного распределения ковариаций в сравниваемых группах. Соответственно, все различия в наблюдаемых исходах становится возможным объяснить только различием вмешательств, имевших место в сравниваемых группах. Еще одно преимущество стратификации - возрастание мощности (power) статистических исследований. Мощность, напомним, определяется как минимальный уровень истинной разницы между группами, который можно выявить в данном исследовании с учетом особенностей его дизайна. Так, при наличии в исследовании 100 человек его мощность при условии стратифицированной рандомизации выросла почти на 12%. Снижается также вероятность ошибок I и II типов при выполнении статистической обработки результатов [20]. Тем не менее, стратификацию желательно проводить по минимальному количеству факторов, действительно существенно влияющих на исходы - при этом сам процесс стратификации упрощается; кроме того, чрезмерная стратификация приводит к дисбалансу в распределении схем вмешательств, поскольку большое количество факторов стратификации (страт) приводит к малому размеру результирующих подгрупп. Пока количество страт достаточно мало, у стратификации нет недостатков.
Перестановка блоков (permuted blocks) - пример исходно ограниченной схемы рандомизации. Данный метод предотвращает дисбаланс количественного состава групп посредством введения ограничительного условия - полного равенства размера образующихся при рандомизации групп сравнения. Простая рандомизация, упомянутая выше, тоже имеет подобное ограничение; тем не менее, размер формируемых данным способом групп может оказаться неодинаковым вплоть до момента набора нужного количества больных в каждую из них. Принцип метода перестановки блоков состоит в следующем: из всех вариантов распределения больных по группам, повторенных требуемое количество раз, формируется т.н. блок. Размер блока произволен, но общее количество вариантов в блоке должно быть кратно количеству сравниваемых вмешательств. Например, если требуется быстро распределить больных по группам А и В так, чтобы размер обеих групп все время оставался одинаковым, можно распределять в обе группы по 2 больных на каждом этапе рандомизации; при этом размер блока будет равен 4. Существует 6 вариантов взаимного расположения «А» и «В» в таком блоке: AABB, ABAB, ABBA, BBAA, BABA, BAAB. В процессе распределения больных по группам один из таких блоков выбирается случайным образом (например, компьютером, либо экспериментатор, непосредственно осуществляющий рандомизацию, выбирает неподписанный конверт из тщательно перетасованной пачки таких же, вскрывает его и достает оттуда карточку - схему блока рандомизации). Понятно, что в данном случае проходят процедуру рандомизации одновременно 4 человека, причем в каждую из формируемых групп попадут 2 из них. При размере блока 2 и наличии двух альтернативных вмешательств А и В рандомизация перестановкой блоков, по сути, сводится к простой, или полной рандомизации (см. выше). Размер блока может быть и более четырех - 6, 8, 10 и т.п., в соответствии с потребностями исследователей; при этом он должен оставаться кратным количеству сравниваемых вмешательств (в данном случае 2 - А и В). Существует разновидность данного метода, когда внутри каждого блока производится независимая рандомизация вариантов распределения больных в группы в желаемой пропорции, например, 1: 2 или 1: 3. Существует также вариант метода, называемый «перестановка случайных блоков» - в этом случае случайным образом меняется размер самих блоков (в рамках решаемой задачи, оставаясь кратным числу сравниваемых вмешательств), причем размер каждого последующего блока остается неизвестен исследователям.
Рандомизация участников исследования последовательными блоками - пример дизайна, сохраняющего баланс сравниваемых групп на протяжении всего исследования. Тем не менее, обеспечивается только баланс количественного состава групп, но не важных характеристик больных. Кроме того, данный дизайн может вносить элемент предопределенности в формирование групп при несоблюдении условия сокрытия рандомизации из-за наличия периодически повторяющихся элементов в конце каждого блока. Например, представим себе клиническое испытание, где производится рандомизация в 3 группы блоками по 6 больных. В этом случае, если первые 5 номеров в блоке имеют последовательность 2, 3, 1, 1, 2, то шестым с неизбежностью окажется номер 3, что делает распределение предсказуемым. Данный недостаток (разновидность selection bias) отчасти преодолевается использованием случайного размера собственно блоков (именно такая разновидность данного метода и называется permuted blocks design - дизайн с перестановкой блоков). В конечном итоге, рандомизация блоками не предоставляет возможностей для достижения баланса существенных признаков (ковариат - см. выше) в формируемых группах. С указанной целью можно использовать стратифицированную рандомизацию блоками, когда данная схема применяется после стратификации, последовательно в каждой страте (см. «стратификация»). При этом количество страт должно быть ограничено, поскольку дизайн с перестановкой блоков рассчитан на максимальный размер отдельного блока, кратный суммарному количеству уровней стратифицирующих факторов-ковариат (т.е. страт). При этом чем больше размер отдельных блоков, тем выше вероятность возникновения дисбаланса формируемых групп (особенно при их небольшом и не кратном величине блока размере). В итоге, стратифицированная рандомизация перестановкой блоков может создать приблизительный баланс распределения схем вмешательств в каждой из страт; тем не менее, исследование в целом может характеризоваться определенным дисбалансом состава групп в случае, если количество страт велико либо размер блоков значителен по сравнению с числом больных, включенных в испытание [19]. Кроме того, данная модификация неудобна при работе с малыми группами.
Главное преимущество титульного дизайна - простота применения, что не относится к стратифицированной рандомизации перестановкой блоков, которая может быть осуществлена без ошибок только при наличии соответствующего программного обеспечения. Тем не менее, после определения стратифицирующих факторов, размера блока и количества формируемых групп схема распределения может быть полностью расписана до начала клинических испытаний, после чего она остается статической в продолжение всего исследования. Правильный анализ результатов исследования должен учитывать все использованные стратифицирующие факторы и размер блока.
Модель избирательной урны (urn model) - одна из наиболее сложных схем рандомизации; тем не менее, при правильном применении она обеспечивает лучший баланс численного состава групп, чем полная рандомизация (особенно при работе с малыми группами), и в то же время не страдает излишней предсказуемостью, как метод перестановки блоков. Модель избирательной урны удобна также для тех случаев, когда размер формируемых групп на момент начала исследования еще не определен.
Принцип модели избирательной урны состоит в следующем: исследователи используют непрозрачную емкость («урну»), реальную или ее компьютерную модель. В урне имеются шары различных цветов, каждый цвет соответствует одной из формируемых групп. Исходное количество шаров разного цвета в урне всегда одинаково (в том числе оно может быть равным нулю). В наиболее простой ситуации мы формируем две группы. В этом случае у нас в урне имеются шары двух цветов - например, красного и синего. Если исследователь вытаскивает из урны красный шар - больной определяется в группу А, если синий - в группу В. Метод работает следующим образом: если из урны извлечен шар красного цвета, то больной направляется в группу А, красный шар возвращается обратно в урну, после чего в урну добавляются один или несколько (всегда одинаковое, заранее оговоренное количество) шаров синего цвета. Принцип метода состоит в том, что после выбора больного в одну из групп шансы следующего больного попасть в другую группу искусственно несколько повышаются (степень повышения зависит от количества добавленных шаров соответствующего цвета), что и обеспечивает в конечном итоге существенно бóльшую вероятность баланса количественного состава формируемых групп, чем в случае простой (полной) рандомизации. В случае, если формируется более двух групп, принцип не меняется - извлеченный шар определенного цвета возвращается назад, после чего в урну вносится определенное одинаковое количество шаров всех остальных цветов. По сути, модель избирательной урны - усложненная разновидность упоминавшегося ранее дизайна «асимметричная монета» (biased coin).
Общее количество шаров каждого цвета, находящихся в урне на момент начала рандомизации, принято обозначать как α, а количество шаров другого цвета (цветов), добавляемое после каждой итерации рандомизации - как β. Один из наиболее простых вариантов реализации модели избирательной урны, когда α=1 и β=1, приведен на рисунке 13.
Рис. 13. Иллюстрация принципа работы модели избирательной урны (по [47]).
В случае, когда α=0, β>0, т.е. исходно урна шаров не содержит, первый больной распределяется в какую-либо из групп по результату настоящего или смоделированного броска «идеальной», т.е. симметричной, монеты. После этого в урну добавляется заданное количество шаров другого цвета (цветов), и процесс рандомизации продолжается как описано выше.
Согласно модели Фридмана (Friedman, 1949), вероятность, с которой больной попадает в группу А, вычисляется по формуле:
,
где: α, β≥0, причем либо α, либо β обязательно больше 0,
φ(Dn, n) - собственно, вероятность распределения в группу А,
n - предполагаемое количество больных в обоих формируемых группах,
Dn - величина дисбаланса между формируемыми группами (человек), причем
Dn=n(A) − n(B),
α - общее количество шаров каждого цвета, находящихся в урне на момент
начала рандомизации,
β - количество шаров другого цвета (цветов), добавляемое после каждого шага
рандомизации
Вероятность, с которой больной попадет в группу В, вычисляется как 1 − φ(Dn, n).
Принято считать, что при проведении простой (полной) рандомизации и достаточно большой величине n обе вероятности стремятся к 0,5.
В случае модели избирательной урны φ(Dn, n) монотонно снижается с возрастанием дисбаланса Dn при фиксированном n и стремится к 0,5 с возрастанием n при фиксированном Dn (см. рис. 14, 15).
Рис. 14. График вероятности попадания произвольного больного в группу А.
α = 10, β = 5, n = 30.
Рис. 15. График вероятности попадания произвольного больного в группу А.
α = 10, β = 5, n = 3000.
Для случая, когда α=0, β>0, величина φ(Dn, n) не зависит от величины β, а схема рандомизации может быть сведена к классической перестановке блоков (см. выше), когда имеется только один блок с размером, увеличивающимся на одну и ту же величину при каждом шаге рандомизации. Такой вариант метода обеспечивает хороший количественный баланс формируемых групп, особенно при небольших n (рис. 16). В этой связи вариант метода (α=0, β>0) предпочтительнее при рандомизации больных в небольшие группы.
Рис. 16. График вероятности попадания произвольного больного в группу А.
α = 0, β = 5, n = 15.
В случае, когда α>0, β=0, модель избирательной урны сводится к схеме простой (полной) рандомизации, и φ(Dn, n)=0,5 независимо от величины Dn (см. рис. 12). Та же ситуация наблюдается при β>0, если n стремится к бесконечности (см. рис. 17).
Рис. 17. График вероятности попадания произвольного больного в группу А.
α = 100, β = 0, n = 50.
Из вышеприведенных рисунков видно, что для модели избирательной урны (при β>0) характерно существенное снижение вероятности распределения больного в группу А, если в этой группе больше больных, чем в группе В, причем эта вероятность тем меньше, чем больше величина дисбаланса. В то же время, в случае простого (полного) распределения φ(Dn, n) всегда равна 0,5 независимо от текущей величины дисбаланса групп, поскольку результат последующего «броска симметричной монеты» совершенно не зависит от результата предыдущего броска, что является одной из аксиом теории вероятности.
Вероятность появления количественного дисбаланса в формируемых группах при использовании модели избирательной урны описывается формулой:
,
причем ,
где: P (|nA−nB|) - вероятность количественного дисбаланса формируемых групп,
Φ - стандартная функция нормального распределения,
d - величина дисбаланса групп А и В (человек),
n - предполагаемое количество больных в обоих формируемых группах,
α - общее количество шаров каждого цвета, находящихся в урне на момент
начала рандомизации,
β - количество шаров другого цвета (цветов), добавляемое после каждого шага
рандомизации
Используя представленную формулу, легко рассчитать, что вариант дизайна (α=0, β>0) выгодно использовать для рандомизации больных в небольшие группы, поскольку он обеспечивает лучший количественный баланс малых групп, чем полная рандомизация, и в то же время бóльшую случайность распределения больных по группам, чем метод перестановки блоков (причем качество рандомизации не зависит от соотношения численности группы и размера блока). При этом с увеличением n вероятность дисбаланса становится еще ниже, чем в случае простой (полной) рандомизации (см. рис. 18); при (α>0, β>0) вероятность появления дисбаланса в больших группах уменьшается еще значительнее.
Рис. 18. Сравнение эффективности модели избирательной урны и простой (полной) рандомизации для распределения больных в большие и малые группы [18].
Практические эксперимента показали, что при α=1 увеличение β с 1 до 5 приводило к повышению баланса групп, при β>5 существенного улучшения баланса не наблюдалось. При больших величинах α (вплоть до 500) улучшение балансировки групп наблюдалось при возрастании β до 12-13, при дальнейшем повышении β разница дисбалансов всякий раз оказывалась незначимой [47].
Кратко резюмируя особенности обсуждаемого дизайна, следует отметить, что:
· При α=0, β>0 вероятность дисбаланса не зависит от величины β,
· При β÷α → 0 модель избирательной урны не отличается от схемы простой (полной) рандомизации,
· При α>0, β÷α >1 и средних по размеру группах дальнейшее увеличение β не приводит к заметному снижению вероятности дисбаланса,
· При β÷α → ∞ (включая вариант, когда α=0) метод урны хорошо сохраняет баланс между малыми группами.
У рассматриваемого метода имеются и некоторые недостатки:
1. Техника выполнения данного варианта рандомизации сложна, сравнительно трудна для понимания, требует наличия в исследовательской группе статистика; кроме того, ход рандомизации невозможно спланировать до начала исследования - это по условию динамический процесс (правда, это удобно, если на момент начала исследования конечный размер сравниваемых групп еще неизвестен);
2. Не всегда удается создать баланс ковариат в группах (как и в случае рандомизации перестановкой блоков); соответственно, может потребоваться предварительная стратификация по существенным для результатов исследования признакам с последующей изолированной рандомизацией в пределах каждого из уровней стратифицирующего фактора.
Адаптивные (приспособительные) модели рандомизации включают в себя ковариативные адаптивные (covariative adaptive) и реактивные адаптивные (response adaptive) модели.
Ковариативная адаптивная рандомизация используется в случае, если количество формируемых групп сравнимо с количеством участников исследования, набираемых в группы (т.е. размер формируемых групп мал). При этом статические схемы рандомизации, описанные выше, в принципе могут обеспечить количественный баланс формируемых групп (например, рандомизация методом переставленных блоков (permutted blocks) либо методом избирательной урны – urn model), но неспособны гарантировать баланс важных для эксперимента характеристик больных (ковариат) в каждой из групп, что приведет к невозможности корректного сравнения полученных в исследовании результатов. Так, например, если мы формируем две группы сравнения по 30 человек в каждой, при условии, что изучаемый нами признак имеется у 30% населения, дисбаланс данного признака на этапе формирования групп при использовании простой (полной) рандомизации составит более 10% с вероятностью 0,45. Для коррекции данного явления обычно применяется стратификация по всем существенным ковариатам с последующей блоковой рандомизацией внутри полученных страт, но увеличение количества ковариат неизбежно приведет к уменьшению числа полных блоков в пределах одной страты (см. выше), что нивелирует эффект от подобного рода манипуляций. В настоящее время не рекомендуется использовать стратификацию более чем по 3-4 существенным признакам [23]. Соответственно, принцип ковариативной адаптивной рандомизации заключается в том, что каждый новый субъект, включаемый в исследование, распределяется в одну из формируемых групп с учетом баланса важных для исследования признаков больных, сложившихся в группах на момент его включения. При этом соотношение важных ковариат постоянно мониторируется; дисбаланс по каждой из ковариат выявляется попарным сравнением групп методом χ2 (хи квадрат) Пирсона. Новый субъект распределяется в ту из групп, в которой значение контролируемых ковариат (с учетом вклада включаемого субъекта) даст наименьшее максимальное отклонение от исходно запланированных величин соотношений данных ковариат.
Ковариативная адаптивная рандомизация имеет ряд разновидностей:
1. Метод минимизации. Классический метод минимизации предполагает построение функций индивидуального баланса для каждого из учитываемых существенных факторов и функции общего баланса для всего исследования, причем переменными этих функций являются, в числе прочих, значения вероятности (р) назначения больному той или иной терапевтической схемы. При этом каждый новый больной, включаемый в исследование, оценивается на предмет уровней мониторируемых ковариат, данные уровни подставляются в вышеописанные формулы, и больной распределяется в ту из формируемых групп, где величина рассчитанного по соответствующей формуле дисбаланса ковариат окажется минимальной, а вероятность р – соответственно, максимальной [40]. Данный способ позволяет сбалансировать формируемые группы по 10-20 существенным факторам (ковариатам), что абсолютно недостижимо при использовании стратификации.
К недостаткам метода относятся:
· Предопределенность (детерминированность) получаемых результатов: в каждый момент времени можно предсказать, в какую из групп будет распределен конкретный пациент. Существуют сложные математические способы, отчасти устраняющие данную проблему (например, с использованием множителей Лагранжа [27]).
· Данный метод рандомизации сложен на этапе подготовки к проведению исследования и требует наличия в исследовательском штате квалифицированных математиков и статистиков. Существует ряд коммерческих программ и плагинов (в основном к известным программам статистического анализа данных – SPSS, SAS), позволяющих облегчить либо опустить данный этап подготовки.
· Перечень рандомизации невозможно сгенерировать заранее, перед началом исследования. Это – общий недостаток динамических моделей рандомизации: каждая последующая итерация распределения участников по группам зависит от всех предыдущих; соответственно, при каждом новом эпизоде рандомизации приходится вновь запускать алгоритм минимизации.
· При неправильной оценке уровней мониторируемых ковариат у включаемого в исследование больного он будет распределен в неверную группу; при этом общий баланс ковариат в формируемых группах нарушится, причем неявно для исследователей.
· В процессе исследования больные могут по разным причинам выйти из него, покинув свои группы, что явным образом приведет к нарушению достигнутого баланса ковариат.
· Алгоритм минимизации может быть реализован с ошибками на программном уровне; описан случай дефектного распределения более чем 1000 женщин в сравниваемые группы до выявления ошибки в алгоритме [11]. Данная проблема отчасти преодолевается неоднократным тестовым запуском рабочего алгоритма до начала исследования с вдумчивым анализом получаемых результатов.
2. Метод максимальной энтропии. Принцип «максимальной энтропии» постулирует, что распределение вероятностей, наиболее соответствующее имеющейся информации (исходно предполагается, что данной информации недостаточно для полной оценки вероятности ожидаемого события) – это распределение, обладающее максимальной энтропией [14]. Предполагается также, что информация объективна и поддается проверке, а вероятности - взаимоисключающие (как, например, вероятность включения в группы сравнения - войдя в какую-либо из групп, больной уже не может быть приписан ни к одной из оставшихся). Алгоритм адаптивной рандомизации, основанный на данном принципе, предполагает написание формулы оценки энтропии исследуемых групп, исходя из совокупности значений мониторируемых факторов (ковариат); количество учитываемых факторов не ограничивается. При каждом новом запуске алгоритма (т.е. при включении в исследование каждого нового участника) производится оценка параметров, интересующих исследователей; полученные значения подставляются в формулу определения энтропии, последовательно для каждой из формируемых групп, с учетом сложившегося в них на момент данного эпизода рандомизации соотношения ковариат; больной будет причислен к той из групп, где подсчитанная величина энтропии окажется максимальной (т.е. где параметры включаемого больного окажут наименьшее влияние на сложившийся баланс ковариат). Данный метод рандомизации имеет те же достоинства и недостатки, что и вышеописанный метод минимизации.
3. Метод минимального правдоподобия. Упомянутая ранее рандомизация по методу минимального правдоподобия (minimal likelihood) при практическом проведении клинических испытаний используется крайне редко.
Дата добавления: 2015-09-03 | Просмотры: 2096 | Нарушение авторских прав
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
|