ПРИМЕНЕНИЕ СОВРЕМЕННЫХ СТАТИСТИЧЕСКИХ МЕТОДОВ В ПРАКТИКЕ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ. СООБЩЕНИЕ ТРЕТЬЕ. ОТНОШЕНИЕ ШАНСОВ: ПОНЯТИЕ, ВЫЧИСЛЕНИЕ И ИНТЕРПРЕТАЦИЯ

April 30, 2005
10535
Resume

Сообщение третье продолжает серию статей*, посвященных корректному применению современных математических методов статистической обработки данных клинических исследований. В публикации рассматриваются такие понятия, как шансы и отношение шансов.

Необходимость правильного понимания и интерпретации некоторых понятий математической статистики, используемых при анализе данных клинических исследований и их интерпретации, важны для принятия правильного решения. В этом и состоит основная задача статистических методов. В свое время известный американский математик А. Вальд писал, что «статистика — это совокупность методов, которые дают нам возможность принимать оптимальные решения в условиях неопределенности». А премьер-министр Англии Б. Дизраэли сказал: «Существует три вида лжи: ложь, наглая ложь и статистика». Однако дело не в самих статистических методах, а в правильности их применения и корректности интерпретации. Статистические методы позволяют сузить интервал неопределенности при принятии решений. Некорректное применение статистических методов, так же, как и прием лекарств для лечения заболевания, при котором они не показаны, приводит к ложным результатам. К неправильным выводам приводит также непонимание сути полученных результатов статистической обработки данных и, соответственно, их неправильная интерпретация.

Так, при интерпретации результатов статистической обработки данных всегда необходимо помнить об их вероятностном смысле. Он состоит в том, что не всегда полученные результаты являются точными, а лишь статистическими оценками истинных значений. Кроме того, при проверке статистических гипотез необходимо помнить о статистической значимости, так как исследования обычно проводятся лишь на какой-то выборке из генеральной совокупности (популяции). Вопрос распространения полученных выводов тесно связан с репрезентативностью анализируемых выборок.

В последнее время продолжают развиваться методы обработки качественных (нечисловых) данных. Некоторые из них хотя и появились давно, иногда недостаточно известны широкому кругу специалистов, работающих в области медицины и фармакологии. В данной статье мы хотим рассмотреть такие понятия, как шансы и отношение шансов.

Шансы (шансовые преимущества)

Шансовым преимуществом (или шансом) называется отношение вероятности того, что событие А произойдет, к вероятности того, что оно не произойдет. То есть если Р(А) — вероятность того, что событие А произойдет, то его шансовое преимущество (или шанс [odds]) будет определяться выражением:

 (1)

Например, если в группе из 90 женщин 60 — блондинки и 30 — брюнетки, то вероятность события А, что любая женщина из этой группы окажется блондинкой, будет равна Р(А) = 60/90 = 0,67, а вероятность события В, что она окажется брюнеткой, равна Р(В) = 30/90 = 0,33. Тогда для любой женщины из этой группы шанс оказаться блондинкой будет равен odds(A) = Р(А)/(1–Р(А)) = 0,67/0,33 = 2/1 = 2. Или рассмотрим другой пример: если вероятность выздоровления пациента равна 0,3, то его шансы выздороветь равны 0,3/(1–0,3)=0,43.

Отношение шансов

Это отношение шансов для проявления определенного уровня (состояния) дихотомической переменной в двух группах субъектов. Например, если два возможных состояния для переменной характеризуются как успех и неуспех, тогда отношение шансов является мерой шансов успехов в одной группе по отношению к другой.

При помощи отношения шансов можно также измерить тесноту взаимосвязи (размер эффекта) между двумя качественными переменными.

Математически отношение шансов можно определить следующим образом:

, (2)

где Ω1=Р1/Q1, а Ω2=Р2/Q2. В этих выражениях Р1 — частота, с которой происходит событие в первой генеральной совокупности, Q1=1–Р1, а Р2 и Q2 — соответствующие частоты во второй генеральной совокупности. На основе вышеизложенного выражение (2) можно записать так:

. (3)

На основании выражения (3) специалисты иногда называют отношение шансов перекрестным отношением или приближенным относительным риском. Если Р2=Р1, то ω=1. Если Р2<Р1, то ω<1, а если Р2>Р1, то ω>1.

Выборочное оценивание отношения шансов

При обработке статистических данных всегда необходимо помнить, что мы имеем дело не со всей генеральной совокупностью (популяцией), а лишь с какой-то ее частью — определенным образом сформированной из ее объектов выборкой. Поэтому обычно получаемое нами на основании выборочных данных значение отношения шансов является лишь оценкой истинного значения отношения шансов в генеральной совокупности. Проще всего получить оценку отношения шансов, представив исходные данные в виде четырехклеточной таблицы. Структура такой таблицы детально рассмотрена в предыдущей публикации (Бабич П.Н. и соавт., 2004). В ней представлены наблюдаемые частоты наличия или отсутствия интересующих признаков в экспериментальной и контрольной группах. Для упрощения изложения материала представим ее здесь повторно (табл. 1).

Основываясь на выражениях (1) и (2), формулу для вычисления отношения шансов можно записать так:

, (4)

где, например, шансы наличия признака в экспериментальной группе будут определяться так:

 (5)

Основываясь на выражении (5) и используя обозначения, представленные в табл. 1, приведем выражения для вычисления шансов:

Далее, используя выражения (3) и (4), отношение шансов можно оценить посредством следующего выражения:

, (8)

где переменные, приведенные в формуле, соответствуют переменным в табл. 1.

Следует заметить, что существует также выражение оценивания отношения шансов по выборке с использованием вместо частот их пропорций. Пропорции представляются в виде четырехклеточной таблицы (табл. 2) по структуре, аналогичной табл. 1.

Приведенные в табл. 2 совместные пропорции p11, p12, p21 и p22 получаются путем деления соответствующих частот из табл. 1 на n••.

Оценить отношение шансов, используя совместные пропорции, можно при помощи выражения:

. (9)

Следует также отметить, что оценку отношения шансов нельзя получить в случае, если частоты n12 или n21 равны нулю. Если же вообще какая-либо частота равна нулю, невозможно получить оценку стандартной ошибки. В связи с этим было предложено модифицировать выражение для оценки отношения шансов:

. (10)

Стандартная ошибка отношения шансов

Стандартную ошибку отношения шансов можно оценить при помощи следующего выражения:

. (11)

Величина стандартной ошибки позволяет оценить точность полученной оценки отношения шансов. Однако она не дает возможности проверять гипотезы и строить доверительные интервалы. Для проверки статистической гипотезы о равенстве отношения шансов единице (ω=1) следует использовать классический критерий хи-квадрат, применение которого детально рассмотрено в работе Дж. Флейса (1989).

Таким образом, для модифицированного отношения шансов, вычисляемого по (10), выражение будет иметь вид:

. (12)

Проверка статистических гипотез

Рассмотрим четырехклеточную таблицу (см. табл. 1). Если наблюдаемые значения маргинальных частот равны n1•, n2•, n•1, n•2, а истинное значение отношения шансов равно ω, то ожидаемые частоты Nij определяются как наблюдаемыми маргинальными частотами, так и значением ω, вычисляемым при помощи выражения:

. (13)

Статистическая гипотеза о равенстве истинного отношения шансов значению ω может быть проверена путем сравнения статистики

(14)

со значениями распределения хи-квадрат с одной степенью свободы. Если требуется проверить нулевую гипотезу о равенстве отношения шансов 1 (ω=1), следует использовать обычный критерий хи-квадрат (Флейс Дж., 1989). При этом ожидаемые частоты рассчитывают посредством выражения:

. (15)

Если же в качестве нулевой гипотезы требуется проверить равенство отношения шансов какому-либо значению, не равному 1 (ω≠1), то ожидаемые частоты будут вычисляться посредством следующих выражений:

, (16)

где:

, (17)

. (18)

Остальные значения ожидаемых частот вычисляются посредством следующих формул:

; (19)

; (20)

. (21)

Было доказано, что при фиксированных значениях маргинальных частот и отношениях шансов наблюдаемые частоты (nij) распределены приближенно нормально со средними, равными соответствующим ожидаемым частотам (Nij) и стандартной ошибкой, равной:

, (22)

где

, (23)

где Nij— ожидаемая частота, вычисленная посредством выражений (16), (19), (20), (21).

Построение доверительных интервалов для отношения шансов

Как известно, доверительным интервалом является интервал значений, в котором с заданной доверительной вероятностью находится истинное значение оцениваемого параметра. В качестве 100(1–α)% доверительного интервала для истинного значения отношения шансов (ω) можно взять множество значений отношения шансов, которые удовлетворяют выражению:

, (24)

где Nij — ожидаемые частоты, которые в случае если гипотетическое значение истинного отношения шансов предполагается равным 1, вычисляются на основании выражения (15); α — задаваемый уровень значимости (обычно равно 0,05); сα/2 — процентная точка стандартного нормального распределения (если α=0,05, то сα/2 ≈ 1,96). В случае когда в качестве нулевой гипотезы принято какое-то значение отношения шансов, не равное 1 (ω≠1), то ожидаемые частоты можно найти на основании выражений (16)–(21).

Как видим, статистический показатель (24) зависит от отношения шансов не явно, а через ожидаемые частоты. Следует отметить, что процесс поиска нижней и верхней границы доверительного интервала является итерационным.

Решение уравнения (24) довольно громоздко, поэтому мы его опустим. Однако довольно часто для практических задач достаточно найти приблизительные границы доверительного интервала. Такими границами — ωL (нижняя граница) и ωU (верхняя граница) — служат границы доверительного интервала логарифма отношения шансов:

, (25)

, (26)

где:

; (27)

; (28)

сα/2 — процентная точка стандартного нормального распределения.

Однако когда хотят получить более точные оценки границ доверительного интервала, для их вычисления используют следующие выражения:

, (29)

, (30)

где:

; (31)

. (32)

Относительный риск

Довольно часто отношение шансов используют для аппроксимации относительного риска. Если мы обозначим принадлежность, например к экспериментальной группе, как событие А (соответственно событие А_ — принадлежность к контрольной группе), а событие, соответствующее наличию интересующего признака, как В (В_ — признак отсутствует), то относительный риск определяется как отношение условных вероятностей Р(В | A) и появления события B в случае появления или непоявления события А (например к принадлежности к экспериментальной или контрольной группе). Математически это можно записать следующим образом:

. (33)

Выборочную оценку R можно получить посредством выражения:

, (34)

где обозначения соответствуют приведенным в табл. 2.

Интерпретация отношения шансов и его свойства

Если значение отношения шансов равно 1, это свидетельствует об отсутствии различий между сравниваемыми группами. Если значение отношения шансов для нежелательных исходов (например осложнение или смерть) меньше 1, это свидетельствует об эффективности метода лечения, направленного на снижение риска этого исхода. При низкой частоте событий значение отношения шансов приблизительно равно относительному риску.

Однако недостатком отношения шансов является асимметричность распределения его значений. Для преодоления этого недостатка этот показатель преобразовывают посредством логит-преобразования, то есть логарифмируют по основанию e и далее работают с полученными таким образом логитами.

В клинических испытаниях «случай — контроль» отношение шансов используют для оценки относительного риска. Также можно оценивать отношение шансов наступления какого-либо события в экспериментальной группе (группе, которая проходит курс испытуемого метода лечения) к шансам его наступления в контрольной группе.

Пример вычисления отношения шансов

Рассмотрим пример, приведенный в предыдущей публикации (Бабич П.Н. и соавт., 2004). Оценим, насколько шансы возникновения нежелательных побочных реакций в экспериментальной группе соотносятся с шансами их возникновения в контрольной группе, исходные данные для которых приведены в табл. 3. Рядом с данными в скобках указаны обозначения, которые соответствуют используемым в вышеприведенных формулах.

Для расчетов воспользуемся электронными таблицами MS Excel. Вид исходных данных и полученных результатов на рабочем листе MS Excel приведен на рис. 1. Расчетные формулы рабочего листа Excel, которые запрограммированы в определенных ячейках, приведены в табл. 4.

Следует также отметить, что для расчета отношения шансов и его доверительных интервалов можно ввести указанные в таблице формулы рабочего листа MS Excel или скачать файл MS Excel с уже готовыми формулами по адресу: http://www.biostat.kiev.ua. Для расчета отношения шансов для решения своей задачи достаточно подставить в затемненные ячейки рабочего листа MS Excel (см. рис. 1) свои значения. Отношение шансов и его доверительные интервалы будут рассчитаны автоматически.

Рис. 1. Исходные данные и результаты расчета отношения шансов на рабочем листе MS Excel

Интерпретация полученных результатов

Как видим из полученных результатов, отношение шансов для наших данных равно 0,37 (доверительный интервал=0,18–0,77). Это можно интерпретировать следующим образом: относительный риск развития побочных явлений в экспериментальной группе статистически значимо ниже, чем в контрольной. Для сравнения также приведены результаты расчета отношения шансов и его доверительного интервала по модифицированной формуле.

Пример неправильной интерпретации отношения шансов

На основе данных, представленных в статье L.A. Garcia Rodriguez и соавторов (2004) (рис. 2), в одном из отечественных изданий специалистом-медиком была дана следующая интерпретация отношения шансов: «риск возникновения сердечно-сосудистых осложнений при приеме ибупрофена возрастает по сравнению с группой плацебо на 18%, диклофенака — на 37%, пироксикама и мелоксикама — на 35%, других нестероидных противовоспалительных препаратов (НПВП) — в среднем на 26%».

Приведенное высказывание является ярким примером некорректной интерпретации результатов указанного исследования. Следует также отметить, что авторы этой статьи таких выводов не делают. В таблице 3 оригинальной публикации (см. рис. 2) приведены отношения шансов (Odds Ratio — OR), оцененные двумя способами — с использованием стандартной формулы (OR) и логистической регрессии (Multivariate Adjusted OR). Кроме того, приведены 95% доверительные интервалы для каждого полученного значения отношения шансов.

Если шансы развития инфаркта миокарда у пациентов группы плацебо и контрольной группы равны, отношение шансов будет равно 1. В качестве проверки статистической гипотезы о равенстве отношения шансов единице необходимо использовать классический критерий хи-квадрат (Флейс Дж., 1989; Бабич П.Н. и соавт., 2004). Следует также помнить, что это можно сделать на основании положений теории интервального оценивания.

Проанализируем данные, приведенные в таблице, представленной на рис. 2.

1. При оценке относительного риска на основании отношения шансов корректнее было бы учитывать те значения отношения шансов, которые получены при помощи логистической регрессии, так как при их оценке учитывались другие сопутствующие переменные (ковариаты), например курение, наличие диабета, артериальной гипертензии, масса тела и др. Поэтому для построения выводов более корректно использовать данные последней колонки таблицы (см. рис. 2). Согласно приведенным в этой колонке данным отношение шансов практически у всех препаратов близко к 1, а у некоторых препаратов даже меньше 1. Причем приведенные для каждого значения этой колонки 95% доверительные интервалы содержат единицу. Это свидетельствует о том, что отклонение отношения шансов от единицы является статистически незначимым на уровне значимости 5% (α=0,05).

2. Если рассматривать столбец таблицы, в котором приведены значения отношений шансов, вычисленные обычным способом, то для некоторых препаратов (например диклофенака) можно сделать вывод, что отношение шансов статистически значимо на уровне 5% (так как у нас 95% доверительный интервал) отличается от 1. Однако для других препаратов, например мелоксикама, отличие приведенного значения от единицы является статистически незначимым на уровне значимости 5% (α=0,05), так как доверительный интервал для этого значения включает единицу. Поэтому относительно мелоксикама, основываясь на табличных данных, можно лишь констатировать тот факт, что истинное значение отношения шансов для генеральной совокупности с доверительной вероятностью 95% будет находиться в интервале от 0,86 до 2,12.

3. Статистическую гипотезу о равенстве отношения шансов единице можно проверить при помощи обычного критерия хи-квадрат. Для этого достаточно данных таблицы, приведенной на рис. 2. При применении критерия хи-квадрат формулировка нашей задачи трансформируется. В этом случае мы проверяем гипотезу о независимости признаков, то есть об отсутствии связи между приемом, например, препарата мелоксикам и развитием инфаркта миокарда. Таким образом, нулевой гипотезой (Н0) будет утверждение об отсутствии связи между приемом данного препарата и развитием инфаркта миокарда, что адекватно утверждению, что отношение шансов равно 1. А так как отношение шансов является аппроксимацией относительного риска, то таким образом мы проверим гипотезу о том, что относительный риск равен 1. Для этого воспользуемся четырехклеточной таблицей частот и критерием хи-квадрат (табл. 5). Более детально с применением данного критерия можно ознакомиться в ряде публикаций (Лапач С.Н. и соавт., 2002; Петри А., Сэбин К., 2003; Бабич П.Н. и соавт., 2004).

Таким образом, согласно приведенным в табл. 5 данным, достигнутый уровень значимости p=0,238, что значительно больше заданного нами уровня значимости α=0,05. Это не позволяет нам отклонить нулевую гипотезу об отсутствии связи между приемом препарата мелоксикам и развитием инфаркта миокарда. В свою очередь это свидетельствует о том, что полученное значение отношения шансов для данного препарата (1,35) статистически незначимо отличается от единицы.

Следовательно, можно сделать такие выводы по поводу указанной интерпретации:

1. Приведенная интерпретация данных указанной статьи является некорректной в силу вышеизложенных аргументов.

2. Для препарата диклофенак приведенное значение отношения шансов, вычисленное по стандартной формуле, формально статистически значимо отличается от единицы. Однако отношение шансов для диклофенака, оцененное при помощи логистической модели с учетом других сопутствующих переменных, свидетельствует о спорности заключения о статистической значимости этого отличия от единицы. Для всех препаратов отношение шансов, полученное при помощи логистической модели с учетом других сопутствующих переменных, статистически незначимо отличается от единицы. Поэтому относительный риск также статистически значимо не отличается от единицы.

ЛИТЕРАТУРА

  • Бабич П.Н., Чубенко А.В., Лапач С.Н. (2004) Применение современных статистических методов в практике клинических исследований. Сообщение второе. Применение критерия хи-квадрат. Укр. мед. часопис, 2(40): 138–144.
  • Лапач С.Н., Чубенко А.В., Бабич П.Н. (2002) Статистика в науке и бизнесе. МОРИОН, Киев, 640 с.
  • Петри А., Сэбин К. (2003) Наглядная статистика в медицине (Пер. с англ.). ГЭОТАР-МЕД, Москва, 144 с.
  • Флейс Дж. (1989) Статистические методы для изучения таблиц долей и пропорций (Пер. с англ.). Финансы и статистика, Москва, 319 с.
  • Garcia Rodriguez L.A., Varas-Lorenzo C., Maguire A., Gonzalez-Perez A. (2004) Nonsteroidal antiinflammatory drugs and the risk of myocardial infarction in the general population. Circulation, 109(24): 3000–3006. Epub. 2004 Jun. 14.

>ЗАСТОСУВАННЯ СУЧАСНИХ СТАТИСТИЧНИХ МЕТОДІВ У ПРАКТИЦІ КЛІНІЧНИХ ДОСЛІДЖЕНЬ. ПОВІДОМЛЕННЯ ТРЕТЄ. ВІДНОШЕННЯ ШАНСІВ: ПОНЯТТЯ, ОБЧИСЛЕННЯ ТА ІНТЕРПРЕТАЦІЯ

Бабич Павло Миколайович, Чубенко Анатолій Васильович, Лапач Сергій Миколайович

Резюме. Повідомлення третє продовжує серію статей, присвячених коректному застосуванню сучасних математичних методів статистичної обробки даних клінічних досліджень. У даній публікації розглядаються такі поняття, як шанси і відношення шансів.

Ключові слова:математична статистика, статистична обробка якісних даних, шанси, відношення шансів, аналіз таблиць спряженості

>APPLICATION OF MODERN STATISTICAL METHODS IN CLINICAL TRIALS. PART 3. ODDS RATIO: CONCEPT, COMPUTATION AND INTERPRETATION

Babich Pavel N, Chubenko Anatoly V, Lapach Sergey N

Summary. Given publication is the third one in the series of articles on the correct application of statistical methods for the analysis of the results of clinical studies. Such concepts as odds and odds ratio are considered in the article.

Key words: mathematical statistics, statistical analysis of qualitative data, odds, odds ratio, contingency tables analysis