Количественные характеристики клинической информации

24 лютого 2014
3560
Резюме

Актуальность темы публикации обусловлена широким распространением количественных характеристик кли-
нической информации (КХКИ) в современных журнальных публикациях. Понимание КХКИ является одним из ус-
ловий современной медицинской практики в процессе принятия клинического решения. В работе даны краткие
характеристики основных эпидемиологических КХКИ. Описаны принципы расчета показателей рисков, количе-
ственных характеристик диагностических тестов, методики построения характеристической кривой диагности-
ческого теста, различные способы интерпретации результатов диагностических тестов, характеристики графи-
ческого метода оценки выживаемости. Сделан акцент на высокой информативности представления КХКИ
с использованием доверительных интервалов. При интерпретации основных КХКИ использованы результаты
реальных исследований. На примере некоторых результатов метаанализа исследований по данным Кокранов-
ской библиотеки представлен пример интерпретации КХКИ. В заключении обосновывается тезис о том, что
навыки понимания КХКИ являются одной из важнейших компетенцией современного врача.

Введение

В украинском клиническом сообществе, как и в других странах, происходит постепенное внедрение принципов доказательной медицины в клиническую практику. На научно-­практических медицинских конференциях стандартом качественной лекции стал доклад с указанием «уровня доказательности» и «степени рекомендаций» клинической технологии, а на занятиях с молодыми врачами я вижу их понимание необходимости критической оценки любых клинических рекомендаций с учетом данных качественного метаанализа результатов клинических исследований. Правда, отметим, что почти никто в аудитории на конференциях не интересуется используемой в докладах шкалой уровней доказательности, а молодым врачам недостает подготовки в основах понимания качества клинической информации. Но при всех этих недостатках можно с уверенностью отметить, что пока еще малопонятные для основной части украинского клинического сообщества принципы доказательной медицины признаны полезными и необходимыми.

Формальная характеристика качества и ценности клинической информации (Воробьев К.П., 2013) по своей сути является выбором типа «да/нет» для национальных систем оценки технологий здравоохранения, который позволяет в наиболее общем случае принять решение о включении/­исключении в/из использования новой медицинской технологии1 (НМТ) в типовой клинической ситуации. Говоря языком эпидемиологии, полезность НМТ также предполагает высокий уровень внешней валидности, то есть применимости НМТ для достаточно широкого круга подклассов клинических ситуаций. Еще одна эпидемио­логическая аналогия позволяет представить формализацию оценки НМТ как аналог скрининга (отсева) в процессе диагностики. После скрининга в клинике достигается определенная степень вероятности наличия заболевания, также как после определения формального критерия ценности клинической информации в здравоохранении предполагается определенная вероятность полезности НМТ. Но в обоих случаях возникает вопрос: как подтвердить/отвергнуть диагноз или применимость НМТ у конкретного пациента? В случае скрининга существуют вполне известные решающие правила, предполагающие применение более сложных диагностических средств и осмотры специалистов. А как определить степень ожидаемой пользы признанной НМТ у конкретного пациента? Для ответа на этот вопрос в процессе принятия конкретного клинического решения необходимо осуществить некий более сложный интеллектуальный процесс, чем простое признание полезности определенной НМТ. Но самое главное, в соответствии с классикой современных принципов принятия клинического решения, врач обязан в доступной форме разъяснить все аспекты применения этой НМТ, чтобы пациент смог сделать осознанный выбор.

Понятие «меры» является универсальным и единственным критерием любого явления. Именно этот критерий используется при формальной оценке НМТ: эксперты изучают множество мер клинического явления, полученных в результате различных клинических исследований, определяют те границы мер, которые являются пороговыми для отнесения НМТ к категории полезной, и выносят соответствующие суждения в ряду: полезно — сомнительно — вредно (Воробьев К.П., 2013). Как бы ни были удобны результаты такого анализа для рекомендаций о применении НМТ в здравоохранении, они скрывают основную часть клинической информации, представленной в отдельных клинических исследованиях. Для формирования собственных суждений о различных аспектах «доказано полезной» НМТ врачу необходимо обратиться к первичному источнику клинической информации — журнальной публикации, в которой наиболее полно представлены результаты исследований.

Современная качественная публикация по результатам клинического исследования, как правило, содержит целый ряд мер клинических эффектов. Для понимания языка современной клинической публикации необходимы достаточно глубокие знания в области клинической эпидемиологии и биостатистики. Острота проблемы отечественного клинического сообщества заключается в том, что в большинстве ни врачи, ни исследователи не владеют достаточной глубиной этих знаний, чтобы понимать или создавать качественную клиническую информацию. Врачи не могут интерпретировать эпидемиологические и статистические характеристики, представленные в международных медицинских журналах, а исследователи ориентированы на использование примитивных методов статистического анализа, который часто выполняется с ошибками. В результате этого наши врачи чаще довольствуются суррогатами качественной клинической информации в переводных обзорных работах, а международный рейтинг клинических исследователей остается на крайне низком уровне. Для изменения ситуации в стране, где не ведется систематизированная подготовка врачей и исследователей в области основ клинической эпидемиологии и понимания современной клинической информации, необходимо вести соответствующую информационную работу для скорейшего внедрения лучших международных стандартов клинической практики и научных исследований.

Цель — продемонстрировать влияние основных количественных характеристик клинической информации на осознанный выбор клинического решения с учетом особенностей конкретного клинического случая и предпочтений пациента.

Источники информации

Клиническая эпидемиология и биостатистика (как базовые методологические дисциплины исследователя) к настоящему времени имеют вполне устоявшиеся традиции. Поэтому в данной работе в качестве основных источников информации мы будем использовать традиционные руководства по клинической эпидемиологии и биостатистике, которые прошли испытание временем и получили международное признание (Флетчер Р. и соавт., 1998; Власов В.В., 2001; 2005; Гринхальх Т., 2006; Ланг Т.А., Сесик М., 2011). При этом мы не ставим задачу донести до читателя основное содержание этих руководств. Мы лишь пытаемся в рамках данной публикации осветить один из вопросов, на который даны ответы достаточно мелким шрифтом в различных местах многостраничных руководств.

Клиническая и статистическая значимость результатов исследований

Наименование этого подраздела отмечается в основных руководствах по клинической эпидемиологии и биостатистике (Власов В.В., 2001, с. 226; Власов В.В., 2006, с. 331; Ланг Т.А., Сесик М., 2011, с. 22) и эта тема неоднократно обсуждалась в периодике (Bhardwaj S.S. et al., 2004; van Tulder M. et al., 2007; Gillani S.W., 2011) как один из базовых аспектов понимания клинической информации. Важность понимания этих двух обсуждаемых категорий связана с реальной практикой продвижения НМТ и новых клинических знаний на медицинский рынок и в клинику. Мотивации производителя НМТ требуют постоянных усилий по продвижению нового товара на медицинский рынок. Большинство ученых также стараются показать преимущества НМТ по результатам проведенных исследований. Этот мощный тандем прилагает все усилия для того, чтобы потребители медицинских услуг и клинической информации поверили в эффективность НМТ.

Один из наиболее распространенных приемов некорректного продвижения новой продукции на медицинский рынок состоит в утверждении доказанности эффективности НМТ исключительно на основе статистического анализа исследований без описания реальной клинической пользы НМТ. Для этого используется типичный прием в рекламных буклетах, который состоит в том, что для выражения кинических эффектов используют красочные столбчатые диаграммы без указания разброса выборочных характеристик с использованием крупного масштаба графика, без включения всего диапазона измеряемого параметра. Это позволяет выгодно представить мнимые преимущества НМТ. Мощным завершающим аккордом такой рекламы является указание на диаграмме о преодолении наиболее распространенного порога уровня статистической значимости, то есть p<0,05 со ссылкой на публикацию неопределенного качества.

Такая рекламная информация оказывает магическое воздействие на недостаточно подготовленного врача и является для него вполне приемлемым обоснованием назначения нового намного более дорогого лекарства взамен общепринятого. Информирование пациента также будет весьма успешным и убедительным, поскольку «доктор предлагает новое более эффективное лекарство», которое якобы «прошло проверку в научных исследованиях», а «эффективность этого лекарства доказана при помощи статистики».

Приведем условный пример. Производители гипотензивных средств или статинов выполнили сравнительное исследование эффективности своих лекарственных средств с препаратами золотого стандарта терапии артериальной гипертензии или атеросклероза на основании оценки таких суррогатных критериев, как артериальное давление и уровень липидов низкой плотности. В результате такого исследования получены статистически значимые различия (p<0,05) изменений суррогатных критериев вследствие терапии, но уровень снижения артериального давления и липидов составил всего лишь 1,5–2%. Такой эффект может быть получен как в результате систематической ошибки при планировании исследования, так и при истинной минимальной разнице результатов воздействия препаратов, при условии увеличения сравниваемых групп до сотен пациентов. Также следует отметить, что в нашем условном примере новые препараты имели следующие особенности: более высокую цену и недостаточно изученную безопасность. Для того чтобы скрыть истинную величину клинического эффекта производитель может выпустить рекламный листок, на котором будет изображен график изменения изучаемых показателей в результате использования сравниваемых препаратов без обозначения размерности оси ординат и с указанием p<0,05 над различиями параметров после лечения. Вся эта информация на рекламном листе будет выглядеть убедительно, но самое главное — она будет абсолютно правдива. Это будет как раз тот случай, когда, по известному изречению, статистику можно отнести к третьей категории лжи. Именно так, иногда не без оснований, относятся к статистике многие врачи. Неподготовленный врач в отчаянии смотрит на статистические выводы клинического исследования, поскольку их смысл полностью скрыт для него, но он знает, что эти малопонятные статистические выводы являются весомыми аргументами в клинической науке. В таких ситуациях наиболее распространенная модель поведения любого человека состоит в отрицании того, что не понятно.

В подобном примере подготовленный врач легко увидит попытку управления его суждениями при помощи статистических манипуляций. Для того чтобы выяснить истинную эффективность НМТ, подготовленный врач определит величину клинического эффекта в абсолютных цифрах, влияние НМТ на клинически значимые для пациента исходы (заболевания органов мишеней и смертность), проведет оценку сравнительной безопасности НМТ и сопоставит величину возможно более высокого клинического эффекта НМТ с ее стоимостью и безопасностью. Причем результаты своих сопоставлений врач обязан будет донести до пациента в доступной для понимания форме. Но для такого анализа необходимы специальные знания в области клинической эпидемиологии и биостатистики, которые пока не предоставляются в наших медицинских университетах.

Следует заметить, что такие приемы продвижения НМТ в настоящее время занимают конкретную нишу: подобные рекламные листы чаще всего выпускаются отечественными производителями, а научные публикации в подобном формате представления результатов исследований характерны для отечественных нерецензируемых журналов и тезисов конференций. Это объясняется тем, что отечественные производители НМТ не имеют необходимых финансовых ресурсов для организации качественных клинических исследований, а поручают исследования инициативным группам отечественных клиницистов, у которых нет ни мотивации, ни достаточного уровня знаний для организации качественных клинических исследований. С другой стороны, корпоративные исследования крупных международных производителей НМТ обеспечиваются достаточной финансовой поддержкой, а в команды исследователей, кроме клиницистов, в обязательном порядке входят профессиональные эпидемиологи и биостатистики. Кроме этих условий следует помнить, что главная мотивация бизнеса — это прибыль. Поэтому недобросовестная реклама в неподготовленной врачебной среде является вполне понятным приемом продвижения НМТ.

Аналогичная проблема использования статистики для недобросовестного манипулирования результатами научных исследований существует в отечественном клиническом сообществе в процессе экспертизы научных исследований в редакциях медицинских журналов, на конференциях и в защитных диссертационных советах. Наиболее распространенной проблемой является указание в докладах, публикациях и в выводах исследований и диссертаций достигнутого порогового значения p<0,05 без указания величины клинического эффекта. При оценке взаимосвязи параметров часто используется акцентирование на достигнутом уровне статистической значимости p<0,05 для коэффициентов корреляции, низкая величина которых не может свидетельствовать о какой-либо реальной взаимосвязи изучаемых показателей.

Статистический тест проводится с единственной целью — показать, что различия полученных результатов в экспериментальной и контрольной группах не носят случайный характер, но результаты теста не свидетельствуют о величине достигнутого клинического эффекта. Условно можно выделить три этапа эволюции формата представления статистических результатов исследований. Вначале использовали среднее значение, стандартное отклонение и указание достижения порогового уровня статистической значимости (обычно использовали выражение «p<0,05»). Затем перешли к более корректному представлению мер положения и разброса (в зависимости от характера распределения выборки) с указанием точного значения достигнутого уровня статистической значимости. В настоящее время преимущества отдают формату представления данных в виде определенной меры положения (чаще среднее или медиана) и указанию доверительного интервала (чаще 95%) для меры положения. Такой формат позволяет передать читателю наиболее полную информацию как о величине достигнутого клинического эффекта, так и об уровне доверия к полученному результату.

Можно с уверенностью утверждать, что в большинстве клинических отчетов отечественных исследований сложилась практика представления результатов статистического анализа на уровне первого из трех перечисленных этапов развития формата статистических данных. А в некоторых публикациях можно вообще не выявить следов цифровых данных результатов исследований. По данным В.П. Леонова (1998), в 15% журнальных публикаций достаточно рейтингового российского журнала «Кардиология» вообще не используются методы статистики, а еще в 16% случаев цифровой анализ не сопровождается проверкой какой-либо статистической гипотезы. Отсутствие в научных исследованиях числовых обоснований выдвигаемых исследователем гипотез грубо противоречит парадигме науки вообще, и современной медицинской науки в частности. Но еще памятны те времена, когда медицинская наука представлялась подробным описанием отдельных клинических случаев. В наиболее известном и популярном руководстве по клинической эпидемио­логии сказано следующее: «Авторы этой книги выступают за использование чисел везде, где это возможно» (Флетчер Р. и соавт., 1998, с. 99). То есть для описания меры клинического эффекта НМТ необходимы числа.

Две группы характеристик величины клинического эффекта

В результате статистического анализа клинического исследования обычно получают две группы статистических результатов. К первой группе статистик относится известный в классической статистике стандартный набор методов анализа и сопоставления изучаемых параметров в выборках. Вторая группа статистических результатов клинического исследования основана на теории клинической эпидемио­логии и представляет собой специальные эпидемиологические характеристики, которые в зависимости от цели и дизайна исследования могут отображать параметры рисков, прогноза, эффективности лечения, ценности диагностических тестов. Именно эта вторая группа характеристик клинического исследования позволяет выделить биостатистику из общей статистики. Методы классической статистики, в том числе описание выборочных характеристик и проверка статистических гипотез, являются обязательными компонентами любого научного исследования, но их правильное использование требует достаточно глубокой специальной подготовки. Необходимость использования этих методов считается традиционной, не вызывает ни у кого сомнений и не является предметом нашего исследования. В то же время эпидемиологические статистические характеристики клинических исследований в отечественных клинических публикациях, основанных на оригинальных исследованиях, отмечаются крайне редко. При этом заметим, что эта вторая группа характеристик величины клинических эффектов является основой современного языка клинической информации, понимание которого составляет одну из важнейших компетенций современного врача.

Отличительной особенностью эпидемиологических статистических характеристик является их взаимосвязь с так называемыми клиническими исходами — фун­даментальной категорией клинической эпидемиологии. Под клиническими исходами подразумеваются «прежде всего исходы, имеющие наибольшее значение для больных» (Флетчер Р. и соавт., 1998, с. 16). В клинической эпидемиологии в качестве основных клинических исходов рассматриваются такие клинические явления, как смерть, наличие заболевания, дискомфорт, инвалидизация, неудовлетворенность качеством жизни. То есть, в отличие от классических статистических характеристик результатов исследования, которые могут описывать величину клинического явления без взаимосвязи с клиническим исходом или проверять случайность различий параметров в двух сравниваемых группах, эпидемиологические статистические характеристики всегда демонстрируют взаимо­связь изучаемых параметров с клинически важными для пациента событиями. Именно это обстоятельство определяет актуальность широкого применения эпидемиологических статистических характеристик в клинических отчетах.

Принципы расчета основных характеристик величины клинического эффекта

Рассмотрим технологию расчета основных эпидемиологических характеристик величины клинического эффекта НМТ. Для расчета этих характеристик используется четырехпольная таблица, или таблица сопряженности, или так называемый латинский квадрат. Построение этой таблицы имеет общие принципы для двух обсуждаемых клинических целей: оценки величины факторов риска и оценки величины эффекта лечебного воздействия (табл. 1).

Таблица 1 Четырехпольная таблица для подготовки данных к вычислению величины клинического эффекта
Клинические цели Неблагоприятный исход
Оценка факторов риска Оценка эффективности вмешательств Да Нет
Воздействие фактора риска Лечение A B
Нет воздействия Контроль C D

При оценке факторов риска в ретроспективных обсервационных исследованиях с дизайном типа случай — контроль вначале выделяют когорты с наличием (A и C) и отсутствием изучаемого клинического исхода (B и D). Затем проводят ретроспективную оценку наличия (A и B) или отсутствия (C и D) фактора риска за весь период ретроспективного исследования. Далее вычисляют следующие долевые показатели:

  • Шансы на неблагоприятный исход в группе воздействия фактора — A/B.
  • Шансы на неблагоприятный исход в группе без воздействия фактора — C/D.
  • Отношение шансов (odd ratio — OR)=(A/B)/(C/D).

Величина OR может колебаться в диапазоне от 0 до бесконечности. Если OR=1, то это свидетельствует о том, что фактор риска не влияет на возникновение клинических исходов. Если OR>1, то это свидетельствует о взаимосвязи изучаемых фактора риска и клинического исхода. В случае, если OR<1, то это свидетельствует о протекторном влиянии изучаемого фактора воздействия на клинический исход.

В случае оценки эффективности НМТ чаще всего используется дизайн рандомизированного контролируемого клинического испытания. Группа вмешательства и контроля формируются случайным образом. Затем проспективно оценивается наступление клинических исходов в обеих группах (A и C). Для вычисления показателей, характеризующих величину клинического эффекта в результате применения НМТ, последовательно вычисляют такие производные:

  • Абсолютный риск неблагоприятного исхода при лечении (absolute risk treatment) ARt=A/(A+B).
  • Абсолютный риск неблагоприятного исхода в контроле (absolute risk control) ARc=C/(C+D).
  • Относительный риск, или отношение рисков (relative risk, risk ratio) RR=ARt/ARc.
  • Снижение относительного риска (relative risk reduction) RRR=1–RR.
  • Снижение абсолютного риска (absolute risk reduction) ARR=ARt–ARc.
  • Число пациентов, подвергаемых лечению, на один предотвращенный неблагоприятный исход (number needed to treat) NNT=1/ARR.

Относительный риск и NNT чаще всего используют для обозначения величины клинических эффектов НМТ. Относительный риск представляет собой отношение частоты наблюдаемого исхода у лиц, подвергавшихся и не подвергавшихся воздействию НМТ. Показатель относительного риска также может использоваться в проспективном когортном исследовании влияния патогенных факторов. И в том, и в другом случае этот показатель отображает силу связи между воздействием и заболеванием. Следует помнить, что в этом показателе скрыта информация о заболеваемости, которая отражена в показателях абсолютного риска. Если заболевание редкое, то даже при высоких значениях относительного риска абсолютный риск может быть невысоким.

При OR>1 вероятность развития неблагоприятного исхода в основной группе выше, а при OR<1 ниже, чем в контроле.

Показатель NNT считается наиболее удачной, интуитивно понятной количественной характеристикой эффективности НМТ. Этот показатель выражается одним числом и наиболее эффективен для декларации силы клинического эффекта, для сравнения разных лечебных воздействий, а также при соответствующем информировании пациента в процессе принятия клинического решения.

Существует еще особая группа эпидемиологических характеристик эффективности диагностических тестов. Расчет этих характеристик в диагностических исследованиях является одним из обязательных условий принятия публикации в рецензируемый медицинский журнал. Так же, как и при расчете предыдущих показателей, при расчете параметров эффективности диагностического теста необходимо построить таблицу сопряженности. В первой строке четырехпольной таблицы вносят количества случаев, при которых данные диагностического теста положительные, но на самом деле заболевание в наличии (A) или отсутствует (B). Во второй строке указывается количество случаев с отрицательными результатами теста, в случаях, когда на самом деле заболевание в наличии (C) или отсутствует (D) (табл. 2).

Таблица 2 Четырехпольная таблица сопряженности для расчета параметров эффективности диагностического теста
Наличие болезни по данным нового теста Наличие болезни по данным золотого стандарта диагностики
Да Нет
Да A B
Нет C D

Для оценки эффективности диагностического теста рассчитывают несколько показателей (Флетчер Р. и соавт., 1998, с. 66), но в данной публикации мы остановимся на двух наиболее распространенных и широко применяемых в клинической практике:

  • Чувствительность диагностического теста — доля истинноположительных результатов теста (A) в общем количестве истинно больных (A+C) (sensitivity) Se=A/(A+C).
  • Специфичность диагностического теста — доля истинноотрицательных результатов теста (D) среди пациентов, не имеющих заболевания (B+D) (specificity) Sp=D/(B+D).

Наименование и размерность этих показателей достаточно ясно отражают важнейшие количественные характеристики диагностических тестов, а их знание в реальной клинической деятельности позволяет принимать адекватные и взвешенные решения о необходимости применения соответствующих тестов.

Если результат диагностического теста представлен количественной характеристикой вероятности наличия заболевания, то для полноты описания возможностей теста выполняется построение графика так называемой характеристической кривой (Receiver Operating Characteristic (ROC)-curve). В этом случае у диагностического теста появляются новые характеристики и новые смыслы. Во многих руководствах упускается методика построения ROC-кривой, что не способствует пониманию этого графика и затрудняет его построение в оригинальных исследованиях. Ниже представим пошаговый алгоритм построения ROC-кривой. В качестве объекта разъяснения возьмем применение концентрации глюкозы в плазме крови для диагностики сахарного диабета, пример, который чаще всего применяется для описания смысла ROC-кривой в известных руководствах по клинической эпидемиологии (Флетчер Р. и соавт., 1998, с. 70; Власов В.В., 2001, с. 192; Власов В.В., 2005, с. 163; Гринхальх Т., 2006, с. 130). Ранняя диагностика сахарного диабета, по данным концентрации глюкозы в плазме крови, опирается на понимание соответствующей характеристической кривой (Anand S.S. et al., 2003). Вначале для пояснения этой фундаментальной категории диагностического теста следует рассмотреть понятие «точка разделения». Для этих целей построим условную модель в виде двух гистограмм распределения2 концентрации глюкозы в плазме крови у здоровых и больных сахарным диабетом в период дебюта заболевания. Эти гистограммы пересекаются в зоне неопределенности установления диагноза (синий цвет) (рис. 1).

Рис. 1
 Условная модель распределения уровня глюкозы у здоровых и больных сахарным диабетом в период дебюта заболевания
Условная модель распределения уровня глюкозы у здоровых и больных сахарным диабетом в период дебюта заболевания

Точка разделения — это произвольное значение показателя диагностического теста, которое выбирается исследователем как граница отнесения исследуемого пациента к категории «здоровый» или «больной». Исходя из данных рисунка рациональный выбор точки разделения может находиться в диапазоне значений 5–7 ммоль/л. Выбор точки 5 ммоль/л позволит выявить всех пациентов с диабетом в начале заболевания, но определенная доля здоровых людей (выборка синего цвета, которая принадлежит зеленой гистограмме) будет ложно отнесена к категории «больные» (ложноположительные результаты теста, соответствует значению «B» в табл. 2). Если в качестве точки разделения будет выбран уровень глюкозы в плазме крови 7 ммоль/л, тогда тест позволит определить всех здоровых лиц, но часть больных (выборка синего цвета, которая принадлежит красной гистограмме) будет отнесена к категории «здоровые» (ложноотрицательные результаты теста, соответствует значению «C» в табл. 2). Такая модель позволяет осознать сущность основных понятий диагностического теста, но на практике в небольших исследованиях невозможно получить такие плавные гистограммы и качественно определить точку разделения.

Для формализации характеристик диагностического теста необходимо построить соответствующую характеристическую кривую. Вначале необходимо вычислить массив показателей чувствительности и специфичности на основе четырехпольной таблицы при разных точках разделения — от минимального до максимального значений уровней изучаемого показателя, при которых по данным теста возможна неопределенность диагностического заключения. Для этого каждую следующую дискретную точку разделения определяют, повышая предыдущее значение диагностического теста до тех пор, пока не произойдет изменение распределения наблюдений в таблице сопряженности. Для каждой точки разделения вычисляют показатели чувствительности и специфичности, которые используют для построения характеристической кривой. Ось ординат графика характеристической кривой представляет значения частоты истинноположительных результатов (Se), а ось абсцисс — частоты ложноположительных результатов3 (1–Sp).

Качественный диагностический тест характеризуется типичным графиком ROC-кривой, например таким, который построен на основе многоцентрового исследования изучения концентрации глюкозы в плазме крови для диагностики сахарного диабета на репрезентативной выборке (936 наблюдений) у канадцев разных этнических групп (рис. 2).

Рис. 2
 Характеристическая кривая теста концентрации глюкозы в плазме крови для диагностики сахарного диабета (по данным S.S. Anand и соавторов (2003) с дополнениями)
Характеристическая кривая теста концентрации глюкозы в плазме крови для диагностики сахарного диабета (по данным S.S. Anand и соавторов (2003) с дополнениями)
Примечание: к подписям на графике добавлены два (верхний и нижний) уровня концентрации глюкозы в плазме крови для демонстрации точек разделения, которые соответственно могут использоваться при более точной диагностике и при массовом скрининге.

Восходящая часть ROC-кривой состоит из множества точек, которые соответствуют высокой границе уровня глюкозы вплоть до 50% чувствительности (истинноположительные данные). На этом участке графика только единичные наблюдения ложно относятся (тест положительный, а болезни нет) к категории «больные». Верхний правый угол графика соответствует точкам разделения с минимальным уровнем концентрации глюкозы в плазме крови. В реальных небольших исследованиях ROC-кривая имеет ломаную форму за счет недостаточного размера выборок исследования (Кобиляк Н.М. та співавт., 2012).

Кроме показателя чувствительности и специфичности, среди ряда характеристик диагностического теста, по данным графика характеристической кривой (Флетчер Р. и соавт., 1998, с. 70; Власов В.В., 2001, с. 178; Власов В.В., 2005, с. 153; Гринхальх Т., 2006, с. 129), следует отметить такую характеристику, как площадь под характеристической кривой (Area Under the ROC-curve — AUROC). Тест начинает отражать какие-либо зависимости между величиной измеряемого показателя и наличием клинического исхода только в том случае, когда AUROC >50%. Чем больше величина AUROC и чем ближе дуга графика к верхнему левому углу — тем более информативный тест.

Как использовать график характеристической кривой диагностического теста в клинической практике? В оригинальных исследованиях и в некоторых других типах публикаций содержатся несбалансированные характеристики специ­фичности и чувствительности количественных диагностических тестов. Например, может указываться Se=90% и Sp=40% без соответствующих разъяснений. Еще более грубый способ убеждения читателя в эффективности диагностического теста состоит в указании лишь высокого уровня чувствительности и умолчании того факта, что при заявленном высоком уровне чувствительности резко возрастает величина ложноположительных результатов теста. Подготовленный в области клинической эпидемиологии врач знает, что для количественных диагностических тестов не существует строго определенных неизменных значений Se и Sp количественных тестов, поскольку они являются взаимозависимыми и могут представляться, как минимум, в трех дискретных вариантах. Поясним это на нашем примере (см. рис. 1).

В вышеуказанном репрезентативном исследовании в качестве оптимальной точки разделения выбрано значение 5,7 ммоль/л. При этом значении точки разделения «чувствительность» и «специфичность» теста составили соответственно 83 и 88% (Anand S.S. et al., 2003). Этот уровень принят авторами как оптимальный при проведении скрининговых исследований для выявления больных сахарным диабетом. Но эти же данные свидетельствуют, что при выборе такого порогового значения диагностического показателя 17% больных (100–83%) будут неверно отнесены к группе здоровых, а 12% здоровых (100–88%) — к группе больных. Если стоит клиническая задача выявить максимальное количество больных, но при этом допустимо пренебречь возможным увеличением ложноположительных результатов, то, в соответствии с нашей моделью, следует выбрать точку разделения 5 ммоль/л. В этом случае предположительные значения чувствительности и специфичности теста составят около 95 и 75% соответственно. Если клиническая задача состоит в более строгом отборе больных в процессе диагностики, тогда в качестве точки разделения следует выбрать около 7 ммоль/л. В этом варианте теста предположительные значения чувствительности и специфичности теста составят около 75 и 95% соответственно. Таким образом, график характеристической кривой позволяет получить наиболее полную количественную характеристику диагностического теста, максимально использовать новую клиническую информацию и осознанно применять ее для скрининговых и диагностических исследований.

С нашей точки зрения, теория диагностических исследований является наиболее сложной для понимания во врачебном сообществе. Преимущества в клинической практике, которые получает подготовленный в этом вопросе врач, компенсирует усилия по самообразованию, поскольку диагностика является наиболее важной задачей клинической практики. Именно поэтому мы акцентируем внимание на этой проблеме оценки величины клинических эффектов НМТ. По этим же причинам практические вопросы оценки и применения диагностических тестов продолжают оставаться темой образовательных публикаций в рейтинговых международных научно-практических медицинских журналах (Mallett S. et al., 2012).

Среди наиболее актуальных критериев оценки величины клинических эффектов НМТ следует еще остановиться на таком прогностическом показателе, как оценка выживаемости. Этот показатель необходим для оценки самого важного для пациента клинического исхода. Он может использоваться для оценки влияния определенного фактора риска или вмешательства на вероятность смертельного исхода в определенные периоды дожития. Также, как при оценке диагностического теста, для оценки ожидаемой продолжительности жизни существуют разные форматы представления клинической информации. Например, можно сказать, что пятилетняя выживаемость при наличии определенного фактора риска составляет определенное количество лет. Но разные группы популяции при одном и том же заболевании могут иметь различные предпочтения: для одних может быть более актуальным качество жизни (это также, как и смерть, является клиническим исходом) в краткосрочной перспективе (люди пожилого возраста), для других (люди молодого возраста) — может быть более важен прогноз многолетней выживаемости и возможные способы ее повышения. Для ответа на эти вопросы необходимо знать вероятность изучаемого исхода у пациентов с определенным заболеванием в разные периоды. Наиболее убедительным аргументом в пользу актуальности такой клинической информации является классический пример разной формы графиков пятилетней выживаемости при различных заболеваниях (Флетчер Р. и соавт., 1998, с. 148).

Для анализа выживаемости в настоящее время разработаны достаточно совершенные методы образного представления клинической информации (кривая Каплана — Мейера), которые интуитивно понятны и содержат ценную информацию о величине клинических эффектов. Также существуют надежные статистические инструменты для оценки степени доверия к результатам оценки выживаемости. Из наиболее доступных руководств методология анализа выживаемости лучше всего описана в классическом российском учебнике по эпидемиологии (Власов В.В., 2005, с. 233).

Оценка выживаемости с построением графиков и вычислением соответствующих статистик давно стали стандартом в соответствующих типах клинических исследований и все чаще появляются в отечественных публикациях (Пархоменко О.М. та співавт., 2013). Но, несмотря на простоту и важное значение этого метода для практики, только немногие врачи понимают смысл клинической информации на графиках выживаемости, а отечественные исследователи недостаточно знают методологию анализа выживаемости.

Господин «доверительный интервал»

В силу особенностей традиций обучения медицине врачи недостаточно знакомы с основами теории вероятности и методами статистического анализа. Но, начиная со второй половины ХХ в., статистика заняла прочные позиции в медицинских исследованиях, а в конце ХХ в. методы статистического анализа были интегрированы в клиническую эпидемиологию — «одну из фундаментальных наук, на которой зиждется здание современной медицины» (Флетчер Р. и соавт., 1998, с. 14). В результате этих процессов из медицинской науки почти исчезли описательные исследования, которые не несут числовой информации, а форма представления клинической информации теперь позволяет оценить как величину клинических эффектов, так и степень доверия к этой информации. Для этих целей применяется специальный формат представления клинической информации в виде меры ожидания и так называемого доверительного интервала. В качестве меры ожидания почти всегда используется среднее значение, если выборка приближается к нормальному распределению, в другом случае — используется медиана. Для того чтобы определить точность оценки меры ожидания, используется диапазон значений изучаемого показателя, в который попадут 95% значений показателей при проведении аналогичного исследования. В особых случаях в качестве меры доверия можно использовать 99% уровень вероятности. Универсальность доверительного интервала состоит в том, что он отражает и величину клинического эффекта, и степень доверия к этой величине. При помощи доверительного интервала можно оценить уровень статистической значимости различий в двух и более группах сравнительных измерений. Если, например, в одной группе пациентов 95% доверительный интервал концентрации глюкозы в плазме крови составит 4,3–5,4 ммоль/л, а в другой группе — 5,5–6,9 ммоль/л, то можно говорить не только о величине различий гликемии, но и о том, что при проведении статистического тестирования будет получен уровень статистической значимости различий <0,05.

Доверительный интервал широко используется для описания меры положения выборочных характеристик, а также для оценки меры доверия ко всем перечисленным в этой работе количественным характеристикам клинической информации, а также к графикам характеристической кривой и графикам выживания.

При изучении новой клинической информации врач обязан хорошо понимать смысл доверительных интервалов для формирования собственных суждений о ценности клинической информации. Приведем пример такой актуальности.

Наиболее типичным примером применения доверительных интервалов является выражение эффективности лекарственных средств. Для этих целей в международной медицинской практике используется специальный формат представления метаанализа контролируемых клинических испытаний, который состоит в представлении кратких, но информативных результатов отдельных клинических исследований в виде текста и графиков. Наиболее качественные метаанализы можно найти в свободном доступе на сайте Кокрановской библиотеки (http://www.thecochranelibrary.com). Для примера мы выбрали материал из сферы наших клинических интересов: метаанализ всемирно признанного австралийского эксперта в области гипербарической оксигенации (ГБО) и клинической эпидемиологии M.H. Bennett и соавторов (2011), который посвящен влиянию ГБО на частоту смертельных исходов у больных с острым коронарным синдромом.

Основной результат этого метаанализа представлен следующим образом (рис. 3).

Рис. 3
Типичный пример представления величины клинического эффекта в результате метаанализа контролируемых клинических испытаний эффективности лечения. Эффективность ГБО при остром коронарном синдроме (Bennett M.H. et al., 2011)

В тексте и на графиках представлены результаты эффективности ГБО у двух групп пациентов в зависимости от наличия кардиогенного шока. Результаты каждого исследования отражены справа в виде графиков отношения рисков и их 95% доверительного интервала. Более показательным примером является представление результатов разных исследований у пациентов без кардиогенного шока (группа ГБО — 280 пациентов, контроль — 322 пациента). Вычисленные значения отношения рисков обозначены синим квадратом, величина которого пропорциональна размеру выборки в конкретном исследовании. Влево и вправо от квадратов отходят линии, которые отражают нижнюю и верхнюю границы 95% доверительных интервалов отношения рисков. Результаты каждого исследования свидетельствуют о том, что ГБО снижает смертность при остром коронарном синдроме, но доверительный интервал в каждом исследовании пересекает значение «1», что обозначает то, что в отдельных исследованиях не достигнут заданный уровень статистической значимости для отношения рисков (p<0,05), то есть существует вероятность получения неблагоприятных эффектов ГБО в более чем одном случае из двадцати. В нижней части каждой группы графиков представлен обобщенный образ отношения шансов в виде ромба, причем правая часть ромба не пересекает значение «1»: OR=0,57 (95% доверительный интервал 0,33–0,98). Также на основе табличных данных можно самостоятельно вычислить абсолютный риск смерти при обычном лечении острого коронарного синдрома (10%) и с использованием метода ГБО (6%).

Представленные данные свидетельствуют о том, что включение ГБО в стандартную терапию острого коронарного синдрома может предотвратить 40% потенциальных смертей. Обобщенный результат эффективности ГБО для обеих категорий коронарных синдромов показывает еще более выраженный лечебный эффект ГБО. Таким образом, каждый врач, имеющий подготовку в области клинической эпидемиологии, может вынести собственные суждения о месте ГБО при остром коронарном синдроме, несмотря на распространение слухов о бесполезности метода ГБО для клинического использования.

Особенно полезным для клинической практики будет опыт сопоставления количественных эпидемиологических характеристик эффектов разных лечебных вмешательств при одном и том же заболевании. Например, в опубликованном в Кокрановской библиотеке (выпуск 6) в 2011 г. метаанализе эффективности статинов при остром коронарном синдроме по результатам 19 рандомизированных контролируемых испытаний на материале >14 тыс. наблюдений не получено статистически значимого снижения смертности OR=0,93 (95% доверительный интервал 0,8–1,08) (Vale N. et al., 2011). Но при этом статины включены в протоколы лечения острого коронарного синдрома во всех странах. Конечно, следует учитывать величину клинических эффектов статинов в отношении других клинических исходов, но также токсичность этих лекарств. Подобное сопоставление величины клинических эффектов НМТ с внимательным изучением первичных исследований позволяет получить серьезные аргументы в пользу выбора терапии конкретного пациента и для создания независимых локальных протоколов лечения различных заболеваний.

Заключение

Мозаичное представление основных количественных характеристик клинической информации в данной публикации не может заменить систематизированного обучения и чтения увесистых руководств по клинической эпидемиологии и биостатистике. Автор лишь попытался продемонстрировать приоритет знаний, необходимых для понимания величины клинического эффекта НМТ в процессе медицинской практики и проведения клинических исследований. При отсутствии этих специальных знаний врач лишается доступа к современной качественной клинической информации и ведет свою практику на основе устаревших принципов. В связи с этим возникает вопрос об источниках знаний и образовательных программах. К сожалению, в Украине пока не предвидится никаких национальных программ обучения основам клинической эпидемио­логии и биостатистики. Более того, на основе собственного опыта могу утверждать, что в медицинских университетах инициативные программы подготовки будущих врачей и исследователей основам клинической эпидемиологии и биостатистики не имеют адекватной поддержки со стороны руководителей. У медицинского научного истеблишмента существует целый ряд мотиваций для отрицания необходимости внедрения в медицинских университетах реальных образовательных программ в области клинической эпидемиологии и биостатистики. В существующей ситуации не следует ожидать реформ снизу, более эффективным будет директивное внедрение соответствующих программ обучения на общегосударственном уровне.

Но сложившаяся ситуация не является поводом для погружения в медицинскую практику средневековья с атрибутами доминирования интересов крупных производителей лекарственных средств в национальном бюджете здравоохранения. В настоящее время существуют великолепные возможности для самообучения. В этой работе мы постарались представить основные аргументы в необходимости такого самообучения клинической эпидемиологии и биостатистики с целью обес­печения полноты понимания современной клинической информации. Количественные характеристики клинической информации в современной медицине становятся одним из главных параметров не только в процессе разработки национальных клинических рекомендаций, но прежде всего, в реальной клинической практике.

Еще один аргумент в необходимости самообразования связан с изменением правил академической аттестации и возрастающими требованиями оценки рейтинга ученого по результатам публикаций в международных рецензируемых научно-медицинских журналах. В этих журналах невозможно опубликовать клинический отчет без соблюдения современных правил планирования, организации и анализа результатов клинических исследований.

Таким образом, понимание количественных характеристик современной клинической информации и умение ее представлять в клинических отчетах становятся сегодня важнейшими квалификационными характеристиками врача и клинического исследователя.

Список использованной литературы

>Кількісні характеристики клінічної інформації

К.П. Воробйов

Резюме. Актуальність теми публікації зумовлена значним поширенням кількісних характеристик клінічної інформації (КХКІ) у сучасних журнальних публікаціях. Розуміння КХКІ є однією з умов сучасної медичної практики у процесі ухвалення клінічного рішення. У роботі наведено короткі характеристики основних епідеміологічних КХКІ. Описано принципи розрахунку показників ризиків, кількісних характеристик діагностичних тестів, методики побудови характеристичної кривої діагностичного тесту, різні способи інтерпретації результатів діагностичних тестів, характеристики графічного методу оцінки виживаності. Зроблено акцент на високій інформативності надання КХКІ із використанням довірчих інтервалів. При інтерпретації основних КХКІ використано результати реальних досліджень. На прикладі деяких результатів метааналізу досліджень, за даними Кокранівської бібліо­теки, представлено приклад інтерпретації КХКІ. У висновку обґрунтовується теза про те, що навички розуміння КХКІ є однією з найважливіших компетенцій сучасного лікаря.

Ключові слова: клінічна інформація, кількісні характеристики, клінічне рішення.

>Quantitative characteristics of clinical information

K.P. Vorobyov

Summary. The importance of the theme is caused by common use of quantitative characteristics of clinical information (QCCI) in modern journal publications. Understanding QCCI is the necessary condition for the clinical decision making in modern medical practice. Short description of main epidemiological QCCI is given in the article. Main principles of the risks and quantitative characteristics of diagnostic tests calculation are given, as well as methods for construction of the characteristic curve of diagnostic test, various ways to interpret the diagnostic tests results, characteristics of a graphic method of an estimation of survival rate. The emphasis is made on the high information value of the QCCI confidence intervals. Interpretation of main QCCI was made in terms of the real studies results. Examples of the QCCI interpretation also were made on the basis of the Cochrane meta-analysis. The conclusion is made that understanding the QCCI is one of the major competencies of modern doctor.

Key words: clinical information, quantitative characteristics, clinical decision.

Адрес для переписки:
Воробьев Константин Петрович
91045, Луганск, квартал 50-летия
Обороны Луганска, 1 Г
ГУ «Луганский государственный
медицинский университет»,
кафедра анестезиологии,
реаниматологии и неотложных
состояний ФПО
E-mail: [email protected]
http://www.vkp.dsip.net

Получено 17.02.2014

_______________________
1 Понятие «медицинская технология» может обозначать различные аспекты медицинской помощи. Об этом совсем недавно подробно написал член правления Московского отделения Общества специалистов доказательной медицины Н.А. Зорин (2014). В данной работе нами использовано понятие НМТ для обозначения широкого класса вмешательств лечебных, диагностических, профилактических, которые в контексте публикации чаще всего рассматриваются как новые конкурирующие вмешательства, полезность которых изучают в контролируемых исследованиях.

2 Реальные гистограммы распределения имеют более длинные хвосты в виде единичных случаев здоровых с высокой концентрацией глюкозы в плазме крови и единичных случаев больных сахарным диабетом с нормальным уровнем этого показателя.

3 Иногда в публикациях ось абсцисс графика ROC-кривой неверно обозначается как «Специфичность» с возрастающими значениями от 0 до 100%.