Все больше и больше областей медицины полагаются на поддержку искусственного интеллекта (ИИ). Это особенно актуально для широкого круга вопросов, основанных на оценке данных изображений: например, врачи ищут на маммограммах крошечные очаги рака или рассчитывают объем опухоли головного мозга на основе томографических изображений МРТ.
Они используют эндоскопические изображения кишечника для отслеживания полипов, а при оценке микроскопических срезов тканей необходимо обнаружить тонкие изменения в отдельных клетках.
Но всегда ли алгоритмы, используемые для этих различных типов анализа изображений, подходят для поставленной задачи? Это в значительной степени зависит от того, какие измеряемые переменные, называемые в технических терминах «метриками», они записывают, и действительно ли они подходят для рассматриваемой задачи.
«Мы часто замечаем, что используются метрики валидации, которые совершенно не имеют отношения к задаче с клинической точки зрения», — говорит Лена Майер-Хейн из DKFZ, приводя пример: «При поиске метастазов в головном мозге изначально больше важно, чтобы алгоритм обнаруживал даже мельчайшие поражения, а не то, что он может с высокой точностью определять контуры каждого отдельного метастаза».
Лена Майер-Хейн и ее коллеги опасаются, что использование неподходящих показателей проверки может помешать научному прогрессу и задержать внедрение важных методов анализа изображений в клиническую практику.
Но какие показатели подходят для конкретного клинического вопроса, учитывая все сильные, слабые стороны и ограничения? Чтобы выяснить это, специалисты по данным DKFZ использовали многоэтапный структурированный процесс опроса лидеров общественного мнения из научных кругов и промышленности из более чем 70 исследовательских институтов по всему миру. Опрос позволил им собрать информацию, которая ранее была доступна только в разрозненных местах по всему миру.
«Благодаря этой работе мы впервые делаем доступной экспертам надежную и исчерпывающую информацию о проблемах и подводных камнях, связанных с метриками проверки при анализе изображений», — говорит Анника Рейнке, один из ведущих авторов.
Работа представляет собой структурированный массив информации, к которому могут получить доступ исследователи всех дисциплин. Целью работы является улучшение понимания ключевой проблемы анализа изображений с помощью ИИ. Хотя основное внимание уделяется анализу медицинских изображений, информацию можно перенести и в другие области анализа изображений.
Во второй статье экспертный консорциум во главе с исследователями из Гейдельберга описывает «Перезагрузку показателей»: комплексную структуру, помогающую врачам и ученым выбирать показатели, подходящие для решения проблемы. «Metrics Reloaded» можно использовать как онлайн-инструмент .
«Пользователям предлагается ответить на полный набор вопросов, чтобы создать точную картину проблемы анализа изображений. Инструмент также привлекает внимание к конкретным проблемам, возникающим в определенных биомедицинских вопросах», — объясняет Пол Йегер, один из старших авторов двух публикаций.
Metrics Reloaded подходит для всех категорий задач анализа изображений, т. е. для классификации изображений, обнаружения объектов или назначения отдельных пикселей (семантическая сегментация). Инструмент работает полностью независимо от источника изображения, поэтому его можно использовать как для изображений КТ или МРТ, так и для микроскопических изображений. Metrics Reloaded также подходит для анализа изображений, выходящего за рамки биомедицинских проблем.
«Metrics Reloaded — это первое систематическое руководство, которое показывает пользователям анализа изображений на основе искусственного интеллекта путь к правильному алгоритму. Мы надеемся, что Metrics Reloaded будет использоваться как можно шире и как можно быстрее, поскольку это может значительно улучшить качество и надежность Это также повысит доверие к анализу изображений с помощью ИИ в повседневной клинической практике », — говорит Мину Тизаби, один из ведущих авторов.