Небезпека самолікування через ШІ: Дослідження Гарварду виявило 80% помилок у ранній діагностиці

Дедалі більше людей звертаються до чат-ботів зі штучним інтелектом замість пошукових систем, коли відчувають нездужання або підозрілі симптоми. Проте нове дослідження показує, що довіряти своє здоров'я нейромережам на ранніх етапах хвороби – вкрай небезпечно.

Джерело зображення: Кім Хьон Кука

Команда дослідників з Гарвардської медичної школи (Harvard Medical School) провела масштабну оцінку діагностичних можливостей сучасних великих мовних моделей (LLM). Вчені протестували 21 передову ШІ-модель, серед яких були лідери ринку: GPT, Gemini та Claude. Результати виявилися протверезними для всіх прихильників ідеї "ШІ-лікарів".

Проблема "диференціального діагнозу"

Головним викликом для ШІ став етап ранньої діагностики – так званий "диференціальний діагноз", коли лікар має визначити ймовірну хворобу лише на основі загальних симптомів та скарг пацієнта (за умов неповної клінічної картини).

Дослідження показало, що рівень помилок штучного інтелекту на цьому етапі сягає шокуючих 80%. Нейромережі виявилися надзвичайно вразливими до невизначеності. Там, де живий лікар використовує інтуїцію, досвід та здатність ставити навідні запитання, ШІ часто робить хибні або надто узагальнені висновки.

Дані вирішують усе

Проте ситуація змінюється, коли моделі отримують більше контексту. Дослідники зазначили, що після надання алгоритмам додаткових результатів клінічних аналізів та тестів, рівень помилок при постановці "фінального діагнозу" знизився вдвічі – до 40%.

Це яскраво ілюструє поточний стан розвитку технології: штучний інтелект демонструє високу продуктивність під час аналізу великих, структурованих та повних наборів медичних даних, але повністю губиться в умовах браку інформації на початковому етапі лікування.

Вердикт: ШІ – лише асистент, а не лікар

Автори дослідження роблять однозначний висновок: повністю покладатися на ШІ для встановлення діагнозів наразі передчасно.

«ШІ чудово справляється з визначенням остаточних діагнозів, коли дані повні, але має серйозні проблеми на ранніх стадіях з обмеженою інформацією», – попереджають дослідники. Технологія ще не досягла того рівня автономності, коли їй можна було б довірити ухвалення рішень щодо здоров'я пацієнтів без прямого втручання кваліфікованих медичних працівників.

Поки що найкращий спосіб використання LLM у медицині – це інструмент "другої думки" для лікарів-професіоналів, які вже мають на руках результати обстежень, а не "перший контакт" для стривожених пацієнтів.

TechDigest

Небезпека самолікування через ШІ: Дослідження Гарварду виявило 80% помилок у ранній діагностиці

Проблема "диференціального діагнозу"

Дані вирішують усе

Вердикт: ШІ – лише асистент, а не лікар

Штучний інтелект як «новий вид»: Чому 2030 рік назавжди змінить правила гри

ШІ за шкільною партою: Чому нейромережі потрібно вивчати вже з першого класу

Дослідження: Симбіоз штучного інтелекту та робототехніки здатний автоматизувати 57% людських завдань

Ефект підлабузника: Чому не варто розкривати чат-ботам власні погляди перед тим, як поставити запитання

Ера Multi-AI: Чому колаборативні системи штучного інтелекту перевершують універсальні моделі

Ера мобільної фотографії на орбіті: Чому NASA дозволило астронавтам брати iPhone у космос

Розумний дім мав стати відкритим, але перетворюється на нескінченну підписку

Скепсис залишається, але потенціал вражає: Чому складаний iPhone може змінити правила гри

Відповідь на AMD Strix Halo: чим здивує новий процесор Intel Serpent Lake із графікою NVIDIA

Ментальна атрофія через штучний інтелект: як освіта адаптується до нових викликів

Небезпека самолікування через ШІ: Дослідження Гарварду виявило 80% помилок у ранній діагностиці

Проблема "диференціального діагнозу"

Дані вирішують усе

Вердикт: ШІ – лише асистент, а не лікар

Приєднатися до обговорення