Небезпека самолікування через ШІ: Дослідження Гарварду виявило 80% помилок у ранній діагностиці
![]() |
| Джерело зображення: Кім Хьон Кука |
Команда дослідників з Гарвардської медичної школи (Harvard Medical School) провела масштабну оцінку діагностичних можливостей сучасних великих мовних моделей (LLM). Вчені протестували 21 передову ШІ-модель, серед яких були лідери ринку: GPT, Gemini та Claude. Результати виявилися протверезними для всіх прихильників ідеї "ШІ-лікарів".
Проблема "диференціального діагнозу"
Головним викликом для ШІ став етап ранньої діагностики – так званий "диференціальний діагноз", коли лікар має визначити ймовірну хворобу лише на основі загальних симптомів та скарг пацієнта (за умов неповної клінічної картини).
Дослідження показало, що рівень помилок штучного інтелекту на цьому етапі сягає шокуючих 80%. Нейромережі виявилися надзвичайно вразливими до невизначеності. Там, де живий лікар використовує інтуїцію, досвід та здатність ставити навідні запитання, ШІ часто робить хибні або надто узагальнені висновки.
Дані вирішують усе
Проте ситуація змінюється, коли моделі отримують більше контексту. Дослідники зазначили, що після надання алгоритмам додаткових результатів клінічних аналізів та тестів, рівень помилок при постановці "фінального діагнозу" знизився вдвічі – до 40%.
Це яскраво ілюструє поточний стан розвитку технології: штучний інтелект демонструє високу продуктивність під час аналізу великих, структурованих та повних наборів медичних даних, але повністю губиться в умовах браку інформації на початковому етапі лікування.
Вердикт: ШІ – лише асистент, а не лікар
Автори дослідження роблять однозначний висновок: повністю покладатися на ШІ для встановлення діагнозів наразі передчасно.
«ШІ чудово справляється з визначенням остаточних діагнозів, коли дані повні, але має серйозні проблеми на ранніх стадіях з обмеженою інформацією», – попереджають дослідники. Технологія ще не досягла того рівня автономності, коли їй можна було б довірити ухвалення рішень щодо здоров'я пацієнтів без прямого втручання кваліфікованих медичних працівників.
Поки що найкращий спосіб використання LLM у медицині – це інструмент "другої думки" для лікарів-професіоналів, які вже мають на руках результати обстежень, а не "перший контакт" для стривожених пацієнтів.

Приєднатися до обговорення