AI 주치의는 아직?… “인터넷 검색과 차이 없어”

곽소영 기자
곽소영 기자
수정 2026-02-10 08:57
입력 2026-02-10 08:57
옥스퍼드 연구팀 “질환 식별 비율 34.5%에 불과”
AI 의학지식은 충분하나 환자와의 소통에는 빈약
우리나라도 AI로 만든 가짜전문가 광고 문제 부각

본 이지지는 생성형 AI 재미나이로 만든 것으로 기사 내용과 연관이 없습니다 제미나이


주요 인공지능(AI) 챗봇과 기존 인터넷 검색엔진을 이용해 병명을 자가 진단 하도록 실험한 결과, AI가 인터넷 검색보다 크게 낫지 않았다는 연구 결과가 나왔다.


AFP는 영국 옥스퍼드대 연구진이 성인 1300명을 대상으로 실험한 결과 이런 결과를 도출하고 최근 국제학술지 네이처 메디신에 게재했다고 9일(현지시간) 밝혔다.

연구진은 실험 참가자에게 숙취로 인한 두통과 담석증 등 10가지 가상 시나리오를 주고 오픈AI의 ‘GPT-4o’, 메타의 ‘라마3’, 코히어의 ‘커맨드R+’ 등 세 개의 챗봇 중 하나로 자가 진단을 하게 했다. 또 구글 등 기존 인터넷 검색으로 역시 같은 시나리오에 대해 자가 진단을 시켰다.

그 결과 AI가 질환을 정확히 식별한 비율은 34.5%였다. 병원 방문이나 응급차 호출 등 대처 방법을 제대로 제시한 비율도 44.2%였다. 연구진은 인터넷 검색엔진을 이용한 결과와 유의미한 차이가 없다고 판단했다.



이에 대해 연구진은 AI 챗봇의 의학적 지식은 충분했지만, 환자들이 자신의 증상을 제대로 설명하지 못하거나 AI의 답변을 오인했다고 봤다. 이른바 ‘AI 주치의’가 지식은 충분해도 환자와의 소통에는 아직 능숙하지 않다는 의미로 읽힌다.

국내에서도 건강기능식품 등을 소개하는 영상에서 AI 기술을 활용한 ‘가짜 전문가’ 영상 광고가 급증하고 있다는 지적이 나온다. 단순히 허위·과대 광고로만 대응해서는 안 된다는 것이다.

또 AI 주치의를 표방한 일부 앱이 암을 양성으로 오진하거나, 문제가 없는데 암이라고 진단하는 경우가 있다는 비판도 나온다.

곽소영 기자
에디터 추천 인기 기사
많이 본 뉴스