오픈AI, 자율성 높인 GPT-5.5 출시…“가장 똑똑하고 직관적”

장진복 기자
장진복 기자
수정 2026-04-24 14:19
입력 2026-04-24 14:19

앤트로픽과 주도권 경쟁 나서
성능지표서 ‘오퍼스4.7’ 대부분 앞서

오픈AI 자료 이미지. 픽사베이


오픈AI가 두 달 만에 새 인공지능(AI) 모델을 선보이며 앤트로픽과 주도권 경쟁에 나섰다.

오픈AI는 23일(현지시간) 새 AI 모델 ‘GPT-5.5’를 공개하면서 “현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델”이라고 소개했다.


오픈AI가 공개한 성능지표(벤치마크) 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 ‘클로드 오퍼스4.7’보다 높은 점수를 받았다.

우선 지식 업무 수행 능력을 평가하는 ‘GDPval’ 지표는 84.9%를 받아 80.3%에 머무른 오퍼스4.7을 앞섰다. 터미널 환경 작업 능력인 ‘터미널-벤치 2.0’에서는 82.7%를 기록해 오퍼스4.7(69.4%)을 10%포인트 이상 뛰어넘었다. 사이버 보안 능력을 평가하는 ‘사이버짐’에서도 81.8%로 오퍼스4.7의 73.1%보다 높았다.

다만 정보기술(IT) 업계에서 가장 수요가 높은 코딩 부문 지표인 ‘SWE-벤치 프로’에서는 58.6%에 그쳐 오퍼스4.7이 64.3%와 차이가 났다. 이에 대해 오픈AI는 “앤트로픽의 모델은 데이터 암기 징후가 보고됐다”며 평가 결과를 인정할 수 없다는 입장을 밝혔다.



오픈AI 측은 이날 화상 브리핑에서 앤트로픽의 ‘미토스’의 성능을 비교하는 질문에 “모델이 매우 정확하다”며 성능지표를 확인해보라고 답했다. 오픈AI는 특히 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다고 강조했다.

그레그 브록먼 오픈AI 사장은 “이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것”이라며 “불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해낸다”고 설명했다. 그러면서 그는 “내게는 이것이 우리가 앞으로 컴퓨터를 사용하는 방식과 대규모 에이전트형 연산이 어떻게 작동할지에 대한 기초를 다지는 것처럼 느껴진다”고 소개했다.

장진복 기자
에디터 추천 인기 기사
많이 본 뉴스