과학

코딩·리서치 스스로 실행 … 오픈AI, 앤스로픽 맞설 새 모델 내놔

Apr 24, 2026 IDOPRESS

오픈AI 'GPT- 5.5' 공개

복잡한 코딩·문서작업·연구

클로드와 제미나이 뛰어넘어

속도·효율 유지한채 성능 개선

기업시장 오픈AI 서비스 확산

코덱스 주간이용 400만명 돌파

오픈AI,두달 만에 차세대 모델

같은날 딥시크도 새 모델 '맞불'

오픈AI가 GPT-5.4를 내놓은 지 두 달 만에 차세대 모델 'GPT-5.5'를 전격 출시했다. 통상 대형 모델 업그레이드에 수개월 이상 걸리던 과거와 비교하면 이례적으로 빠른 속도로 인공지능(AI) 시장에서 주도권을 놓치지 않겠다는 의지가 반영됐다는 평가다. 연내 기업공개(IPO)를 앞둔 오픈AI는 동시에 최근 급부상한 경쟁사 앤스로픽을 정조준하며 차세대 AI 주도권 경쟁에도 불을 붙였다.

오픈AI는 23일(현지시간) "새롭게 출시한 GPT-5.5는 적은 지시만으로도 해야 할 일을 스스로 파악한다"며 "현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델"이라고 소개했다. 이날 사전 브리핑에서 그레그 브로크먼 오픈AI 사장은 "사용자가 세세하게 명령하지 않아도 여러 단계를 나누어 계획하고 실행하는 능력이 강화됐다"며 "코딩뿐 아니라 문서 작업,스프레드시트,프레젠테이션,브라우저 조사,여러 앱을 오가며 업무 처리하는 능력이 뛰어나다"고 설명했다.

GPT-5.5는 챗GPT와 코덱스에 우선 적용되고 기업 고객용 응용 프로그램 인터페이스(API)는 수주 내에 공개될 예정이다.

오픈AI가 공개한 성능을 보면 GPT-5.5는 여러 영역에서 앤스로픽 '클로드'와 구글 '제미나이'를 뛰어넘는 성과를 보였다. 복잡한 명령어 기반 코딩 평가인 '터미널 벤치 2.0'(과제 해결률)에서 82.7%를 기록해 GPT-5.4(75.1%)를 앞섰다. 9개 산업 분야에서 44개 직군의 지식노동 수행능력을 평가하는 'GDPval'(실무 완성도)에서는 84.9%를 기록했다. 사이버 보안 평가 '사이버짐'(보안 취약점 돌파율)에서도 81.8%로 이전 모델(79.0%)보다 향상됐다. 과학 연구 분야도 강화됐다. 유전학·정량생물학 평가에서 GPT-5.5는 25%로 GPT-5.4(19.0%)보다 높았고,생물정보학 평가에서도 80.5%를 기록했다.

오픈AI는 GPT-5.5가 GPT-5.4와 비슷한 응답 속도를 유지하면서도 더 높은 성능을 낸다고 밝혔다. 브로크먼 사장은 "GPT-5.5는 GPT-5.4와 비교해 더 적은 토큰으로 빠르고 날카롭게 사고한다"며 "더 높은 지능을 얻기 위해 속도를 희생하지 않았다"고 강조했다. AI 시장은 누가 더 똑똑한 모델을 만드느냐에서 누가 더 적은 비용으로 더 많은 일을 처리하느냐의 경쟁으로 옮겨가고 있다.

기업 시장에서 오픈AI 서비스 확산 속도도 가파르다. 오픈AI에 따르면 AI 코딩·업무 자동화 도구 코덱스 주간 이용자는 400만명으로 2주 전 300만명에서 빠르게 늘었다. 오픈AI 내부에서도 직원의 85%가 매주 코덱스를 사용하고 있다. 브로크먼 사장은 "코덱스는 이제 코딩만을 위한 도구가 아니며 온갖 업무에 쓰이고 있다"며 "재무,커뮤니케이션,마케팅,데이터과학,상품 관리까지 활용 범위가 넓어졌다"고 말했다. 오픈AI 재무팀은 GPT-5.5와 코덱스를 활용해 세금 양식 2만4771건,총 7만1637쪽을 검토하며 작업 기간을 전년 대비 2주 단축했다.

이날 오픈AI는 GPT-5.5 발표 과정에서 앤스로픽을 견제하는 모습도 보였다. 소프트웨어 개발 능력을 평가하는 대표 지표인 'SWE-벤치 프로'에서 GPT-5.5는 58.6%를 기록해 앤스로픽 클로드 오퍼스 4.7의 64.3%보다 5%포인트 이상 낮았다. 대신 오픈AI는 발표 자료 각주에 "앤스로픽 모델 일부 결과에서 데이터 암기 징후가 보고됐다"고 적으며 평가 신뢰성에 의문을 제기했다.

보안 분야에서도 앤스로픽은 비교 대상으로 거론됐다. GPT-5.5가 미토스보다 더 강력한 모델인지,그렇다면 이용 대상을 제한할 계획이 있는지를 묻는 질문에 브로크먼 사장은 직접적인 성능 비교는 피하며 "GPT-5.5는 매우 강력한 사이버 역량을 갖춘 모델이다. 다만 우리는 이를 더 넓은 범위로 출시하고 있다"고 답했다. 미토스는 앤스로픽이 최근 공개한 고성능 AI 모델로,사이버 공격·취약점 탐지 능력이 위험 수준에 이르렀다는 자체 판단에 따라 미국과 영국 등 제한된 국가에만 우선 공개된 모델이다.

오픈AI는 안전장치를 한층 강화했다고 설명했다. 마크 첸 오픈AI 안전총괄은 "이용자들이 보안 관련 활동을 시도할 때 이전보다 거부가 늘었다고 느낄 수 있는데,이는 의도된 설계"라며 "모델이 강력해지면서 오용 위험도 함께 커지는 것이며 안전장치도 그에 맞춰 확장돼야 한다"고 강조했다.

한편 이날 중국 기업 딥시크도 새로운 모델 '딥시크 V4' 2종을 공개하며 오픈AI에 맞불을 놨다. 딥시크는 "오픈소스 중 최고 성능 모델이며,오픈AI와 구글 제미나이 등 미국 기업의 폐쇄형 모델과 경쟁할 수 있다"고 밝혔다. 특히 아키텍처 혁신을 통해 동일한 인프라를 활용하면서도 10배 많은 양을 처리할 수 있다고 설명했다.

[실리콘밸리 원호섭 특파원 / 서울 정호준 기자]

코딩·리서치 스스로 실행 … 오픈AI, 앤스로픽 맞설 새 모델 내놔

추천하다

‘이종범·정민철이 야구 지도’...컴투스, 게이머 대상 야구 캠프 연다

집값 20% 하락시 ‘깡통주택 위험’은 2.6배…최대 8만8천가구

“우리집 이번달 원리금 입금했지?” …5대 은행 연체율 봤더니 ‘빨간불’

스테이블코인 결제 시대 본격화...입법 지연 사이 기업들 빨라진다[엠블록레터]

웹툰 엔터, 배민 마케팅책임자 영입···글로벌 리더십 개편

항해

빠른 탐색