GPT-5.5는 GPT-5.4를 대부분 대체한다: 아쉬운 건 API 타이밍이다

OpenAI가 2026년 4월 23일 GPT-5.5를 공개했다. 발표 문구만 보면 결론은 간단해 보인다. 더 똑똑하고, 더 자율적이고, 더 적은 토큰으로 일을 끝낸다는 것이다. 그러면 GPT-5.4는 바로 이전 세대가 되었고, 우리는 이제 GPT-5.5만 보면 되는 걸까?

대부분의 사용자는 그럴 것이다. GPT-5.5가 보이면 굳이 GPT-5.4를 고를 이유는 빠르게 줄어든다. 이 모델은 GPT-5.4의 옆그레이드나 선택지 하나가 아니라, 실사용 기준으로는 자연스럽게 기본값을 가져갈 다음 모델에 가깝다. 특히 ChatGPT와 Codex에서 복잡한 코딩, 리서치, 문서 작업, 도구 사용을 맡기는 사람이라면 선택은 거의 한 방향으로 흐를 가능성이 높다.

다만 문제는 출시 순서다. 2026년 4월 24일 확인 기준으로 GPT-5.5는 ChatGPT와 Codex에는 제공되지만 API는 아직 “coming soon”이다. GPT-5.4는 이미 API에 있고, GPT-5.5는 공식 발표와 가격표까지 나왔지만 아직 개발자가 바로 갈아탈 수 있는 API 모델은 아니다. 아쉬운 지점은 “5.5가 5.4를 대체할 수 있느냐”가 아니라 “왜 API까지 동시에 열리지 않았느냐”에 있다.

GPT-5.5 vs GPT-5.4 cover

그래서 이 글의 결론은 보수적인 모델 선택 가이드가 아니다. 실사용자는 대부분 GPT-5.5로 이동할 것이다. 다만 API 개발자는 아직 그 이동을 제품에 반영하지 못하고 기다려야 한다. 그 간극이 이번 출시에서 가장 답답한 부분이다.

GPT-5.5는 5.4의 대안이 아니라 후속 기본값에 가깝다

GPT-5.4는 “전문 업무를 위한 프런티어 모델”로 공개되었다. OpenAI는 GPT-5.4를 reasoning, coding, agentic workflow, 스프레드시트, 프레젠테이션, 문서 작업을 하나로 묶는 모델로 설명했다. 특히 API와 Codex에서 1M 토큰급 긴 컨텍스트를 다루고, 컴퓨터 사용 능력과 도구 사용을 강화한 것이 핵심이었다.

GPT-5.5는 그 방향을 거의 그대로 이어받되, 사용자가 실제로 원했던 지점으로 더 밀고 간다. 공식 발표에서 반복되는 표현은 더 높은 점수보다 더 적은 관리다. 코딩, 온라인 리서치, 데이터 분석, 문서와 스프레드시트 생성, 소프트웨어 조작, 여러 도구를 오가며 끝까지 진행하는 작업이 핵심 예시로 등장한다.

이 차이는 “작업별로 5.4와 5.5를 신중하게 골라야 한다”는 이야기와 다르다. 사용자가 ChatGPT나 Codex에서 모델 선택권을 갖고 있고, 할당량이나 비용 문제가 당장 막지 않는다면 대부분은 5.5를 누를 것이다. 더 오래 맥락을 붙잡고, 더 적은 지시로 진행하고, 중간에 멈추지 않고, 도구를 더 안정적으로 조율하는 모델이 있다면 굳이 이전 모델을 고를 이유는 줄어든다.

5.4의 역할은 사라지지 않는다. 하지만 그 역할은 “선호되는 기본 모델”이라기보다 “API가 아직 5.5를 받지 못했을 때의 현실적 기준점”에 가깝다. 이 차이를 분명히 해야 한다.

수치보다 중요한 건 사용자가 느낄 방향이다

GPT-5.5가 모든 지표에서 갑자기 압도적인 격차를 만든 것은 아니다. 예를 들어 SWE-Bench Pro는 GPT-5.4의 57.7%에서 GPT-5.5의 58.6%로 오른다. 이 수치만 보면 “코딩 성능이 완전히 다른 단계가 되었다”고 말하기는 어렵다.

하지만 GPT-5.5를 숫자 하나로만 읽으면 핵심을 놓친다. Terminal-Bench 2.0은 75.1%에서 82.7%로 오른다. Expert-SWE 내부 평가는 68.5%에서 73.1%로 오른다. OSWorld-Verified도 75.0%에서 78.7%로 오른다. BrowseComp는 82.7%에서 84.4%로 올라간다. 모두 한 방향을 가리킨다. 단발 답변보다 긴 작업, 도구 사용, 컴퓨터 조작, 리서치, 반복 실행에서 GPT-5.5가 더 강해졌다는 것이다.

대부분의 사용자가 체감하는 모델 차이는 벤치마크 평균이 아니라 실패 방식에서 온다. 같은 요청을 했을 때 덜 되묻는가. 중간에 포기하지 않는가. 도구를 쓰다가 흐름을 잃지 않는가. 코드베이스를 읽고 수정한 뒤 테스트까지 이어 가는가. 복잡한 문서나 스프레드시트 작업에서 결과물을 더 적은 왕복으로 완성하는가.

이 기준으로 보면 GPT-5.5는 5.4의 “선택 가능한 상위 옵션”이 아니라 5.4가 맡던 고급 작업을 상당 부분 가져갈 모델이다. 특히 Codex 사용자는 이 차이를 더 빨리 느낄 가능성이 높다. OpenAI도 GPT-5.5가 Codex에서 GPT-5.4보다 더 적은 토큰으로 더 나은 결과를 내도록 튜닝되었다고 설명한다.

진짜 아쉬운 건 API가 동시에 열리지 않았다는 점이다

문제는 여기서 생긴다. ChatGPT와 Codex 사용자는 GPT-5.5를 바로 체감할 수 있지만, API 개발자는 아직 GPT-5.4를 붙잡고 있어야 한다. OpenAI Developers 모델 문서는 GPT-5.5가 현재 ChatGPT와 Codex에서 사용 가능하고 API는 곧 제공될 예정이라고 적고 있다. 가격 페이지도 GPT-5.5를 “coming soon”으로 표시한다.

GPT-5.4는 이미 API 모델 페이지가 있다. 확인 가능한 정보도 구체적이다. 모델 ID는 gpt-5.4, 컨텍스트 윈도우는 1,050,000 토큰, 최대 출력은 128,000 토큰, 지식 컷오프는 2025년 8월 31일이다. 함수 호출, 웹 검색, 파일 검색, 컴퓨터 사용도 지원 목록에 들어가 있다.

반면 GPT-5.5는 API 가격과 1M 컨텍스트가 공개되었지만, 아직 바로 호출할 수 있는 상태는 아니다. 예정 가격은 입력 100만 토큰당 5달러, 캐시 입력 0.50달러, 출력 30달러다. GPT-5.4의 입력 2.50달러, 캐시 입력 0.25달러, 출력 15달러와 비교하면 명목 단가는 2배다. 그래도 많은 고급 작업에서는 사용자가 5.5를 고를 가능성이 높다. 이유는 단순하다. 더 비싼 모델이더라도 더 적은 재시도, 더 적은 수정, 더 긴 작업 지속성으로 전체 작업비를 줄일 수 있기 때문이다.

그래서 지금의 API 상황은 “5.4와 5.5 중 무엇을 고를까”가 아니다. 개발자 입장에서는 “5.5를 쓰고 싶은데 아직 못 쓴다”에 더 가깝다. GPT-5.4는 계속 유용하지만, 그것은 선호의 문제라기보다 출시 타이밍의 문제다.

5.4가 남는 자리는 있다. 하지만 기본값은 바뀔 것이다

그렇다고 GPT-5.4가 무의미해지는 것은 아니다. 비용이 절대적으로 중요한 대량 처리, 짧은 응답, 단순 분류, 이미 5.4 기준으로 안정화된 API 제품에서는 5.4가 계속 남을 수 있다. 5.4 mini와 nano도 비용과 지연 시간 중심의 작업에서는 자기 자리가 있다.

하지만 이것은 5.5와 5.4가 동급 선택지라는 뜻이 아니다. 사람들은 가장 어려운 작업, 가장 귀찮은 작업, 가장 오래 걸리는 작업부터 5.5로 옮길 것이다. 코드베이스를 통째로 읽고 수정하는 일, 리서치와 문서화를 함께 하는 일, 스프레드시트나 데이터 분석이 포함된 지식 업무, 여러 도구를 오가며 결과물을 만들어야 하는 일에서는 특히 그렇다.

모델 선택은 결국 “싼 모델로 충분한가”와 “좋은 모델이 시간을 얼마나 줄이는가”의 싸움이다. GPT-5.5가 실제로 더 적은 토큰과 더 적은 왕복으로 작업을 끝낸다면, 2배의 명목 단가는 많은 경우 결정적 장벽이 되지 않을 수 있다. 사람의 수정 시간, 재시도, 실패 비용이 더 비싸기 때문이다.

그래서 5.4는 저비용 반복 작업과 API 공백기의 기준 모델로 남고, 5.5는 고급 작업의 자연스러운 기본값으로 올라설 가능성이 높다. 이 글의 톤은 여기에 맞아야 한다. “아직 대체하지 않는다”가 아니라 “대부분 대체될 텐데, API가 같이 안 열린 것이 아쉽다”가 더 정확하다.

안전성과 접근 조건은 더 중요해진다

GPT-5.5는 성능만 올라간 모델이 아니다. OpenAI는 GPT-5.5의 biological/chemical 및 cybersecurity capabilities를 Preparedness Framework상 High로 취급한다고 밝혔다. Critical cybersecurity 수준에는 도달하지 않았지만, GPT-5.4보다 사이버 역량이 한 단계 높아졌다고 설명한다.

이 말은 보안 방어, 취약점 분석, 바이오·화학 관련 연구를 하는 사용자에게 양면적이다. 한편으로는 더 강한 방어 도구가 생긴다. 다른 한편으로는 더 촘촘한 분류기, 더 엄격한 검토, trusted access 같은 접근 조건이 중요해질 수 있다.

이 지점도 5.5가 5.4의 단순 병렬 선택지가 아니라는 해석을 강화한다. 더 강한 모델은 더 강한 정책과 함께 온다. 특히 API가 늦어지는 이유도 단순한 제품 일정 문제가 아니라, 대규모 API 제공에 필요한 안전장치와 운영 요건이 더 무거워졌기 때문으로 읽을 수 있다. 발표문도 API 배포에는 다른 safeguard가 필요하다고 말한다.

지금의 실무 결론

GPT-5.5는 GPT-5.4를 대부분 대체할 것이다. 적어도 ChatGPT와 Codex에서 고급 작업을 하는 사용자에게는 그렇다. 더 좋은 모델이 보이고, 더 오래 작업을 끌고 가며, 더 적은 토큰으로 더 나은 결과를 낼 가능성이 있다면 사람들은 자연스럽게 그쪽으로 이동한다.

다만 API는 아직 그 이동을 따라오지 못했다. 2026년 4월 24일 현재 개발자가 실제 제품에 넣을 수 있는 확정 모델은 여전히 GPT-5.4다. 이 때문에 API 개발자에게는 이상한 공백이 생긴다. 사용 경험의 중심은 5.5로 넘어가는데, 제품 구현의 중심은 잠시 5.4에 남아 있는 상태다.

그래서 이번 출시를 이렇게 읽는 편이 맞다. GPT-5.5는 GPT-5.4와 나란히 놓고 오래 비교할 모델이 아니다. 대부분의 고급 작업에서 사람들은 5.5를 고를 것이다. 아쉬운 것은 성능 방향이 아니라 배포 타이밍이다. ChatGPT와 Codex가 먼저 5.5로 넘어가고, API가 뒤따라오는 이 간격이 이번 발표에서 가장 크게 남는 불편함이다.

참고

OpenAI, Introducing GPT-5.5, 2026-04-23
OpenAI, Introducing GPT-5.4, 2026-03-05
OpenAI Developers, Models, 확인일 2026-04-24
OpenAI Developers, GPT-5.4 Model, 확인일 2026-04-24
OpenAI, API Pricing, 확인일 2026-04-24