[AI 뉴스] 2026-05-04 — GPT-5.5 Bedrock · DeepSeek 가격 인하
Moderator
· 조회 1
2026년 5월 4일 글로벌 AI 시장은 미·중 프론티어 모델 경쟁이 한층 격화되는 모습을 보이고 있습니다. OpenAI의 GPT-5.5가 Amazon Bedrock을 통해 기업 고객에게 본격 공급되는 가운데, 중국 DeepSeek은 V4 시리즈 가격을 75% 인하하며 미국 빅랩들을 정면으로 압박했습니다. Google은 200만 토큰 컨텍스트의 Gemini 3.1 Ultra를 공개했고, Anthropic은 Claude Opus 4.7과 차세대 Mythos 라인업을 차례로 준비 중입니다. 동시에 미국 주요 랩들은 Frontier Model Forum을 중심으로 중국발 모델 복제 이슈에 공동 대응하기 시작했습니다.
OpenAI — GPT-5.5, Amazon Bedrock으로 기업 시장 직격
- 엔터프라이즈 채널 확대: OpenAI는 자사 최신 추론 모델 GPT-5.5를 Amazon Bedrock에서 제공하기 시작했습니다. 그동안 Azure 및 자사 API 중심으로 유통되던 OpenAI 모델이 AWS 기업 인프라에 정식 편입되면서, 이미 Bedrock에 익숙한 대형 기업 고객들이 별도 인프라 변경 없이 GPT-5.5를 도입할 수 있게 되었습니다.
- 강점 영역: OpenAI는 GPT-5.5의 핵심 활용처로 에이전틱 코딩, 컴퓨터 사용(computer use), 지식 작업, 과학 연구를 꼽았습니다. 멀티스텝 자동화와 장시간 태스크 수행 능력이 직전 세대 대비 크게 향상되었다는 것이 회사 측 설명입니다.
- 접근 일정: 기업·교육 사용자 대상 확대는 8월 14일까지 단계적으로 진행될 예정입니다. 이를 통해 Bedrock 내 Anthropic Claude, Meta Llama, Mistral과 직접 경쟁 구도가 형성될 전망입니다.
- 원문
DeepSeek — V4 가격 75% 인하, 미국 진영 가격 정책 흔든다
- V4 Flash·V4 Pro 출시: 중국 DeepSeek이 신규 라인업 V4 Flash와 V4 Pro를 공개했습니다. 핵심은 공격적인 가격 정책으로, 캐시 미스 입력 비용은 백만 토큰당 $1.74에서 $0.435로 약 75% 인하되었고, 캐시 히트 입력은 $0.145에서 $0.03625로 더 큰 폭으로 떨어졌습니다.
- 오픈 웨이트 전략 유지: DeepSeek은 V4에 대해서도 오픈 웨이트 접근 방식을 유지해, 자체 호스팅을 원하는 기업과 연구자들이 직접 모델을 내려받아 사용할 수 있도록 했습니다.
- 시장 파급: Anthropic Claude Opus나 OpenAI GPT-5.5와 같은 프리미엄 모델 가격과 비교하면 격차가 두 자릿수 배수로 벌어지면서, 비용 민감 워크로드를 중심으로 미국 빅랩의 가격 정책 재조정 압력이 커지고 있습니다.
- 원문
Google — Gemini 3.1 Ultra 출시, 200만 토큰 컨텍스트로 격차 벌리기
- 200만 토큰 컨텍스트: Google DeepMind가 Gemini 3.1 Ultra를 공식 공개했습니다. 가장 큰 변화는 컨텍스트 윈도우가 200만 토큰까지 확장되었다는 점으로, 대규모 코드베이스 분석, 장편 문서 처리, 멀티 세션 에이전트 메모리 등에서 강점을 보일 것으로 예상됩니다.
- 네이티브 멀티모달: 텍스트, 이미지, 오디오, 비디오를 별도 어댑터 없이 단일 모델에서 직접 처리하는 네이티브 멀티모달 구조가 적용되었습니다. 영상 입력 기반 추론과 음성 응답 품질이 특히 강조되었습니다.
- 레거시 모델 종료: 기존 Gemini 2.0 계열 모델은 2026년 6월 1일자로 서비스가 종료될 예정입니다. 사용 중인 개발자와 기업은 3.x 라인업으로의 마이그레이션 일정을 조기에 수립할 필요가 있습니다.
- 원문
Anthropic — Claude Opus 4.7 임박, Mythos 내부 테스트 진행
- 50일간 4개 업데이트: Anthropic은 2026년 초 50일이라는 짧은 기간 동안 Claude 주요 업데이트 4건을 연이어 공개하며 릴리스 사이클을 크게 단축했습니다.
- Opus 4.7 출시 임박: 차기 플래그십 Claude Opus 4.7의 출시가 임박한 것으로 확인됩니다. 동시에 차세대 코드네임 Claude Mythos가 내부 제한 테스트(internal limited testing) 단계에 들어간 상태로, 외부 파트너 일부에 한해 평가가 시작된 것으로 알려졌습니다.
- 100만 토큰 컨텍스트 정착: 현재 운용 중인 Opus 4.6과 Sonnet 4.6은 100만 토큰 컨텍스트를 기본 제공해, Google Gemini 3.1 Ultra의 200만 토큰과 함께 장컨텍스트 모델이 사실상 산업 표준으로 자리잡는 모양새입니다.
- 원문
Zhipu AI — GLM-4.7, 환각률 1.2%로 프론티어 최저
- 환각률 1.2%: 중국 Zhipu AI가 신규 모델 GLM-4.7을 공개했습니다. 회사가 공개한 벤치마크에 따르면 환각률(hallucination rate)이 1.2%로, 현재 알려진 프론티어 랩 모델 가운데 가장 낮은 수치입니다.
- 화웨이 어센드 학습: GLM-4.7은 NVIDIA GPU가 아닌 화웨이 어센드(Ascend) 칩으로 학습되었습니다. 미국의 대중 반도체 수출 규제 환경에서 중국 자체 반도체 생태계만으로 프론티어급 모델을 충분히 학습할 수 있다는 점을 입증한 사례로 평가됩니다.
- 파격적인 가격: 입력 가격이 백만 토큰당 $0.11에 불과해 Claude Opus 대비 약 1/136 수준에 형성되어 있습니다. 정확성과 가격 두 측면 모두에서 미국·중국 모델 격차 논의를 다시 촉발할 만한 수치입니다.
- 원문
미국 빅랩 — Frontier Model Forum, 중국 모델 복제 공동 대응
- 공동 대응 협의체: OpenAI, Anthropic, Google이 Frontier Model Forum을 통해 중국 기업의 모델 복제 이슈와 관련된 정보 공유를 본격화했습니다. DeepSeek 등 일부 중국 모델이 미국 프론티어 모델로부터 출력 데이터를 추출해 증류(distillation)하는 방식으로 역량을 흡수했다는 주장이 제기되고 있습니다.
- 법적 쟁점 확산: 같은 시기 Anthropic은 학습 데이터와 관련된 소송에서 약 15억 달러 규모 합의에 도달했습니다. 모델 학습에 사용되는 데이터 소스의 합법성과 라이선스 이슈가 빅랩 전반의 비용 구조에 직접 영향을 미치는 상황입니다.
- 의미: 미국 진영은 가격에서 밀리는 대신 데이터·모델 보호 측면에서 제도적 방어선을 높이려는 전략을 분명히 하고 있어, 향후 중국 모델 출시 때마다 유사한 분쟁이 반복될 가능성이 큽니다.
- 원문
오늘의 한 줄 인사이트
오늘의 키워드는 "가격은 중국, 컨텍스트는 미국, 방어선은 법무"입니다. DeepSeek V4와 Zhipu GLM-4.7이 가격·정확도 양면에서 새로운 기준을 제시하는 사이, OpenAI GPT-5.5와 Google Gemini 3.1 Ultra, Anthropic Claude Opus 4.7은 엔터프라이즈 채널과 초장문 컨텍스트로 차별화를 시도하고 있습니다. 기업 도입 담당자라면 단일 모델 베팅 대신 Bedrock·Vertex·자체 호스팅을 아우르는 멀티 모델 아키텍처와, 6월 1일 종료되는 Gemini 2.0 등 레거시 모델 마이그레이션 일정을 지금 점검할 시점입니다.