OpenAI 모델 Amazon Bedrock 지원: AWS 운영팀이 확인할 API 변화

요약: OpenAI가 2026년 6월 1일 API changelog에서 GPT-5.4, GPT-5.5 계열 모델을 Amazon Bedrock의 OpenAI 호환 Responses API endpoint로 사용할 수 있다고 공지했습니다. AWS 중심으로 보안, 과금, 네트워크, 계정 통제를 운영하던 팀에게는 모델 선택지가 늘어난 변화입니다. 다만 “OpenAI API와 완전히 같다”가 아니라, Region별 지원 모델과 기능 차이를 먼저 확인해야 합니다.

무엇이 발표됐나

OpenAI API changelog의 2026년 6월 1일 항목은 짧지만 영향이 큽니다. OpenAI models are now available in Amazon Bedrock through an OpenAI-compatible Responses API endpoint. 지원 모델과 기능은 AWS Region에 따라 다를 수 있다고 명시되어 있습니다.

이 발표가 중요한 이유는 단순히 배포 채널이 하나 더 생겼기 때문이 아닙니다. 많은 기업은 이미 AWS Organizations, IAM, VPC endpoint, CloudTrail, Cost Explorer, Bedrock 사용 정책을 운영 표준으로 갖고 있습니다. 이런 팀에서 외부 SaaS API를 직접 붙이는 일은 보안 검토와 조달 절차가 길어질 수 있습니다. Bedrock 경유 선택지가 생기면 기존 AWS 거버넌스 안에서 OpenAI 모델을 검토할 수 있습니다.

하지만 실무자는 흥분하기 전에 제약부터 봐야 합니다. OpenAI는 “supported models and features vary by AWS Region”이라고 밝혔습니다. 즉 같은 코드가 모든 Region에서 같은 모델과 도구를 쓸 수 있다고 가정하면 안 됩니다.

기존 OpenAI API 직접 호출과 다른 점

직접 OpenAI API를 호출하면 OpenAI 계정, 프로젝트, API key, OpenAI platform의 billing과 rate limit 정책을 기준으로 운영합니다. Bedrock을 통하면 인증과 접근 통제의 중심이 AWS로 이동합니다. 이 차이는 운영팀에게 큽니다.

첫째, 인증 경로가 달라집니다. 장기 OpenAI API key를 애플리케이션에 저장하는 대신 AWS IAM role, STS, workload identity 흐름을 쓸 가능성이 커집니다. 보안팀 입장에서는 key rotation과 secret sprawl 부담이 줄어듭니다.

둘째, 네트워크 통제 방식이 달라집니다. AWS 내부 워크로드가 Bedrock endpoint를 호출하는 구조라면 VPC endpoint, egress 제어, CloudTrail 감사와 묶어 볼 수 있습니다. 외부 인터넷으로 나가는 API 호출을 최소화해야 하는 조직에는 이 점이 핵심입니다.

셋째, 기능 parity를 직접 검증해야 합니다. OpenAI API에서 쓰던 Responses API 기능, built-in tools, prompt caching, Batch, structured outputs, computer use, web search가 Bedrock 경유에서 모두 같은 방식으로 동작한다고 단정하면 위험합니다. Region과 서비스 지원 범위가 다르면 배포 후 장애가 납니다.

마이그레이션 전 반드시 확인할 항목

가장 먼저 모델 매트릭스를 만들어야 합니다. 현재 production에서 쓰는 모델명, fallback 모델, 최대 컨텍스트, tool 사용 여부, JSON schema 사용 여부, streaming 여부를 표로 정리합니다. 그런 다음 Bedrock에서 같은 Region에 지원되는 모델과 기능을 대조합니다.

두 번째는 요청/응답 스키마 차이입니다. “OpenAI-compatible”은 개발 경험을 맞추겠다는 뜻이지, 모든 에러 코드와 billing metric까지 동일하다는 보장은 아닙니다. timeout, rate limit, validation error, content filtering response를 실제로 호출해 보고 기존 retry 로직이 맞는지 확인해야 합니다.

세 번째는 비용 집계입니다. 직접 OpenAI API 비용과 AWS Bedrock 비용은 청구서 위치가 달라집니다. FinOps 팀이 모델별, 서비스별, 팀별 비용을 추적하려면 tag, account 분리, CloudWatch metric 수집 방식이 필요합니다.

추천 아키텍처: 추상화 계층을 먼저 둔다

Bedrock 지원을 곧바로 애플리케이션 코드 곳곳에 넣는 것은 좋지 않습니다. 모델 provider가 늘어날수록 호출 코드가 흩어지고, 운영 중 장애 시 fallback이 어려워집니다.

권장 구조는 내부 AI gateway를 두는 방식입니다. 애플리케이션은 내부 gateway에 “요약”, “분류”, “코드리뷰”, “검색 보강 답변” 같은 task 단위 요청을 보냅니다. gateway가 OpenAI direct, Amazon Bedrock, 다른 provider를 선택합니다. 이렇게 하면 provider 교체, Region failover, rate limit 조절, prompt 버전 관리를 한 곳에서 처리할 수 있습니다.

특히 Responses API를 쓰는 팀은 tool 호출 정책을 gateway에서 관리해야 합니다. 모델 provider만 바뀌어도 tool availability가 달라질 수 있기 때문입니다. 같은 prompt가 direct OpenAI에서는 web search를 쓰고, Bedrock 경유에서는 해당 tool이 없어서 실패하는 상황을 막아야 합니다.

테스트 케이스 예시

마이그레이션 테스트는 단순 “hello world”로 끝내면 안 됩니다. 최소한 다음 케이스를 자동화해야 합니다.

짧은 일반 생성 요청: latency와 기본 응답 포맷 확인.
긴 컨텍스트 요청: 최대 입력 크기와 truncation 정책 확인.
structured output 요청: schema validation 실패 시 에러 형태 확인.
streaming 요청: client disconnect와 retry 처리 확인.
tool 사용 요청: 지원되지 않는 tool 요청 시 fallback 정책 확인.
rate limit 유발 요청: 429 또는 throttling 응답과 backoff 동작 확인.
안전성 필터 요청: refusal 또는 moderation 관련 응답 처리 확인.

이 테스트를 CI에 넣으면 Region별 기능 차이가 바뀌었을 때 빨리 알 수 있습니다.

실행 체크리스트

현재 OpenAI API 사용처를 모델, 기능, Region, 비용 기준으로 목록화한다.
Bedrock에서 지원되는 OpenAI 모델과 기능을 Region별로 확인한다.
direct OpenAI 호출과 Bedrock 호출을 내부 AI gateway 뒤로 숨긴다.
streaming, structured outputs, tool calls, rate limit, refusal 응답을 실제 요청으로 비교한다.
AWS IAM role, CloudTrail, VPC endpoint, account 분리 정책을 보안팀과 맞춘다.
비용 태깅과 팀별 chargeback 기준을 먼저 정한다.
production 전환은 전체 트래픽이 아니라 읽기 전용/저위험 워크로드부터 canary로 시작한다.
provider 장애 시 direct OpenAI 또는 다른 모델로 fallback하는 runbook을 준비한다.