OpenAI Dev Day 2025 : AgentKit

OpenAI Dev Day 2025 스토리

Apps SDK, 새로운 패러다임 시프트를 제안하다

AgentKit [현재글]

Codex

New Models

Apps SDK 다음은 AgentKit에 대해서 공유를 해보고자 합니다.
혹시 AI를 활용해서 자동화 도구를 만들어보려고 시도해보신 적 있으신가요? 복잡한 API 연결, 끝없는 테스트, 그리고 실제 배포까지 가는 험난한 과정을 경험하셨다면 아마도 이런 생각을 하셨을 것입니다. “이거 왜 이렇게 만들기 어려운 거지?”

솔직하게 말씀드리면 AI 에이전트 구축은 그동안 전문 개발자들에게도 만만치 않은 도전이었습니다. 하지만 OpenAI가 최근 발표한 AgentKit은 이런 상황을 완전히 바꿔놓을 가능성을 보여주고 있습니다.

AgentKit? 왜 주목해야 하는가?

OpenAI의 AgentKit은 AI 에이전트를 더 빠르고 효율적으로 구축할 수 있도록 돕는 통합 개발 도구입니다. 간단하게 말하자면, AI 에이전트를 만드는 데 필요한 모든 빌딩 블록을 한곳에 모아놓은 것이죠.

그런데 여기서 잠깐, ‘AI 에이전트’가 정확히 무엇일까요? OpenAI는 AI가 단순히 질문에 답변하는 것을 넘어서, 맥락을 이해하고 다양한 도구를 활용하며 실제 작업을 수행하는 시스템으로 발전하고 있다고 설명합니다. 예를 들어 “아이스크림 판매가 떨어졌어”라고 물으면, 과거 데이터를 분석하고 외부 요인을 고려해서 구체적인 해결책까지 제시하는 것이죠.

OpenAI가 AgentKit을 만든 이유

정말 흥미로운 부분입니다. 많은 개발자와 기업들이 AI 에이전트의 가능성을 보고 구축을 시도했지만, 대부분 프로토타입 단계에서 멈춰버렸다고 합니다. 왜일까요?

오케스트레이션(여러 AI 모델과 도구를 조율하는 과정), 평가 루프 설정, 데이터 연결 등 복잡한 과정들이 발목을 잡았기 때문입니다. AgentKit은 바로 이런 어려움을 해결하기 위해 탄생했습니다.

AgentKit의 핵심 기능들을 살펴볼까요?

AgentKit은 네 가지 핵심 구성 요소로 이루어져 있습니다. 각각을 함께 살펴보겠습니다.

Q1. Agent Builder는 무엇을 할 수 있나요?

Agent Builder는 에이전트의 논리 흐름을 시각적으로 설계할 수 있는 캔버스입니다. 코드를 직접 작성하는 대신, 마치 플로우차트를 그리듯이 노드를 연결하면서 에이전트의 작동 방식을 디자인할 수 있습니다.

정말 놀라운 점은 이미 수십만 명의 개발자가 사용하고 있는 Response API를 기반으로 만들어졌다는 것입니다. 이는 검증된 기술 위에서 더 쉽게 개발할 수 있다는 의미죠.

Agent Builder에서는 파일 검색, 도구 연결, 가드레일(안전장치), 그리고 휴먼 인 더 루프(사람의 확인이 필요한 단계)같은 공통 빌딩 블록들을 끌어다 쓸 수 있습니다. 복잡한 워크플로우도 블록을 조립하듯이 만들 수 있는 것입니다.

Q2. ChatKit은 어떤 역할을 하나요?

개발자들이 자주 겪는 또 다른 어려움이 있습니다. 훌륭한 AI 에이전트를 만들었는데, 이를 실제 서비스에 통합하는 과정이 복잡하다는 것이죠.

ChatKit은 바로 이 문제를 해결합니다. 브랜드와 워크플로우를 반영할 수 있는 간단하고 임베드 가능한 채팅 인터페이스를 제공합니다. 각 에이전트 노드에서 어떤 도구가 호출되고 있는지도 시각적으로 확인할 수 있어서, 에이전트가 어떻게 최적의 응답을 만들어내는지 투명하게 볼 수 있습니다.

Chat Interface 자동화 (이미지 출처: ChatGPT로 생성)

Q3. Evals for Agents는 왜 중요한가요?

아마도 가장 현실적인 고민은 이것일 것입니다. “내가 만든 에이전트가 제대로 작동하는지 어떻게 확인하지?”

Evals for Agents는 바로 이 질문에 대한 답입니다. 네 가지 핵심 기능을 제공합니다.

첫째, Trace Grading을 통해 에이전트의 결정을 단계별로 추적할 수 있습니다. 에이전트가 왜 그런 답변을 했는지, 어떤 과정을 거쳤는지 명확하게 볼 수 있죠.

둘째, Datasets 기능으로 개별 에이전트 노드를 평가할 수 있습니다. 전체 시스템 중 어느 부분이 잘 작동하고 어느 부분에 개선이 필요한지 정확히 파악할 수 있습니다.

셋째, Automated Prompt Optimization은 정말 획기적입니다. 프롬프트를 자동으로 최적화해주기 때문에, 수많은 시행착오를 거치지 않아도 됩니다.

마지막으로 OpenAI 모델뿐만 아니라 외부 모델에 대한 평가도 직접 실행할 수 있습니다. 다양한 AI 모델을 비교하면서 최적의 선택을 할 수 있는 것이죠.

Q4. Connector Registry는 무엇을 연결해주나요?

실제 업무 환경에서 AI 에이전트를 활용하려면 기업의 내부 데이터나 다양한 외부 시스템에 접근해야 합니다. 하지만 이런 연결 작업은 보안 문제 때문에 항상 민감했습니다.

Connector Registry는 관리 제어판을 통해 에이전트를 내부 도구 및 타사 시스템에 안전하게 연결할 수 있는 기능을 제공합니다. 보안을 유지하면서도 필요한 데이터에 접근할 수 있는 것입니다.

실제로 어떻게 활용되고 있을까요?

이론은 충분히 들었습니다. 실제 기업들은 AgentKit을 어떻게 활용하고 있을까요? 두 가지 인상적인 사례를 살펴보겠습니다.

Albertsons의 스마트한 소매점 운영

Albertsons는 미국 전역에 2,000개 이상의 식료품점을 운영하는 대형 유통업체입니다. 매장 매니저들은 매일 수많은 결정을 내려야 합니다. 프로모션을 언제 할지, 제품 진열을 어떻게 바꿀지, 재고는 어떻게 관리할지 등등 말이죠.

AgentKit을 활용한 후 정말 흥미로운 변화가 생겼습니다. 아이스크림 판매가 32% 급감했을 때, 매니저가 에이전트에게 “무슨 일이야?”라고 물으면 어떻게 될까요?

에이전트는 계절성 데이터, 과거 판매 트렌드, 외부 요인(날씨, 지역 이벤트 등)을 종합적으로 분석해서 구체적인 권장 사항을 즉시 제공합니다. “진열 위치를 변경하세요” 또는 “지역 광고를 실행해보세요” 같은 실행 가능한 조언을 받을 수 있는 것이죠.

HubSpot의 고객 지원 혁신

전 세계 수십만 조직이 사용하는 고객 플랫폼 HubSpot도 AgentKit을 활용하고 있습니다. HubSpot의 AI 도구인 Breeze의 응답을 Custom Response Widget으로 개선했습니다.

예를 들어 식물 관련 문의가 들어왔다고 가정해보십시오. Breeze 어시스턴트는 자체 지식 기반을 검색하고, 지역별 치료법을 확인하고, 관련 정책 세부 정보를 통합해서 여러 솔루션과 권장 사항을 종합적으로 제공합니다.

단순히 답변 하나를 주는 것이 아니라, 맥락을 이해하고 다양한 정보원을 활용해서 가장 도움이 되는 답변을 만들어내는 것입니다.

실전 데모: 8분 만에 에이전트 만들기

정말 놀라운 순간이 있었습니다. OpenAI의 크리스티나는 DevDay 행사에서 라이브로 ‘Ask Froge’라는 에이전트를 단 8분 만에 구축했습니다. 실제 웹사이트에서 작동하는 에이전트를 말이죠. 그리고 배포까지 한번의 클릭으로 이루어지는 것을 시연했습니다.

AgentKit Demo 영상 (동영상 출처: OpenAI YouTube)

하지만 현실적으로 생각해볼 점들도 있습니다

솔직하게 말씀드리면 AgentKit이 완벽한 해결책만은 아닐 수 있습니다. 몇 가지 고려해야 할 현실적인 부분들이 있습니다.

학습 곡선의 존재

아무리 쉽게 만들었다고 해도, 처음 AgentKit을 활용하려는 분들에게는 여전히 진입 장벽이 있을 것입니다. 노드를 연결하고, 워크플로우를 설계하고, 적절한 도구를 선택하는 과정은 어느 정도의 학습과 연습이 필요합니다.

기존의 API를 직접 호출하는 것보다는 확실히 쉽지만, 그래도 개발 경험이 전혀 없는 분들에게는 도전적일 수 있습니다. 좀 더 쉽고 효율적으로 에이전트를 만들 수 있게 하는 가이드나 튜토리얼이 더 풍부해진다면 좋을 것 같습니다.

비용 고려사항

또 다른 현실적인 문제는 비용입니다. AgentKit을 사용하면 GPT 모델을 더 쉽게 활용할 수 있지만, 동시에 그만큼 추가 API 호출이 발생할 수 있습니다.

에이전트가 여러 단계를 거쳐 작업을 수행하고, 다양한 도구를 호출하고, 파일을 검색하는 과정에서 예상보다 많은 API 호출이 발생할 수 있습니다. 특히 대규모로 운영할 때는 비용 관리가 중요한 고려사항이 될 것입니다.

실제 프로젝트를 시작하기 전에 예상 사용량을 계산하고, 비용 효율적인 구조를 설계하는 것이 필요합니다.

AgentKit이 보여주는 더 큰 그림

여기서 정말 흥미로운 질문 하나를 던져볼 수 있습니다. OpenAI는 AgentKit을 통해 무엇을 만들려고 하는 걸까요?

ChatGPT를 Super App으로?

제 생각에는 OpenAI가 ChatGPT를 일종의 ‘운영체제’처럼 만들고 싶어 하는 것 같습니다. 최근 발표된 Apps SDK와 함께 생각해보면 더욱 명확해집니다.

개발자들이 AgentKit으로 만든 에이전트를 ChatGPT에서 직접 활용할 수 있게 된다면 어떻게 될까요? ChatGPT는 단순한 대화형 AI가 아니라, 수많은 에이전트와 앱이 작동하는 플랫폼이 될 것입니다.

마치 스마트폰에 다양한 앱을 설치해서 사용하는 것처럼, ChatGPT에 다양한 에이전트를 추가해서 활용하는 시대가 올지도 모릅니다. 실제로 OpenAI는 연말에 앱 제출 및 게시 기능을 제공할 예정이라고 밝혔습니다.

AI 자동화의 새로운 가능성

AgentKit은 분명 AI 활용 범위를 크게 확장시킬 것입니다. 지금까지는 특정 기능을 구현하는 것도 복잡했다면, 앞으로는 다양한 시나리오를 훨씬 쉽게 만들어낼 수 있을 것입니다.

고객 서비스 자동화, 데이터 분석 에이전트, 업무 프로세스 최적화, 개인화된 추천 시스템 등 그동안 구현하기 어려웠던 아이디어들이 현실이 될 수 있습니다.

마무리하며

AgentKit은 AI 에이전트 구축의 복잡성을 크게 줄여주는 획기적인 도구입니다. 완벽하지는 않지만, 분명 올바른 방향으로 나아가고 있습니다.

아직 학습이 필요하고, 비용도 고려해야 하지만, 그럼에도 불구하고 AgentKit이 열어주는 가능성은 정말 흥미진진합니다. 개발자들이 더 쉽게 에이전트를 만들 수 있게 되면서, 우리가 상상하지 못했던 새로운 활용 사례들이 등장할 것입니다.

여러분도 AgentKit을 활용해서 나만의 AI 에이전트를 만들어보는 것은 어떨까요? 처음에는 간단한 것부터 시작해서, 점차 복잡한 워크플로우를 구축해나가다 보면 AI 자동화의 진정한 힘을 경험하실 수 있을 것입니다.

앞으로 AI 에이전트가 얼마나 확장되고 현실화 될지 궁금합니다.