OpenAI、新AIエージェント構築支援ツール、何が画期的?作業を大幅軽減

●この記事のポイント
・OpenAIはAIエージェントを構築するための新しいプラットフォーム基盤の機能セットとして「Responses API」「Agents SDK」を発表
・かなり複雑なプログラムを組む必要があった処理が、Responses APIを使うと数行で書けるようになった
・ホテルや航空券の予約手続きなどを、APIによってChatGPTが人間の代わりにやってくれる
OpenAIは3月11日、AIエージェントを構築するための新しいプラットフォーム基盤の機能セットとしてAPIの「Responses API」、SDK(ソフトウェア開発キット)の「Agents SDK」を発表した。それぞれどのような特徴を持つツールなのか。専門家は「これまで複雑なコードを書かなければならなかったところが、一気に簡単になる」と解説する。
OpenAIはこれまでリーズニング、マルチモーダル対応などモデルの新機能を相次いでリリースし、複雑で複数ステップを要するタスクにも対応可能なエージェント構築の基盤を整備してきた。だが、高度なモデル機能を本番環境で稼働するエージェントとして実装することは難しいという声も存在し、開発プロセスを効率化するための情報の可視化や、十分な組み込みサポートが不足しているといった課題もあった。こうした課題を解決するためにリリースされるのが「Responses API」と「Agents SDK」だ。
Responses API
API(Application Programming Interface)とは、ソフトウェア、プログラム、ウェブサービスを接続するインターフェース。OpenAIのリリースによれば、Responses APIは「Chat Completions API」の使いやすさと「Assistants API」の強力なツール利用機能を統合しており、開発者がエージェント型アプリケーションを構築する際に、より柔軟で拡張性の高い基盤になるという。開発者は単一の「Responses API」呼び出しで複数のツールを組み合わせたり、モデルと複数回のやりとりを行うことで、これまで以上に複雑なタスクにも容易に対応できるようになる。
ウェブ検索、ファイル検索、コンピュータ操作などが標準で組み込まれ、これらは相互に連携し、モデルが現実世界のデータにアクセスできるようにすることで、タスク遂行能力を大幅に向上させる。開発者の利便性を重視した多くの改善が施されており、統一されたアイテムベースの設計、シンプルなポリモーフィズム、直感的なストリーミングイベントのサポートに加え、モデルのテキスト出力により簡単にアクセスできる 「response.output_text」のようなSDKのヘルパー機能も提供している。
ソフトウェアエンジニアで合同会社Hundreds代表の大塚あみ氏は次のように解説する。
「もともとOpenAIが提供していたツールは、ChatGPTに対してプロンプトトークンを送って、テキストが返ってくる、というだけでした。その後、画像入力などができるようになり、Responses APIではさらに機能が拡張され、パソコンの中にあるドキュメントの情報からレスポンスを作成できるようになりました。例えば、社内規則の情報をもとにChatGPTに質問することができたり、ホテルや航空券の予約手続きなどをAPIによってChatGPTが人間の代わりにやってくれたり、ウェブ検索を自律的にやってくれるといった機能が追加されています。
従来、こうした処理を実装するには、かなり複雑なプログラムを組む必要がありましたが、Responses APIを使うと数行で書けるようになっており、こうした点は大きな進化だといえます。非常に難しく専門家ではないとできない作業がAPI一つで簡単にできるようになったというのは注目点です」
Agents SDK
Agents SDKは、複数のAIエージェントの連携や制御を、シンプルに構築するために使われる、開発者向けツールキットのこと。SDK(Software Development Kit)とは、ソフトウェアを開発するためのツール。OpenAIのリリースによれば、Agents SDKは、OpenAIが昨年公開した実験的なSDKの「Swarm」の機能を大幅に進化させたもので、マルチエージェントのワークフロー構築をよりシンプルかつ効率的に行えるよう設計されている。カスタマーサポートの自動化、複数のステップを要するリサーチ、コンテンツ生成、コードレビュー、見込み客の開拓などの用途に活用できるという。
前出・大塚氏はいう。
「SDKとは、簡単にいうと、ソフトウェア開発を簡単にするためのツールです。エージェントを構築するには複雑なコードをたくさん組む必要があり、エラー処理も大変ですが、そうしたことが簡単に処理できるようになるツールです。
『Agents SDK』は、別々のサービスでつくられたエージェントとエージェントを組み合わせるといったコーディングを簡単にするためのツールです。エージェントを構築する人にとっては、非常に手間が省けて作業が軽減されるでしょう。これまでは結構難しいコードを書かなければならなかったところが一気に簡単になり、コードがきれいになるというのも開発者にとってはメリットでしょう」
(文=BUSINESS JOURNAL編集部、協力=大塚あみ/合同会社Hundreds代表)