OpenAIが新しいo3およびo4-mini推論モデルを発表
Mac

OpenAIが新しいo3およびo4-mini推論モデルを発表

  • Lamiyi
  • 0
  • rhahw
OpenAIが新しいo3およびo4-mini推論モデルを発表

OpenAIは、回答前により深く考えるよう設計されたoシリーズの最新モデル、o3とo4-miniという2つの新しいAIモデルをリリースしました。これらは同社がこれまでにリリースした中で最も賢いモデルであり、ChatGPTのツールキット全体を活用して、Web検索から画像分析まであらゆる処理を処理できます。

OpenAI o3は、コーディング、数学、科学、視覚認識などの分野の最先端を押し広げる、当社の最も強力な推論モデルです。Codeforces、SWE-bench(カスタムモデル固有のスキャフォールドを構築しない)、MMMUなどのベンチマークで新しいSOTAを樹立しました。多面的な分析を必要とし、答えがすぐにはわからない複雑なクエリに最適です。特に、画像、チャート、グラフィックの分析などの視覚タスクで優れたパフォーマンスを発揮します。外部の専門家による評価では、o3は難しい現実世界のタスクにおいて、OpenAI o1よりも重大なエラーが20%少なく、特にプログラミング、ビジネス/コンサルティング、創造的なアイデア創出などの分野で優れています。初期のテスターは、思考パートナーとしての分析の厳密さを強調し、特に生物学、数学、工学の分野において、新しい仮説を生成し、批判的に評価する能力を強調しました。

OpenAI o4-miniは、高速かつコスト効率の高い推論に最適化された小型モデルです。特に数学、コーディング、視覚タスクにおいて、そのサイズとコストに対して驚異的なパフォーマンスを発揮します。AIME 2024および2025のベンチマークテストにおいて、最高のパフォーマンスを発揮しました。専門家による評価では、非STEMタスクやデータサイエンスなどの分野で、前身となるo3-miniを上回るパフォーマンスを示しました。その効率性により、o4-miniはo3よりも大幅に高い使用制限をサポートしており、推論が有効な問題に対して、高ボリューム・高スループットの強力な選択肢となります。

OpenAIによると、外部の専門家評価者から、両モデルは、知能の向上とウェブソースの活用により、従来モデルよりも指示への追従性が向上し、より有用で検証可能な応答を示したと評価された。以前の推論モデルと比較して、これら2つのモデルは、特に記憶や過去の会話を参照することで、よりパーソナライズされ、関連性のある応答を提供するため、より自然で会話的な印象を与えるはずだ。

ChatGPT Plus、Pro、Teamユーザーは、本日よりモデルセレクターでo1、o3-mini、o3-mini-highに代わり、o3、o4-mini、o4-mini-highが表示さ
れます。ChatGPT EnterpriseおよびEduユーザーは1週間後に利用可能になります。無料ユーザーは、クエリを送信する前にコンポーザーで「Think」を選択することで、o4-miniを試すことができます。全プランのレート制限は、以前のモデルセットから変更ありません。

OpenAIは数週間以内に、ツールの完全サポートを備えたOpenAI o3-proをリリースする予定です。現時点では、Proユーザーは引き続きo1-proをご利用いただけます。

o3とo4-miniは、Chat Completions APIとResponses APIを通じて開発者にも利用可能です(一部の開発者は、これらのモデルにアクセスするために組織認証 (新しいウィンドウで開きます) が必要となります)。Responses APIは、推論サマリー、関数呼び出し時の推論トークンの保持によるパフォーマンス向上をサポートしており、近々、Web検索、ファイル検索、コードインタープリターなどの組み込みツールをモデルの推論機能に組み込む予定です。

詳細とベンチマークについては、下記のリンク先の完全な発表をご覧ください。

続きを読む

OpenAIが新しいo3およびo4-mini推論モデルを発表