OpenAIが新しいGPT-4.1モデルを発表

Mac

OpenAIが新しいGPT-4.1モデルを発表

Lamiyi
0
rhahw

OpenAIが新しいGPT-4.1モデルを発表

OpenAIは、API向けに新しいGPT-4.1、GPT-4.1 mini、GPT-4.1 nanoモデルを発表しました。開発者向けに提供が開始されたこれらのモデルは、GPT-4oおよびGPT-4o miniを全般的に上回る性能を発揮します。

特に、これらのモデルはコーディングと指示追従において大きな進歩を遂げていると言われています。3つのモデルすべてにおいて、コンテキストウィンドウが大幅に拡張され、最大100万トークンを処理できるようになりました。OpenAIは、これらのモデルはより大きなコンテキストを効果的に活用する能力が向上したと主張しています。彼らの知識ベースは2024年6月まで更新されています。

OpenAIは、メインモデルGPT-4.1の詳細について、いくつかのベンチマーク結果を公開しました。コーディングに関しては、SWE-bench Verifiedで54.6%のスコアを記録し、「GPT-4oと比較して絶対値で21.4%の向上」と評価しました。ScaleのMultiChallengeベンチマークで測定された命令追跡では38.3%を記録し、GPT-4oと比較して絶対値で10.5%の向上となりました。また、このモデルはVideo-MMEベンチマークにおいて、ロングコンテキスト理解でも新たな最高スコアを記録したようです。

ベンチマークの数値はある程度の目安となるものの、OpenAIはこれらのモデルが開発者のフィードバックに基づいて実用的なユースケースを念頭に構築されたことを強調しました。その目的は、コストとレイテンシを削減しながら、より優れたパフォーマンスを実現することでした。

GPT-4.1のミニバリアントは、小型モデルにとって大きな一歩と位置付けられており、一部のテストではフルサイズのGPT-4oを凌駕すると言われています。OpenAIは、GPT-4oと同等かそれ以上の知能スコアを実現しながら、ほぼ2倍の速度で実行コストを83%削減できると主張しています。

3つ目の新モデルであるGPT-4.1 nanoは、速度と低コストが最も重要となる状況を対象としています。OpenAIはこれを最速かつ最安の選択肢としていますが、それでもより大規模なモデルと同じ100万トークンのコンテキストウィンドウを処理できます。フットプリントが小さいにもかかわらず、OpenAIはMMLUやGPQAなどの評価で良好なスコアを報告しており、いくつかの点ではGPT-4o miniを凌駕していると主張しています。そのため、テキスト分類や自動補完機能の駆動など、迅速な処理が求められるタスクに最適な候補となります。

信頼性と長いコンテキストの処理におけるこれらのアップグレードは、GPT-4.1 モデルを AI エージェントの構築により適したものにすることも目的としています。

重要な点として、これらの新しいGPT-4.1モデルは現時点ではAPIのみです。OpenAIは、ChatGPTで使用されているGPT-4oのバージョンには、基盤となる多くの改良点が既に少しずつ取り入れられており、今後もさらなるアップデートが予定されていると述べています。

このニュースと並行して、OpenAIはGPT-4.5 PreviewモデルをAPIから廃止するプロセスを開始します。これは、GPT-4.1がGPT-4.5 Previewの機能と同等かそれ以上であり、価格と速度も優れているためです。開発者は2025年7月14日までに移行できます。

これらの 4.1 モデルの詳細とベンチマークについては、以下のリンク先の完全な発表をご覧ください。