Gemini 2.5 Proは、Googleが2025年3月25日に公開した最新のAIモデルで、特に「思考モデル(thinking model)」として設計されており、複雑な問題を処理する能力が向上しています。
以下に、Gemini 2.5 Proに追加された主な機能や特徴をまとめます。これらは公式発表や関連情報に基づいています。
1. 強化された推論能力
Gemini 2.5 Proは、応答前に自身の思考プロセスを段階的に実行する「チェーン・オブ・ソート(chain-of-thought)」機能を備えており、これにより精度と性能が向上しています。
例えば、数学や科学の問題を解く際、より論理的かつ正確な結論を導き出せます。Googleの発表によると、GPQAやAIME 2025などのベンチマークで高いスコアを記録し、特に高度な推論が求められるタスクで優れた結果を示しています。
2. マルチモーダル処理の進化
テキストだけでなく、画像、音声、コードなどの複数形式のデータを統合的に処理する能力が強化されています。
画像解析ではデザインや表情を高精度で把握でき、コード生成やデバッグでも優れたパフォーマンスを発揮します。これにより、単一のプロンプトから多様な出力を生成する柔軟性が増しています。
3. 高速な出力とエラー率の低下
ユーザーからの報告やレビューによると、前モデル(Gemini 2.0など)と比較して出力速度が劇的に向上し、エラー率も大幅に低下しています。特に推論速度が速く、実用性が向上している点が強調されています。
4. コーディング能力の向上
プログラミング関連のタスクにおいて、Gemini 2.5 Proは高い精度でコード生成や編集が可能です。
Googleは、SWE-Bench Verifiedベンチマークで63.8%のスコアを達成したと主張しており、単一行のプロンプトから実行可能なビデオゲームのコードを生成する例も示しています。
また、ウェブアプリの作成やエージェント的なコード(自律的にタスクを実行するコード)の生成でも強みを発揮します。
5. コンテキストウィンドウの拡張
Gemini 2.5 Proは1百万トークンのコンテキストウィンドウをサポートしており、大量のデータを一度に処理できます。
これにより、1500ページのドキュメントや長時間のビデオコンテンツを扱うことが可能ですが、一部のユーザーからは「コンテキストウィンドウは大きくない」との指摘もあり、具体的な上限については状況によるようです。
6. 安全性と正確性の向上
思考プロセスを組み込むことで、AIの「ハルシネーション(幻覚)」が減少し、より正確で信頼性の高い応答が得られるよう設計されています。これにより、事実性や論理性を重視するタスクでの利用価値が高まっています。
注意点と制限
- 実験的段階:Gemini 2.5 Proは「Experimental」としてリリースされており、一部の機能(例: Deep ResearchやCanvas)は現時点で利用不可です。
- 画像生成の制限:現時点では画像生成機能はサポートされていないとの報告があります。
- Webアクセスの欠如:リアルタイムのウェブ検索機能は搭載されていません。
利用方法
Gemini 2.5 ProはGoogle AI Studioで開発者向けに提供されており、Gemini Advancedユーザーもデスクトップおよびモバイルのモデル選択メニューから利用可能です。
ただし、高度な機能を利用するにはGoogle Oneの「AI Premiumプラン」(月額約2900円、2025年3月時点)への加入が必要です。
まとめ
以上の機能追加により、Gemini 2.5 Proはビジネスでの資料作成、データ分析、プログラミング支援など多岐にわたる用途で活用できる万能なAIモデルへと進化しています。
特に推論とマルチモーダル能力の強化が際立っており、競合モデル(例: OpenAIのGPT-4やClaude 3)と比較しても優位性を発揮する場面が多いとされています。