
Image by TechCrunch, from Flickr
話す前に考えるAI?クロード3.7ソネット、ハイブリッド推論をデビュー
Anthropicは、新たなAIモデルであるClaude 3.7 Sonnetを公開しました。この新バージョンでは、オプションの「拡張思考」モードが導入され、ユーザーがモデルが複雑なタスクを処理する方法をよりコントロールできるようになりました。
急いでいますか?ここに要点をまとめました!
- このモデルは、答えを出す前に自己反省を可能にすることで、推論力と問題解決能力を向上させます。
- エクステンデッド思考モードは、有料プランでのみ利用可能です。
- コーディングアシスタントのクロードコードは、開発者向けに限定プレビュー中です
Anthropicは、ハイブリッド推論を導入する更新されたAIモデル、Claude 3.7 Sonnetをリリースしました。これにより、ユーザーは迅速な反応と長時間の思考の間で選択することが可能になります。
この新しいアプローチは、必要に応じてモデルが反応を評価し、洗練するための追加時間を取ることにより、問題解決を改善することを目指しています。
標準モードでは、クロード3.7ソネットはその前身、クロード3.5ソネットの反復改善として機能します。しかし、拡張思考モードでは、モデルは答えを出す前に自己反省に取り組みます。
AnthropicのAI製品リードであるマイケル・ゲルステンハバーは、この機能をユーザーが反応時間と推論深度をバランスさせる手段として説明しました。「[ユーザー]は、考える時間や、推論力と知性を時間と予算と引き換えにコントロールすることができます」と彼は述べた。これはWIREDによって報告されました。
このプロセスは、数学、物理学、コーディング、指示に従うことなど、複数のステップを要する推論が必要な領域での精度を高めることを目指しています。APIを介してモデルと対話するユーザーは、「考える」のに使用するトークンの数に上限を設定することができ、これにより反応速度とコストの制御が可能となります。
WIREDは、このアップデートには「スクラッチパッド」機能も含まれており、モデルがリクエストを処理する際の推論ステップが可視化されると指摘しています。このアプローチは、DeepSeekのような他のAIモデルで使用されている手法に似ています。
Anthropicは、Claude 3.7 Sonnetが競争スタイルのベンチマークよりも実世界のアプリケーションに最適化されていると述べています。初期のテストでは、複雑なコードベース、高度なツールの使用、フルスタックソフトウェア開発などのタスクに対するパフォーマンスが拡張理論モードにより改善されることが示唆されています。
このモデルは、SWE-bench VerifiedとTAU-benchで評価され、Anthropicの報告によれば、以前のバージョンを上回る性能を発揮していると報じられています。
CNNによれば、AnthropicはClaude 3.7の価格を以前のモデルと同じに保ち、OpenAIの最新のオファリングよりも下に位置づけています。1百万入力トークンあたり$3、1百万出力トークンあたり$15で、これはOpenAIの同等なティアの$15と$60と比べてみるとわかります。
コメントする
キャンセル