アリババ、新しいQwen AIモデルを発表、DeepSeek-V3を上回る性能を主張

Photo by John Schnobrich on Unsplash

アリババ、新しいQwen AIモデルを発表、DeepSeek-V3を上回る性能を主張

閲覧時間: 1 分間

中国の巨大企業、アリババはこの水曜日に最新版のAIモデル、Qwenを発表しました。同社は、人気のあるDeepSeek-V3よりも優れた性能を発揮すると主張しています。

急いでいる方へ!早見の要点です!

  • アリババは、今週の水曜日に最新の推論モデルQwen 2.5-Maxをリリースしました。
  • この中国の巨人は、DeepSeek-V3、GPT-4o、Llama-3.1-405Bなどの人気モデルを上回る性能を発揮すると主張しています。
  • また、同社は今週Qwen2.5-VLをローンチしました。これは、画像を処理し、コンピューターやモバイルを使用してAIエージェントとしてタスクを実行できるAIモデルです。

ロイターによると、アリババは中国の旧正月の休日に、新たな推論モデルとして名付けられた新Qwen 2.5-Maxを発表しました。これにより、ここ数日間の大規模なAI開発に加えて、国内の競争も加わることとなりました。

月曜日に、DeepSeekが米国のAppleのApp Storeで第一位に躍り出た。これにより、ChatGPTを抜き、AI業界の他の企業を懸念させ、投資家を警戒させる結果となりましたーNvidiaの株価がわずか一日で17%下落したのです。

さて、AlibabaはそのQwenモデルの最新版を発表しましたー同社は昨年9月にQwenスイートのための100以上のオープンソースAIモデルをリリースしましたーこれらは、人気のあるフロンティアモデルよりも優れた結果を約束しています。

“Qwen 2.5-Maxは、ほぼ全ての面でGPT-4o、DeepSeek-V3、Llama-3.1-405Bを上回っています」と、同社は公式WeChatアカウントで発表しました。

新しい推論モデルであるQwen 2.5-MaxのAPIは、アリババのクラウドを通じて利用可能であり、ユーザーはチャットページでもモデルをテストできます。

「私たちは、20兆トークン以上で事前学習され、さらに厳選された監督微調整(SFT)とヒューマンフィードバックからの強化学習(RLHF)の方法論でポストトレーニングされた大規模MoEモデル、Qwen2.5-Maxを開発しています」と、GithubのQwenチームが記述しました。

中国の巨大企業は月曜日にQwen2.5-VLもリリースしました。これは画像も処理でき、モバイルやコンピューターにアクセスしてタスクを実行できるマルチモーダルAIモデルのシリーズです。OpenAIは、ユーザーのコンピューターを自動的に制御してタスクを実行することを可能にするOperatorという同様の機能を発表しました。

アリババのチームによると、全てのQwenモデルは、OpenAI、Microsoft、Google、Meta、そしてDeepSeekからの類似のバージョンを上回っています。

この記事を気に入っていただけましたか?
評価しましょう!
気に入らなかった あまり気に入らなかった まあまあ気に入った 気に入った! とても気に入った!

弊社の作品を楽しんでいただけてとても嬉しいです

大切な読者として、ぜひTrustpilotでコメントをお寄せください。単純なことですが、弊社にとってとても大切なことです。ご愛顧いただきありがとうございます!

Trustpilotで弊社を評価してください
0 0 ユーザーが投票しました
タイトル
コメント
フィードバックをありがとうございます
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

コメントする

Loader
Loader 詳細をご覧ください…