DeepSeek V4、長文コーディングでChatGPTやClaudeを上回ると噂される

DeepSeek V4は、長文コンテキストのコーディングにおいてChatGPTやClaudeを上回ると噂されており、エリートレベルのコーディングタスクをターゲットにしています。内部関係者によると、2月中旬のリリース後に予想されるパフォーマンスを内部テストが示唆している場合、シリコンバレーのAI業界は懸念すべきだと主張しています。

中国拠点のAIスタートアップ企業DeepSeekは、2月17日に最新の大規模言語モデルであるDeepSeek V4をリリースする計画であると報じられています。関係者によると、このモデルは長文コンテキストのコードプロンプトやタスクを処理する際に、OpenAIのChatGPTやAnthropicのClaudeなどの既存の大規模言語モデルに影を落とす可能性があるとのことです。

開発者たちがDeepSeek V4のリリースに大きな期待を表明

この中国企業は、執筆時点では差し迫ったリリースに関する情報を公開しておらず、噂も確認していません。さまざまなソーシャルネットワークの開発者たちは、リリースへの大きな期待を表明しています。AI開発者でHyperbolic Labsの共同創設者であるYuchen Jinは、 X上で「DeepSeek V4は間もなくリリースされると噂されており、ClaudeやGPTよりも強力なコーディング能力を持つ」と投稿しました。

Subredditのr/DeepSeekも盛り上がりを見せており、あるユーザーは、DeepSeekの差し迫ったV4モデルへの執着が普通ではないと説明しました。そのユーザーは、「ニュースや可能性のある噂を頻繁にチェックし、DSウェブサイトのドキュメントを読んでアップデートを示す変更や兆候を探している」と述べました。

DeepSeekの以前のリリースは、グローバル市場に大きな影響を与えました。この中国のAIスタートアップ企業は、 2025年1月にR1推論モデルをリリースし、1兆ドル規模の売却につながりました。このリリースは、米国のAIスタートアップ企業が01モデルに費やした費用よりも大幅に少ないコストであるにもかかわらず、数学と推論のベンチマークでOpenAIの01モデルと同等の性能を示しました。

この中国企業は、モデルのリリースにわずか600万ドルしか費やさなかったと報じられています。一方、グローバルな競合他社は同じ成果を得るために約70倍の費用を費やしています。V3モデルは、MATH-500ベンチマークで90.2%のスコアを記録し、Claudeの78.3%を上回りました。DeepSeekのより最近のV3アップグレード(V3.2 Speciale)は、生産性をさらに向上させました。

V4モデルのセールスポイントは、V3が強調していた純粋な推論、形式的証明、論理的数学から進化しました。新しいリリースは、推論タスクと非推論タスクの両方を組み合わせたハイブリッドモデルになると予想されています。このモデルは、高精度と長文コンテキストのコード生成を必要とする既存のギャップを埋めることで、開発者市場の獲得を目指しています。

Claude Opus 4.5は現在、SWEベンチマークで80.9%の精度を達成し、優位性を主張しています。V4はこれを打ち破り、Claude Opus 4.5を覆す必要があります。過去の成功に基づけば、今後のモデルはこの閾値を超え、ベンチマークでの優位性を主張する可能性があります。

DeepSeekがLLMのトレーニングにmHCを先駆けて導入

DeepSeekの成功は、多くの人々に深い職業的な不信感を残しました。このような小さな企業がどうしてこのようなマイルストーンを達成できたのでしょうか。その秘密は、 1月1日に公開された研究論文に深く根付いている可能性があります。同社は、開発者が大規模言語モデルを簡単にスケールできる新しいトレーニング方法を特定しました。DeepSeekの創設者兼CEOであるLiang Wenfengは、研究の中で、同社がAIモデルのトレーニングにManifold-Constrained Hyper-Connections(mHC)を使用していると述べました。

この幹部は、開発者が大規模言語モデルをトレーニングする際に遭遇する問題に対処するためにmHCを使用することを提案しました。Wenfengによると、mHCは他のAI開発者が大規模言語モデルをトレーニングするために使用するフレームワークであるHyper-Connections(HC)のアップグレードです。彼は、HCや他の従来のAIアーキテクチャがすべてのデータを単一の狭いチャネルを通じて強制するのに対し、mHCはその経路を複数のチャネルに広げ、トレーニングの崩壊を引き起こすことなくデータと情報の転送を容易にすると説明しました。

OmdiaのチーフアナリストであるLian Jye Suは、CEO Wenfengが研究を公開したことを称賛しました。Suは、DeepSeekがトレーニング方法を公開する決定が、中国のAI部門における新たな信頼を示していると強調しました。DeepSeekは発展途上国を支配しています。Microsoftは木曜日にレポートを公開し、DeepSeekが中国のAI市場の89%を占め、発展途上国で勢いを増していることを示しました。

あなたのプロジェクトを暗号資産業界のトップマインドに届けたいですか?データとインパクトが出会う次の業界レポートに掲載しましょう。

出典: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/