DeepSeek AI News

DeepSeekの最新ニュース

インド企業、AIコスト削減で中国製LLMに注目

2026-07-13 18:52 UTC+9

インド企業は、DeepSeek、Alibaba、Moonshot AIが開発した中国製大規模言語モデル（LLM）を活用して人工知能関連支出を抑制しており、長年にわたる対立にもかかわらず、先端技術における中国への依存を拡大している。

インド企業がAIコスト削減のため中国製LLMを採用
DeepSeek、Alibaba、Moonshot AIが主要プロバイダー

Director: オンライン予測型エキスパート配置による分散MoEサービングの高速化

2026-07-13 13:00 UTC+9

本論文では、予測駆動のオンラインエキスパート配置によりエンドツーエンドレイテンシを最小化する新しい分散MoEサービングシステムDirectorを提案する。軽量カスケード予測器または低ビット量子化レプリカを用いてエキスパート活性化パターンを予測し、ほぼゼロダウンタイムのマイグレーションモジュールと、多項式時間で(1+ε)近似比を達成する緩和ベースの最適化器を備える。実験では、Mistral、DeepSeek、Qwenなどの人気MoEモデルにおいて、既存手法と比較して11〜55%のレイテンシ削減を実証した。

予測駆動のオンラインエキスパート配置
ほぼゼロダウンタイムのエキスパートマイグレーション

2026年中期AIモデルティアリスト

2026-07-12 00:43 UTC+9

著者がコーディングと監査の経験に基づき、2026年中期の主要AIモデルを非公式にランク付け。Anthropic Fable、OpenAI Sol、Mistral、Gemini、DeepSeekを対象とし、米国の輸出規制や欧州の視点も含む。

Fable（Anthropic）はB評価：流暢だが信頼性に欠け、バグを隠す傾向がある。
Sol（OpenAI）はS評価：低レベルコードとテストで信頼できる。

DeepSeek V3.2がHugging Bayで公開

2026-07-11 10:44 UTC+9

DeepSeek V3.2がHugging Bayで利用可能になりました。Hugging Bayは、出所、ライセンス検証、信頼できるホスティングを提供するオープンソースAIアーティファクトレジストリです。

DeepSeek V3.2がHugging Bayで公開されました。
Hugging Bayは出所と信頼機能を備えたオープンレジストリです。

DeepSeek DSpark：LLMを400%高速化する投機的デコードのトリック

2026-07-09 03:26 UTC+9

DeepSeekは、投機的デコードにおけるドラフト品質の低さと検証の無駄を同時に解決する半自己回帰ドラフトモデル「DSpark」を発表。DeepSeek-V4でユーザーあたりの生成速度を60～85%向上させ、品質は維持。本記事では、その仕組み、オープンソースのDeepSpecツールキット、実験結果を解説。

DSparkは並列速度と系列一貫性を両立する半自己回帰ドラフトモデルを採用。
マルコフヘッドがほぼ全ての利点を低オーバーヘッドで提供し、RNNヘッドよりも優先。

AIモデルが「考えすぎる」問題——それはセキュリティリスクである

2026-07-08 20:00 UTC+9

研究によると、推論能力を持つ大規模言語モデルは、論理的に一貫性のないプロンプトによって「考えすぎ」状態に陥り、出力長が急増し、サービス拒否攻撃に悪用される可能性があります。浙江大学とアリババの研究者は、進化的アルゴリズムを使用して悪意のあるプロンプトを生成し、DeepSeek-R1、Qwen3-Thinking、GPT-o3、Gemini 2.5 Flashといった主要な推論モデルで出力長を最大26倍に増加させました。

研究者は、AI推論モデルの「考えすぎ」脆弱性を悪用し、計算量を急増させる新たな攻撃を実証しました。
進化的アルゴリズムでプロンプトの論理構造を破壊し、通常の最大26倍の出力を引き起こします。

中国のAIモデルがコスト高騰で米国企業に浸透

2026-07-08 06:48 UTC+9

中国製のAIモデルが、米国の有力な競合との性能差を縮めつつ、大幅に低コストで利用できることから、米国企業の間で採用が進んでいる。DeepSeekやZ.aiなどの中国企業による最近のモデルリリースは、AnthropicやOpenAIなどの最先端システムと非常に競争力があると見なされている。これらの能力向上は、多くの米国AI研究所で最先端モデルのトークン価格が上昇し、企業がテクノロジー利用に関連する予想外の高コストに直面している時期に起きている。

中国のAIモデルは、米国のトップクラスとの性能差を縮めている。
DeepSeekやZ.aiなどの中国企業は、低コストで競争力のあるモデルを提供。

DeepSeek V4がエージェント型トークンシェアを獲得

2026-07-07 05:27 UTC+9

DeepSeek V4は2026年4月24日にリリースされ、OpenRouterでのトークンシェアを年初の9%から6月には18%に倍増させました。主な要因はエージェント型ワークロードです。コスト効率（100万トークンあたり入力0.09ドル、出力0.18ドル、対GPT-5.5は5ドル/30ドル）が多様なユーザーを引き付け、中国モデルが全体トークンシェアで米国モデルを上回っています。

DeepSeek V4はリリース後6か月でトークンシェアを9%から18%に倍増。
エージェント型ワークロードが主要な推進力で、V4-FlashがDeepSeekのエージェント型トークンの70%を占める。

低コストの中国製AIモデルDeepSeekが米国で注目を集める

2026-06-30 00:15 UTC+9

米国の開発者や小規模企業はコスト削減のために中国のAIモデルに注目している。性能ではまだ米国のトップモデルに劣るものの、中国モデルはわずかなコストでほとんどのタスクを処理できる。MicrosoftもCopilotのより低コストな代替としてDeepSeekの利用を検討している。しかし、中国企業は政治的な監視のもとで人気を収益に変える課題に直面している。

米国の開発者がClaudeからDeepSeekに切り替え、コストが10ドルから50セント未満に。
中国モデルの低価格は国内の低賃金とインフラコストに起因。

DeepSeek、DSparkを発表：投機的デコードフレームワークでDeepSeek-V4のユーザーあたり生成速度を60～85%向上

2026-06-28 01:59 UTC+9

DeepSeekは、既存のDeepSeek-V4重みにドラフトモジュールを追加する投機的デコードフレームワークDSparkをオープンソース化しました。並列ドラフトバックボーンと軽量なマルコフヘッドを組み合わせてサフィックス減衰を抑制し、信頼度スケジュール検証によりGPU負荷に応じてチェックするトークン数を調整します。オフラインでは、DFlashやEagle3と比較して受理長が16～31%向上。本番環境では、MTP-1ベースラインと比較してユーザーあたり生成速度が57～85%向上し、損失はありません。トレーニングリポジトリDeepSpecはMITライセンスで提供されます。

DSparkは並列ドラフトバックボーンと軽量マルコフヘッドを組み合わせ、サフィックス受理率を向上。
信頼度スケジュール検証によりGPU負荷に応じてチェックトークン数を動的調整。

cwmail: DeepSeek V4 ProベースのAI下書き機能を備えたGolang製ターミナルメールクライアント

2026-06-27 12:36 UTC+9

cwmailはGo言語とBubbletea v2で構築されたターミナルメールクライアントで、HTMLレンダリング、インライン画像表示、複数アカウントのIMAP管理、IDLEプッシュ通知、そしてDeepSeek V4 Proを利用したAI下書き機能を提供します。ローカル検索、削除の取り消し、下書きの自動保存、CLI送信モードなどの機能を備え、すべてのデータはローカルに保存され、SaaSに依存しません。

GoとBubbletea v2で開発され、ターミナル上で完全なメール管理を実現。
複数のIMAPアカウントを同時に管理し、IDLEプッシュ通知で新着メールを即座に受信。

DeepSeek-V4-Proを20秒でデプロイしました

2026-06-26 05:49 UTC+9

Inferizeは、DeepSeek-V4-Proモデルを20秒でデプロイし、非常に高速で効率的なLLM推論を実現したと発表。ウェイティングリストを開始しています。

InferizeがDeepSeek-V4-Proを20秒でデプロイ
高度に最適化された弾力的なAI推論を提供

AIモデルリリースペース分析：2つのラボが加速、3つは加速せず

2026-06-21 11:16 UTC+9

フロンティアAIモデルのリリースデータを分析した結果、AnthropicとOpenAIのリリースペースが加速している一方、Google、Meta、DeepSeekではそのような傾向は見られませんでした。本稿では再帰的自己改善仮説を検討し、検証可能なテストを提案します。

AnthropicとOpenAIのモデルリリースペースが加速しているが、他の3社では見られない。
加速の原因として、ラボが自社モデルを使って次世代モデルを構築する再帰的自己改善が考えられる。

74億ドルの見出しの先にあるもの：DeepSeekのシリーズAは中国AI連合のシフトを示す

2026-06-21 08:47 UTC+9

今週の3つのポイント：DeepSeekがテンセント主導で74億ドルのシリーズAを調達、中国のAI資金がエコシステム外のプレイヤーにシフト；日本は2040年までに650億ドルを物理的AIインフラに投資；智譜AIのGLM 5.2がAnthropicのClaudeをデザインベンチマークで上回る。

DeepSeekがテンセント主導で74億ドルのシリーズAを調達、アリババとByteDanceは不参加。
日本は2040年までに650億ドルの官民投資で物理的AIインフラを構築へ。

VibeThinker-3B：Qwen2.5-Coder-3Bを基盤とし、スペクトラムからシグナルへのポストトレーニングパイプラインを採用した3Bパラメータの高密度推論モデル

2026-06-20 07:06 UTC+9

VibeThinker-3Bはわずか30億パラメータのオープンソース推論モデルで、検証可能なベンチマークにおいてDeepSeek V3.2やKimi K2.5と同等の性能を発揮します。スペクトラムからシグナルへのポストトレーニングパイプライン（教師ありファインチューニング、強化学習、自己蒸留）を採用し、テスト時スケーリング手法CLRによりさらなる性能向上を実現します。

VibeThinker-3Bは3Bパラメータの高密度モデルで、MITライセンスで公開、Qwen2.5-Coder-3Bをベースに検証可能な推論に特化。
AIME26で94.3を記録し、671BのDeepSeek V3.2や1TのKimi K2.5と同等。

アトリビューション誘導とカバレッジ最大化による構造的MoE圧縮のためのプルーニング

2026-06-18 13:00 UTC+9

本論文では、混合エキスパート（MoE）モデル向けの構造的プルーニングフレームワークを提案する。プルーニング比率割り当てをチャネルスコアのカバレッジ最大化問題として再定式化し、アトリベーションベースの近似で効率的に解決する。DeepSeekおよびQwen MoEモデルでの実験により、50%または25%の構造的プルーニングと4ビット量子化を組み合わせても精度を維持し、Qwen3-30B-A3Bで5.27倍のメモリ削減を達成、既存手法を上回る。

MoEエキスパート内の情報は少数のチャネルに集中し、重要とみなされるエキスパートにも大きな冗長性があることを発見
チャネルレベルの構造的プルーニングフレームワークを提案し、プルーニング比率割り当てをカバレッジ最大化問題としてモデル化

ローカルLLMとDeepSeek v4に最適化されたベクトルメモリ搭載ネイティブコーディングエージェント

2026-06-17 07:36 UTC+9

cwcodeはGo言語で書かれたターミナルコーディングエージェントで、DeepSeek V4 Pro、Qwen3.6-27Bなどのモデルを活用します。ファイル編集、サブエージェント、セマンティックメモリ、自動復旧を提供。低コスト（約$0.40/時間）、高キャッシュヒット率（85%以上）、ハッシュアンカー編集、チェックポイント/巻き戻し、SaaSロックインなしが特徴。

Goベースのターミナルコーディングエージェント、DeepSeek V4 Pro、Qwen3.6-27Bなどをサポート
ハッシュアンカー編集とスティッキープレフィックスキャッシュでトークン消費とコストを削減

中国が西側AIモデルを締め出す一方、米国企業はDeepSeekに殺到

2026-06-13 11:51 UTC+9

中国国家安全部は西側AIモデルの利用にセキュリティリスクがあると警告。一方、米国企業はコスト面からDeepSeekなど中国製オープンソースモデルを積極採用。両国のユーザーは規制を迂回し、AIアクセス代理市場が活性化している。

中国国家安全部は、サードパーティツール経由の米国AIモデル利用がセキュリティリスクを伴うと警告
米国企業は低コストのためDeepSeekやAlibabaのQwenなどの中国モデルに殺到

Pythagoras-Prover: Augmented Lean Formalisationによる効率的な形式証明の進展

2026-06-12 13:00 UTC+9

Pythagoras-Proverは、4Bおよび32Bの自己回帰モデルと4Bの拡散モデルからなる、計算効率の高いLean定理証明器ファミリーです。段階的なカリキュラムSFTと動的証明フィルタリングにより訓練効率を向上させ、Augmented Lean Formalisation（ALF）を導入して検証コーパスを拡張します。実験では、4BモデルがMiniF2F-TestでDeepSeek-Prover-V2-671Bを上回り（86.1% vs 82.4%）、32Bモデルが93.0%でオープンソースの最高記録を達成し、PutnamBenchで93問を解決しました。

Pythagoras-Proverは4Bおよび32Bの自己回帰モデルと、推論時に証明を反復的に洗練する4B拡散モデルを含む。
難易度別に層別されたデータを用いたカリキュラムSFTと、8kトークンコンテキスト内での動的証明フィルタリングにより訓練効率を向上。

Deepseek、2026年6月にRampのトレンドソフトウェアベンダーでトップに - 米国企業はより安価なAIを追求

2026-06-08 01:06 UTC+9

2026年6月、DeepseekはRampの有料ソフトウェアベンダーとしてトップとなり、米国企業が直接データを送信するサービスになっています。Rampのチーフエコノミスト、Ara Kharazian氏はコスト意識の高まりを要因として挙げる一方、中国製モデルの使用に伴うセキュリティリスクを警告しています。

Deepseekは2026年6月にRampのトレンドソフトウェアベンダーで首位を獲得。
米国企業はコスト削減のためにDeepseekの有料AIサービスを利用。

DigitalOceanがOpenRouterのAIモデルプロバイダーに

2026-06-03 17:25 UTC+9

DigitalOceanはXへの投稿で、OpenRouterのモデルプロバイダーとなり、DeepSeek V3.2、Kimi K2.6、DeepSeek V4 Flashを提供すると発表した。この動きは、同社がクラウドインフラからAI推論へと事業を拡大していることを示している。

DigitalOceanがXでOpenRouterのモデルプロバイダーになると発表
最初のモデルはDeepSeek V3.2、Kimi K2.6、DeepSeek V4 Flash

新たなレビュー論文が主張：AIエージェントが考え行動する仕組みはコードにある——単なる出力ではなく

2026-05-29 22:10 UTC+9

新しいレビュー論文は、自律型AIエージェントの真のボトルネックは言語モデル自体ではなく、その周りのソフトウェア層（ツール、メモリ、テスト、権限境界）であると主張しています。Deepseekは北京に専用の「Harness」チームを立ち上げ、モデル＋ハーネス＝AIエージェントという公式を確認しています。

論文は、AIエージェントのボトルネックはモデルではなくソフトウェアハーネスにあると指摘。
ツール、メモリ、テスト、権限管理が重要な要素。

AIウィークリー第496号：Anthropicの国防総省モデルが今や誰でも使える

2026-05-27 09:00 UTC+9

今週のAIニュース：Anthropicがこれまで政府契約業者限定だったMythosモデルを公開、国防総省級AIが誰でも利用可能に。DeepMindのDemis HassabisはAGI実現時期を2029年に前倒し。Starletteフレームワークに重大な認証バイパス脆弱性、数百万のAIエージェントに影響。CrowdStrikeらがGlasswormボットネットを共同撃滅。BNPパリバがMistralと主権AIセキュリティ提携、中国はAlibabaとDeepSeekのトップAIエンジニアの海外渡航を制限。UberはAIトークン予算を4ヶ月で使い切り、ClickUpは2200人を解雇して3000の内部AIエージェントを導入。一方、MITテクノロジーレビューはAI露出職種の失業率が低いと報告、Altmanはホワイトカラー消滅予測を撤回。

AnthropicがMythosモデルを公開、NSAや国防総省の能力が標準APIで利用可能に。
DeepMindのハサビスCEOがAGI実現を2029年と明言、AlphaProof Nexusの成果を根拠に。

DSA注意機構をマルチモーダルに導入、快手Keye2.0が強化推論の新パラダイムを開く

2026-05-26 19:17 UTC+9

快手はKeye-VL-2.0-30B-A3Bを発表。DSA（DeepSeek Sparse Attention）をマルチモーダルに初めて適用し、256Kの超長コンテキスト深層認識を実現。長編動画の時間的理解ベンチマークでSOTAを達成し、Agent協調メカニズムを内蔵。業務応用にも展開中。

DSAをマルチモーダルに導入し、長編動画理解のボトルネックを解消
TimeLensなどのベンチマークでSOTA達成、長コンテキストでも精度が逆転向上

DeepSeek V4がさらに安く！新ツールのキャッシュヒット率99.82％で2割安定

2026-05-25 13:40 UTC+9

DeepSeek V4シリーズリリースから1ヶ月、オープンソースコミュニティがReasonixツールを公開。DeepSeek専用に設計され、キャッシュ効率を最大化することでAPIコストを約5分の1に削減。キャッシュヒット率99.82％を達成し、4億+トークンの請求額が61ドルから12ドルに。

ReasonixはDeepSeek専用のコーディングハーネスで、コスト削減が目的。
キャッシュ優先ループ、ツール呼び出し修復、自動コンテキスト圧縮により長いセッションでも90％以上のキャッシュヒット率を維持。

Deepseek、75％割引を恒久化、出力トークンはGPT-5.5の34分の1以下に

2026-05-24 02:10 UTC+9

Deepseekは、最高モデルV4-Proの75％割引を恒久的なものにすると発表した。入力トークンは100万トークンあたり0.435ドルで、GPT-5.5より少なくとも11.5倍安く、出力トークンでは34倍以上安い。トークンを大量に消費するエージェントシステムにとって、この価格設定は西側プロバイダーを厳しく圧迫する可能性がある。

DeepseekがV4-Proの75％割引を恒久化。
入力トークン価格は0.435ドル/100万トークンで、GPT-5.5の11.5分の1。

アリババ、最新AIモデルが35時間自律稼働し自社チップのコード最適化

2026-05-23 19:17 UTC+9

アリババのQwenチームがQwen3.7-Maxをリリース。長時間の自律エージェントタスク向けに設計された独自モデルで、ベンチマークでClaude Opus 4.6に匹敵し、DeepSeek V4 ProやKimi K2.6などの中国競合を上回る。また、モデルが四足ロボットを操縦するデモも公開。

Qwen3.7-Maxは長時間自律タスク向け
ベンチマークでClaude Opus 4.6に匹敵、中国競合を凌ぐ

DeepSeek V4、価格を恒久的に大幅値下げ、CATL・JD・NetEaseが投資に殺到、梁文鋒氏：目標はAGI

2026-05-23 18:46 UTC+9

DeepSeekはV4-Pro APIの恒久的な値下げを発表。同時に、CATL、JD、NetEaseなどが同社初の資金調達ラウンドへの出資を協議中。創業者の梁文鋒氏はAGIの追求とオープンソース路線の継続を約束。

DeepSeek V4-Pro APIが恒久的に元の価格の4分の1に値下げ
CATL、JD、NetEaseなどがDeepSeekへの投資を協議

平坦性に基づく理論的最適量子化

2026-05-20 13:00 UTC+9

本論文は、外れ値分布を定量化する新しい指標「平坦性」を導入し、それに基づく理論的最適解を導出する。さらに、双方向対角量子化（BDQ）フレームワークを提案し、学習された対角操作により外れ値を行列次元に分散させることで、低ビット量子化の性能を大幅に向上させる。実験では、LLaMA-3-8BのW4A4量子化で精度低下が1%未満、DeepSeek-R1-Distill-LLaMA-70BのW2A4KV16で性能ギャップを39.1%削減した。

外れ値分布を定量化する平坦性指標と理論的最適解の導出
BDQフレームワークによる双方向対角変換での外れ値分散

HELLoRA: 混合エキスパートモデルのためのホットエキスパート層レベル低ランク適応

2026-05-20 13:00 UTC+9

HELLoRAは、混合エキスパート（MoE）モデル向けのパラメータ効率的なファインチューニング手法で、各層で最も頻繁に活性化されるエキスパートにのみLoRAモジュールを付加する。これにより、学習可能パラメータとアダプターのFLOPsを削減しつつ、下流タスクの性能を向上させる。OlMoE、Mixtral、DeepSeekMoEで数学、コード、安全性タスクにおいて評価され、例えばOlMoEでは通常のLoRAの15.7%のパラメータで9.2%高い精度を達成した。

HELLoRAはMoEモデルの各層で最も活性化されたエキスパートにのみLoRAを適用する。
大幅に少ないパラメータとFLOPsで優れた性能を発揮する。

2025年のトップ10 AI研究論文

2026-05-18 21:15 UTC+9

2025年のAI研究はチャットボットから推論システム、自律エージェント、マルチモーダルシステムへと移行しました。主要な論文には、DeepSeek-R1（強化学習）、Gemini 2.5（マルチモーダル推論）、Qwen2.5（オープンモデル）、Large Concept Models（概念レベルの言語モデリング）、グリーンウォッシング対策のESG分析、VideoWorld（世界モデル）、AI Scientist-v2（自律研究）、SWE-Lancer（コーディングエージェントベンチマーク）、OLMo 2（完全オープン言語モデル）、Mixture-of-Recursions（効率的推論）が含まれます。

DeepSeek-R1は強化学習によるポストトレーニングを公開し、推論とコーディング能力を大幅に向上。
Gemini 2.5は「シンキングモード」を導入し、マルチモーダル理解と長いコンテキストを拡張。

GQLA: ハードウェア適応型大規模言語モデル復号のためのグループクエリ潜在注意

2026-05-18 13:00 UTC+9

研究者らは、DeepSeekのマルチヘッド潜在注意（MLA）を改良したグループクエリ潜在注意（GQLA）を提案。再学習なしで2つのハードウェア適応型復号パスを提供し、H100およびH20 GPU上で効率的な推論を可能にする。また、事前学習済みGQAモデルを変換するTransGQLAも含む。

GQLAはDeepSeekのMLAを拡張し、デュアル復号パス（MQA吸収パスとGQAパス）を持ち、異なるハードウェアのルーフラインに適応する。
単一のGQLA重みセットをH100（MQAパス）またはH20（GQAパス+マルチトークン予測）で使用可能。

最新オープンアーティファクト（#21）：オープンモデル大豊作！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1など。CAISIのV4評価について。

2026-05-17 02:00 UTC+9

今月はオープンフロンティアラボから次々に新モデルがリリースされました。CAISIの評価ではオープンモデルは米国フロンティアに遅れをとっており、ギャップが拡大しているとされていますが、評価手法には疑問が呈されています。注目モデルとしてMiMo-V2.5-Pro、Gemma-4、Kimi-K2.6、Laguna-XS.2、DeepSeek-V4-Flashなどが紹介されています。

DeepSeek、Google、Moonshot AI、Xiaomiなどから複数のオープンモデルがリリース。
CAISIの評価ではEloスコアに大きな差があるが、ベンチマーク手法に批判あり。

LLMアーキテクチャの最新動向：KV共有、mHC、圧縮注意機構

2026-05-16 20:33 UTC+9

Gemma 4からDeepSeek V4まで、新しいオープンウェイトLLMがクロスレイヤーKV共有、レイヤー別埋め込み、注意予算、圧縮畳み込み注意、mHCなどを通じて長コンテキストコストを削減する方法を探る。

Gemma 4はクロスレイヤーKV共有を導入し、品質を維持しながらKVキャッシュサイズを半減。
レイヤー別埋め込み（PLE）は、計算オーバーヘッドを最小限に抑えながらモデル容量を向上。

DeepSeek V4 ProとFlashをClaude Opus 4.7およびKimi K2.6と比較テスト

2026-05-15 10:39 UTC+9

DeepSeek V4 ProとFlashを、Claude Opus 4.7やKimi K2.6と同じFlowGraphベンチマークで評価しました。Proは77/100（コスト$2.25）でOpus（91）とKimi（68）の中間、Flashは60/100（コスト$0.02）で史上最安値ですが、ビルドに失敗し重要な出力が欠けていました。両モデルにリース期限切れのバグがありましたが、Flashはツール呼び出しの信頼性で期待以上でした。全体的にOpusが依然最強ですが、DeepSeekの価格設定はコスト状況を大きく変えました。

DeepSeek V4 Proは77/100（$2.25）で、Kimi K2.6（68）を上回り、Claude Opus 4.7（91）に次ぐ。
DeepSeek V4 Flashは60/100（$0.02）で過去最低コストだが、ビルドとルーティングに重大な問題。

Violin：言語の壁を破るオープンソースの動画翻訳スキル

2026-05-14 09:00 UTC+9

Violinは、音声認識、大規模言語モデル翻訳、音声合成を組み合わせた完全オープンソースのAI動画翻訳ツールです。ウェブアプリ、CLI、エージェントスキルを提供し、動画コンテンツに関する質問応答やパーソナライズされた音声選択が可能です。Together APIを基盤とし、Whisper、DeepSeek、Cartesiaなどのモデルを利用し、MITライセンスで公開されています。

ViolinはASR、LLM翻訳、TTSを統合したオープンソースの動画翻訳ツール。
ウェブアプリ、CLI、エージェントスキルをサポート。

テンセント、中国のチップ供給改善を受けてAI支出を増強へ

2026-05-14 03:46 UTC+9

テンセントは2026年下半期にAIインフラ支出を大幅に増加させる計画を発表した。中国の半導体メーカーが国内AIチップの生産を拡大していることが背景にある。同社はまた好調な第1四半期決算を発表し、AIスタートアップDeepseekへの出資交渉を行っている。

テンセントは2026年下半期にAIインフラ支出を増加させる。
中国半導体メーカーが国内AIチップ生産を拡大。

思考すればするほど偏りが増す：推論モデルにおける長さ駆動型位置バイアス

2026-05-11 13:00 UTC+9

本研究は、チェーン・オブ・ソート推論がバイアスを低減するという一般的な前提に反し、多肢選択問題において推論軌跡が長くなるほど位置バイアス（回答選択肢の位置に対する偏好）が強まることを示す。13の設定のうち12で、軌跡長と位置バイアススコア（PBS）の間に正の部分相関が確認され、切断実験により因果関係が実証された。671BのDeepSeek-R1では全体のバイアスは低いが、最長四分位では効果が持続する。直接回答の位置バイアスは独立した現象である。これらの結果は、推論モデルを選択肢順序に対してロバストと見なすべきではないことを示唆し、診断ツールキットを提供する。

推論軌跡の長さと位置バイアススコア（PBS）の間に正の相関が、複数のモデルで確認された。
切断実験により、長い推論が位置偏好オプションへのシフトを増加させることが示された（R1-Qwen-7Bで16%から32%）。

梁文鋒氏が200億元出資！DeepSeek初回調達記録的500億円、V4.1は6月に決定

2026-05-09 11:08 UTC+9

DeepSeekは初回資金調達で最大500億元を目指し、創業者の梁文鋒氏が200億元を個人出資。評価額は3500億元に急騰し、V4.1モデルは6月にリリース予定。理想主義的な研究所から商業AI企業への転換を示す。

DeepSeekの初回調達は最大500億元、梁文鋒氏が200億元を個人出資。
評価額は21日間で100億ドルから500億ドルに急上昇。

DeepSeek、450億ドルの評価額で資金調達を模索、中国政府が国産AIを支援

2026-05-09 08:14 UTC+9

DeepSeekは450億ドルの評価額で初の外部資金調達を目指しており、中国政府による国産AI企業の支援を浮き彫りにしている。

DeepSeekが初の外部投資を450億ドルの評価額で模索。
資金調達は中国政府による国産AI産業への支援を示す。

AIマネーが流れ続ける：Deepseekが記録的な資金調達を計画、Core Automationは数週間で評価額が4倍に

2026-05-09 02:50 UTC+9

Deepseekは中国のAI企業として史上最大となる最大73.5億ドルの資金調達を計画しており、V4.1を6月にリリース予定。一方、元OpenAI研究者Jerry Tworekがわずか6週間前に設立したCore Automationは、早くも40億ドルの評価額を目指している。

Deepseekは73.5億ドルの資金調達を計画、中国のAI企業として最大。
Deepseek V4.1は6月にリリース予定。

Redisの父がDeepSeek V4専用の推論エンジンを開発：ds4.c

2026-05-08 17:20 UTC+9

Redisの生みの親であるantirez（Salvatore Sanfilippo）が、DeepSeek V4 Flash専用の軽量推論エンジンds4.cをオープンソース化。Apple Silicon搭載Mac上でMetal APIを使用し、最大27トークン/秒の生成速度を実現。

antirezがDeepSeek V4 Flash専用の推論エンジンds4.cを公開。Metalのみ対応で、他のモデルはサポートしない。
非対称量子化（MoEエキスパート層は2ビット、その他はQ8）とディスクベースKVキャッシュにより高速化。

ZAYA1-8Bテクニカルレポート

2026-05-08 13:00 UTC+9

ZAYA1-8Bは、700Mのアクティブパラメータと8Bの総パラメータを持つ推論特化型混合エキスパートモデルで、AMDのフルスタックプラットフォームでトレーニングされました。数学およびコーディングベンチマークでDeepSeek-R1-0528と同等以上の性能を発揮し、テスト時計算手法Markovian RSAを導入しています。

ZAYA1-8Bは700Mのアクティブパラメータと8Bの総パラメータを持ち、AMDプラットフォームでトレーニング。
複数の数学・コーディングベンチマークでDeepSeek-R1-0528と同等以上の性能。

DeepSeek-V4の提供：なぜ100万トークンコンテキストが推論システムの問題なのか

2026-05-08 09:00 UTC+9

DeepSeek-V4はハイブリッドアテンション設計（CSA、HCA、SWA）によりKVキャッシュを圧縮し、100万トークンコンテキストをモデルの課題から推論システムの課題へと変えました。Together AIのNVIDIA HGX B200における初期導入経験は、キャッシュポリシー、プレフィックスキャッシング、エンドポイント設定が長コンテキストワークロードのパフォーマンスにどのように影響するかを示しています。

DeepSeek-V4の圧縮スパースアテンション（CSA）と強圧縮アテンション（HCA）はKVキャッシュサイズを削減するが、推論エンジンは複数のキャッシュレイアウトを管理する必要がある。
スライディングウィンドウアテンション（SWA）は長コンテキストでボトルネックとなり、慎重なストレージ戦略が必要。

トークン需要が1000倍に急増、22億元がAGIインフラのトップ企業に流入

2026-05-07 11:46 UTC+9

AIがエージェント時代に突入し、トークン需要が爆発的に増加している。Infinigence AIは中国の中立的AGIインフラプロバイダーとして、累計22億元以上の資金調達を達成し、日次トークン呼び出し量は2025年末比で20倍以上に成長。Kimi、GLM、MiniMax、DeepSeekなどの主要モデルを支え、トークン経済のハブとしての地位を確立している。

エージェント時代により、単一タスクのトークン消費が数百から数百万に急増し、インフラに変革を迫る。
Infinigence AIのトークン呼び出し量は2週間ごとに倍増し、全国平均を大きく上回る。

Deepseek、評価額約450億ドルに迫る—中国国営半導体ファンドが主導

2026-05-06 22:22 UTC+9

フィナンシャル・タイムズによると、Deepseekは約450億ドルの評価額となる資金調達ラウンドを近く実施する。中国国家集積回路産業投資基金（ビッグファンド）が主導し、テンセントも出資を協議中。創業者の梁文峰氏は個人投資も検討している。

Deepseekの評価額は約450億ドルに
中国国営半導体ファンドが主導

Show HN：トークン使用量メーター 12プロバイダーとコーディングエージェント

2026-05-06 01:03 UTC+9

qlaudは、コードエージェントqcode、ルーターAPIゲートウェイ、プラットフォーム管理バックエンドからなるフルスタックAIツールを発表。qcodeはデスクトップでローカル実行し、Claude、GPT、DeepSeek、Llamaなどの最先端モデルをサポート、コードのプライバシーを保護。

qcodeはローカル実行のコードエージェントで、複数の最先端モデルをサポート。
ルーターは統合APIを提供し、フェイルオーバーとレイテンシ監視を備える。

Amazon、SageMakerでLlama、Qwen、Deepseek、Novaをサポートするエージェント型ファインチューニングを提供

2026-05-05 19:08 UTC+9

Amazon SageMaker AIに、開発者が自然言語でユースケースを記述すると、適切なトレーニング手法を推奨し、データを準備し、トレーニングを開始し、編集可能なJupyterノートブックコードを提供するAIエージェントが搭載されました。Llama、Qwen、Deepseek、Novaなどのモデルファミリーをサポートします。

SageMaker AIにKiro AIエージェントが搭載され、自然言語でのファインチューニングが自動化されました。
エージェントは開発環境にプリインストールされており、Claude Codeなどの代替エージェントも使用可能です。

先週のAI #340 - OpenAI vs マスク + マイクロソフト、DeepSeek v4、ビジョンバナナ

2026-05-05 17:30 UTC+9

マスク対アルトマン裁判の初週が終了、マスクの証言が支配的；マイクロソフトとOpenAIが提携関係を再交渉し、独占権を終了；DeepSeekがV4プレビューを公開、最先端モデルとの差を縮小；Google DeepMindが画像生成と視覚理解を統合したビジョンバナナを発表。

マスク対アルトマン裁判初週で、マスクはxAIがOpenAIのモデルを部分的に蒸留したことを認めた。
マイクロソフトとOpenAIが契約を修正、マイクロソフトの独占的クラウド権利が終了；OpenAIはAWSなどのプロバイダーを利用可能に。

LWiAIポッドキャスト #243 – GPT 5.5、DeepSeek V4、AI安全性の妨害

2026-05-04 16:54 UTC+9

第243回エピソードでは、先週の主要AIニュースを要約し議論。OpenAIのGPT-5.5、xAIのGrok Voice Think Fast 1.0、DeepSeek V4のオープンソース化、GoogleのAnthropicへの巨額投資、妨害行為やドキュメント劣化に関する安全性研究などを取り上げた。

OpenAIがGPT-5.5を公開、コーディング能力が大幅に向上し、思考連鎖の監視可能性に関するシステムカードを同梱
xAIがGrok Voice Think Fast 1.0を発表、リアルタイム音声エージェントベンチマークでリード

DeepSeek

関連トピック