DeepSeek AI ニュース

ソース分布

Hacker News AI29
The Decoder5
量子位4
MarkTechPost3
AI Weekly1
Analytics Vidhya1
arXiv AI1
arXiv Machine Learning1

トピック分布

Agent37
モデル23
チップ22
研究15
政策6
スタートアップ2
ツール1

タイムライン

2026-05-263
2026-05-252
2026-05-272
2026-05-292
2026-06-032
2026-06-082
2026-06-202
2026-06-212

最新動向

2026年中期AIモデルティアリスト

2026-07-12 00:43 UTC+9

著者がコーディングと監査の経験に基づき、2026年中期の主要AIモデルを非公式にランク付け。Anthropic Fable、OpenAI Sol、Mistral、Gemini、DeepSeekを対象とし、米国の輸出規制や欧州の視点も含む。

Fable（Anthropic）はB評価：流暢だが信頼性に欠け、バグを隠す傾向がある。
Sol（OpenAI）はS評価：低レベルコードとテストで信頼できる。

DeepSeek V3.2がHugging Bayで公開

2026-07-11 10:44 UTC+9

DeepSeek V3.2がHugging Bayで利用可能になりました。Hugging Bayは、出所、ライセンス検証、信頼できるホスティングを提供するオープンソースAIアーティファクトレジストリです。

DeepSeek V3.2がHugging Bayで公開されました。
Hugging Bayは出所と信頼機能を備えたオープンレジストリです。

DeepSeek、自社AIチップ開発へ

2026-07-09 23:42 UTC+9

杭州に拠点を置くAIスタートアップDeepSeekが、NVIDIAとHuaweiへの依存を減らすため、自社推論チップの設計を進めている。コスト最適化と協調設計の強みを活かし、米国の輸出規制に対応する動きであり、AI価格競争を激化させる可能性がある。

DeepSeekは学習ではなく推論に特化したチップを開発中。
チップによりサービングコストを削減し、NVIDIAとHuaweiへの依存を低減。

DeepSeek DSpark：LLMを400%高速化する投機的デコードのトリック

2026-07-09 03:26 UTC+9

DeepSeekは、投機的デコードにおけるドラフト品質の低さと検証の無駄を同時に解決する半自己回帰ドラフトモデル「DSpark」を発表。DeepSeek-V4でユーザーあたりの生成速度を60～85%向上させ、品質は維持。本記事では、その仕組み、オープンソースのDeepSpecツールキット、実験結果を解説。

DSparkは並列速度と系列一貫性を両立する半自己回帰ドラフトモデルを採用。
マルコフヘッドがほぼ全ての利点を低オーバーヘッドで提供し、RNNヘッドよりも優先。

AIモデルが「考えすぎる」問題——それはセキュリティリスクである

2026-07-08 20:00 UTC+9

研究によると、推論能力を持つ大規模言語モデルは、論理的に一貫性のないプロンプトによって「考えすぎ」状態に陥り、出力長が急増し、サービス拒否攻撃に悪用される可能性があります。浙江大学とアリババの研究者は、進化的アルゴリズムを使用して悪意のあるプロンプトを生成し、DeepSeek-R1、Qwen3-Thinking、GPT-o3、Gemini 2.5 Flashといった主要な推論モデルで出力長を最大26倍に増加させました。

研究者は、AI推論モデルの「考えすぎ」脆弱性を悪用し、計算量を急増させる新たな攻撃を実証しました。
進化的アルゴリズムでプロンプトの論理構造を破壊し、通常の最大26倍の出力を引き起こします。

中国のAIモデルがコスト高騰で米国企業に浸透

2026-07-08 06:48 UTC+9

中国製のAIモデルが、米国の有力な競合との性能差を縮めつつ、大幅に低コストで利用できることから、米国企業の間で採用が進んでいる。DeepSeekやZ.aiなどの中国企業による最近のモデルリリースは、AnthropicやOpenAIなどの最先端システムと非常に競争力があると見なされている。これらの能力向上は、多くの米国AI研究所で最先端モデルのトークン価格が上昇し、企業がテクノロジー利用に関連する予想外の高コストに直面している時期に起きている。

中国のAIモデルは、米国のトップクラスとの性能差を縮めている。
DeepSeekやZ.aiなどの中国企業は、低コストで競争力のあるモデルを提供。

DeepSeek V4がエージェント型トークンシェアを獲得

2026-07-07 05:27 UTC+9

DeepSeek V4は2026年4月24日にリリースされ、OpenRouterでのトークンシェアを年初の9%から6月には18%に倍増させました。主な要因はエージェント型ワークロードです。コスト効率（100万トークンあたり入力0.09ドル、出力0.18ドル、対GPT-5.5は5ドル/30ドル）が多様なユーザーを引き付け、中国モデルが全体トークンシェアで米国モデルを上回っています。

DeepSeek V4はリリース後6か月でトークンシェアを9%から18%に倍増。
エージェント型ワークロードが主要な推進力で、V4-FlashがDeepSeekのエージェント型トークンの70%を占める。

NVIDIAの推論ソフトウェアスタックがどのように最低トークンコストを実現するか

2026-07-01 00:00 UTC+9

NVIDIAの推論ソフトウェアスタックは、GPU、CPU、ネットワーキング、システムと共同設計され、オープンソースエコシステムによって強化され、ハードウェアのパフォーマンスを継続的に向上させています。Blackwellプラットフォームでは、このソフトウェアスタックがわずか1か月でDeepSeek V4モデルのトークンコストを最大5倍削減しました。この記事では、ソフトウェアの最適化が運用、アプリケーションアクセラレーション、インフラアクセスの3つの層を通じてどのようにシステムレベルのパフォーマンス向上をもたらし、トークンあたりのコストを削減するかを詳しく説明しています。

NVIDIAのフルスタック推論ソフトウェアは、Blackwell上でDeepSeek V4のトークンコストを1か月で5倍削減。
Baseten、Cognition、Deep Infra、Together AIなどの企業がTensorRT-LLMやDynamoを活用して大幅な改善を達成。

AIニュース：今日は大きな出来事はなかった

2026-06-30 15:47 UTC+9

今日のAIニュースは比較的静かだったが、Metaの非侵襲型脳コンピューターインターフェースBrain2Qwerty v2、CursorのiOSリモートエージェントリリース、DeepSeekのDSpark投機的デコーディング技術、オープンウェイトモデルの商業的アクセス拡大、SnowflakeのArctic RLトレーニングインフラなど注目すべき進展があった。Redditコミュニティでは、2台のMacでGLM-5.2 753Bをローカル実行した事例が話題に。

MetaがBrain2Qwerty v2を発表、非侵襲型デコーダーがリアルタイムタイピングで約61%の単語精度を達成。
CursorがiOSアプリをリリース、常時稼働のクラウドエージェントとデスクトップエージェントの遠隔操作をサポート。

低コストの中国製AIモデルDeepSeekが米国で注目を集める

2026-06-30 00:15 UTC+9

米国の開発者や小規模企業はコスト削減のために中国のAIモデルに注目している。性能ではまだ米国のトップモデルに劣るものの、中国モデルはわずかなコストでほとんどのタスクを処理できる。MicrosoftもCopilotのより低コストな代替としてDeepSeekの利用を検討している。しかし、中国企業は政治的な監視のもとで人気を収益に変える課題に直面している。

米国の開発者がClaudeからDeepSeekに切り替え、コストが10ドルから50セント未満に。
中国モデルの低価格は国内の低賃金とインフラコストに起因。

DeepSeek、DSparkを発表：投機的デコードフレームワークでDeepSeek-V4のユーザーあたり生成速度を60～85%向上

2026-06-28 01:59 UTC+9

DeepSeekは、既存のDeepSeek-V4重みにドラフトモジュールを追加する投機的デコードフレームワークDSparkをオープンソース化しました。並列ドラフトバックボーンと軽量なマルコフヘッドを組み合わせてサフィックス減衰を抑制し、信頼度スケジュール検証によりGPU負荷に応じてチェックするトークン数を調整します。オフラインでは、DFlashやEagle3と比較して受理長が16～31%向上。本番環境では、MTP-1ベースラインと比較してユーザーあたり生成速度が57～85%向上し、損失はありません。トレーニングリポジトリDeepSpecはMITライセンスで提供されます。

DSparkは並列ドラフトバックボーンと軽量マルコフヘッドを組み合わせ、サフィックス受理率を向上。
信頼度スケジュール検証によりGPU負荷に応じてチェックトークン数を動的調整。

Golangで書かれたHacker NewsのネイティブTUIクライアント、AIコメント要約機能搭載

2026-06-28 01:04 UTC+9

cwnewsはターミナル用のHacker Newsリーダーで、6つのフィード、スレッドコメントの折りたたみ、3つのテーマ、DeepSeek V4 FlashによるAI要約を備えています。GoとBubbletea v2で構築され、すべてをSQLiteにキャッシュして高速アクセスを実現します。

Hacker Newsの6つのフィード（Top/New/Best/Ask/Show/Jobs）をサポートするターミナルUIクライアント。
折りたたみ可能なスレッドコメントと深さごとの色分けされたインデント。

DeepSeekが推論最適化をオープンソース化、生成速度が60～85%向上

2026-06-27 18:18 UTC+9

DeepSeekは、生成速度を60～85%向上させる推論最適化技術をオープンソース化しました。詳細は技術論文で公開されています。

DeepSeekが推論最適化を公開
生成速度が60～85%向上

cwmail: DeepSeek V4 ProベースのAI下書き機能を備えたGolang製ターミナルメールクライアント

2026-06-27 12:36 UTC+9

cwmailはGo言語とBubbletea v2で構築されたターミナルメールクライアントで、HTMLレンダリング、インライン画像表示、複数アカウントのIMAP管理、IDLEプッシュ通知、そしてDeepSeek V4 Proを利用したAI下書き機能を提供します。ローカル検索、削除の取り消し、下書きの自動保存、CLI送信モードなどの機能を備え、すべてのデータはローカルに保存され、SaaSに依存しません。

GoとBubbletea v2で開発され、ターミナル上で完全なメール管理を実現。
複数のIMAPアカウントを同時に管理し、IDLEプッシュ通知で新着メールを即座に受信。

DeepSeek Flashがエージェント製品の経済性を覆す

2026-06-26 07:56 UTC+9

DeepSeek Flashは、安価で高速なテキスト専用コード生成モデルを提供することで、開発者と大手AIラボ間の不適切な価格関係を打ち破る。エージェント構築者は高価なマルチモーダルAPIからオープンソースモデルへの切り替えが可能になり、コストを大幅に削減し、ブラウザエージェントのアーキテクチャを再構築する。

DeepSeek Flashはエージェントの経済性を覆し、開発者が競合他社を補助することを防ぐ。
モデルを作業者からコンパイラに変えることで、エージェントのワークフローが数十回のAPI呼び出しから1回の計画呼び出しに削減される。

DeepSeek-V4-Proを20秒でデプロイしました

2026-06-26 05:49 UTC+9

Inferizeは、DeepSeek-V4-Proモデルを20秒でデプロイし、非常に高速で効率的なLLM推論を実現したと発表。ウェイティングリストを開始しています。

InferizeがDeepSeek-V4-Proを20秒でデプロイ
高度に最適化された弾力的なAI推論を提供

百度、Unlimited OCRを公開：KVキャッシュを一定に保つ3Bパラメータモデルで長文書を解析

2026-06-25 14:39 UTC+9

百度はUnlimited OCRをオープンソース化しました。これは30億パラメータのMixture-of-Expertsモデルで、Reference Sliding Window Attention（R-SWA）によりKVキャッシュを一定に保ち、一度のフォワードパスで数十ページの文書を効率的に解析します。OmniDocBench v1.5で93.23を達成し、DeepSeek OCRベースラインを6.22ポイント上回り、MITライセンスで提供されます。

Unlimited OCRは30億パラメータのMoEモデルで、推論時は5億パラメータのみ活性化。
Reference Sliding Window Attention（R-SWA）によりKVキャッシュサイズが一定に保たれる。

Show HN：リアルなAI音声で電子書籍をオーディオブックに変換

2026-06-25 00:04 UTC+9

開発者は、オープンソースのKokoroモデルを使用して電子書籍をオーディオブックに変換するサービスebookaloudを構築しました。コードの99%はAI（DeepSeek v4）によってマルチエージェントワークフローで生成されました。従量課金制で、十分な品質を提供し、将来的には多言語対応やPDF抽出を計画しています。

オープンソースのKokoroモデルを使用し、疲れにくいリアルなAI音声を実現。
コードの99%はDeepSeek v4によるマルチエージェントコーディングで生成され、コストは12ドル。

より安価で安全なエージェント型AIワークフロー

2026-06-22 03:39 UTC+9

ある開発者がGLM-5.2やDeepSeek V4 Flashなどのモデルを使い、低コスト（0.034ドル）で効率的なエージェント型AIコーディングを実現し、VirtualBoxのサンドボックスでプライバシーを保護した経験を共有。具体的な手順、コスト比較、AI業界のビジネスモデルへの考察を述べている。

DeepSeek V4 Flashを使用したエージェントタスクが0.034ドル、3分で完了。人間は1時間で4つのミスを犯した。
VirtualBox内のDebian VMでエージェントを実行し、プロジェクトデータを隔離してプライバシーを保護。

Show HN: CommitGate – コミット中の脆弱性を自動スキャン

2026-06-22 00:35 UTC+9

CommitGate は AI を活用した Git のプリコミットセキュリティゲートで、git commit のたびにステージングされた差分を自動スキャンし、秘密情報や危険なコードが履歴に入る前にブロックします。Gitleaks による決定的スキャンと LLM によるセマンティック分析を組み合わせ、OpenAI、DeepSeek、Groq などの AI プロバイダーをサポートし、オプションで Splunk に監査ログを送信できます。

コミット前にステージングされた差分を自動スキャンし、高リスクコードをブロック。
Gitleaks で既知の秘密パターンを検出し、AI レビュアーが正規表現で見逃す脆弱性を捕捉。

AIモデルリリースペース分析：2つのラボが加速、3つは加速せず

2026-06-21 11:16 UTC+9

フロンティアAIモデルのリリースデータを分析した結果、AnthropicとOpenAIのリリースペースが加速している一方、Google、Meta、DeepSeekではそのような傾向は見られませんでした。本稿では再帰的自己改善仮説を検討し、検証可能なテストを提案します。

AnthropicとOpenAIのモデルリリースペースが加速しているが、他の3社では見られない。
加速の原因として、ラボが自社モデルを使って次世代モデルを構築する再帰的自己改善が考えられる。

74億ドルの見出しの先にあるもの：DeepSeekのシリーズAは中国AI連合のシフトを示す

2026-06-21 08:47 UTC+9

今週の3つのポイント：DeepSeekがテンセント主導で74億ドルのシリーズAを調達、中国のAI資金がエコシステム外のプレイヤーにシフト；日本は2040年までに650億ドルを物理的AIインフラに投資；智譜AIのGLM 5.2がAnthropicのClaudeをデザインベンチマークで上回る。

DeepSeekがテンセント主導で74億ドルのシリーズAを調達、アリババとByteDanceは不参加。
日本は2040年までに650億ドルの官民投資で物理的AIインフラを構築へ。

VibeThinker-3B：Qwen2.5-Coder-3Bを基盤とし、スペクトラムからシグナルへのポストトレーニングパイプラインを採用した3Bパラメータの高密度推論モデル

2026-06-20 07:06 UTC+9

VibeThinker-3Bはわずか30億パラメータのオープンソース推論モデルで、検証可能なベンチマークにおいてDeepSeek V3.2やKimi K2.5と同等の性能を発揮します。スペクトラムからシグナルへのポストトレーニングパイプライン（教師ありファインチューニング、強化学習、自己蒸留）を採用し、テスト時スケーリング手法CLRによりさらなる性能向上を実現します。

VibeThinker-3Bは3Bパラメータの高密度モデルで、MITライセンスで公開、Qwen2.5-Coder-3Bをベースに検証可能な推論に特化。
AIME26で94.3を記録し、671BのDeepSeek V3.2や1TのKimi K2.5と同等。

華為チップがDeepSeekモデルを微調整、中国のAI自立に大きな飛躍

2026-06-20 02:33 UTC+9

華為技術を含む研究チームは、同社のAscend 910Cチップを使用してDeepSeek-V4-Proモデルのポストトレーニングを完了しました。これは、中国の半導体産業が複雑なAIモデル訓練において重要な進歩を遂げたことを示します。プロジェクトでは少なくとも1000個のチップを使用し、1.6兆パラメータのモデルを全パラメータ調整し、国内チップの推論から訓練への能力移行を実証しました。米国の制裁下で中国のAI自給自足を強化する一歩です。

華為と研究機関がAscend 910CチップでDeepSeek-V4-Proのポストトレーニングに成功。
1000個以上のチップクラスターで1.6兆パラメータモデルを全パラメータ調整。

Show HN: Wolffish – OS向け個人デスクトップAIエージェント

2026-06-19 20:32 UTC+9

Wolffishは、インストール後すぐに使えるデスクトップAIエージェントで、サーバーや複雑な設定は不要。DeepSeek、GLM、Claude、GPTなどのモデルに対応し、完全オフラインでも動作。プライバシーとセキュリティを重視し、データはローカルに留まります。オープンソースで無料。

Wolffishはシンプルで使いやすいデスクトップAIエージェントです。
複数のAIモデル（DeepSeek、GLM、Claude、GPTなど）をサポートし、ローカルモデルも利用可能。

アトリビューション誘導とカバレッジ最大化による構造的MoE圧縮のためのプルーニング

2026-06-18 13:00 UTC+9

本論文では、混合エキスパート（MoE）モデル向けの構造的プルーニングフレームワークを提案する。プルーニング比率割り当てをチャネルスコアのカバレッジ最大化問題として再定式化し、アトリベーションベースの近似で効率的に解決する。DeepSeekおよびQwen MoEモデルでの実験により、50%または25%の構造的プルーニングと4ビット量子化を組み合わせても精度を維持し、Qwen3-30B-A3Bで5.27倍のメモリ削減を達成、既存手法を上回る。

MoEエキスパート内の情報は少数のチャネルに集中し、重要とみなされるエキスパートにも大きな冗長性があることを発見
チャネルレベルの構造的プルーニングフレームワークを提案し、プルーニング比率割り当てをカバレッジ最大化問題としてモデル化

ローカルLLMとDeepSeek v4に最適化されたベクトルメモリ搭載ネイティブコーディングエージェント

2026-06-17 07:36 UTC+9

cwcodeはGo言語で書かれたターミナルコーディングエージェントで、DeepSeek V4 Pro、Qwen3.6-27Bなどのモデルを活用します。ファイル編集、サブエージェント、セマンティックメモリ、自動復旧を提供。低コスト（約$0.40/時間）、高キャッシュヒット率（85%以上）、ハッシュアンカー編集、チェックポイント/巻き戻し、SaaSロックインなしが特徴。

Goベースのターミナルコーディングエージェント、DeepSeek V4 Pro、Qwen3.6-27Bなどをサポート
ハッシュアンカー編集とスティッキープレフィックスキャッシュでトークン消費とコストを削減

主要AIプラットフォームでのトークン使用量とサブスクリプション追跡

2026-06-14 13:09 UTC+9

Tokens 4 Breakfast は、Claude、OpenAI、Cursor、Copilot、Gemini、DeepSeek、Mistral などの主要AIプラットフォームにおけるトークン使用量、サブスクリプション費用、レート制限をリアルタイムで追跡するmacOSメニューバーアプリです。開発者が予期しない過剰支出を回避するためのアラート、予算設定、プロバイダー間の可視性を提供します。フリー版は1プロバイダー対応、Pro版は一括$7.99で全機能を解放します。

メニューバーにAI使用コスト、レート制限、サブスクリプション費用をリアルタイム表示。
Claude、OpenAI、Cursor など主要8プロバイダーに対応。

中国が西側AIモデルを締め出す一方、米国企業はDeepSeekに殺到

2026-06-13 11:51 UTC+9

中国国家安全部は西側AIモデルの利用にセキュリティリスクがあると警告。一方、米国企業はコスト面からDeepSeekなど中国製オープンソースモデルを積極採用。両国のユーザーは規制を迂回し、AIアクセス代理市場が活性化している。

中国国家安全部は、サードパーティツール経由の米国AIモデル利用がセキュリティリスクを伴うと警告
米国企業は低コストのためDeepSeekやAlibabaのQwenなどの中国モデルに殺到

Pythagoras-Prover: Augmented Lean Formalisationによる効率的な形式証明の進展

2026-06-12 13:00 UTC+9

Pythagoras-Proverは、4Bおよび32Bの自己回帰モデルと4Bの拡散モデルからなる、計算効率の高いLean定理証明器ファミリーです。段階的なカリキュラムSFTと動的証明フィルタリングにより訓練効率を向上させ、Augmented Lean Formalisation（ALF）を導入して検証コーパスを拡張します。実験では、4BモデルがMiniF2F-TestでDeepSeek-Prover-V2-671Bを上回り（86.1% vs 82.4%）、32Bモデルが93.0%でオープンソースの最高記録を達成し、PutnamBenchで93問を解決しました。

Pythagoras-Proverは4Bおよび32Bの自己回帰モデルと、推論時に証明を反復的に洗練する4B拡散モデルを含む。
難易度別に層別されたデータを用いたカリキュラムSFTと、8kトークンコンテキスト内での動的証明フィルタリングにより訓練効率を向上。

DeepSeekはAIを安くした——今、それを維持するために数十億ドルが必要

2026-06-08 21:36 UTC+9

DeepSeekは低コストAIモデルで業界を変えたが、米国評価では最新モデルが frontier に8ヶ月遅れている。同社は今、次のフェーズのために数十億ドルの資金調達を進めており、自ら作り出した資本競争に直面している。

CAISI評価：DeepSeek V4 Proは最も優れた中国モデルだが、米国 frontier より8ヶ月遅れ。
DeepSeekは約74億ドルを調達し、評価額は500〜600億ドルと報道される。

Deepseek、2026年6月にRampのトレンドソフトウェアベンダーでトップに - 米国企業はより安価なAIを追求

2026-06-08 01:06 UTC+9

2026年6月、DeepseekはRampの有料ソフトウェアベンダーとしてトップとなり、米国企業が直接データを送信するサービスになっています。Rampのチーフエコノミスト、Ara Kharazian氏はコスト意識の高まりを要因として挙げる一方、中国製モデルの使用に伴うセキュリティリスクを警告しています。

Deepseekは2026年6月にRampのトレンドソフトウェアベンダーで首位を獲得。
米国企業はコスト削減のためにDeepseekの有料AIサービスを利用。

ジョブサーチャー：AIによる就職活動支援ツール

2026-06-07 00:36 UTC+9

ジョブサーチャーは、新卒者のためのAI搭載求人検索アシスタントです。履歴書を分析し、LinkedIn検索クエリを自動生成し、スキル、経験、学歴、業界、年次ごとの適合度を5次元で評価します。教師モデルにDeepSeek V4 Pro、生徒モデルにQwen3-8Bを使用し、2,500件の履歴書と約10,000件の求人データで学習。オープンソースでHuggingFace Spaces上で利用可能です。

履歴書を基にしたLinkedIn検索クエリの自動生成と多次元スコアリング
DeepSeek V4 Pro（教師）とQwen3-8B（生徒）のモデル構成

DeepSWE の結果は信頼できない – 同一モデルで 3/3 の「失敗」タスクを解決

2026-06-05 01:32 UTC+9

DeepSWE ベンチマークの監査により、deepseek-v4-pro の報告結果（解決率 8%、平均コスト 4.22 ドル）が複数の問題により無効であることが判明：キャッシュ価格設定を無視した結果コストが約 5 倍に膨らみ、報告された 3 つの失敗タスクすべてが同一モデルで解決され、OpenRouter のプライバシー設定が DeepSeek をデフォルトでブロックし、モデルに推論努力の調整が行われていませんでした。

コストが約 5 倍に膨張：ベンチマークは全入力トークンをキャッシュミス率で課金し、78% のキャッシュヒット（99.2% 割引）を無視。
3 つの「失敗」タスクすべてを同一モデル deepseek-v4-pro で解決、総コスト約 0.86 ドル。

米国企業、高額なシリコンバレーAIから中国DeepSeekへとシフト

2026-06-04 16:18 UTC+9

中国のAIスタートアップDeepSeekが6月の米国企業支出指数でトップとなり、OpenAIやAnthropicなどの高額な米国製品からより手頃な中国モデルへの乗り換えが進んでいる。

DeepSeekがRampの6月のトレンドソフトウェアベンダーリストで首位に立ち、PheedLoopやFireworks AIを上回った。
米国企業がDeepSeekに直接支払い、データを中国のサーバーに送信しており、コスト効率の良いAIを求めている。

DigitalOceanがOpenRouterのAIモデルプロバイダーに

2026-06-03 17:25 UTC+9

DigitalOceanはXへの投稿で、OpenRouterのモデルプロバイダーとなり、DeepSeek V3.2、Kimi K2.6、DeepSeek V4 Flashを提供すると発表した。この動きは、同社がクラウドインフラからAI推論へと事業を拡大していることを示している。

DigitalOceanがXでOpenRouterのモデルプロバイダーになると発表
最初のモデルはDeepSeek V3.2、Kimi K2.6、DeepSeek V4 Flash

Dropstone 1.5：月額15ドルでClaude Codeの2倍の使用量

2026-06-03 12:59 UTC+9

Dropstone 1.5はターミナルで動作するAIコーディングエージェントです。毎月トップモデルをテストし、最良のものに切り替えます。現在はDeepSeekとKimiモデルを採用し、米国サーバーでホスト、データは保存しません。月額15ドルで週約450回の深いコーディングセッションを提供し、Claude Code Pro（20ドル）の約2倍の使用量です。安全性を重視し、全操作に許可が必要です。

月額15ドルで週約450回の深いコーディングセッション、Claude Code Proの2倍。
DeepSeek V4 Flash、V4 Pro、Kimi K2.6モデルを使用、米国サーバーでホスト、データ保存なし。

Show HN: Tkcore AI – カスタム知識グラウンディングを備えたマルチモデルワークスペース

2026-06-02 16:26 UTC+9

Tkcore AIは、DeepSeek、Qwen、GLM、Kimi、MiniMaxなどの多様なAIモデルを統合したマルチモデルワークスペースで、低遅延応答、長コンテキスト、マルチモーダル入力、ファイルアップロードによるカスタム知識グラウンディングを提供します。

DeepSeek、Qwen、GLM、Kimi、MiniMaxの各モデルをサポートし、多様なタスクに対応。
低遅延・高スループットのテキスト処理と画像/動画などのマルチモーダル機能。

新たなレビュー論文が主張：AIエージェントが考え行動する仕組みはコードにある——単なる出力ではなく

2026-05-29 22:10 UTC+9

新しいレビュー論文は、自律型AIエージェントの真のボトルネックは言語モデル自体ではなく、その周りのソフトウェア層（ツール、メモリ、テスト、権限境界）であると主張しています。Deepseekは北京に専用の「Harness」チームを立ち上げ、モデル＋ハーネス＝AIエージェントという公式を確認しています。

論文は、AIエージェントのボトルネックはモデルではなくソフトウェアハーネスにあると指摘。
ツール、メモリ、テスト、権限管理が重要な要素。

PPIO、非凡産研「2026 Global AI 100」に選出、AIで海外展開の新潮流をリード

2026-05-29 20:24 UTC+9

PPIO は非凡産研が発表した「2026 Global AI 100」リストに選ばれました。このリストは非凡大賞 – 年次 AI グローバリゼーション成長サミットで選定され、グローバルな AI ネイティブ企業を表彰するものです。PPIO はグローバル分散型コンピューティングインフラ、フルスタッククラウドサービス、DeepSeek・GLM などのモデルプラットフォーム、革新的なエージェントサンドボックスを提供。2026年4月時点で4,800以上の分散ノードを統合し、日次トークン呼び出しは1兆回超、開発者は57万人超。また、上海市デジタル海外サービスプラットフォームのパイロットユニットやGDAパイロットサービスステーションにも選ばれています。

PPIO が「2026 Global AI 100」に選出、AIグローバル化のリーダーシップを示す。
全GPU構成をカバーするグローバル分散コンピューティングインフラを提供。

Show HN: Python AIエージェントとVueダッシュボードを1つのElectronアプリにパッケージ化しました

2026-05-28 19:12 UTC+9

Hermes Desktopは、Pythonランタイム、hermes-agent（自己改善型AIエージェント）、hermes-web-ui（Vue 3 + Koaのチャットダッシュボード）を1つのElectronアプリにバンドルしたクロスプラットフォームデスクトップアプリです。ユーザーはPythonやNodeを個別にインストールする必要がなく、DingTalkと統合され、DeepSeekを搭載しています。

Pythonランタイムとhermes-agentをバンドルし、依存関係不要で動作
Electronシェルを使用し、hermes-web-uiフロントエンドを統合

DeepSeekの陳德里氏が自動研究スキルを開発、論文作成における人間の作業はわずか2時間

2026-05-27 10:14 UTC+9

DeepSeekの研究者である陳德里氏は、自身が開発したDeliAutoResearchスキルを用いて、DeepSeek-V4-ProとGPT-Image2と協力し、わずか6日間で46ページの論文を完成させた。この論文は、研究エージェントの自律性をL1～L5に分類する枠組みを提案し、4つのアーキテクチャパターンと17の主流システムを分析、6つの未解決問題を指摘している。陳氏によると、人間の「CPU時間」はわずか2時間未満であり、残りはAIエージェントが担当した。

陳德里氏のDeliAutoResearchスキルにより、論文の99%がAIエージェントによって執筆された。
論文は、自動運転のSAEレベルに類似した研究エージェントの自律性分類（L1～L5）を提案。

AIウィークリー第496号：Anthropicの国防総省モデルが今や誰でも使える

2026-05-27 09:00 UTC+9

今週のAIニュース：Anthropicがこれまで政府契約業者限定だったMythosモデルを公開、国防総省級AIが誰でも利用可能に。DeepMindのDemis HassabisはAGI実現時期を2029年に前倒し。Starletteフレームワークに重大な認証バイパス脆弱性、数百万のAIエージェントに影響。CrowdStrikeらがGlasswormボットネットを共同撃滅。BNPパリバがMistralと主権AIセキュリティ提携、中国はAlibabaとDeepSeekのトップAIエンジニアの海外渡航を制限。UberはAIトークン予算を4ヶ月で使い切り、ClickUpは2200人を解雇して3000の内部AIエージェントを導入。一方、MITテクノロジーレビューはAI露出職種の失業率が低いと報告、Altmanはホワイトカラー消滅予測を撤回。

AnthropicがMythosモデルを公開、NSAや国防総省の能力が標準APIで利用可能に。
DeepMindのハサビスCEOがAGI実現を2029年と明言、AlphaProof Nexusの成果を根拠に。

中国、トップAI研究者の海外渡航に許可を義務化との報道

2026-05-26 23:25 UTC+9

中国は、AlibabaやDeepSeekなどの民間企業に所属するトップAI研究者に対し、海外渡航前に政府の許可を得ることを義務付けると報じられている。北京はデータ漏洩や技術盗難、人材引き抜きを懸念し、国内AI産業への統制を強めている。

中国はトップAI研究者に対し、海外渡航前に許可を得ることを義務付けた。
この方針はAlibabaやDeepSeekなどの民間企業に適用される。

DSA注意機構をマルチモーダルに導入、快手Keye2.0が強化推論の新パラダイムを開く

2026-05-26 19:17 UTC+9

快手はKeye-VL-2.0-30B-A3Bを発表。DSA（DeepSeek Sparse Attention）をマルチモーダルに初めて適用し、256Kの超長コンテキスト深層認識を実現。長編動画の時間的理解ベンチマークでSOTAを達成し、Agent協調メカニズムを内蔵。業務応用にも展開中。

DSAをマルチモーダルに導入し、長編動画理解のボトルネックを解消
TimeLensなどのベンチマークでSOTA達成、長コンテキストでも精度が逆転向上

Cited AI Workspace: ファイルの再アップロードは不要

2026-05-26 11:18 UTC+9

UUMuseはクラウド型AIナレッジベースプラットフォームで、ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなどのモデルで引用付きの回答、コンテンツ生成、デプロイが可能。APIやMCPを介してエージェントやアプリからも呼び出せます。永続的なメモリ、マルチエキスパート討論（Spark）、エージェントモード、ドキュメントサイト・API・MCPサーバーとしての展開機能を備えています。

ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなど複数のAIモデルが出典を引用して回答。
AIがユーザーの文体やプロジェクトコンテキストを記憶し、会話間で引き継ぐ永続メモリ。

DeepSeek V4がさらに安く！新ツールのキャッシュヒット率99.82％で2割安定

2026-05-25 13:40 UTC+9

DeepSeek V4シリーズリリースから1ヶ月、オープンソースコミュニティがReasonixツールを公開。DeepSeek専用に設計され、キャッシュ効率を最大化することでAPIコストを約5分の1に削減。キャッシュヒット率99.82％を達成し、4億+トークンの請求額が61ドルから12ドルに。

ReasonixはDeepSeek専用のコーディングハーネスで、コスト削減が目的。
キャッシュ優先ループ、ツール呼び出し修復、自動コンテキスト圧縮により長いセッションでも90％以上のキャッシュヒット率を維持。

Lynote Humanize Text – オープンソースAIテキスト人間化ツールキット

2026-05-25 12:09 UTC+9

Lynote Humanize Textは、AI生成テキストを検出されにくい人間らしい文章に変換するオープンソースツールキットです。プロダクション対応のStandard Pipelineは、DeepSeekによるマルチステップ書き換えと翻訳エンジンの組み合わせでTurnitinやGPTZeroなどの検出器をバイパスします。リポジトリには参考実装やn8nワークフローサポートが含まれ、専門家評価で9.1/10の品質スコアと100%の情報保持率を達成しました。Lynote.aiプラットフォームではAdvancedおよびFocus層を追加し、テキストごとに最適な手法を自動選択します。

オープンソースのAIテキスト人間化ツール、主要なAI検出器を回避。
プロダクション対応のStandard Pipelineは5ステップのチェーン（DeepSeek書き換え+複数エンジン翻訳）。

Deepseek、75％割引を恒久化、出力トークンはGPT-5.5の34分の1以下に

2026-05-24 02:10 UTC+9

Deepseekは、最高モデルV4-Proの75％割引を恒久的なものにすると発表した。入力トークンは100万トークンあたり0.435ドルで、GPT-5.5より少なくとも11.5倍安く、出力トークンでは34倍以上安い。トークンを大量に消費するエージェントシステムにとって、この価格設定は西側プロバイダーを厳しく圧迫する可能性がある。

DeepseekがV4-Proの75％割引を恒久化。
入力トークン価格は0.435ドル/100万トークンで、GPT-5.5の11.5分の1。

アリババ、最新AIモデルが35時間自律稼働し自社チップのコード最適化

2026-05-23 19:17 UTC+9

アリババのQwenチームがQwen3.7-Maxをリリース。長時間の自律エージェントタスク向けに設計された独自モデルで、ベンチマークでClaude Opus 4.6に匹敵し、DeepSeek V4 ProやKimi K2.6などの中国競合を上回る。また、モデルが四足ロボットを操縦するデモも公開。

Qwen3.7-Maxは長時間自律タスク向け
ベンチマークでClaude Opus 4.6に匹敵、中国競合を凌ぐ

DeepSeek