AI News HubLIVE

ソース分布

  • Hacker News AI12
  • 量子位12
  • The Decoder7
  • arXiv Machine Learning3
  • AI Weekly2
  • arXiv AI2
  • Last Week in AI2
  • Latent Space2

トピック分布

  • Agent33
  • モデル27
  • チップ25
  • 研究14
  • 政策10
  • スタートアップ5
  • ツール3
  • ロボット1

タイムライン

  • 2026-05-088
  • 2026-05-234
  • 2026-05-053
  • 2026-05-263
  • 2026-05-042
  • 2026-05-092
  • 2026-05-112
  • 2026-05-132

最新動向

Show HN: Python AIエージェントとVueダッシュボードを1つのElectronアプリにパッケージ化しました

Hermes Desktopは、Pythonランタイム、hermes-agent(自己改善型AIエージェント)、hermes-web-ui(Vue 3 + Koaのチャットダッシュボード)を1つのElectronアプリにバンドルしたクロスプラットフォームデスクトップアプリです。ユーザーはPythonやNodeを個別にインストールする必要がなく、DingTalkと統合され、DeepSeekを搭載しています。

  • Pythonランタイムとhermes-agentをバンドルし、依存関係不要で動作
  • Electronシェルを使用し、hermes-web-uiフロントエンドを統合
サイト内本文

DeepSeekの陳德里氏が自動研究スキルを開発、論文作成における人間の作業はわずか2時間

DeepSeekの研究者である陳德里氏は、自身が開発したDeliAutoResearchスキルを用いて、DeepSeek-V4-ProとGPT-Image2と協力し、わずか6日間で46ページの論文を完成させた。この論文は、研究エージェントの自律性をL1~L5に分類する枠組みを提案し、4つのアーキテクチャパターンと17の主流システムを分析、6つの未解決問題を指摘している。陳氏によると、人間の「CPU時間」はわずか2時間未満であり、残りはAIエージェントが担当した。

  • 陳德里氏のDeliAutoResearchスキルにより、論文の99%がAIエージェントによって執筆された。
  • 論文は、自動運転のSAEレベルに類似した研究エージェントの自律性分類(L1~L5)を提案。
サイト内本文

AIウィークリー第496号:Anthropicの国防総省モデルが今や誰でも使える

今週のAIニュース:Anthropicがこれまで政府契約業者限定だったMythosモデルを公開、国防総省級AIが誰でも利用可能に。DeepMindのDemis HassabisはAGI実現時期を2029年に前倒し。Starletteフレームワークに重大な認証バイパス脆弱性、数百万のAIエージェントに影響。CrowdStrikeらがGlasswormボットネットを共同撃滅。BNPパリバがMistralと主権AIセキュリティ提携、中国はAlibabaとDeepSeekのトップAIエンジニアの海外渡航を制限。UberはAIトークン予算を4ヶ月で使い切り、ClickUpは2200人を解雇して3000の内部AIエージェントを導入。一方、MITテクノロジーレビューはAI露出職種の失業率が低いと報告、Altmanはホワイトカラー消滅予測を撤回。

  • AnthropicがMythosモデルを公開、NSAや国防総省の能力が標準APIで利用可能に。
  • DeepMindのハサビスCEOがAGI実現を2029年と明言、AlphaProof Nexusの成果を根拠に。
サイト内本文

中国、トップAI研究者の海外渡航に許可を義務化との報道

中国は、AlibabaやDeepSeekなどの民間企業に所属するトップAI研究者に対し、海外渡航前に政府の許可を得ることを義務付けると報じられている。北京はデータ漏洩や技術盗難、人材引き抜きを懸念し、国内AI産業への統制を強めている。

  • 中国はトップAI研究者に対し、海外渡航前に許可を得ることを義務付けた。
  • この方針はAlibabaやDeepSeekなどの民間企業に適用される。
サイト内本文

DSA注意機構をマルチモーダルに導入、快手Keye2.0が強化推論の新パラダイムを開く

快手はKeye-VL-2.0-30B-A3Bを発表。DSA(DeepSeek Sparse Attention)をマルチモーダルに初めて適用し、256Kの超長コンテキスト深層認識を実現。長編動画の時間的理解ベンチマークでSOTAを達成し、Agent協調メカニズムを内蔵。業務応用にも展開中。

  • DSAをマルチモーダルに導入し、長編動画理解のボトルネックを解消
  • TimeLensなどのベンチマークでSOTA達成、長コンテキストでも精度が逆転向上
サイト内本文

Cited AI Workspace: ファイルの再アップロードは不要

UUMuseはクラウド型AIナレッジベースプラットフォームで、ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなどのモデルで引用付きの回答、コンテンツ生成、デプロイが可能。APIやMCPを介してエージェントやアプリからも呼び出せます。永続的なメモリ、マルチエキスパート討論(Spark)、エージェントモード、ドキュメントサイト・API・MCPサーバーとしての展開機能を備えています。

  • ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなど複数のAIモデルが出典を引用して回答。
  • AIがユーザーの文体やプロジェクトコンテキストを記憶し、会話間で引き継ぐ永続メモリ。
サイト内本文

DeepSeek V4がさらに安く!新ツールのキャッシュヒット率99.82%で2割安定

DeepSeek V4シリーズリリースから1ヶ月、オープンソースコミュニティがReasonixツールを公開。DeepSeek専用に設計され、キャッシュ効率を最大化することでAPIコストを約5分の1に削減。キャッシュヒット率99.82%を達成し、4億+トークンの請求額が61ドルから12ドルに。

  • ReasonixはDeepSeek専用のコーディングハーネスで、コスト削減が目的。
  • キャッシュ優先ループ、ツール呼び出し修復、自動コンテキスト圧縮により長いセッションでも90%以上のキャッシュヒット率を維持。
サイト内本文

Lynote Humanize Text – オープンソースAIテキスト人間化ツールキット

Lynote Humanize Textは、AI生成テキストを検出されにくい人間らしい文章に変換するオープンソースツールキットです。プロダクション対応のStandard Pipelineは、DeepSeekによるマルチステップ書き換えと翻訳エンジンの組み合わせでTurnitinやGPTZeroなどの検出器をバイパスします。リポジトリには参考実装やn8nワークフローサポートが含まれ、専門家評価で9.1/10の品質スコアと100%の情報保持率を達成しました。Lynote.aiプラットフォームではAdvancedおよびFocus層を追加し、テキストごとに最適な手法を自動選択します。

  • オープンソースのAIテキスト人間化ツール、主要なAI検出器を回避。
  • プロダクション対応のStandard Pipelineは5ステップのチェーン(DeepSeek書き換え+複数エンジン翻訳)。
サイト内本文

Deepseek、75%割引を恒久化、出力トークンはGPT-5.5の34分の1以下に

Deepseekは、最高モデルV4-Proの75%割引を恒久的なものにすると発表した。入力トークンは100万トークンあたり0.435ドルで、GPT-5.5より少なくとも11.5倍安く、出力トークンでは34倍以上安い。トークンを大量に消費するエージェントシステムにとって、この価格設定は西側プロバイダーを厳しく圧迫する可能性がある。

  • DeepseekがV4-Proの75%割引を恒久化。
  • 入力トークン価格は0.435ドル/100万トークンで、GPT-5.5の11.5分の1。
サイト内本文

アリババ、最新AIモデルが35時間自律稼働し自社チップのコード最適化

アリババのQwenチームがQwen3.7-Maxをリリース。長時間の自律エージェントタスク向けに設計された独自モデルで、ベンチマークでClaude Opus 4.6に匹敵し、DeepSeek V4 ProやKimi K2.6などの中国競合を上回る。また、モデルが四足ロボットを操縦するデモも公開。

  • Qwen3.7-Maxは長時間自律タスク向け
  • ベンチマークでClaude Opus 4.6に匹敵、中国競合を凌ぐ
サイト内本文

DeepSeek V4、価格を恒久的に大幅値下げ、CATL・JD・NetEaseが投資に殺到、梁文鋒氏:目標はAGI

DeepSeekはV4-Pro APIの恒久的な値下げを発表。同時に、CATL、JD、NetEaseなどが同社初の資金調達ラウンドへの出資を協議中。創業者の梁文鋒氏はAGIの追求とオープンソース路線の継続を約束。

  • DeepSeek V4-Pro APIが恒久的に元の価格の4分の1に値下げ
  • CATL、JD、NetEaseなどがDeepSeekへの投資を協議
サイト内本文

【AINews】すべてのモデルラボは今やエージェントラボ

OpenAIのIPO申請を前に、業界の巨人たちが純粋なモデルからエージェント製品へとシフトしている。DeepSeekが永久75%値下げ、MCPプロトコルがステートレス化、Googleが年中無休のAIエージェントを発表、Anthropicが1万以上の脆弱性を発見。エージェント化が新たな常識に。

  • Greg Brockman氏、モデル単体はもはや製品ではなく、ハーネス+エージェント+ワークフローが重要と発言
  • DeepSeek V4 Proが永久75%値下げ、推論コストを大幅削減
サイト内本文

700億円調達!DeepSeek Codeが登場へ、ACM金メダリスト崔添翼が指揮

DeepSeekは700億元を調達し、自社のAIコード製品「DeepSeek Code」を開発中。シニア研究員のDeli ChenがCode Harnessチームの採用を呼びかけ、元TSY Capital共同創業者の崔添翼がチーム責任者に就任する可能性が高い。

  • DeepSeekが700億元を調達し、AI研究を優先。
  • DeepSeek Codeの開発が確認され、Agent Harnessチームを採用中。
サイト内本文

非公開DeepSeek API用の非同期Pythonクライアント

aiodeepseekは非公開DeepSeek API向けの高性能非同期Pythonクライアントで、ストリーミング、画像アップロード、マルチターン会話、新規アカウント登録をサポートします。C++とAVX2最適化によりProof-of-Workを自動解決します。

  • ストリーミング出力と画像アップロードをサポートする非同期Pythonクライアント
  • マルチターン会話とアカウント登録機能
サイト内本文

平坦性に基づく理論的最適量子化

本論文は、外れ値分布を定量化する新しい指標「平坦性」を導入し、それに基づく理論的最適解を導出する。さらに、双方向対角量子化(BDQ)フレームワークを提案し、学習された対角操作により外れ値を行列次元に分散させることで、低ビット量子化の性能を大幅に向上させる。実験では、LLaMA-3-8BのW4A4量子化で精度低下が1%未満、DeepSeek-R1-Distill-LLaMA-70BのW2A4KV16で性能ギャップを39.1%削減した。

  • 外れ値分布を定量化する平坦性指標と理論的最適解の導出
  • BDQフレームワークによる双方向対角変換での外れ値分散
サイト内本文

HELLoRA: 混合エキスパートモデルのためのホットエキスパート層レベル低ランク適応

HELLoRAは、混合エキスパート(MoE)モデル向けのパラメータ効率的なファインチューニング手法で、各層で最も頻繁に活性化されるエキスパートにのみLoRAモジュールを付加する。これにより、学習可能パラメータとアダプターのFLOPsを削減しつつ、下流タスクの性能を向上させる。OlMoE、Mixtral、DeepSeekMoEで数学、コード、安全性タスクにおいて評価され、例えばOlMoEでは通常のLoRAの15.7%のパラメータで9.2%高い精度を達成した。

  • HELLoRAはMoEモデルの各層で最も活性化されたエキスパートにのみLoRAを適用する。
  • 大幅に少ないパラメータとFLOPsで優れた性能を発揮する。
サイト内本文

2025年のトップ10 AI研究論文

2025年のAI研究はチャットボットから推論システム、自律エージェント、マルチモーダルシステムへと移行しました。主要な論文には、DeepSeek-R1(強化学習)、Gemini 2.5(マルチモーダル推論)、Qwen2.5(オープンモデル)、Large Concept Models(概念レベルの言語モデリング)、グリーンウォッシング対策のESG分析、VideoWorld(世界モデル)、AI Scientist-v2(自律研究)、SWE-Lancer(コーディングエージェントベンチマーク)、OLMo 2(完全オープン言語モデル)、Mixture-of-Recursions(効率的推論)が含まれます。

  • DeepSeek-R1は強化学習によるポストトレーニングを公開し、推論とコーディング能力を大幅に向上。
  • Gemini 2.5は「シンキングモード」を導入し、マルチモーダル理解と長いコンテキストを拡張。
サイト内本文

GQLA: ハードウェア適応型大規模言語モデル復号のためのグループクエリ潜在注意

研究者らは、DeepSeekのマルチヘッド潜在注意(MLA)を改良したグループクエリ潜在注意(GQLA)を提案。再学習なしで2つのハードウェア適応型復号パスを提供し、H100およびH20 GPU上で効率的な推論を可能にする。また、事前学習済みGQAモデルを変換するTransGQLAも含む。

  • GQLAはDeepSeekのMLAを拡張し、デュアル復号パス(MQA吸収パスとGQAパス)を持ち、異なるハードウェアのルーフラインに適応する。
  • 単一のGQLA重みセットをH100(MQAパス)またはH20(GQAパス+マルチトークン予測)で使用可能。
サイト内本文

最新オープンアーティファクト(#21):オープンモデル大豊作!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1など。CAISIのV4評価について。

今月はオープンフロンティアラボから次々に新モデルがリリースされました。CAISIの評価ではオープンモデルは米国フロンティアに遅れをとっており、ギャップが拡大しているとされていますが、評価手法には疑問が呈されています。注目モデルとしてMiMo-V2.5-Pro、Gemma-4、Kimi-K2.6、Laguna-XS.2、DeepSeek-V4-Flashなどが紹介されています。

  • DeepSeek、Google、Moonshot AI、Xiaomiなどから複数のオープンモデルがリリース。
  • CAISIの評価ではEloスコアに大きな差があるが、ベンチマーク手法に批判あり。
サイト内本文

LLMアーキテクチャの最新動向:KV共有、mHC、圧縮注意機構

Gemma 4からDeepSeek V4まで、新しいオープンウェイトLLMがクロスレイヤーKV共有、レイヤー別埋め込み、注意予算、圧縮畳み込み注意、mHCなどを通じて長コンテキストコストを削減する方法を探る。

  • Gemma 4はクロスレイヤーKV共有を導入し、品質を維持しながらKVキャッシュサイズを半減。
  • レイヤー別埋め込み(PLE)は、計算オーバーヘッドを最小限に抑えながらモデル容量を向上。
サイト内本文

異なるモデルが数論競走問題を解決

AIボットコンテストで、参加者は回文素数の2進展開における最長連続1ビットの長さを計算しました。DeepSeek V4-Proが73点で優勝し、ChatGPTとGrokは事前計算の解釈誤りにより未参加となりました。Kimiはバグにより初期ラウンドで偶然正解し、最終ラウンドで勝利しました。本記事では各ボットの戦略、アルゴリズムの詳細、および結果を詳しく分析します。

  • DeepSeekが73点で1位、Claudeが60点、GLMが40点で続く。
  • ChatGPTとGrokは接続前に事前計算を行い、10秒の登録ウィンドウを逃して未参加に。
サイト内本文

DeepSeek V4 ProとFlashをClaude Opus 4.7およびKimi K2.6と比較テスト

DeepSeek V4 ProとFlashを、Claude Opus 4.7やKimi K2.6と同じFlowGraphベンチマークで評価しました。Proは77/100(コスト$2.25)でOpus(91)とKimi(68)の中間、Flashは60/100(コスト$0.02)で史上最安値ですが、ビルドに失敗し重要な出力が欠けていました。両モデルにリース期限切れのバグがありましたが、Flashはツール呼び出しの信頼性で期待以上でした。全体的にOpusが依然最強ですが、DeepSeekの価格設定はコスト状況を大きく変えました。

  • DeepSeek V4 Proは77/100($2.25)で、Kimi K2.6(68)を上回り、Claude Opus 4.7(91)に次ぐ。
  • DeepSeek V4 Flashは60/100($0.02)で過去最低コストだが、ビルドとルーティングに重大な問題。
サイト内本文

Violin:言語の壁を破るオープンソースの動画翻訳スキル

Violinは、音声認識、大規模言語モデル翻訳、音声合成を組み合わせた完全オープンソースのAI動画翻訳ツールです。ウェブアプリ、CLI、エージェントスキルを提供し、動画コンテンツに関する質問応答やパーソナライズされた音声選択が可能です。Together APIを基盤とし、Whisper、DeepSeek、Cartesiaなどのモデルを利用し、MITライセンスで公開されています。

  • ViolinはASR、LLM翻訳、TTSを統合したオープンソースの動画翻訳ツール。
  • ウェブアプリ、CLI、エージェントスキルをサポート。
サイト内本文

テンセント、中国のチップ供給改善を受けてAI支出を増強へ

テンセントは2026年下半期にAIインフラ支出を大幅に増加させる計画を発表した。中国の半導体メーカーが国内AIチップの生産を拡大していることが背景にある。同社はまた好調な第1四半期決算を発表し、AIスタートアップDeepseekへの出資交渉を行っている。

  • テンセントは2026年下半期にAIインフラ支出を増加させる。
  • 中国半導体メーカーが国内AIチップ生産を拡大。
サイト内本文

米国はAI競争で勝利している

米国は商業化の分野でAI競争に勝っており、強力なクラウドインフラ、データプラットフォーム、エネルギー優位性を持っている。中国のDeepSeekのような競争相手はいるが、米国は収益、採用、ツール、リーチで明らかにリードしている。欧州はクラウド規模とエコシステムに欠け、追いつくのは難しい。AI競争は安全保障競争でもあり、兵器化されたAIとクローズドスタックへの移行を含む。

  • 2025年1月のDeepSeek R1の衝撃以来、米国企業はAI商業化を加速し、収益、採用、ツールでリードしている。
  • 米国はAWS、Azure、Google Cloudなどのグローバルハイパースケーラーと、YouTubeやGitHubなどのデータプラットフォームを所有し、完全なAIエコシステムを構築している。
サイト内本文

AIの健康回答の半数が誤っている、説得力があるように聞こえても――新研究

BMJ Openに掲載された新たな研究では、5つの人気AIチャットボット(ChatGPT、Gemini、Grok、Meta AI、DeepSeek)を50の健康質問でテストしたところ、回答の約20%が高度に問題あり、半数が問題あり、30%がやや問題ありと評価された。Grokが最悪の成績で、オープンエンドの質問は特にリスクが高かった。研究は、AIを医療の権威として扱わず、情報を検証する必要性を強調している。

  • 研究ではChatGPT、Gemini、Grok、Meta AI、DeepSeekの5つのボットに各50の健康質問を実施。
  • 回答の約20%が高度に問題あり、半数が問題あり、30%がやや問題ありと評価された。
サイト内本文

ノートPCでのローカルAIの2年:オープンモデルがムーアの法則を超えた

2024年5月から2026年5月まで、最も高価なMacBook Proのメモリは128GBのままで、ハードウェアはほとんど変わりませんでした。しかし、その上で動作する最もスマートなオープンウェイトモデルの人工分析知能指数スコアは10から47(DeepSeek V4 Flash)に上昇し、4.7倍の向上、10.7ヶ月ごとに倍増し、ムーアの法則の2倍以上のペースでした。進歩は、スパース混合専門家モデル、積極的な量子化、推論調整された小型高密度モデルによるものです。

  • 128GB MacBook Pro上のオープンウェイトAIモデルの知能指数が24ヶ月で4.7倍に向上、倍加速度はムーアの法則を超える。
  • 2つの不連続点:スパースMoEモデル(gpt-oss-120Bなど)と小型高密度推論モデル(Qwen3.6 27Bなど)。
サイト内本文

思考すればするほど偏りが増す:推論モデルにおける長さ駆動型位置バイアス

本研究は、チェーン・オブ・ソート推論がバイアスを低減するという一般的な前提に反し、多肢選択問題において推論軌跡が長くなるほど位置バイアス(回答選択肢の位置に対する偏好)が強まることを示す。13の設定のうち12で、軌跡長と位置バイアススコア(PBS)の間に正の部分相関が確認され、切断実験により因果関係が実証された。671BのDeepSeek-R1では全体のバイアスは低いが、最長四分位では効果が持続する。直接回答の位置バイアスは独立した現象である。これらの結果は、推論モデルを選択肢順序に対してロバストと見なすべきではないことを示唆し、診断ツールキットを提供する。

  • 推論軌跡の長さと位置バイアススコア(PBS)の間に正の相関が、複数のモデルで確認された。
  • 切断実験により、長い推論が位置偏好オプションへのシフトを増加させることが示された(R1-Qwen-7Bで16%から32%)。
サイト内本文

シーケンスレーダー #857:今週のAI:マシンの内側、テキストボックスの外側

今週のAIは、科学化、製品化、投機化が同時に進む市場の様相を示した。Anthropicは自然言語オートエンコーダを発表し、モデルの内部状態を言語で解釈する新手法を提案。OpenAIは新しい音声モデルでAIをネイティブインターフェースへと押し上げる。SubQは1200万トークンのコンテキストウィンドウを主張し、RAGアーキテクチャに挑戦。DeepSeekやMoonshotなどの中国AIラボの評価額が急騰し、市場はAIを戦略的資産として捉えている。全体として、AIはモデル競争からインフラ競争へと移行している。

  • Anthropicの自然言語オートエンコーダは、モデルの活性化値を自然言語に圧縮し、解釈可能性の新たなパラダイムを開く
  • OpenAIの音声モデルは、AIをテキストインターフェースからリアルタイム音声エージェントへと進化させる
サイト内本文

百度が文心5.1を発表:検索能力が国内トップに、事前学習コストは業界のわずか6%

百度は次世代基盤大規模モデル「文心5.1」を正式に発表。独自の「多次元弾力的事前学習」技術により、同規模モデルの約6%の事前学習コストで基礎性能の先端を実現し、LMArena検索ランキングで国内1位、世界4位を獲得。エージェント能力が大幅に向上し、DeepSeek-V4-Proを上回り、クリエイティブライティングはGemini 3.1 Proと同等。

  • 文心5.1は多次元弾力的事前学習を採用し、事前学習コストを業界平均の6%に削減。
  • LMArena検索ランキングでスコア1223を記録し、国内1位、世界4位、唯一の国産モデル。
サイト内本文

梁文鋒氏が200億元出資!DeepSeek初回調達記録的500億円、V4.1は6月に決定

DeepSeekは初回資金調達で最大500億元を目指し、創業者の梁文鋒氏が200億元を個人出資。評価額は3500億元に急騰し、V4.1モデルは6月にリリース予定。理想主義的な研究所から商業AI企業への転換を示す。

  • DeepSeekの初回調達は最大500億元、梁文鋒氏が200億元を個人出資。
  • 評価額は21日間で100億ドルから500億ドルに急上昇。
サイト内本文

AIマネーが流れ続ける:Deepseekが記録的な資金調達を計画、Core Automationは数週間で評価額が4倍に

Deepseekは中国のAI企業として史上最大となる最大73.5億ドルの資金調達を計画しており、V4.1を6月にリリース予定。一方、元OpenAI研究者Jerry Tworekがわずか6週間前に設立したCore Automationは、早くも40億ドルの評価額を目指している。

  • Deepseekは73.5億ドルの資金調達を計画、中国のAI企業として最大。
  • Deepseek V4.1は6月にリリース予定。
サイト内本文

Show HN: Stagewise – Z.ai/DeepSeek/MoonshotサブスクリプションのためのエージェンティックIDE

Stagewiseは、開発者向けのオープンソースのエージェンティックIDEであり、ブラウザのコンソールやデバッガにアクセスできるコードエージェントを内蔵しています。Z.ai、DeepSeek、Moonshotなどの人気AIプロバイダに独自のAPIキーを使用でき、コンテキストスイッチなしでブラウズとビルドが可能です。

  • オープンソースのエージェンティックIDE、コードエージェント内蔵
  • 複数のAIプロバイダに独自のAPIキーを使用可能
サイト内本文

華為、AIチップ収益120億ドルを見込む – 中国ファウンドリは需要に追いつけず

華為はAIチップ収益が2026年までに120億ドルに達すると予想。阿里巴巴、字节跳动、腾讯などの大手顧客からの注文に支えられ、一方でNVIDIAの中国市場シェアはゼロに低下。主要な課題はSMICの先端ノード容量不足、低歩留まり、長いサイクルタイム。昇騰950PRはDeepSeek V4の最適化により中国クラウドプロバイダーの主要AIチップに。

  • 華為はAIチップ収益を2026年までに2025年の75億ドルから120億ドルに引き上げる見込みで、年間60%超の成長。
  • NVIDIAのCEO Jensen Huangは、米国の輸出規制と北京の国産化推進により、中国におけるAIアクセラレータ市場シェアがゼロに落ち込んだと発言。
サイト内本文

Redisの父がDeepSeek V4専用の推論エンジンを開発:ds4.c

Redisの生みの親であるantirez(Salvatore Sanfilippo)が、DeepSeek V4 Flash専用の軽量推論エンジンds4.cをオープンソース化。Apple Silicon搭載Mac上でMetal APIを使用し、最大27トークン/秒の生成速度を実現。

  • antirezがDeepSeek V4 Flash専用の推論エンジンds4.cを公開。Metalのみ対応で、他のモデルはサポートしない。
  • 非対称量子化(MoEエキスパート層は2ビット、その他はQ8)とディスクベースKVキャッシュにより高速化。
サイト内本文

米研究員が36時間の中国AI巡礼で見た「すべてのラボがバイトダンスを恐れ、全員がDeepSeekを称賛」

AI2の研究員Nathan Lambertが北京で36時間にわたり中国のAIラボを訪問。学生がコア開発に参加する協力的な文化、DeepSeekへの敬意、そして米国との対照的な姿勢を報告。

  • 中国のAIラボでは学生が主要な研究に参加し、協力文化が根付いている。
  • バイトダンスは恐れられ、DeepSeekは広く尊敬されている。
サイト内本文

ZAYA1-8Bテクニカルレポート

ZAYA1-8Bは、700Mのアクティブパラメータと8Bの総パラメータを持つ推論特化型混合エキスパートモデルで、AMDのフルスタックプラットフォームでトレーニングされました。数学およびコーディングベンチマークでDeepSeek-R1-0528と同等以上の性能を発揮し、テスト時計算手法Markovian RSAを導入しています。

  • ZAYA1-8Bは700Mのアクティブパラメータと8Bの総パラメータを持ち、AMDプラットフォームでトレーニング。
  • 複数の数学・コーディングベンチマークでDeepSeek-R1-0528と同等以上の性能。
サイト内本文

DeepSeek-V4の提供:なぜ100万トークンコンテキストが推論システムの問題なのか

DeepSeek-V4はハイブリッドアテンション設計(CSA、HCA、SWA)によりKVキャッシュを圧縮し、100万トークンコンテキストをモデルの課題から推論システムの課題へと変えました。Together AIのNVIDIA HGX B200における初期導入経験は、キャッシュポリシー、プレフィックスキャッシング、エンドポイント設定が長コンテキストワークロードのパフォーマンスにどのように影響するかを示しています。

  • DeepSeek-V4の圧縮スパースアテンション(CSA)と強圧縮アテンション(HCA)はKVキャッシュサイズを削減するが、推論エンジンは複数のキャッシュレイアウトを管理する必要がある。
  • スライディングウィンドウアテンション(SWA)は長コンテキストでボトルネックとなり、慎重なストレージ戦略が必要。
サイト内本文

トークン需要が1000倍に急増、22億元がAGIインフラのトップ企業に流入

AIがエージェント時代に突入し、トークン需要が爆発的に増加している。Infinigence AIは中国の中立的AGIインフラプロバイダーとして、累計22億元以上の資金調達を達成し、日次トークン呼び出し量は2025年末比で20倍以上に成長。Kimi、GLM、MiniMax、DeepSeekなどの主要モデルを支え、トークン経済のハブとしての地位を確立している。

  • エージェント時代により、単一タスクのトークン消費が数百から数百万に急増し、インフラに変革を迫る。
  • Infinigence AIのトークン呼び出し量は2週間ごとに倍増し、全国平均を大きく上回る。
サイト内本文

Deepseek、評価額約450億ドルに迫る—中国国営半導体ファンドが主導

フィナンシャル・タイムズによると、Deepseekは約450億ドルの評価額となる資金調達ラウンドを近く実施する。中国国家集積回路産業投資基金(ビッグファンド)が主導し、テンセントも出資を協議中。創業者の梁文峰氏は個人投資も検討している。

  • Deepseekの評価額は約450億ドルに
  • 中国国営半導体ファンドが主導
サイト内本文

Show HN:トークン使用量メーター 12プロバイダーとコーディングエージェント

qlaudは、コードエージェントqcode、ルーターAPIゲートウェイ、プラットフォーム管理バックエンドからなるフルスタックAIツールを発表。qcodeはデスクトップでローカル実行し、Claude、GPT、DeepSeek、Llamaなどの最先端モデルをサポート、コードのプライバシーを保護。

  • qcodeはローカル実行のコードエージェントで、複数の最先端モデルをサポート。
  • ルーターは統合APIを提供し、フェイルオーバーとレイテンシ監視を備える。
サイト内本文

Amazon、SageMakerでLlama、Qwen、Deepseek、Novaをサポートするエージェント型ファインチューニングを提供

Amazon SageMaker AIに、開発者が自然言語でユースケースを記述すると、適切なトレーニング手法を推奨し、データを準備し、トレーニングを開始し、編集可能なJupyterノートブックコードを提供するAIエージェントが搭載されました。Llama、Qwen、Deepseek、Novaなどのモデルファミリーをサポートします。

  • SageMaker AIにKiro AIエージェントが搭載され、自然言語でのファインチューニングが自動化されました。
  • エージェントは開発環境にプリインストールされており、Claude Codeなどの代替エージェントも使用可能です。
サイト内本文

先週のAI #340 - OpenAI vs マスク + マイクロソフト、DeepSeek v4、ビジョンバナナ

マスク対アルトマン裁判の初週が終了、マスクの証言が支配的;マイクロソフトとOpenAIが提携関係を再交渉し、独占権を終了;DeepSeekがV4プレビューを公開、最先端モデルとの差を縮小;Google DeepMindが画像生成と視覚理解を統合したビジョンバナナを発表。

  • マスク対アルトマン裁判初週で、マスクはxAIがOpenAIのモデルを部分的に蒸留したことを認めた。
  • マイクロソフトとOpenAIが契約を修正、マイクロソフトの独占的クラウド権利が終了;OpenAIはAWSなどのプロバイダーを利用可能に。
サイト内本文

LWiAIポッドキャスト #243 – GPT 5.5、DeepSeek V4、AI安全性の妨害

第243回エピソードでは、先週の主要AIニュースを要約し議論。OpenAIのGPT-5.5、xAIのGrok Voice Think Fast 1.0、DeepSeek V4のオープンソース化、GoogleのAnthropicへの巨額投資、妨害行為やドキュメント劣化に関する安全性研究などを取り上げた。

  • OpenAIがGPT-5.5を公開、コーディング能力が大幅に向上し、思考連鎖の監視可能性に関するシステムカードを同梱
  • xAIがGrok Voice Think Fast 1.0を発表、リアルタイム音声エージェントベンチマークでリード
サイト内本文

「DeepSeek版Claude Code」、GitHubで2.3kスターを獲得

DeepSeek-TUIは、Rustで書かれたターミナルベースのコーディングエージェントで、DeepSeekモデルに特化して最適化されています。DeepSeek-V4のリリースと開発者による中国語でのプロモーションがきっかけで急激に人気が高まり、GitHubのトレンド入りを果たしました。思考連鎖の表示、コンテキスト圧縮、RLMマルチエージェント並列処理、複数のモデル切り替えなどの機能を備えています。

  • DeepSeek-TUIはClaude Codeのようなターミナルコーディングツールで、DeepSeek向けに最適化、GitHubで2.3kスターを獲得。
  • 独立開発者Hunter Bownが作成、Rustで記述、MITライセンスで公開。
サイト内本文

DeepSeek V4最大の遺憾

DeepSeek V4のテクニカルレポートには多数の革新が含まれているが、Engramモジュールが欠落していることが話題となった。EngramはTransformer向けのネイティブ知識参照テーブルであり、静的な知識検索と深い推論を分離する。V4には含まれなかったが、その後3つの論文がCXLメモリプーリング、衝突なしホットレイヤー最適化、視覚モダリティへの応用を探求した。

  • DeepSeek V4には期待されていたEngramモジュールが含まれていなかった。
  • Engramはハッシュ参照により静的な知識を効率的に検索し、深層ネットワークを推論に解放する。
サイト内本文

[AINews] AIエンジニアワールズフェア — オートリサーチ、メモリ、ワールドモデル、トークンマキシング、エージェンティックコマース、垂直AIのスピーカー募集

本記事は、AIエンジニアワールズフェアの第2波スピーカー募集を発表し、オートリサーチ、メモリ、ワールドモデル、トークンマキシング、エージェンティックコマース、垂直AIなどの新しいトラックをカバーしています。また、Grok 4.3のリリース、DeepSeek V4 Proの進展、Codex vs Claude Codeの競争、エージェントインフラストラクチャ研究、ローカルLLMコミュニティでの議論など、最近のAI開発を要約しています。

  • AIエンジニアワールズフェアの第2波スピーカー募集開始、新しいテーマトラックを追加。
  • Grok 4.3がリリースされたが、評価は賛否両論。DeepSeek V4 Proが信頼できるオープンウェイトのコーディングモデルとして登場。
サイト内本文

AIウィークリー第488号:OpenAI、5日間で3つのものを失う

今週、OpenAIは三重の打撃を受けた:マスクの訴訟による非営利から営利への転換の脅威、収益未達による市場の連鎖反応、AWS提携によるマイクロソフト独占の終焉。同時に、DeepSeekの価格競争、ビッグテックの人員削減、ホワイトハウスによるAnthropicの安全評価回避計画など、AI業界の価格決定権の移行と規制環境の変化を示す出来事が相次いだ。

  • マスクの1340億ドル訴訟はOpenAIの非営利資産返還を求め、AI業界における営利化転換の法的基準を設定する。
  • OpenAIの収益がOracleの3000億ドル計算契約の担保となる予想を下回り、半導体株が連れ安。
サイト内本文

今週のAIシーケンス#851:DeepSeek-V4とミリオントークンインテリジェンスのアーキテクチャ

DeepSeek-V4は単なるフロンティアモデルではなく、新しいメモリ階層、アテンション機構、トレーニング安定化装置を通じて、百万トークンのコンテキストウィンドウを経済的に活用する問題を解決し、長いコンテキスト推論を実用的にするシステムエンジニアリングアプローチです。

  • DeepSeek-V4は百万トークンのコンテキストウィンドウをサポートしますが、焦点は単に取り込むことではなく、そのコンテキストを経済的に使用することにあります。
  • このモデルは、実用的な長いコンテキスト推論を実現するために、新しいメモリ階層、アテンション機構、トレーニング安定化装置、オプティマイザの選択、量子化方式、およびサービススタックを導入しています。
サイト内本文

企業ナビゲーション