[AINews] 創業者とフォワードデプロイドエンジニア 2026-05-30 昨日のAnthropicの大きなニュースを消化する中で、AIEの新しいフォワードデプロイドエンジニアトラックとファウンダーズプログラム、および5月28日~29日のAIニュースを紹介します。主なトピック:Claude Opus 4.8のベンチマークが混在するリリース、マルチターン強化学習のトークン化バグ、オープンモデルとツールチェーンの進展、Google/OpenAIの製品拡張、注目の研究論文。
Claude Opus 4.8は漸進的改善をもたらすが、ベンチマークで圧倒せず、価格設定が依然として痛点。 マルチターン強化学習トレーニングのトークン化バグが特定され、「Token-In, Token-Out」の原則が必要。 DDS Vibe Academy – 47の無料AIコーディングマスタークラス、AIエージェントによって構築 2026-05-29 DDS Vibe Academyは、AIエージェントによって完全に構築された47の無料AIコーディングマスタークラスを提供します。創設者のRobert McCullock氏は、コードを一切書かず、制約条件を設計しただけだと述べています。コースは基礎、開発、応用、習得の4レベルに分かれ、Claude、Antigravity、MCPなどの技術をカバーしています。
AIエージェントによって構築された47の無料AIコーディングマスタークラス 創設者はコードを一切書かず、制約のみを設計 ダウンロード:リチウムの解放とエボラの制御 2026-05-29 弱酸でケイ酸塩鉱物を溶解し、リチウムとともにアルミナやシリカを抽出する新技術が低コストで環境負荷の低いリチウム供給を実現。コンゴ民主共和国でのエボラ出血熱のアウトブレイクは制御が困難。教皇レオ14世の新しい回勅はテクノロジーは中立ではないと警告し、AI時代への連帯を呼びかける。その他、Anthropicの評価額、ブルーオリジンロケット爆発、JWSTの成果など最新テクノロジーニュース。
新しいリチウム抽出法は弱酸でケイ酸塩を溶解し、低コスト・低排出を実現。Rock Zero社が商業化を進める。 コンゴ民主共和国でエボラ出血熱(ブンディブギョウイルス)発生、医療従事者4名が死亡。制御が困難。 BYD、4nm AIチップを発表:プロセスはNVIDIA並み、演算性能はテスラを凌駕 2026-05-29 BYDが中国初の車載グレード4nmスマート運転チップ「Xuanji A3」を発表。3チップで2100 TOPS超、専用NPUアーキテクチャにより消費電力20%削減、演算効率100%向上。王伝福氏はスマート運転中の事故を無制限に補償する方針を示した。
BYD、完全自社開発の4nmスマート運転チップXuanji A3を発表 専用NPUにより消費電力20%削減、演算効率100%向上 新たなレビュー論文が主張:AIエージェントが考え行動する仕組みはコードにある——単なる出力ではなく 2026-05-29 新しいレビュー論文は、自律型AIエージェントの真のボトルネックは言語モデル自体ではなく、その周りのソフトウェア層(ツール、メモリ、テスト、権限境界)であると主張しています。Deepseekは北京に専用の「Harness」チームを立ち上げ、モデル+ハーネス=AIエージェントという公式を確認しています。
論文は、AIエージェントのボトルネックはモデルではなくソフトウェアハーネスにあると指摘。 ツール、メモリ、テスト、権限管理が重要な要素。 ライトセイルテクノロジー、テンセント出行サービスと戦略的提携、新たな予約販売を開始 2026-05-29 ライトセイルテクノロジーがテンセント出行サービスと提携し、AI全感覚ウェアラブル端末をプラットフォームに統合。同端末はJD.comのベストセラーリストで1位を獲得し完売、新たな予約販売が割引価格で開始された。
ライトセイルとテンセント出行サービスが提携し、AIウェアラブルを交通サービスに統合。 AIウェアラブル端末はJD.comのベストセラーリストで8日連続1位を獲得し完売。 PPIO、非凡産研「2026 Global AI 100」に選出、AIで海外展開の新潮流をリード 2026-05-29 PPIO は非凡産研が発表した「2026 Global AI 100」リストに選ばれました。このリストは非凡大賞 – 年次 AI グローバリゼーション成長サミットで選定され、グローバルな AI ネイティブ企業を表彰するものです。PPIO はグローバル分散型コンピューティングインフラ、フルスタッククラウドサービス、DeepSeek・GLM などのモデルプラットフォーム、革新的なエージェントサンドボックスを提供。2026年4月時点で4,800以上の分散ノードを統合し、日次トークン呼び出しは1兆回超、開発者は57万人超。また、上海市デジタル海外サービスプラットフォームのパイロットユニットやGDAパイロットサービスステーションにも選ばれています。
PPIO が「2026 Global AI 100」に選出、AIグローバル化のリーダーシップを示す。 全GPU構成をカバーするグローバル分散コンピューティングインフラを提供。 面壁智能(ModelBest)「オープンソースウィーク」:エッジAIの終盤を定義する体系的な「宣言」 2026-05-29 面壁智能は5月25日から29日まで、OpenBMBコミュニティと共同でエッジ大規模言語モデル(LLM)オープンソースウィークを開催し、BitCPM-CANN(1.58ビット低ビットトレーニングモデル、昇華対応)、MiniCPM5-1B(2倍のパラメータモデルを凌駕)、ForgeTrain(AIが自ら書いた訓練フレームワーク、Megatronより10%高速)、PilotDeck(エージェントOS)、UltraData(コアデータセット)の5つの成果をリリースした。これらの成果はフルスタックのシステム革新を構成し、エッジAIの競争は単一技術ではなくシステム工学であることを示している。MiniCPM5-1BはGPT-4oの一部を超え、「密度の法則」を実証。面壁智能の2年の先行と体系的な優位性が業界の変革をリードする。
面壁智能は2026年5月25-29日にエッジLLMオープンソースウィークを開催し、毎日1つの重要技術を公開。 5つの成果は訓練フレームワーク、モデル圧縮、データ、エージェントOSをカバーし、体系的な革新を示す。 5億トークン無料!世界初の商用AIホスト登場、トークン消費を気にせず使える 2026-05-29 Lenovoが世界初の商用AIホストシリーズを発表。一人会社(OPC)や成長企業向けに、ローカル+クラウドのハイブリッド構成でトークンコストとデータセキュリティ問題を解決。豊富なトークンプレゼントとすぐに使える設計。
Lenovoが3機種のAIホストを発表:mini 100、300、Pro 700。個人からチームまで対応。 ローカル推論+クラウド弾力性でトークンコストを70%~95%削減。 下限ゼロから上限AAA級まで!テンセントのAIゲーム創作プラットフォームがヤバい 2026-05-29 次のAI創作の波はゲーム分野に来ている。テンセントがAIゲーム創作プラットフォーム「コードネームCraft」を発表。自然言語でプレイ可能なゲームを生成でき、2D/3D両対応、AIGCツールや無料アセットを備え、ゲーム制作のハードルを大幅に下げる。
テンセントがAIゲーム創作プラットフォーム「コードネームCraft」を公開、自然言語からゲーム生成 2D/3D両対応、フルAIGCパイプラインと2万以上の無料アセットを搭載 クリエイティブデザイン版WorkBuddy登場!テンセントがAIエージェントクリエイティブスタジオ「Miora」を発表 2026-05-29 テンセントは、画像、動画、UI/UX、3D生成を統合したAIクリエイティブスタジオ「Miora」を発表しました。記憶システム、マルチモーダルキャンバス、カスタマイズ可能なスキルを備え、一人でクリエイティブスタジオ全体を運用できるようにします。
テンセントがMioraを発表、クリエイティブAIエージェントスタジオ 画像、動画、UI/UX、3Dコンテンツの生成をサポート 初の教皇によるAIに関する回勅が大部分AIによって執筆された証拠 2026-05-29 著者はテキスト分析、統計的証拠、AI検出ツールを用いて、教皇レオ1世の最初の回勅『Magnifica Humanitas』の相当部分がAI(特にClaude)によって書かれたと論じています。回勅におけるダッシュや「genuinely」の使用頻度が過去の回勅をはるかに上回り、Pangram検出器が複数の段落をAI生成と判定したことを挙げています。個々の証拠は説明可能かもしれませんが、複数の角度からの証拠の一致は無視しがたいとしています。
回勅ではダッシュと「genuinely」の使用頻度が過去のどの回勅よりもはるかに高い。 AI検出ツールPangramが複数の段落を40~100%AI生成とフラグ付けしたが、過去の回勅ではすべて0%だった。 清華大学系チームが大規模モデル向け「スマート計算パワーグリッド」を構築 2026-05-29 清華大学出身のスタートアップ、Shishi Technologyは独自の並列最適化技術により、異種計算リソースと推論最適化エンジンを統合し、トークンあたりのコストを40%削減。国産トークン最適化工場を目指し、AI導入の障壁を低くする。
2021年設立、国家スーパーコンピューティングセンター(無錫)のコアチーム出身、創業者Yan Bowenは清華大学博士研究員。 NVIDIA GPUや国産AIチップを統合した異種計算プールで、遊休リソースを有効活用。 AIトークン使用量を最適化する方法:repo-brainの紹介 2026-05-29 repo-brainは、コードベース全体を1つのMarkdownコンテキストファイルに圧縮し、最大96%の圧縮率を実現してAIトークン使用量を大幅に削減するオープンソースツールです。静的解析、アーキテクチャ解析、意味的関係の発見に対応し、複数のAIプロバイダーをサポートします。
コードベース全体を1つのMarkdownコンテキストファイルに圧縮し、AIトークン使用量を削減 262ファイルのリポジトリで96%の圧縮率を達成(154,229トークンから6,487トークンへ) 強化学習はインフラストラクチャの問題である 2026-05-29 本稿では、大規模言語モデルの後学習における強化学習の実践について説明し、現在のボトルネックはアルゴリズムではなくインフラストラクチャであると指摘します。Modalは大規模なRL後学習の経験を共有し、オープンソースライブラリがマルチノードトレーニング、環境管理、GPU利用率などの主要な問題を解決する方法を紹介します。
強化学習によるLLM後学習のボトルネックはインフラストラクチャであり、トレーニングエンジン、推論サンドボックス、環境分離が含まれる。 マルチノードトレーニングでは重み同期に時間がかかり、RDMAとデルタ圧縮が遅延を大幅に削減する。 Claude 4.8が登場!一部の能力でMythosを上回り、数百のサブエージェントを並行処理 2026-05-28 Anthropicが最新フラッグシップモデルClaude Opus 4.8をリリース。端末エンジニアリングと知識作業で改善が見られ、一部ベンチマークでMythosを凌駕。誠実性が大幅に向上し、コード欠陥の見逃し率が前世代の4分の1に。新機能「Dynamic Workflows」により、タスクを数百の並行サブエージェントに分割して実行可能。
Claude Opus 4.8が4.7から43日でリリース、コーディングと知識タスクで進歩 Dynamic Workflows:ClaudeがJavaScriptオーケストレーションスクリプトを生成し、数百の並行サブエージェントを調整 DeepSWE:オリジナルかつ長期のエンジニアリングタスクにおけるコーディングエージェントの評価 2026-05-28 DeepSWEは、AIコーディングエージェントを未踏の複雑なソフトウェアエンジニアリングタスクで評価する新しいベンチマークです。データ汚染を回避し、多様なリポジトリをカバーし、大幅なコード変更を必要とし、手書きの検証器を使用します。最先端モデル間で性能に大きな差が見られ、GPT-5.5が70%の精度でリードしています。
DeepSWEはオリジナルタスクによる汚染フリーのベンチマークです。 タスクは5言語、91リポジトリにわたります。 ワールドモデルが言語モデルを引き継ぐ:物理AGI「デュアルピラミッド」システムを世界初開発、汎用ロボットが「家庭時代」に突入 2026-05-28 極佳視界(Jijia Vision)が世界初の物理AGI「デュアルピラミッド」システムを発表。家庭用ロボット「拾光S1」を投入し、100台の家庭向け受注を獲得。12ヶ月以内に物理AGIの「GPT-3モーメント」を目指す。
極佳視界がデータピラミッドとアルゴリズムピラミッドから成る「デュアルピラミッド」システムを開発。 家庭用ロボット「拾光S1」は車輪付きアーム構成で、実際の家庭で100台の受注を獲得。 Show HN: Python AIエージェントとVueダッシュボードを1つのElectronアプリにパッケージ化しました 2026-05-28 Hermes Desktopは、Pythonランタイム、hermes-agent(自己改善型AIエージェント)、hermes-web-ui(Vue 3 + Koaのチャットダッシュボード)を1つのElectronアプリにバンドルしたクロスプラットフォームデスクトップアプリです。ユーザーはPythonやNodeを個別にインストールする必要がなく、DingTalkと統合され、DeepSeekを搭載しています。
Pythonランタイムとhermes-agentをバンドルし、依存関係不要で動作 Electronシェルを使用し、hermes-web-uiフロントエンドを統合 沙鋼、DingTalkと契約し、「悟空」をすべての「鉄鋼人」の生産性ツールに 2026-05-28 沙鋼とDingTalkが戦略的提携を締結。悟空AIを中核に、鉄鋼業界でのAI大規模導入を推進し、AI時代の働き方を実現する。
沙鋼がDingTalkと提携し、鉄鋼製造にAIを統合 悟空AIをエンジンとした全社共通のコラボレーションプラットフォームを構築 AI生成の数学論文5本が受理!00後創業者・洪楽潼が14億ドル調達 2026-05-28 Axiom Math社(創業者は00後中国系の洪楽潼)が、AIシステムAxiomProverが生成した8本の数学論文のうち5本が査読付きジャーナルに受理されたと発表。同社は3月に20億ドルの資金調達を完了し、評価額160億ドルに達した。
Axiom MathのAIシステムAxiomProverが生成した8本の数学論文のうち5本が学術誌に受理された。 創業者・洪楽潼はスタンフォード大学を中退して起業し、20億ドルを調達、評価額160億ドル。 7Bモデルがo3、GPT-5を打ち破る! 医学AIエージェントが「どこを見て、どう見るか」を学習 2026-05-28 上海創智学院のLeapQuestチームは、複数の大学と協力して、モデルが推論プロセスで視覚ツールを積極的に活用し、受動的な入力から能動的なエビデンス探索へと変革する新しい医学AIパラダイムを提案。2本の論文がICML 2026に採択された。
LeapQuestは、医学画像と動画向けにOphiuchusとMedScopeを提案。Think with Images/Videosパラダイムを採用。 Ophiuchus-7Bは8つのVQAベンチマークで平均68.0点を達成し、o3(62.2)やGPT-5(59.9)を上回る。 AIがソフトウェア業界を書き換える?8歳児がOSを開発、一人会社が1000万円の受注 2026-05-28 2026年中国AIGC産業サミットで、百度の秒哒(Miaoda)製品責任者・朱広翔氏が、AIがプログラミングのハードルをコード記述から会話に下げたと発表。秒哒ユーザーの87%はコード非習得者で、8歳児がOSを開発、一人会社(OPC)がプロジェクトマネージャーだけで千万円の受注を獲得。石油技術者が140万元の調達プラットフォームを代替。Vibe Codingが需要側を供給側に変え、大衆創業を実現。
第四次プログラミング革命:自然言語プログラミングで創造者数が爆発的に増加 秒哒ユーザーの87%はコード非習得、OPCが最大グループ(16%が起業家) スローン賞受賞者・戴亮氏が復旦大学に常勤で着任 2026-05-28 2021年スローン賞受賞者でUCバークレー物理学部助教授の戴亮氏が復旦大学に常勤教授として着任し、物理学部および天文・天体物理研究センターで教鞭をとる。復旦大学は近年、蘇昊、袁峰、季索清など多くのトップ人材を獲得している。
戴亮氏(2021年スローン賞受賞)が復旦大学に常勤で加入 元UCバークレー助教授、北京大学物理学部出身 清華大学に新しい先生:ジェンセン・フアン 2026-05-28 NVIDIAのCEOジェンセン・フアンが清華大学経営管理学院の顧問委員会に加わることが明らかになった。委員会はアップルのティム・クックが議長を務め、イーロン・マスク、サティア・ナデラ、マーク・ザッカーバーグ、馬雲らが名を連ねる。フアンは先日、カーネギーメロン大学から名誉博士号を授与された。
ジェンセン・フアンが清華大学経営管理学院顧問委員会に参加 委員会はクック議長、マスク、ナデラ、馬雲ら世界的リーダーで構成 ITBench-AA:フロンティアモデルがエンタープライズITエージェントタスクの初のベンチマークで50%未満のスコアに — Artificial AnalysisとIBMによる 2026-05-27 Artificial AnalysisとIBMが、エンタープライズITエージェントタスク向けのベンチマークITBench-AAを発表。サイトリライアビリティエンジニアリング(SRE)に焦点を当て、フロンティアモデルはすべて50%未満のスコアで、Claude Opus 4.7が47%でトップ。このベンチマークは、Kubernetesインシデント対応におけるモデルの診断能力を評価する。
Claude Opus 4.7が47%でトップ、GPT-5.5が46%、Qwen3.7 Maxが42%。 すべてのフロンティアモデルが50%未満であり、ITBench-AAは最も飽和度の低いエージェントベンチマークの一つ。 AIは軍拡競争、米国はNVIDIAのスーパーチップに90億ドルを投じて追従する 2026-05-27 米国政府は、CIAやNSAがAnthropicやOpenAIなどのAI大手に追いつくため、NVIDIAのGB10スーパーチップを90億ドルで秘密調達する申請を行った。この資金は議会の承認が必要で、国防予算から8億ドルがクラウドコンピューティングに振り向けられている。記事では、チップの仕様、コスト、そして激化するAIハードウェア競争について詳述する。
米国政府はCIAとNSAのために、NVIDIA GB10スーパーチップを90億ドルで秘密調達する申請を行った。 GB10チップは消費電力140Wで1ペタフロップスのFP4性能を発揮し、700億パラメータのモデルを微調整できる。 Show HN: Mneme HQ – AIコーディングエージェント向けリポジトリネイティブアーキテクチャルール 2026-05-27 Mneme HQ は、コード生成前に制約を強制することでアーキテクチャの漂流を防ぎ、レビューの負荷を軽減する、AI支援開発向けアーキテクチャガバナンスレイヤーです。AIコーディングエージェントのワークフローに直接統合され、禁止されたフレームワーク、境界を越えた呼び出し、陳腐化した決定をPRキューに到達する前にブロックします。
AIエージェントがコードを生成する前にアーキテクチャルールを強制し、違反を根本から阻止 Claude Code、Cursor、GitHub Copilotなど、主要なAIコーディングツールと連携 南アフリカにはAIのレバレッジがあるが、政策草案はそれを活かせていない 2026-05-27 南アフリカは世界の白金族金属埋蔵量の約88%を保有し、アフリカ最大のデータセンター市場を持ち、米中AIインフラ競争の最前線にある。しかし、幻覚的な引用を含むため撤回されたAI政策草案は、これらの優位性を有利な条件のために活用できていない。記事では、南アフリカの構造的レバレッジ、3つの可能性のあるAIインフラの未来(中国、米国、ローカルのオープンウェイト)、および拘束力のあるガバナンス条項の必要性を分析している。
南アフリカの白金族金属と再生可能エネルギーは独自のAIレバレッジを提供するが、政策草案にはハイパースケーラーへの最低条件、データ主権、技術移転条件が欠けている。 米国と中国のテクノロジー企業(マイクロソフト、ファーウェイ)が南アフリカのAIインフラ支配を競う中、政策は南アフリカが見返りに何を求めるかを明示していない。 雷鳥、GTシリーズとV4を同時発表、次世代AIグラス雷鳥iOを予告 2026-05-27 5月27日、雷鳥創新は夏季新製品発表会を開催し、業界初のプロ向け映像級ARグラス「雷鳥GTシリーズ」(1899元~)と、最新のAI撮影グラス「雷鳥V4」(2199元~)を発表。さらに、次世代AIグラス「雷鳥iO」を第3四半期に発売予定と予告した。
GTシリーズ:プロ向け映像級ARグラス、59°視野角、ドルビービジョン対応、78g、1899元~。 V4:AI撮影グラス、0.2秒起動、2.1秒応答、11.5時間音楽再生、IP67、38g、2199元~。 5秒で3Dシーン編集、北大・香港中文・上海AIラボがVGGT-Editを開発、120倍の高速化を実現 2026-05-27 北京大学、香港中文大学、上海AIラボ、NTUの研究チームが、約5秒でシーン編集を実行できるネイティブ3D編集フレームワークVGGT-Editを発表。従来手法と比べて最大120倍の高速化を達成し、意味的一貫性、多視点安定性、推論速度で既存手法を上回る。
VGGT-Editは初のネイティブ3D編集フレームワークで、3D空間で直接編集を行い、2D手法による多視点の不整合を排除。 残差場予測により、背景を安定させながら局所的な変更のみをモデル化し、高速で高品質な編集を実現。 先週のAIニュース#341 - マスク、OpenAIに敗訴、Google IOアップデート、OpenAIがエルデシュ問題を解決 2026-05-27 今週のトップAIニュース:イーロン・マスクのOpenAIに対する1500億ドルの訴訟が棄却;Google I/O 2026でGemini 3.5 FlashやGemini Sparkなどの大型AIアップデートを発表;OpenAIのAIが80年来の数学問題を解決;Take It Down Actが完全施行、プラットフォームに48時間以内のディープフェイク削除を義務付け;SpaceXがIPO後、Cursorを600億ドルで買収する計画を明らかに。
マスクのOpenAIに対する1500億ドル訴訟が陪審員により棄却。OpenAIはIPO準備。 Google I/O 2026でGemini 3.5 Flash、Gemini Spark、Gemini Omniなどの大規模AIアップデート。 ダウンロード:AI雇用パニックを打ち破る 2026-05-27 ホワイトカラー職へのAIの脅威に対するヒステリーが高まっているが、データによると、この技術はまだ労働市場に大規模な影響を与えていない。実際、AIにさらされている職業の失業率は、さらされていない職業よりも低い。しかし、スタンフォード大学の研究では、AIが静かに初級職を侵食し、AIにさらされた職業の若年労働者の雇用が急減していることがわかった。また、教皇のAI規制呼びかけ、スペースXの打ち上げ、ファーウェイのチップブレークスルーなど、他のテクノロジーニュースも取り上げている。
AIは大規模な失業を引き起こしていないが、初級職を弱体化させている可能性がある。 スタンフォード大学の研究では、AIにさらされた職業の若年労働者の雇用が急減。 Show HN: Mirdel – ローカルファーストのAIワークスペース、UIベースのエージェントワークフローを搭載 2026-05-27 MirdelはローカルファーストのデスクトップAIワークスペースで、会話、ナレッジベース、ノート、翻訳、画像・動画処理、ローカルモデル、拡張可能なワークフローを統合し、長期間実行可能な環境を提供します。データプライバシーとユーザーコントロールを重視し、複数のクラウドモデルとローカルモデルをサポートし、アプレット、スキル、MCPによるワークフローのモジュール化と再利用を実現します。
ローカルファースト:データ、モデル、設定はデフォルトでローカルに保存され、機密情報は暗号化されます。 モジュラーワークベンチ:チャット、ナレッジベース、ノート、翻訳、画像・動画処理などの独立したモジュールがコンテキストを共有します。 Codex自己蒸留法が話題に!OpenAI社員が伝授:コピペでAIが繰り返し作業を排除 2026-05-27 OpenAI社員Vaibhav Srivastavが公開した、Codexに繰り返し作業を自動化させるプロンプトが急速に広がっています。
OpenAI社員VaibhavがCodexに過去の会話をスキャンさせ、繰り返し作業をツールとしてパッケージ化するプロンプトを公開 2つのバージョンがあり、第2版はデータソースをMemoryとChronicleに拡大し、コーディング以外もカバー [AINews] 新しいAIインフラのデカコーン:Fireworks、Baseten(OpenRouterも順調) 2026-05-27 AIインフラスタートアップのFireworks、Baseten、OpenRouterが大型ラウンドを調達し、推論インフラが主要なAIプラットフォーム層として台頭していることを示しています。同時に、エージェントハーネスエンジニアリング、新しいベンチマーク、モデルアップデートがAIニュースサイクルを支配しています。
Fireworks(150億ドル)、Baseten(110億ドル)、OpenRouter(1.13億ドル)が推論インフラ資金調達の波をリード。 エージェントハーネスエンジニアリングがコーディングエージェントの主な差別化要因に。 DeepSeekの陳德里氏が自動研究スキルを開発、論文作成における人間の作業はわずか2時間 2026-05-27 DeepSeekの研究者である陳德里氏は、自身が開発したDeliAutoResearchスキルを用いて、DeepSeek-V4-ProとGPT-Image2と協力し、わずか6日間で46ページの論文を完成させた。この論文は、研究エージェントの自律性をL1~L5に分類する枠組みを提案し、4つのアーキテクチャパターンと17の主流システムを分析、6つの未解決問題を指摘している。陳氏によると、人間の「CPU時間」はわずか2時間未満であり、残りはAIエージェントが担当した。
陳德里氏のDeliAutoResearchスキルにより、論文の99%がAIエージェントによって執筆された。 論文は、自動運転のSAEレベルに類似した研究エージェントの自律性分類(L1~L5)を提案。 AIウィークリー第496号:Anthropicの国防総省モデルが今や誰でも使える 2026-05-27 今週のAIニュース:Anthropicがこれまで政府契約業者限定だったMythosモデルを公開、国防総省級AIが誰でも利用可能に。DeepMindのDemis HassabisはAGI実現時期を2029年に前倒し。Starletteフレームワークに重大な認証バイパス脆弱性、数百万のAIエージェントに影響。CrowdStrikeらがGlasswormボットネットを共同撃滅。BNPパリバがMistralと主権AIセキュリティ提携、中国はAlibabaとDeepSeekのトップAIエンジニアの海外渡航を制限。UberはAIトークン予算を4ヶ月で使い切り、ClickUpは2200人を解雇して3000の内部AIエージェントを導入。一方、MITテクノロジーレビューはAI露出職種の失業率が低いと報告、Altmanはホワイトカラー消滅予測を撤回。
AnthropicがMythosモデルを公開、NSAや国防総省の能力が標準APIで利用可能に。 DeepMindのハサビスCEOがAGI実現を2029年と明言、AlphaProof Nexusの成果を根拠に。 ChatGPTをやめて無料でプライベートなローカルAI「Ollama」に乗り換えた理由 2026-05-26 お金、プライバシー、地球を守りましょう。このインストール可能なAIは、ChatGPTのような従来のモデルにはない利点を提供します。
Ollamaは無料、プライベート、オープンソース。 ローカルで動作し、自分のハードウェアを使用。 次に来ることについてのいくつかのアイデア、2026年5月 2026-05-26 2026年のAIはさらなる加速を続け、オープンモデルはエージェント能力で遅れをとり、GoogleのGeminiはClaude CodeやCodexに対抗できず、アメリカのオープンモデルが台頭し、AnthropicとOpenAIの競争が激化、既存の権力構造がAIに関与し始めている。
オープンモデルはエージェント能力でクローズドモデルに5〜6ヶ月遅れ、12ヶ月以上に延びる可能性。 Google GeminiはClaude CodeやCodexに対抗できるツールを欠く。 中国、トップAI研究者の海外渡航に許可を義務化との報道 2026-05-26 中国は、AlibabaやDeepSeekなどの民間企業に所属するトップAI研究者に対し、海外渡航前に政府の許可を得ることを義務付けると報じられている。北京はデータ漏洩や技術盗難、人材引き抜きを懸念し、国内AI産業への統制を強めている。
中国はトップAI研究者に対し、海外渡航前に許可を得ることを義務付けた。 この方針はAlibabaやDeepSeekなどの民間企業に適用される。 DSA注意機構をマルチモーダルに導入、快手Keye2.0が強化推論の新パラダイムを開く 2026-05-26 快手はKeye-VL-2.0-30B-A3Bを発表。DSA(DeepSeek Sparse Attention)をマルチモーダルに初めて適用し、256Kの超長コンテキスト深層認識を実現。長編動画の時間的理解ベンチマークでSOTAを達成し、Agent協調メカニズムを内蔵。業務応用にも展開中。
DSAをマルチモーダルに導入し、長編動画理解のボトルネックを解消 TimeLensなどのベンチマークでSOTA達成、長コンテキストでも精度が逆転向上 BODHI: 正確なOSカーネル仕様推論 2026-05-26 研究者らは、大規模言語モデルによるOSカーネルの形式的仕様生成を大幅に向上させるドメイン知識プロンプティング手法「BODHI」を提案。OSV-Benchベンチマークにおいて、Claude Opus 4.6とBODHIの組み合わせで96.73%のPass@1を達成した。
BODHIは、15のドメイン固有変換パターンをカバーする構造化C to Python変換ガイドを追加する。 OSV-Benchの245タスクにおいて、Pass@1を55.10%から96.73%に向上。 Cited AI Workspace: ファイルの再アップロードは不要 2026-05-26 UUMuseはクラウド型AIナレッジベースプラットフォームで、ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなどのモデルで引用付きの回答、コンテンツ生成、デプロイが可能。APIやMCPを介してエージェントやアプリからも呼び出せます。永続的なメモリ、マルチエキスパート討論(Spark)、エージェントモード、ドキュメントサイト・API・MCPサーバーとしての展開機能を備えています。
ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなど複数のAIモデルが出典を引用して回答。 AIがユーザーの文体やプロジェクトコンテキストを記憶し、会話間で引き継ぐ永続メモリ。 ContextVault – ChatGPT、Claude、Gemini向けローカルファーストAI会話レコーダー 2026-05-26 ContextVaultは、ChatGPT、Claude、Geminiなどの主要LLMプラットフォームでのAI会話をリアルタイムでキャプチャし、IndexedDBにローカル保存するブラウザ拡張機能です。ワンクリックでMarkdownまたはZIP形式にエクスポートでき、データがデバイスから離れることはありません。無料・オープンソースで、アカウントやバックエンドは不要です。
ChatGPT、Claude、Geminiなど7つのLLMプラットフォームに対応し、リアルタイムで会話をキャプチャ。 すべてのデータはIndexedDBにローカル保存され、クラウド同期や第三者によるアクセスはありません。 HTML Deployer:AI生成HTMLをワンクリックでウェブサイトに公開 2026-05-25 HTML Deployerは、ChatGPT、Claude、GeminiからAI生成HTMLを抽出し、プレビュー、ZIPダウンロード、またはNetlify、GitHub、FTP、セルフホストサーバーへの直接公開を可能にするChrome拡張機能です。開発者、創業者、マーケター、代理店、初心者向け。
ChatGPT、Claude、GeminiからHTMLコードブロックを抽出。 プレビュー、ZIPエクスポート、クラウド/FTP/セルフホストへの直接公開。 DeepSeek V4がさらに安く!新ツールのキャッシュヒット率99.82%で2割安定 2026-05-25 DeepSeek V4シリーズリリースから1ヶ月、オープンソースコミュニティがReasonixツールを公開。DeepSeek専用に設計され、キャッシュ効率を最大化することでAPIコストを約5分の1に削減。キャッシュヒット率99.82%を達成し、4億+トークンの請求額が61ドルから12ドルに。
ReasonixはDeepSeek専用のコーディングハーネスで、コスト削減が目的。 キャッシュ優先ループ、ツール呼び出し修復、自動コンテキスト圧縮により長いセッションでも90%以上のキャッシュヒット率を維持。 Claudeの合格率4%未満——SaaS-BenchがComputer-Useの「全自動オフィス」幻想を打ち砕く 2026-05-25 UniPat AIが公開したSaaS-Benchによる評価で、Claudeなどの主要大規模モデルの完全合格率は最高でも3.8%にとどまり、AIによる全自動オフィスはまだ遠い現実であることが明らかになった。
SaaS-Bench評価では、最強モデルClaude Opus 4.7でも完全合格率はわずか3.8%。 タスクの93.4%が複数のアプリにまたがり、テキストタスクの97.3%が100ステップ超。 Lynote Humanize Text – オープンソースAIテキスト人間化ツールキット 2026-05-25 Lynote Humanize Textは、AI生成テキストを検出されにくい人間らしい文章に変換するオープンソースツールキットです。プロダクション対応のStandard Pipelineは、DeepSeekによるマルチステップ書き換えと翻訳エンジンの組み合わせでTurnitinやGPTZeroなどの検出器をバイパスします。リポジトリには参考実装やn8nワークフローサポートが含まれ、専門家評価で9.1/10の品質スコアと100%の情報保持率を達成しました。Lynote.aiプラットフォームではAdvancedおよびFocus層を追加し、テキストごとに最適な手法を自動選択します。
オープンソースのAIテキスト人間化ツール、主要なAI検出器を回避。 プロダクション対応のStandard Pipelineは5ステップのチェーン(DeepSeek書き換え+複数エンジン翻訳)。 将来の推論が演算リソースの70%を消費し、トレーニングは30%に|シリコンバレー投資家・張璐氏@AIGC2026 2026-05-25 2026年中国AIGC産業サミットで、Fusion Fund創業パートナーの張璐氏は、AI演算需要の中心がトレーニングから推論に移行し、将来は推論が70%の演算リソースを消費すると指摘。データセンター内の通信は計算よりも100倍以上の電力を消費する可能性があり、光通信などの新技術が重要に。物理AIの最大のボトルネックは高品質な実世界データの不足であり、ヘルスケア、宇宙、ナノロボットが有望な応用分野と述べた。
推論の演算比率は50%から70%に上昇し、AIインフラ最適化の核心に。 データセンター内の通信は計算の100倍以上の電力を消費、光通信などの革新が鍵。