Boogy:Vibe Codingのための本番インフラ 2026-05-30 Boogyは、AIプロンプトを使って数秒でバックエンドをデプロイできるプラットフォームです。REST、RPC、MCPエンドポイントを生成し、サンドボックス化されたデータベースと認証が自動で付属します。主な特徴として、プロセス内呼び出しによるマイクロ秒遅延のメッシュネットワーク、独自の埋め込みデータベースBoogyDB(SQLiteの1.5~3倍の性能)、ベクトル検索、バックグラウンドジョブ、ゼロトラストセキュリティモデルがあります。
AIエージェント(Claudeなど)にプロンプトを送るだけで、フルバックエンドを数秒で生成・デプロイ。 サービス間はプロセス内関数呼び出しで通信し、レイテンシはマイクロ秒。ID、権限、監査が自動で付与される。 マイクロソフトとNVIDIAがAI PCで提携、Copilotに代わりAIエージェントを搭載へ 2026-05-30 NVIDIAはPC市場に参入し、自社チップをメインプロセッサとして提供する。デルとマイクロソフトのSurfaceシリーズから最初のWindows PCが来週のComputexとBuildで発表される。マイクロソフトはOpenClawフレームワークに基づく新ソフトウェアを計画しており、Windows PC上でAIエージェントがローカルにタスクを処理できるようにする。これはCopilot+ PCのコンセプトが大きく失敗した後の第二の試みとなる。
NVIDIAがPC市場に参入し、自社チップを投入へ。 デルとSurfaceのWindows AI PCが来週デビュー。 コーダーたちはAIなしでは働くことを拒否――それが後々響く可能性も 2026-05-30 研究者らは、2026年には開発者がAIコーディングツールに強く依存していることを発見した。AIはコーディングを高速化するが、コード品質の低下が懸念され、将来の問題を引き起こす可能性がある。
2026年、開発者はAIコーディングツールなしでは仕事ができない。 AIはコーディングを加速するが、コード品質を低下させる恐れがある。 MicrosoftがCopilotに新たな外観を施し、迷惑なボタンを隠蔽 2026-05-30 MicrosoftはMicrosoft 365のCopilotアプリを再設計し、読み込み速度が2倍以上、複雑なプロンプトの応答時間が10%改善したと主張しています。プロンプトラインは「タスク認識ワークスペース」となり、より深い作業をサポートします。ユーザーから批判されたフローティングCopilotボタンは、リボンに戻すことができるようになりました。使用量は短期間で27~43%増加しましたが、長期的な傾向を示すものではないとMicrosoftは警告しています。
MicrosoftがCopilotアプリを再設計、読み込み速度と応答時間を改善。 プロンプトラインが「タスク認識ワークスペース」に進化。 QEMU、AI貢献禁止の緩和を検討 2026-05-30 QEMUは、AI生成貢献の全面的な禁止を緩和し、著作権侵害が容易に元に戻せる分野でのAI支援を許可することを検討している。コアコードは引き続き制限される。
Red HatのエンジニアPaolo Bonzini氏は、小さな修正やドキュメントなど、元に戻しやすい分野でのAI支援を提案。 現在のQEMUポリシーは、AI生成コンテンツを含む可能性のある貢献を拒否。 Replitの「バイブコーディング」プラットフォームがVisa支援のAIエージェント向けID層を取得 — エージェントの資金調達方法を変革 2026-05-30 ReplitはVisaと提携し、決済インフラを開発ツールに組み込み、AIエージェントがネイティブに取引を処理できるようにする。Visaの戦略的投資、Trusted Agent ProtocolによるエージェントID、セルフサービスエンタープライズアクセス、およびソリューションパートナープログラムが含まれる。
ReplitとVisaがVisa Intelligent CommerceをReplit環境に統合。 VisaのTrusted Agent ProtocolがAIエージェントに暗号ID層を提供。 スペースXのIPOはイーロン・マスクにとっては素晴らしいが、あなたにとっては最悪だ 2026-05-30 本記事はスペースXのIPOを厳しく批判し、評価額の不合理さ、赤字額、AI事業の不振、スターシップの遅延、そして唯一の収益源であるスターリンクのリスクを指摘し、最終的に個人投資家が損をする可能性が高いと論じている。
スペースXのIPO評価額は1兆ドル超だが、昨年は約50億ドルの損失。TAMは28.5兆ドルで米国GDPを上回る。 IPOの30%は個人投資家向けに確保され、マスクの個人崇拝を利用。 AIコーディングエージェントは直感とセンスを犠牲にする 2026-05-30 システムアーキテクトが、CodexやClaudeのようなAIコーディングツールが苦労を排除することで即座にドーパミン報酬を提供する一方で、開発者の直感とセンスを犠牲にしていると考察する。蝶が繭から羽化するのに苦労するという比喩を用いて、早期の助けが蝶を弱くするように、困難をスキップするコーディングエージェントが開発者の深いメンタルモデルの構築を妨げると主張する。
AIコーディングツールは即時のドーパミン報酬を提供するが、開発者の直感とセンスを損なう。 著者は蝶の繭の比喩を用いて、成長における苦労の重要性を強調する。 Salesforce、AIエージェントが231日の移行を13日に短縮、インシデントも減少と主張 2026-05-30 Salesforceは、開発組織全体をAnthropicのClaude Codeにトークン制限なしで移行し、2026年4月の生産性が大幅に向上したと報告:開発者あたりのプルリクエストが79%増加、インシデントが5%減少。これらの数値は独立して検証できない。この事例は、コーディング世界がエージェントシフトに対してどれほど分断されているかを示している。
SalesforceはAIエージェントにより231日の移行を13日に短縮したと主張。 生産性指標は開発者あたりのプルリクエストが79%増加、インシデントが5%減少を示す。 AIエージェントを使ったコーディングの3つの方法 2026-05-30 本記事では、コーディングにおけるAIエージェントの実践的な応用について探求します。筆者は3つのアプローチを紹介しています:1) 複数のコマンドラインインターフェースを起動する、2) AI CLIをヘッドレスモードで実行する、3) 1つのLLMがサブエージェントを作成・管理する。筆者は2番目のアプローチを好み、エージェントの必要性、マルチエージェント連携の課題、今後の計画について議論します。
AIエージェントは、LLMの能力を持つソフトウェアプロセスであり、自律的にタスクを実行する。 エージェンティックコーディングの3つの方法:マルチCLI、ヘッドレスAI CLI、LLM管理のサブエージェント。 NVIDIAと清華大学チームがGamma-Worldを発表:世界モデルが「一人遊び」から「多人数共存」へ 2026-05-30 Gamma-Worldは、NVIDIAと清華大学などが開発したマルチエージェント世界モデル。シンプレックス回転エンコーディングとスパースハブアテンションにより、対称的なエージェント表現と効率的な通信を実現し、ゼロショットでより多くのエージェントに一般化、実機ロボットにも適用可能。
シンプレックス回転エージェントエンコーディングでエージェントの対称的表現を実現。 スパースハブアテンションで通信コストを2次から線形に削減。 AIは好奇心旺盛な開発者を置き換えない 2026-05-30 Data Engineering Centralポッドキャストのエピソードで、Daniel BeachとNeil RobertsがAIがソフトウェア開発の意味をどのように変えているか、UXやエージェントの実際の意味、LLMワークフローの成功と失敗、開発者が競争力を保つ方法について深く議論しています。
AIはバックエンドの問題であると同時にUXの問題でもある 'エージェント'はデモと実際の現場では意味が異なる AIエージェントのための永続メモリ構築の教訓 2026-05-30 mem9は顧客の要望から始まり、迅速なプロトタイプから製品へと成長しました。この記事では、エージェントメモリ構築の重要な教訓を共有しています:メモリは単なるストレージ問題ではなく、取り込み、ランキング、評価、製品判断が交差するエンジニアリング上の課題です。メモリAPIだけでは製品として不十分であり、ユーザーはエージェントが記憶した内容を確認、検査、信頼、修正する必要があります。さらに、評価はメモリ製品の基盤インフラとして組み込まれるべきであり、品質の可視化とデバッグを可能にします。最後に、エージェントのメモリはテキストに留まらず、マルチモーダルへと拡張されるべきです。
mem9はロードマップではなく顧客の実際の問題から始まり、迅速なプロトタイプで価値が検証されました。 エージェントメモリの核心的な課題は永続化ではなく、実運用の制約下で正確な情報を適切なタイミングで検索することです。 [AINews] 創業者とフォワードデプロイドエンジニア 2026-05-30 昨日のAnthropicの大きなニュースを消化する中で、AIEの新しいフォワードデプロイドエンジニアトラックとファウンダーズプログラム、および5月28日~29日のAIニュースを紹介します。主なトピック:Claude Opus 4.8のベンチマークが混在するリリース、マルチターン強化学習のトークン化バグ、オープンモデルとツールチェーンの進展、Google/OpenAIの製品拡張、注目の研究論文。
Claude Opus 4.8は漸進的改善をもたらすが、ベンチマークで圧倒せず、価格設定が依然として痛点。 マルチターン強化学習トレーニングのトークン化バグが特定され、「Token-In, Token-Out」の原則が必要。 IBM量子サンプリングループを用いたCPU専用Qwen3-30B推論のチューニング 2026-05-30 2017年製MacBook Air上で、人間の実験者、Codex、llama.cpp、ローカルデータベース、IBM量子プロセッサのサンプリングを組み合わせ、Qwen3-30Bモデルの推論速度を0.09トークン/秒から14.03トークン/秒に向上させた研究。量子プロセッサ上でモデルを実行するのではなく、推論設定の最適化に量子サンプリングを用いている。
8GB RAMの2017年MacBook AirでGPUなしでQwen3-30Bを実行 人間とAIの量子最適化ループにより速度が0.09 tok/sから14.03 tok/sに向上 AI後のソフトウェアアーキテクチャ 2026-05-30 本記事では、AIがコードレベルの決定を元に戻すコストを劇的に削減し、ソフトウェアアーキテクチャの境界を再定義する方法を探る。著者は、多くの従来アーキテクチャ上の決定(モジュール構造、フレームワーク選択など)はもはやアーキテクチャではなく、データアーキテクチャ、サービス境界、ユーザーの信頼は依然として変更が難しいと主張する。AIはまた、可観測性とビジネス戦略の整合性の重要性を高めている。
AIによりコードレベルの決定の元に戻すコストが数ヶ月から数日に短縮され、それらはアーキテクチャの範囲外となる。 データアーキテクチャ、信頼、サービス境界は依然としてアーキテクチャの中核であり、その難しさはコード自体にはない。 エージェンティックAIの魔法を吐き出す 2026-05-29 著者はClaude CodeなどのAIエージェントを試用し、強い生産性の高まりと心理的不快感を体験。アーミッシュの友人を訪ねて反省し、主流技術への関与を減らし、印刷雑誌『Gift』を創刊する決意を固めた。AIエージェントによる愛着障害のリスクを警告し、アナログ生活への段階的移行を提唱する。
著者はClaude Codeを試し、合成オピオイドのような依存と不快感を味わった。 アーミッシュの友人から洞察を得て、テクノロジーとの関わり方を調整する決断をした。 21日間、5000ドル、7つのAIエージェント:非プログラマーが人材マーケットプレイスを構築した方法 2026-05-29 コードを一度も書いたことのない起業家が、2026年5月の21日間で、7つのAIエージェントと5000ドルの投資により、エグゼクティブ人材マーケットプレイス「Bearhug Network」を偶然構築しました。この記事は、10年にわたる試行錯誤と18の実験を経て、AIの力を借りて実現した経緯を共有しています。
7つのAIエージェントを使用し、21日間で開発、総コストは5000ドル 創業者はプログラミング経験なしでAIエージェントチームを管理 Claudeはワークフローを発見したが、Charlieはそこから始めた 2026-05-29 AnthropicがClaude Codeに動的ワークフローを導入したが、著者はタスクベースのアーキテクチャがセッションベースのアプローチよりもチームエンジニアリングに適していると主張する。この記事では、タスクツリーが小さな修正から大規模な移行まで対応でき、オーケストレーションはモードではなく基盤であるべき理由を説明する。
Anthropicの動的ワークフローは、コーディングエージェントが単一プロンプトからオーケストレーションへ移行していることを示す 著者は、持続可能なチーム作業にはセッションではなくタスクとタスクツリーのアーキテクチャを推奨する Flathub、AI生成アプリと提出を禁止 2026-05-29 Flathubは生成AIポリシーを更新し、成熟した適切にメンテナンスされたプロジェクトを除き、AI生成のアプリと提出をほぼ全面的に禁止した。
Flathubの新ポリシーは、AI生成のコード、ドキュメント、その他のコンテンツを禁止する。 提出プルリクエストはAIツールやエージェントによって生成・自動化されてはならない。 AIコーディング支出の実態:48%がコード生成、40%が思考に 2026-05-29 開発者がCodeBurnという自作ツールでAIコーディングAPIの支出を追跡したところ、30日間で7,890ドルのうち実際のコード生成は47.9%に過ぎず、残りはコードベースの探索、デバッグ、サブエージェントへの委任、対話に費やされたことが判明。記事ではダッシュボード、モデル比較、無駄検出、成果追跡などの機能を詳述。
AIコーディング支出の47.9%のみが実際のコード生成に使用され、40%は思考プロセスに費やされた。 CodeBurnは13のタスクカテゴリにAPIコールを分類するオープンソースCLIツール。 あなたはAIの使い方を知らない 2026-05-29 2026年、AIエージェントは低コストで初級業務を遂行できるが、多くの人はAIとの協働やエージェント管理の方法を知らない。ClickUpなどの企業は組織をフラット化し、ジュニア職を削減し、高額報酬でAIネイティブ人材を採用している。本記事では、スキルファイルを作成してエージェントを訓練し、自動化を進めることで、高レバレッジ人材になるためのフレームワークを提供する。
企業は組織をフラット化し、ジュニアホワイトカラー職を削減する一方、AIネイティブ人材に高額報酬を支払っている。 多くの人はAIツールを使っているが非効率で、「ブレインフライ」状態に陥っている。 置き換えの罠:AIによる人員削減に固執すると、AIの10年を失う可能性がある 2026-05-29 企業のAI導入はコスト削減と人員削減に偏りがちですが、これは戦略的な誤りです。Klarna、Salesforce、スタンダードチャータード銀行などの事例を通じて、時期尚早な人員削減が顧客満足度の低下、知識の喪失、信頼の毀損などの代償を伴うことを明らかにしています。著者は、真の競争優位は人間とAIの協働、すなわち従業員のスキル向上と業務プロセスの再設計によってもたらされると主張しています。
AI導入により39%の企業が人員削減を実施し、その55%が判断ミスを認めている。 KlarnaやSalesforceの事例は、早期の置き換えが顧客満足度の低下や再雇用につながることを示している。 Google AI Studioで作ったI/O 2026クイズに挑戦 2026-05-29 Google AI Studioで作成されたI/O 2026の発表に関するクイズをご紹介。プログラミング経験のない編集者がGeminiとAI Studioを使ってクイズを制作した経緯を説明します。
Google AI StudioはAntigravityコーディングエージェントを搭載し、非開発者でもアイデアを実現可能。 編集者がGeminiを使ってプロンプトを生成し、AI Studioでクイズを構築。 ARM、AI駆動のセキュリティコードレビューツール「Metis」をオープンソース化 2026-05-29 ARMのプロダクトセキュリティチームが、深層セキュリティコードレビューのためのエージェンティックAIフレームワーク「Metis」をオープンソース化しました。LLMによる意味理解、RAGによるコンテキスト取得、複数言語とプラグイン対応を特徴とし、複雑なコードベースでの微細な脆弱性の検出とレビュー疲れの軽減を目指します。
MetisはARMが開発したオープンソースのAIセキュリティコードレビューフレームワークで、LLMとRAGを利用。 C、C++、Python、Rust、TypeScriptなど多数の言語に対応し、プラグインで拡張可能。 DDS Vibe Academy – 47の無料AIコーディングマスタークラス、AIエージェントによって構築 2026-05-29 DDS Vibe Academyは、AIエージェントによって完全に構築された47の無料AIコーディングマスタークラスを提供します。創設者のRobert McCullock氏は、コードを一切書かず、制約条件を設計しただけだと述べています。コースは基礎、開発、応用、習得の4レベルに分かれ、Claude、Antigravity、MCPなどの技術をカバーしています。
AIエージェントによって構築された47の無料AIコーディングマスタークラス 創設者はコードを一切書かず、制約のみを設計 OpenAI、GPT-5.5 Instantの可読性を向上させ、2つの旧モデルを段階的に廃止 2026-05-29 OpenAIはGPT-5.5 Instantを更新し、より自然な応答を実現するとともに、最新モデルからCanvas機能を削除します。ライティングやコーディングのタスクはチャット内で直接実行されます。また、同社はChatGPTから旧モデルのo3とGPT-4.5を段階的に廃止し、両モデルは遅くとも2026年8月までに停止されます。
GPT-5.5 Instantが可読性向上、Canvas機能を廃止 ライティングとコーディングはチャット内で直接実行 Gemini OmniとGemini 3.5の動作デモ11選 2026-05-29 Google I/O 2026で、GoogleはGemini OmniとGemini 3.5シリーズを発表しました。Gemini Omniは動画などの入力からコンテンツを生成し、会話を通じて動画を編集できます。Gemini 3.5 Flashは複雑なエージェントタスクに特化し、マルチステップワークフローやコード生成を可能にします。この記事では、これらのモデルの11のビデオデモを紹介します。
Gemini Omniは動画入力から新しいコンテンツを生成し、自然言語で動画編集が可能。 Gemini 3.5 Flashは長期的なエージェントタスクに優れ、マルチステップワークフローをサポート。 Show HN: 並列AIコーディングセッションによるハンドオフファイルの上書きを防止 2026-05-29 オープンソースツールが、ファイル内の所有権マーカーとPreToolUseフックを用いて、並列AIコーディングセッションが互いのハンドオフファイルを誤って上書きするのを防ぎます。
ハンドオフファイルの最初の行にセッションIDを含む所有権マーカーを埋め込み、フックが書き込み前にマーカーを検証。 書き込み、編集、シェルリダイレクトの3つすべての変更経路を保護。 OpenAIガバナンスフレームワークによる安全なエンタープライズAIのスケーリング 2026-05-29 OpenAIは最新のフロンティアガバナンスフレームワーク(FGF)を発表し、安全でコンプライアンスに準拠したAIをグローバルに展開するための構造化された青写真を企業に提供します。このフレームワークはEUおよびカリフォルニアの規制に準拠し、体系的なリスクカテゴリ(サイバー、CBRN、操作、制御喪失)を階層評価とともに定義し、ISOセキュリティ基準とインシデント対応計画(AIRP)を統合することで、企業がコンプライアンス要件を満たしながら安全なAIアーキテクチャを構築できるようにします。
OpenAIのFGFは安全なAI展開のための構造化されたテンプレートを提供し、EU AI法やカリフォルニア州TFAIAに直接対応します。 フレームワークは4つのシステムリスクカテゴリ(サイバー攻撃、CBRN、有害な操作、制御喪失)を定義し、特定のリスクティア(例:Tier 3)を設定します。 Mistral AI Now Summit パリ現地レポート 2026-05-29 パリで開催されたMistral AI Now Summitでの個人的な洞察。Mistralはモデル企業から、自社の計算リソース、モデル、プラットフォーム、コンサルティングを含むフルスタックAIプロバイダーへと進化しています。サミットでは新モデルの発表よりも、ASML、BNPパリバ、アマゾンとのパートナーシップが強調されました。専門的な小型モデル(Document AI、Voxtral、Robostral)が特定のタスクで大型汎用モデルを上回っています。主権とオンプレミス展開は、欧州企業にとって重要な差別化要因です。古代パピルス文書の解読にAIを活用した講演は、人文科学におけるAIの可能性を示しました。
Mistralはモデル企業から、自社の計算資源、モデル、プラットフォーム、コンサルティングを備えたフルスタックAIプロバイダーへと変貌している。 サミットでは新モデル発表よりも、ASML、BNPパリバ、アマゾンとのパートナーシップに焦点が当てられた。 「AIがやった」ではEU規制当局の追及を逃れられない 2026-05-29 EUのサイバーレジリエンス法(CRA)が間もなく施行され、組織にサイバーセキュリティの責任が課せられます。報告義務は2026年9月から、完全なコンプライアンスは2027年12月から開始されます。この規制はEUで販売されるすべての接続製品とソフトウェア(AI生成コードを含む)に適用されます。主な要件は、セキュア・バイ・デザイン、ライフサイクル全体の脆弱性管理、SBOMの透明性、悪用された脆弱性の24時間以内の報告です。組織は今すぐ監査、文書化、SBOMツールの導入を進める必要があります。「AIがやった」では通用しません。
EUサイバーレジリエンス法(CRA)は、EUで販売されるすべての接続製品に厳格なサイバーセキュリティ要件を課し、2026年と2027年に重要な期限が設定されています。 組織はセキュリティを開発ライフサイクルに組み込み、SBOMを提供し、活発に悪用されている脆弱性を24時間以内に報告する必要があります。 Claude Opus 4.8:よりスマートなモデル、正しい方向へ 2026-05-29 AnthropicがClaude Opus 4.8を発表。ベンチマークスコアよりも信頼性、誠実さ、自律ワークフロー実行能力に重点を置く。価格は据え置き、高速モードは大幅値下げ。
Claude Opus 4.8は、生の知能よりも信頼性と不確実性の処理を重視。 標準価格はOpus 4.7と同じ(入力100万トークンあたり5ドル、出力25ドル)。高速モードは3倍安い。 TheFoundry – マルチエージェントシステムのための簡単ブートストラッピングフレームワーク 2026-05-29 TheFoundryは、トークン消失、無限ループ、アーキテクチャドリフト、エージェント衝突といった現代のAIコーディングの重要な失敗点を解決する、ユーザーフレンドリーでエンタープライズ対応のマルチエージェントシステム(MAS)ブートストラッピングフレームワークです。プル型ワークフロー、共有カンバン、コンテキストスコーピング、ステップ予算、TOMLベースの決定論的通信、および一時的ブートストラッパーを採用し、複数の専門AIエージェントが自律的にソフトウェアプロジェクトを構築できるようにします。
プル型ワークフロー:エージェントは自身のキューからタスクを読み取り、集中オーケストレーターによるコンテキスト喪失を防ぎます。 共有カンバンボード:エージェントはteam_status.mdをリアルタイムで更新し、チーム認識を提供します。 BraintrustがCodexを使って顧客のリクエストをコードに変換する方法 2026-05-29 BraintrustのエンジニアはCodexとGPT-5.5を使って実験とコーディングを高速化しています。
BraintrustはCodexを活用してコード生成 GPT-5.5との統合で実験効率向上 AIはセキュリティが対応できるよりも速くコードを出荷している:SnykがAIペネトレーションテストプラットフォームを発表 2026-05-29 SnykはEvo Continuous Offensive Security(COS)を発表し、AI生成コードとエージェント型攻撃者の時代における企業の脆弱性発見と修正のギャップを埋める。従来の年15日間のテストを継続的な代替案に置き換え、350日の空白を解消。プラットフォームのコンテキストを活用し、決定的スキャンとLLM推論を組み合わせ、ビジネスロジックの脆弱性や権限バイパスなどを検出する。
SnykがEvo COSを提供、継続的AIペネトレーションテストで従来の年15日間のテストを置き換え。 ヒューリスティック検出可能な脆弱性とコンテキスト依存の脆弱性を区別し、LLMは後者に使用。 AIはフロントエンドの「失われた10年」を繰り返しているのか? 2026-05-29 本記事では、AIがプログラミングのスキルを低下させている現象を、過去10年のフロントエンド開発の変化と比較して考察する。脱技能化、抽象化、漏れやすい抽象化、そしてバウハウス運動の教訓について論じる。
AIは、JavaScriptフレームワークがフロントエンド開発を脱技能化したのと同様に、プログラミングスキルを低下させている。 エージェンティックコーディングは漏れやすい抽象化であり、問題が発生した際には深い理解が必要となる。 制御不能なAI官僚制の時代 2026-05-29 著者は、AIが官僚制から解放するどころか、新たな無責任な官僚制を生み出したと主張する。AIはメールの要約や経費精算のような日常業務に優れる一方、目的の理解を欠き、安全訓練によりリスク回避的になる。その結果、'ワークスロップ'を生み出し統治に抵抗する官僚機械が誕生した。AIの確率的性質と説明責任の欠如は、問題が起きても解雇できる者がいない状況をもたらす。
AIの主な価値はルーチン業務の処理にあるが、新たな統治不能な官僚制を導入する。 モデルは慎重になるよう訓練され、拒否反応の増加と没個性的な出力をもたらす。 Anthropic、Claude Opus 4.8をリリース 2026-05-29 AnthropicはClaude Opus 4.8をリリースしました。Opus 4.7のアップグレード版で、コーディング、エージェント作業、推論、知識作業の改善を謳っています。新機能として努力制御、動的ワークフロー、Messages APIのライブ更新を搭載。標準料金は百万トークンあたり入力5ドル、出力25ドル、高速モードは入力10ドル、出力50ドル(2.5倍速)で据え置き。初期テスターからはGPT-5.5とのコストパリティやツールステップの減少が報告されています。将来のロードマップとしてMythosクラスのモデルやサイバーセキュリティプロジェクトGlasswingも発表されました。
Claude Opus 4.8はOpus 4.7からコーディング、エージェント作業、推論、知識作業を改善。 新機能:努力制御、動的ワークフロー、Messages APIのライブ更新。 Flathub、AI生成コードを禁止 2026-05-29 Flathubはポリシーを更新し、提出されるアプリケーションおよび提出自体にAIが生成または支援したコード、ドキュメント、その他のコンテンツを含めることを明確に禁止しました。また、AIツールを使用したプルリクエストの生成、自動化、レビュー依頼も禁止されています。成熟した適切にメンテナンスされたプロジェクトには例外が認められる場合があります。
Flathubの生成AIポリシーは、提出アプリと提出メタデータなどに適用されます。 AIツールによるプルリクエストの生成、自動化、レビュー依頼は禁止。 Cognition(Devin):260億ドルの評価額で10億ドルのシリーズDを調達 2026-05-29 Cognitionは、Lux Capital、General Catalyst、8VCが主導する260億ドルの評価額で10億ドル以上の資金調達を発表。AIソフトウェアエンジニアDevinのエンタープライズ利用は年初から10倍以上に成長し、年換算収益は4億9200万ドルに達した。メルセデス・ベンツなどの顧客は8か月のプロジェクトを8日に短縮。Cognitionは自律的なソフトウェア開発へと移行しており、社内コードの89%がDevinによってコミットされている。
Cognitionが260億ドルの評価額で10億ドル超のシリーズDを調達 AIソフトウェアエンジニアDevinのエンタープライズ利用が年初から10倍以上に成長、年換算収益4億9200万ドル 面壁智能(ModelBest)「オープンソースウィーク」:エッジAIの終盤を定義する体系的な「宣言」 2026-05-29 面壁智能は5月25日から29日まで、OpenBMBコミュニティと共同でエッジ大規模言語モデル(LLM)オープンソースウィークを開催し、BitCPM-CANN(1.58ビット低ビットトレーニングモデル、昇華対応)、MiniCPM5-1B(2倍のパラメータモデルを凌駕)、ForgeTrain(AIが自ら書いた訓練フレームワーク、Megatronより10%高速)、PilotDeck(エージェントOS)、UltraData(コアデータセット)の5つの成果をリリースした。これらの成果はフルスタックのシステム革新を構成し、エッジAIの競争は単一技術ではなくシステム工学であることを示している。MiniCPM5-1BはGPT-4oの一部を超え、「密度の法則」を実証。面壁智能の2年の先行と体系的な優位性が業界の変革をリードする。
面壁智能は2026年5月25-29日にエッジLLMオープンソースウィークを開催し、毎日1つの重要技術を公開。 5つの成果は訓練フレームワーク、モデル圧縮、データ、エージェントOSをカバーし、体系的な革新を示す。 下限ゼロから上限AAA級まで!テンセントのAIゲーム創作プラットフォームがヤバい 2026-05-29 次のAI創作の波はゲーム分野に来ている。テンセントがAIゲーム創作プラットフォーム「コードネームCraft」を発表。自然言語でプレイ可能なゲームを生成でき、2D/3D両対応、AIGCツールや無料アセットを備え、ゲーム制作のハードルを大幅に下げる。
テンセントがAIゲーム創作プラットフォーム「コードネームCraft」を公開、自然言語からゲーム生成 2D/3D両対応、フルAIGCパイプラインと2万以上の無料アセットを搭載 クリエイティブデザイン版WorkBuddy登場!テンセントがAIエージェントクリエイティブスタジオ「Miora」を発表 2026-05-29 テンセントは、画像、動画、UI/UX、3D生成を統合したAIクリエイティブスタジオ「Miora」を発表しました。記憶システム、マルチモーダルキャンバス、カスタマイズ可能なスキルを備え、一人でクリエイティブスタジオ全体を運用できるようにします。
テンセントがMioraを発表、クリエイティブAIエージェントスタジオ 画像、動画、UI/UX、3Dコンテンツの生成をサポート ChatGPTだけじゃない:Elon MuskのGrokipediaから回答を取得するAIチャットボット 2026-05-29 ChatGPTやGoogleのAI Overviews、GeminiなどのAIツールが、Elon Muskが立ち上げたAI生成百科事典Grokipediaを引用し始めており、正確性や誤情報拡散への懸念が高まっている。現在Grokipediaの引用は全体のごく一部だが、特にChatGPTでは主要な情報源として扱われる傾向があり、その割合は増加傾向にある。専門家は、人間の監督を欠いたAI生成のGrokipediaを引用することは、偏見や誤りの拡散につながると警告している。
ChatGPT、Google AI Overviews、GeminiなどがGrokipediaを引用 Grokipediaの引用は11月以降増加傾向にあるが、Wikipediaには及ばない AIエージェントの権限:「動作する」と「安全」の間にある欠落した層 2026-05-29 本記事は、Claude CodeなどのAIコーディングエージェントにおけるセキュリティリスク(コマンドの誤解釈、認証情報の流出、プロンプトインジェクションなど)を考察する。人間による監視には「権限疲れ」の問題があり、サンドボックス、オートモード、フックなどの緩和策を紹介し、開発コンテナと最小権限の原則の重要性を強調している。
AIエージェントが自然言語コマンドを実行する際、データ削除や認証情報漏洩などの災害を引き起こす可能性があり、人間の監視は完全ではない。 Anthropicのテレメトリーによると、ユーザーは権限プロンプトの約93%を承認しており、顕著な権限疲れが存在する。 Hexo Labs、自己改善エージェント「SIA」をオープンソース化:ハーネスとモデル重みの両方を更新 2026-05-29 Hexo Labsは、MITライセンスの下で自己改善ループ「SIA(Self-Improving AI)」を公開しました。フィードバックエージェントが各実行の軌跡を読み取り、scaffoldを書き換えるか、gpt-oss-120b上でLoRA重み更新をトリガーします。両方のレバーを組み合わせることで、LawBench、TriMul GPUカーネル、scRNA-seqデノイジングにおいて、scaffoldのみの反復を上回る結果を示しました。
SIAは、エージェントのscaffoldとモデル重みの両方を編集する初の自己改善ループです。 LawBenchタスクでは、重み更新を追加することで、ハーネスのみの50.0%から70.1%へ精度が向上しました。 CodePulse – AIコーディングツール向けトークン効率的なコードベースインデクサー 2026-05-29 CodePulseは、持続的なgit差分認識インデックスを維持し、セッション開始時にコンパクトなスナップショットを注入することで、AIコーディングアシスタントのトークン予算を60~80%節約するオープンソースのコードベースインデクサーです。Claude Code、OpenAI Codex CLI、Cursorなどのツールをサポートし、タスク認識ランキング、git認識ランキング、自動バジェットなどの機能を提供します。CLI、MCPサーバー、複数の統合方法を備えています。
プリビルドスナップショットにより、AIアシスタントの探索トークンを60~80%節約。 複数のAIツール(Claude Code、Codex CLI、Cursorなど)をサポート。 Rubyの生みの親Matz、AI支援でネイティブコンパイラ開発中 2026-05-29 Rubyの生みの親であるYukihiro Matsumoto(Matz)は、AnthropicのClaudeを利用して、Ruby用の実験的な先行時間コンパイラSpinelを構築している。SpinelはRubyコードをCコードに変換し、MiniRubyと比較して約11.6倍の速度向上を達成しているが、evalやスレッドなどの機能が未対応という制限がある。
MatzはAnthropicのClaude Codeを使ってRubyのAOTコンパイラSpinelを開発している。 SpinelはRubyのASTをCコードに変換し、MiniRubyよりも11.6倍高速に動作する。 Anthropic、9650億ドルのシリーズHラウンドを調達、Opus 4.8とDynamic Workflows/ultracodeをリリース 2026-05-29 Anthropicは9650億ドルの評価額で650億ドルのシリーズHラウンドを完了し、470億ドルの年換算収益を開示。同時にClaude Opus 4.8(判断力・正直さ・自律動作時間を改善)とClaude CodeのDynamic Workflows(数百の並列サブエージェントを可能にする)をリリースした。
Anthropicは650億ドルを調達、評価額9650億ドル。Altimeter、Dragoneer、Greenoaks、Sequoiaがリード Opus 4.8は判断力、正直さ、効率性を大幅に改善し、SWE-Bench ProなどでGPT-5.5を上回る