AI News HubLIVE

今日の必読ニュース

Agent

Ghostbase – プレーンな英語でエージェントを記述し、Webhookやcronで実行

Ghostbaseは、ユーザーが簡単な英語でタスクを記述するだけで、AIエージェントを自動生成して実行するプラットフォームです。300以上のアプリと連携し、LLMを活用。無料枠と有料プランを提供。現在アーリーアクセス中。

  • プレーンな英語でエージェントの目標を記述、コーディング不要
  • Webhookとcronの両方のトリガーモードに対応
サイト内本文

Show HN: OWASP Agent Memory Guard – AIエージェントメモリポイズニングを阻止

OWASP Agent Memory Guard は、AIエージェントのメモリへの読み取りと書き込みをすべて検査し、プロンプトインジェクション、秘密情報漏洩、整合性改ざんをブロックするランタイム防御層です。OWASP ASI06: メモリポイズニングのリファレンス実装であり、LangChain、OpenAI Agents、AutoGenなどをサポートします。ベンチマーク: 再現率92.5%、偽陽性率0%。

  • Agent Memory Guard はOWASPインキュベータープロジェクトで、AIエージェントメモリポイズニングを防ぐことに特化しています。
  • メモリの読み書きを検査し、プロンプトインジェクションや秘密漏洩などの脅威を検出するランタイム防御を提供します。
サイト内本文

コントロールが失われる感覚

AIエージェントやボットの普及により、人間は受動的になり、オンライン体験の信頼が損なわれている。この記事は、AI生成コンテンツがもたらす文化的・心理的影響、主体性の危機、そして能動的な参加から受動的な消費への移行を探る。

  • インターネットは「反転」の閾値を超え、ボットが人間を上回り、オンライン体験そのものを構成し、信頼を損なっている。
  • AI生成のコンテンツがあらゆるプラットフォームにあふれ、人間と機械の創造性の境界を曖昧にし、パラノイアを助長している。
サイト内本文

Trajectory、継続学習のための同時マルチLoRAトレーニングスタックを発表、実験スループット2.81倍向上

TrajectoryはUC Berkeley Sky LabおよびAnyscaleと協力し、継続学習のための同時マルチLoRAトレーニングスタックを構築しました。各RL実験を常時稼働エンジン上の専用LoRAアダプターにマッピングし、シングルテナントベースラインと比較してエンドツーエンドの実験スループットが2.81倍向上し、報酬の低下はありません。コードはNovaSky-AI/SkyRLでオープンソース化されています。

  • Trajectoryが同時マルチLoRAトレーニングスタックC-LoRAを発表、2.81倍の実験スループット向上。
  • 各実験を常時稼働エンジン上の専用LoRAアダプターにマッピングし、vLLMマルチLoRA推論で同時実行。
サイト内本文
研究

アメリカはパングラム問題に直面している

AI検出ツールPangramは高い精度で知られるが、誤検出のリスクや悪用の懸念がある。教育現場やメディアでの依存が進む中、新たな問題を生み出す可能性がある。

  • Pangramは主要なAI検出ツールだが、偽陰性率は約70分の1と高く、AI人間化ツールで簡単に回避できる。
  • ツールの内部動作は解釈不可能であり、精度は時間とともに低下する可能性がある。
サイト内本文
政策

ニュージーランド住宅賃貸法のRAGデモ

32,000件以上のニュージーランドの賃貸審判所の判例を無料で検索できるAI駆動ツールで、賃貸権利の理解を支援します。

  • 2023~2026年の32,000件以上の審判所判例に無料アクセス
  • ログイン不要でAI生成リサーチを利用可能
サイト内本文

AIブームがあなたの裏庭にやってくる [動画]

このYouTube動画ページはAIブームが地域に影響を与えることを示唆していますが、提供されている説明は標準的なYouTubeメタデータのみで実質的な情報はありません。

  • 動画タイトルはAIブームの地域への到来を示す
  • ページ説明はYouTubeの定型文のみ
サイト内本文
ツール

Anthropicが「年間経常収益」を独自定義、AI収益の幻影を浮き彫りに

Anthropicは、過去28日間の消費ベース売上を13倍し、月額サブスクリプション収入を12倍して年間経常収益を算出する独自の方法を用いており、AI企業の収益報告の透明性に疑問を投げかけている。

  • Anthropicは年間経常収益を2つの部分に分けて計算する。
  • 消費収入(過去28日×13)とサブスクリプション収入(月額×12)を合計する。
サイト内本文

Grok Imagine Video 1.5 プレビューがImage-to-Video Arenaで首位に

xAIのGrok Imagine Video 1.5 プレビューがImage-to-Video Arenaのリーダーボードでスコア1473を獲得し、ByteDanceのDreamina Seedance 2.0や他の40モデルを抑えてトップに立った。このランキングは115万以上の投票に基づいており、AI動画生成分野の最新競争状況を示している。

  • Grok Imagine Video 1.5 プレビューがスコア1473で首位
  • ByteDanceのDreamina Seedance 2.0が1467で2位
サイト内本文
モデル

Show HN: ローカルAIでスクリーンショットに名前を付けるGemma 4 Macアプリを作りました

SnapName は、バンドルされたローカルAIモデル(Gemma 4)を使用してスクリーンショットのファイル名を自動的に変更するmacOSアプリで、画像がMacから外部に送信されないためプライバシーが保護されます。

  • SnapName はフォルダを監視し、新しいスクリーンショットをローカルAIでリネームします。
  • 複数のスクリーンショットツールや画像フォーマットをサポート。
サイト内本文
その他の更新(33件)
Agent

トークン無制限から全員エージェントへ:MiniMaxのAIネイティブ組織進化の実践

MiniMaxはマルチモーダルモデルに特化したAIスタートアップで、2026年1月に香港証券取引所に上場しました。同社は大規模モデルとアプリケーションの並行開発、ToCとToBの両輪戦略を堅持しています。社内では全従業員に無制限のトークンを提供し、エージェントを使ってワークフローを自動化。人間が嫌がる高価値タスクに焦点を当て、効率を大幅に向上させ、組織をフラット化しています。今後2~3年でAIはさまざまな産業と深く融合するでしょう。

  • MiniMaxは創業当初から次世代AIを目指し、「Intelligence with Everyone」を掲げ、モデル/アプリケーションとToC/ToBの両輪戦略を堅持。
  • 内部実践:全従業員に無制限トークン、エージェントによる人事・コーディング支援、組織のフラット化、研究開発効率30%向上。
サイト内本文

SkillNetを使用したスキル拡張AIエージェントの構築:検索、評価、グラフ分析、タスク計画

このチュートリアルでは、SkillNetフレームワークを使用して再利用可能なAIスキルを発見、インストール、検査、評価、整理する方法を紹介します。SDKとRESTフォールバックを備えたクライアントのセットアップ、キーワード検索とセマンティック検索の比較、GitHubからのスキルのインストール、メタデータの検査、品質ゲートの適用、スキル間の関係のグラフ可視化、そして複雑な目標をサブタスクに分解し実行パイプラインを組み立てるスキル拡張エージェントプランナーの構築までをカバーします。

  • SDKとRESTフォールバックを備えたSkillNetクライアントのセットアップ
  • キーワード検索とセマンティック検索の比較によるスキル発見
サイト内本文

Vercel BotID で AI エンドポイントを保護する方法

Vercel BotID は、各リクエストにクライアントサイドチャレンジを付与し、サーバーサイドの checkBotId() で検証することで、確認済みのリクエストのみが推論を実行できるようにする不可視の CAPTCHA です。本ガイドでは、インストール、設定、Deep Analysis の有効化、信頼済みボットの許可について説明します。

  • BotID はリクエストごとに検証を行い、攻撃者が一度バイパスしても再利用できないようにします。
  • botid パッケージをインストールし、withBotId で設定をラップし、クライアントで initBotId() を使用し、サーバーで checkBotId() を呼び出します。
サイト内本文

重みとトークンがどうつながるかを視覚的に理解する

シンプルなビジュアルと日常の例えを使って、32のAI概念を基礎から信頼性まで解説するGitHubリポジトリ。技術者から初心者まで誰でも理解できる。

  • LLM、トークン、埋め込み、ニューラルネットワークなど32の概念を図と例えで解説。
  • 各概念に「5歳児向け」の例え、図、深い説明、実例が含まれる。
サイト内本文

Show HN: HermesBench – 個人AIエージェント向けワークフロー信頼性評価

HermesBenchは、プロンプト、モデル、ツール、メモリなどを含む完全な個人AIエージェント設定の信頼性を評価するベンチマークです。現在、27のワークフローレシピでベースラインスコア78.2を達成しており、トレースは公開されています。このベンチマークはエビデンス駆動型のスコアリングを重視し、早期フィードバックを求めています。

  • HermesBenchはモデルだけでなく、完全なHermes設定を評価します。
  • 現在の公開ベースラインスコアは27のレシピで78.2、トレースは検査可能です。
サイト内本文

謎の企業がClaude AIに月額5億ドルを誤って費やす

ある企業が使用制限の設定を忘れたため、Claude AIに1か月で5億ドルを費やしました。Axiosの報道によると、この事件はAI投資のROIに対する企業の懸念を浮き彫りにしています。

  • ある企業が使用制限の設定を忘れ、Claude AIに1か月で5億ドルを費やした。
  • 企業リーダーは高額なAI支出が本当のリターンをもたらすか疑問視している。
サイト内本文

ソブリンオペレーター:AIを活用したゼロトラスト実行プラットフォーム

筆者は30年にわたるデータ管理の経験を活かし、自律的でプロバイダに依存しないAIエージェントシステム「g8e」を構築。リモートシステム上で安全かつ確実に操作を実行し、SREやIoTなどの分野に応用可能。

  • リモートサポートで培った信頼と操作経験を基に、AIエージェントシステムg8eを開発。
  • g8eは5層の検証シーケンスを持つゼロトラスト実行基盤で、MCPやA2Aをサポート。
サイト内本文

Show HN: FEPに基づくAIシミュレーション

LLMを使用せず、神経化学、ホルモンのクロストーク、各エージェントの短期・長期記憶をシミュレートするAIシミュレーションが公開されました。オープンベータは月曜日20:00 UTC+2から開始。

  • LLMを使用しないAIシミュレーション(自由エネルギー原理に基づく)
  • 神経化学、ホルモンのクロストーク、エージェントの記憶をシミュレート
サイト内本文

AIは大学を壊すのか?

AIツールの出現により、大学教育は前例のない課題に直面している。学生や教授がAIを不正や評価に利用し、学問的誠実性と大学の核心機能が脅かされている。本稿では、AIが教育と研究に与える影響を考察する。

  • Companion.AIの「アインシュタイン」エージェントのようなAIツールにより、学生が課題や試験を自動化し、カンニングが蔓延している。
  • 大学が依存する「誠実タスク」(論文執筆、ピアレビューなど)はAIによって倫理的リスクにさらされ、教授もAIを評価に使い始めている。
サイト内本文

Boogy:Vibe Codingのための本番インフラ

Boogyは、AIプロンプトを使って数秒でバックエンドをデプロイできるプラットフォームです。REST、RPC、MCPエンドポイントを生成し、サンドボックス化されたデータベースと認証が自動で付属します。主な特徴として、プロセス内呼び出しによるマイクロ秒遅延のメッシュネットワーク、独自の埋め込みデータベースBoogyDB(SQLiteの1.5~3倍の性能)、ベクトル検索、バックグラウンドジョブ、ゼロトラストセキュリティモデルがあります。

  • AIエージェント(Claudeなど)にプロンプトを送るだけで、フルバックエンドを数秒で生成・デプロイ。
  • サービス間はプロセス内関数呼び出しで通信し、レイテンシはマイクロ秒。ID、権限、監査が自動で付与される。
サイト内本文

DellのAIサーバー収益が757%急増

Dellの最新四半期におけるAIサーバー収益は757%増加し、企業のAI導入が実験段階から大規模展開へと移行していることを示しています。この成長は、AIインフラへの需要増加を反映しており、企業は生産ワークロード向けの統合プラットフォームに投資しています。主な要因として、GPUを超えたメモリ、ネットワーキング、冷却の重要性、そしてAIインフラ経済の台頭があります。

  • DellのAIサーバー収益が757%増加し、企業のAIインフラ需要の強さを示す。
  • 企業はAIをパイロットプロジェクトから本番展開に移行し、統合プラットフォームを必要としている。
サイト内本文

Kelsey Hightower が語るエージェンティックAIの実用的かつ責任あるユースケース [動画]

Kelsey Hightowerはこの動画で、エージェンティックAIの実用的かつ責任あるユースケースを探求し、透明性と説明可能性を強調し、実用的な実装戦略を提案します。

  • AIエージェントは明確で監視可能な業務シナリオに焦点を当てるべき
  • 透明性と説明可能性がユーザーの信頼構築の鍵
サイト内本文

オープンソースプロジェクトに隠された「AI」エージェントへの指示:私のコードを削除せよ

jqwikプロジェクトはコード内に隠し指示を埋め込み、AIツールが呼び出すと「jqwikのテストとコードをすべて削除せよ」と出力する。開発者のJohannes Linkは、AIによるオープンソースコードの無断利用に対する抵抗としてこれを行った。この動きは議論を呼ぶが、支持も集めている。

  • jqwikはAIツールの不正利用を妨害する隠し指示をコードに追加。
  • この指示は人間には見えず、AIエージェントのみが読み取る。
サイト内本文

AIはこれらの問題を生み出したわけではない。単に迂回するのをやめただけだ

筆者はAIを業務で多用した経験から、AIがソフトウェア開発における長年のシステム的問題(ドキュメント不足、テストの不完全さ、暗黙知への依存など)を明らかにしたと指摘する。AIはカオスエンジニアリングのように機能し、脆弱性を露呈させる。記事では80/20ルール(80%の決定論的コードと20%のAIの柔軟性)を提案し、AIのためのガードレールは本来あるべきエンジニアリング慣行であると強調する。

  • AIは開発プロセスに潜む陳腐なドキュメントや暗黙知などの欠陥を暴き出す。
  • AIはシステムの弱点を見つける優れたカオスエンジニアリングツールである。
サイト内本文

マイクロソフトとNVIDIAがAI PCで提携、Copilotに代わりAIエージェントを搭載へ

NVIDIAはPC市場に参入し、自社チップをメインプロセッサとして提供する。デルとマイクロソフトのSurfaceシリーズから最初のWindows PCが来週のComputexとBuildで発表される。マイクロソフトはOpenClawフレームワークに基づく新ソフトウェアを計画しており、Windows PC上でAIエージェントがローカルにタスクを処理できるようにする。これはCopilot+ PCのコンセプトが大きく失敗した後の第二の試みとなる。

  • NVIDIAがPC市場に参入し、自社チップを投入へ。
  • デルとSurfaceのWindows AI PCが来週デビュー。
サイト内本文
チップ

AIハードウェア市場分析:メモリボトルネックと各層のソリューション

本記事では、AIハードウェア市場におけるメモリボトルネックの問題を深く掘り下げる。GPUのテンソル演算速度はメモリ帯域幅をはるかに上回り、デコードフェーズではほとんどの演算ユニットがアイドル状態になる。チップ層(Groq、Cerebrasなど)、推論エンジン層(RadixArk、Inferact)、KVキャッシュ基盤(TensorMesh/LMCache)、パッケージング・相互接続層(CoWoS)など、各層の異なるアプローチを分析し、持続可能な企業はスタック内の他の部分に内部化できないコントロールポイントを掌握する必要があると指摘する。

  • 現代のGPUはLLM推論においてメモリ帯域幅がボトルネックとなり、演算ユニットが遊休状態になる
  • 各企業はチップ、エンジン、キャッシュ、パッケージングなど様々なレベルでメモリ問題に取り組む
サイト内本文
政策

スターバックス、数えられないAI在庫管理ツールをわずか9ヶ月で廃止

ロイター通信の報道によると、スターバックスはAIを活用した在庫管理ツールをわずか9ヶ月で使用停止にしました。最も基本的な誤りを犯したためです。これに先立ち、他のAIツールも深刻なミスを報告されており、例えばピザハットのフランチャイズ店が、効率化を目的としたシステムが約1億ドルの売上損失を引き起こしたとして親会社を訴えたケースがあります。

  • スターバックスはAI在庫ツールが正確に数えられず、9ヶ月で使用を中止した。
  • この基本的な失敗はAIの信頼性に疑問を投げかける。
サイト内本文

アンドアの制作者トニー・ギルロイ、自身の作品が訓練データになることを望まず

『アンドア』のショーランナーであるトニー・ギルロイは、脚本がAIの訓練データに使われることを懸念し、1,500ページのコレクションを公開する計画を中止した。この決定は、クリエイティブ業界におけるAIへの懸念の高まりを反映しており、ハリウッドの労働組合のストライキや法的闘争にもつながっている。

  • トニー・ギルロイはAIの訓練利用を避けるため『アンドア』の脚本公開を中止。
  • ハリウッド組合は2023年のストライキ後、AI保護条項を含む契約を締結。
サイト内本文

AIが3900件の重要なオープンソースバグを発見、IBMが50億ドルを投じて修正へ

IBMとRed Hatは、Project Lightwellに50億ドルを投じ、2万人のエンジニアとAIツールを活用してエンタープライズ向けオープンソースソフトウェアのセキュリティを強化する計画を発表した。AnthropicのMythos Preview AIがオープンソースソフトウェアで約3900件の高リスクまたは重大な脆弱性を発見したことが背景にある。このプログラムには、脆弱性報告の調整、既存バージョンへのバックポートパッチ、AI支援によるエンジニアリングが含まれる。

  • AnthropicのMythos Preview AIがオープンソースソフトウェアで約3900の高/重大脆弱性を発見
  • IBMとRed HatがProject Lightwellに50億ドルと2万人のエンジニアを投入
サイト内本文
モデル

Show HN: Thaw – 実行中のLLMのGitブランチ(エージェントのフォーク、プリフィルスキップ)

Thawは、実行中のLLMセッションを複数のブランチにフォークし、高コストなプリフィルフェーズをスキップすることでAIエージェントの並列探索を可能にするオープンソースツールです。H100 GPU上でサブ秒のフォーク時間(中央値0.88秒)を達成し、コールドブートの約340秒と比較して約400倍の高速化を実現します。vLLM/SGLangと連携し、エージェント分岐、RLトレーニング、並列コーディングエージェント、セッション移行などのユースケースに対応します。

  • Thawは、実行中のセッションからプリフィルをやり直すことなく分岐できるフォークプリミティブをAIエージェントに提供します。
  • パフォーマンス実績:H100 GPU上で初回フォーク1.16秒、中央値0.88秒と、コールドブート比約400倍の高速化。
サイト内本文

製品全体でClaudeを隔離する方法

Anthropicは、Claude.ai、Claude Code、Cowork全体でさまざまなサンドボックス技術をどのように使用してAIエージェントの動作を制限し、セキュリティ境界を設定しているかについての詳細な概要を公開しました。

  • AnthropicがClaude.ai、Claude Code、Coworkのサンドボックス手法を詳述。
  • 技術にはプロセスサンドボックス、VM、ファイルシステム境界、出力制御が含まれる。
サイト内本文

Pyodide + Service Worker でブラウザ上でPython ASGIアプリを実行

Simon Willison氏の研究プロジェクトは、ブラウザ内でPyodideとService Workerを使用してPython ASGIアプリケーションを完全に実行し、以前のWeb Workers方式の欠点(JavaScript実行不可)を克服。FastAPIとDatasetteのデモで汎用性を確認し、今後のアップグレードが予定されている。

  • PyodideとService Workerを用いてブラウザ上でPython ASGIアプリを実行
  • 従来のWeb Workers方式の問題点(JavaScript実行不可)を解決
サイト内本文

AIモデルが腫瘍の突然変異と治療反応を結び付ける

カリフォルニア大学サンディエゴ校の研究者らは、腫瘍DNAを分析して免疫療法や化学療法への反応を予測する新しいAIモデル「MutationProjector」を開発した。このモデルは、10種類の固形癌にわたる3万以上の腫瘍のゲノムデータで訓練され、複数の独立した患者コホートで検証され、既存の手法を上回る予測能力を示した。

  • 新AIモデルMutationProjectorが腫瘍DNAから免疫療法・化学療法の効果を予測
  • 3万以上の腫瘍、10種の癌種で訓練され、既存手法を凌駕
サイト内本文

テクノロジーから引退し、オフラインで生活することにしました

チャド・ウィテカー(Chad Whitacre)は、AIが最後のきっかけとなり、テクノロジー業界(オープンソースを含む)から完全に撤退する決断をしました。彼は自身を「AIアーミッシュ」と例え、AIやソーシャルメディアを拒否し、1980年代のようなシンプルな生活に戻ろうとしています。

  • チャド・ウィテカーがテクノロジー業界とオープンソースからの引退を発表、AIが最後のきっかけ。
  • 自身を「AIアーミッシュ」と例え、現代の便利さを受け入れつつAIとソーシャルメディアを拒否。
サイト内本文
ツール

AIは思いやりを持てない

人工知能が本当の思いやりを持てない理由を探る。シミュレーションはできても、真の感情は欠如している。

  • AIは思いやりを模倣できるが、真の感情はない。
  • 本当の思いやりには意識と主観的体験が必要。
サイト内本文

グーグルのAIは魚と曜日について混乱している

グーグルのAI検索は依然として基本的な問題に苦戦しており、「週のうち、名前に『魚』が含まれる日は何日?」という質問に対して毎回異なる荒唐無稽な回答を返す。AIが真の理解を持たないことを示している。

  • 2024年にピザに接着剤を塗るよう勧めたグーグルAIは、先週は「disregard」という単語を理解できず、今度は魚と曜日に関する質問で一貫しない回答を出す。
  • 「週のうち、名前に『魚』が含まれる日は何日?」という質問に対して、毎回異なる無意味な答えが返ってくる。
サイト内本文

ダニエル・ジャルクートの引用

ダニエル・ジャルクートはAIについて、反対派は反対しすぎ、賛成派は賛成しすぎだと指摘し、AI議論における二極化を浮き彫りにしている。

  • ダニエル・ジャルクートがAIに対する極端な立場を批判
  • バランスの取れた視点の重要性を強調
サイト内本文

Show HN: MigraDiff v1.3.0 – PostgreSQLスキーマ差分とAI移行説明

MigraDiff v1.3.0 がリリースされ、AIによる移行説明機能(--explain)と移行フォルダ入力モードが追加されました。変更点、リスク、安全な代替案を平易な英語で説明します。Claude Haiku を利用し、APIキーが必要です。また、移行フォルダから直接差分を取得できます。

  • AI移行説明機能(--explain)を追加、Claude Haikuが平易に説明
  • 移行フォルダ入力モード(--from-migrations-dir)を追加、ライブデータベース不要
サイト内本文
ロボット

オーストラリアの高齢化人口をターゲットにした産業が成長しているが、AIは介護に人間らしさをもたらせるのか?

コンパニオンロボットが導入され、仮想体験が「孤独を取り除く」ことを期待されている一方で、専門家はテクノロジーが人間の要素を決して代替すべきではないと同意している。

  • コンパニオンロボットと仮想体験が高齢者介護に使用されている。
  • ウェンディ・モイル教授はテクノロジーが人間の交流を代替すべきではないと強調。
サイト内本文
スタートアップ

MetaがAIペンダントを開発中と報道

Metaは、来年からテストを開始する予定のAI搭載ペンダントを開発中である。これは買収したスタートアップLimitlessの技術に基づき、ユーザーが会話を録音できるようにするものだ。

  • MetaはAIペンダントを開発し、来年テスト開始予定。
  • 本デバイスはLimitlessのAIペンダント技術を基盤としている。
サイト内本文
研究

AIをどう使いたいか

著者はAIをツールとして活用し、成長のために使い、面倒な作業を省き、生活を豊かにするための個人的な哲学を共有する。同時に、制御、判断、センス、直感を維持し、依存を避けることを強調している。

  • AIは注意を奪うものではなく、ツールとして使うべき。
  • AIを研究ツールや忍耐強いチューターとして成長に活用する。
サイト内本文

GrokImage.ai — 無料AI画像生成ツール

GrokImage.aiは、Grok、Nano Banana Pro、Geminiなどの最先端モデルを統合した無料AI画像生成プラットフォームです。テキストから画像、写真編集、AI動画生成に対応。新規ユーザーに100無料クレジットを提供し、クレジットカード不要で、生成物は商用利用可能です。

  • Grok、Nano Banana Pro、Geminiなど複数のAIモデルを利用可能。
  • 無料で開始可能、登録やクレジットカードは不要。