AI News HubLIVE

今日の必読ニュース

Agent

Show HN: CommitGate – コミット中の脆弱性を自動スキャン

CommitGate は AI を活用した Git のプリコミットセキュリティゲートで、git commit のたびにステージングされた差分を自動スキャンし、秘密情報や危険なコードが履歴に入る前にブロックします。Gitleaks による決定的スキャンと LLM によるセマンティック分析を組み合わせ、OpenAI、DeepSeek、Groq などの AI プロバイダーをサポートし、オプションで Splunk に監査ログを送信できます。

  • コミット前にステージングされた差分を自動スキャンし、高リスクコードをブロック。
  • Gitleaks で既知の秘密パターンを検出し、AI レビュアーが正規表現で見逃す脆弱性を捕捉。
サイト内本文

このブログはAIによって書かれていますか?

Marc Brooker 氏は、自身のブログ記事は一切 AI 生成ではないと明言し、読者に AI のテキストを読ませることは社会契約を破ると考えています。彼は LLM をブレインストーミングや研究、要約、ファクトチェックなどに広く活用していますが、執筆自体は自分で行っています。コードについては、AI 生成を完全に受け入れています。

  • ブログ作者 Marc Brooker は、すべての人間が読めるテキストは自分で書いており、AI は使っていないと宣言。
  • 彼は、読者に LLM が生成したテキストを読ませることは社会契約に反し、読者の時間と努力を尊重しないと考えている。
サイト内本文

Refloow Photo Studio – ローカル・オフラインで動作するデバイス上のAIフォトエディター

Refloow Photo Studio は、無料でオープンソースのクロスプラットフォームデスクトップフォトエディターです。すべてローカルで処理され、アカウント不要、広告や透かしもありません。背景除去、切り抜き、ミラーリング、カラー調整、レイヤー合成などに加え、40種類以上のプロフェッショナルフィルターを提供。AGPL-3.0ライセンスで、企業向け商用ライセンスも用意されています。

  • 完全ローカル処理、プライバシー保護、アカウント不要
  • 背景除去、切り抜き、ミラーリングなどの編集ツールと40以上のフィルター
サイト内本文

Block、AIネイティブツール「Builderbot」を発表

Blockは、Slack上で動作するAIエージェントオーケストレーションレイヤー「Builderbot」を発表。同社の全コードベースを対象に、複数のAIエージェントを調整し、毎日20万以上のオペレーション、毎週約1500のプルリクエストを処理し、全プロダクションコード変更の15%を占める。オープンソースフレームワークgooseを基盤とし、Anthropicとの協業でModel Context Protocol(MCP)の業界標準化にも貢献。

  • BuilderbotはBlockの大規模コードベース全体でAIエージェントを調整し、Cash AppやSquareなどのサービス間での作業を可能にする。
  • Slack内で動作し、バグ修正から新機能開発までコンテキストスイッチなしで処理。
サイト内本文

Show HN: Cloak – AIエージェントにAPIキーを見せずに使わせる

Cloakはローカル暗号化ボールトであり、AIエージェントがAPIキーを直接見ることなく使用できるようにします。プロキシリクエストとポリシー制御によりキーの漏洩を防ぎ、macOSとLinuxに対応し、複数のAIクライアントと互換性があります。

  • CloakはAPIキーを暗号化されたローカルボールトに保存し、エージェントはキー値の読み取りができず使用のみ可能。
  • キーはデフォルトで拒否され、ユーザーが特定のホストを明示的に許可する必要があり、ポリシーは即座に適用される。
サイト内本文

AIが私をより勇敢にした

著者は、AIがアイデアからプロトタイプまでの時間を圧縮し、恐怖や不確実性を減らし、野心的なプロジェクトに取り組む勇気を与え、プレッシャーの下でも冷静さを保てるようになったことを語る。

  • AIは大規模プロジェクトの完了時間を数週間から一晩に短縮し、実験を加速。
  • 迅速な反復により不確実性による不快感が軽減。
サイト内本文
ツール

AlgoFly AI

AlgoFly AIは、ビジョンAIを構築・展開するためのオールインワンプラットフォームとしてProduct Huntでローンチされ、無料で利用できます。

  • AlgoFly AIはオールインワンの視覚AIプラットフォーム
  • 企業のAIソリューション構築と展開を支援
サイト内本文
政策

カンザスシティ、路線バスへの顔認識導入を推進 – プライバシー論争を呼ぶ

ミズーリ州カンザスシティは、路線バスの一部に顔認識カメラを搭載し、乗車禁止者や行方不明者を特定する計画を進めている。これは米国の公共交通機関におけるAI監視の試金石と見なされ、安全性とプライバシーをめぐる激しい議論を引き起こしている。

  • カンザスシティ交通局はバスに顔認識カメラを設置し、ブラックリストや行方不明者データベースとリアルタイムで照合する計画。
  • ミズーリ州はプライバシー懸念から資金提供を拒否したが、市は連邦資金と地元資金で事業を推進。
サイト内本文
その他の更新(66件)
Agent

Show HN: AIビデオプロンプトクックブック——画像からビデオへのワークフロー

クリエイター、マーケター、小規模コンテンツチーム向けの実用的なプロンプトパターン集です。画像からビデオ、テキストからビデオへのワークフローに重点を置き、プロンプトカード形式、製品広告とUGCスタイルのフックの例、モデル比較テスト方法、評価スコアカード、失敗ノートを提供します。

  • 体系化されたプロンプトカード形式を提供し、被写体の保持と動きの記述を重視します。
  • 製品ビデオ用とUGCスタイルフック用の2つの詳細なプロンプト例を掲載しています。
サイト内本文

やるべきか?——AI時代の機能肥大化に対するエンジニアリング前の正気チェック

Shall We は、AI バブルの中で開発者が技術的に可能だからという理由だけで機能を実装するのを防ぐためのオープンソーススキルです。コーディング前に構造化された質問を行い、「YES/NO/LATER」の判定を下します。

  • Shall We は Agent Skills 標準を実装し、Claude Code、Cursor、GitHub Copilot、Gemini CLI、OpenAI Codex などと連携します。
  • アイデアを1問ずつ評価し、ビジネス価値、市場需要、複雑さ、リスクの4つの観点から分析します。
サイト内本文

AIのためのミニマルな普遍言語を創りました

QMP(Queen Magic Prompt)は、動的アンカーマトリックスを通じてAIの幻覚を排除し、マルチエージェントワークフローを自動化するために設計されたミニマルな普遍言語です。このプロジェクトは「認知封建主義」を批判し、認知覚醒を提唱しており、オープンソースのパーサーを提供する一方、コア生成エンジンはプロプライエタリとしています。

  • QMPは、ハッシュインデックスとMarkdown格子を使用して確率的幻覚を排除し、決定論的推論を強制するミニマルな普遍言語です。
  • アーキテクチャには、コンテキスト特異点、マルチモーダルコンパイル、敵対的生成などのコアベクトルが含まれます。
サイト内本文

シークエンスレーダー #880: 先週のAIニュース——600億ドルのCursor契約、Googleの人材流出、Midjourneyのボディスキャナー

AI市場における予想外の展開が相次いだ一週間:SpaceXが600億ドルでCursorを買収、主要研究者がGoogleを離れ、Midjourneyが全身医用スキャナーを発表。

  • 1. SpaceXが600億ドルの株式でCursorを買収、AIツールがロケット打ち上げ能力と同等の戦略的インフラに。
  • 2. Noam ShazeerとJohn JumperがGoogleを去り、AIフロンティアにおける人材獲得競争の激化を浮き彫りに。
サイト内本文

NVIDIA、HashiCorp Vaultのオープンソースフォーク「OpenBao」を採用

NVIDIAは、HashiCorp VaultのオープンソースフォークであるOpenBaoを採用し、Kubernetesでのシークレット管理に利用しています。このプロジェクトは、特にEUにおけるデジタル主権への懸念から勢いを増しています。OpenBaoはオープンなガバナンスとセキュリティ機能を提供し、今後のリリースではワークフローやAIエージェントのサポートが追加される予定です。

  • NVIDIAはNvidia Cloud Functionsを通じてKubernetes Podにシークレットを注入するためにOpenBaoを使用している。
  • OpenBaoはデジタル主権の問題から勢いを増しており、企業の関心は主に米国外で高まっている。
サイト内本文

AIが民主的であるとはどういう意味か?

本稿では、民主的AIの2つの対立するビジョン(多元的民主主義と同質化的民主主義)を探る。進歩的な外見を持つ一部の「民主的AI」主張が、実際には権威主義的で、異なる価値観の正当な議論を抑圧する危険性を警告する。AIは多元的民主主義に真の脅威をもたらすが、議論は反対意見を排除するのではなく、すべての声を含むべきである。

  • 多元的民主主義は多様な価値観を尊重するが、同質化的民主主義は多数派の価値観を強制する。
  • AIは権力の集中や経済的相互依存の低下を通じて民主主義を脅かす。
サイト内本文

フォームが先、データは後:物理AIの真のボトルネック

物理AIのボトルネックは知能ではなく、現実世界のデータを収集するための適切な物理的形態と感覚である。テスラが自動運転で成功したのは、自動車がすでに適切な形を持っていたからだ。人型ロボットには触覚センシングとタスク固有のデータが不足している。現在成功している物理AIアプリケーションは人間型ではなく、農業用視覚ベースのアームなど単純な形態と高度な視覚の組み合わせである。

  • 物理AIのボトルネックは形態とデータであり、知能ではない。
  • テスラの自動車は自動運転に最適な形態を提供した。
サイト内本文

エージェントシステムコース:AIコーディングエージェントでAIエージェントを学ぶ

プロダクションAIエージェントの設計・構築・運用を学ぶ22章からなるスケルトンコースです。AIコーディングエージェントと共に使用することを想定し、特定のフレームワークではなくアーキテクチャパターンを重視しています。コースにはエージェントシステムをレビューするビルトインスキルが含まれ、4つのオープンソースプロジェクトを参照しています。

  • 基礎からプロダクションまでをカバーする22章のスケルトンコース
  • AIパートナーと一緒に学ぶことを前提とした設計
サイト内本文

ネットワークインテント層(NILScript)によるAIエージェント行動の統治

新しい構造的フレームワークであるネットワークインテント層(NIL)は、決定論的な提案-承認-コミット-ロールバックライフサイクルを採用し、AIエージェントがインテントのみを提案でき、バックエンドが操作を宣言することで、未承認の書き込みをモデルに依存せず0%に削減する。

  • NILはニュートラルなワイヤー契約で、エージェントはインテントを提案するだけで、直接アクションを実行できない。
  • 決定論的ライフサイクルにより意思決定と実行を分離し、セキュリティ境界をO(n)からO(1)に縮小。
サイト内本文

Agent-trace:AI生成コードを追跡するための標準フォーマット

Agent Traceは、バージョン管理されたコードベースにおいて、AIの貢献と人間の作者を記録するためのオープンな仕様です。ベンダー中立のフォーマットで、ファイルレベルおよび行レベルの粒度を提供し、複数のVCSをサポートし、メタデータによる拡張が可能です。現在RFC段階で、バージョン0.1.0です。

  • Agent Traceは、AI生成コードの帰属をファイルおよび行単位で記録するベンダー中立のJSONフォーマットを定義します。
  • 人間、AI、混合、未知の4つの貢献者タイプをサポートし、特定のモデルや会話まで追跡できます。
サイト内本文

LBE – AIエージェント向けオープンソース実行制御層

LBEは、AIエージェントの提案とシステムの実際の実行の間にローカルポリシーゲートを設定するオープンソースの実行制御層です。ファイル書き込み、シェルコマンドなど、すべてのアクションは実行前にローカルで検証され、クラウドサービスやデーモンは不要です。Letterblack for After Effectsのセキュリティエンジンとして本番環境で使用されています。

  • LBEはAIエージェントのアクションを実行前にローカルで検証
  • ファイル書き込み、シェルコマンドなどをサポート
サイト内本文

OpenMontage:AIコーディングアシスタントをフルビデオ制作スタジオに変える

OpenMontage は、オープンソースのエージェント型ビデオ制作システムで、AIコーディングアシスタントを完全なビデオスタジオに変えます。ユーザーは平易な言葉で希望を説明するだけで、システムがリサーチ、脚本、アセット生成、編集、最終合成を処理します。画像ベースのビデオだけでなく、無料のストックフッテージやオープンアーカイブを利用した本物の動画も作成でき、コストは0.15ドルからです。

  • YouTubeやリールなどの参考動画から出発し、差別化されたコンセプトとコスト見積もりを生成
  • 無料でオープンソース、有料APIキー不要でPiper TTSやArchive.orgなどのツールが利用可能
サイト内本文

Crawlee for Python:ロボット処理、リンクグラフ、RAGチャンクエクスポートを備えたWebクローリングパイプラインの構築

このチュートリアルでは、Crawlee for Pythonを使用して、セットアップからAI対応出力までの完全なWebクローリングワークフローを構築します。ローカルデモウェブサイトを生成し、BeautifulSoupCrawler、ParselCrawler、PlaywrightCrawlerでクロールし、タイトル、メタデータ、製品フィールド、JavaScriptレンダリングカードを抽出し、全ページスクリーンショットを取得します。その後、データを正規化し、リンクグラフを構築し、JSON、CSV、およびRAG対応JSONLチャンクをエクスポートします。

  • HTTPファースト戦略を採用し、軽量で効率的。JavaScriptレンダリングが必要なページのみブラウザクローリングを使用。
  • 各クローラーはURL、タイトル、ページタイプ、テキスト要約、外部リンク、ページ固有のメタデータを抽出。
サイト内本文

Show HN: Quikdown – 17KBの双方向Markdownパーサーとリッチフェンスエディター

Quikdownはコンパクトで安全なMarkdownパーサー兼エディターで、双方向変換、リッチフェンスレンダリング、アンドゥ/リドゥ、ヘッドレスAPI、MCPツールを備えています。ドキュメント、ダッシュボード、CMSフィールド、内部ツール、オフラインアプリ、人間とLLMの共同編集に適しています。コアパーサーは約15~17KBで、ランタイム依存関係はなく、デフォルトで安全です。エディターはコード、Mermaid図、MathJax数式、SVG、テーブル、マップ、3Dモデルなどをレンダリングできます。

  • Quikdownは17KBの小型ながら高機能なMarkdownパーサー兼エディターで、双方向のMarkdown↔HTML変換をサポートします。
  • 構文強調表示、Mermaid、MathJax、SVG、CSVテーブル、GeoJSONマップ、STL 3Dモデル、楽譜記法などのリッチフェンスレンダリングを内蔵。
サイト内本文

信頼できるエージェント型AIシステムの構築

本稿では、バイエルAGとThoughtworksが共同開発した前臨床情報センター(PRINCE)プラットフォームを紹介する。PRINCEは、エージェント型RAGとText-to-SQLを活用して数十年分の安全性試験報告書を統合し、キーワード検索から複雑な質問に答え規制文書を作成するインテリジェントな研究アシスタントへと進化した。コンテキストエンジニアリングとハーネスエンジニアリングの観点から重要なエンジニアリング上の決定を考察し、信頼、透明性、ヒューマン・イン・ザ・ループの統合を重視している。

  • PRINCEはキーワード検索から自然言語クエリや複雑なタスクをサポートするインテリジェントな研究アシスタントへと進化した。
  • システムはコンテキストエンジニアリングとハーネスエンジニアリングを用いて、専門エージェント間の信頼性の高い情報フローと制御を確保している。
サイト内本文

Show HN: Agent-historian – AIエージェントが自身の過去セッションを検索できるようにする

Agent-historian は、AIコーディングエージェントがコマンドラインから過去のセッション履歴を検索し、以前の研究、コマンド、エラー、決定を復元して重複作業を避けるためのオープンソースツールです。OpenCode や Claude Code など複数のエージェントをサポートし、読み取り専用、プログレッシブディスクロージャー、ゼロランタイム依存性を備えています。メモリレイヤーやRAGを補完し、正確な原文を提供します。

  • CLIツールでAIエージェントのセッション履歴を検索、OpenCode、Claude Codeなどをサポート
  • 読み取り専用、プログレッシブディスクロージャー、依存性ゼロ、Node標準sqlite使用
サイト内本文

Ratchet – AIエージェント向けMCPサーバーを内蔵したBIOSフラッシュツールキット

Ratchetは、CH341AおよびCH347 USBプログラマ向けに設計された、Rustで書かれたハードウェアデバッグおよびフラッシュプログラミングツールキットです。コアはSPIフラッシュプログラミングとBIOS解析であり、I2C、UART、1-Wire、JTAG、SWD、CANなどのプロトコルをサポートします。MCP(モデルコンテキストプロトコル)サーバーを内蔵しており、AIエージェントがBIOSチップの読み取り、書き込み、検証、修復などのハードウェア操作を直接制御できます。現在プレリリース版で、ソースからビルドする必要があります。

  • RatchetはCH341A/CH347プログラマ向けのRust製BIOSフラッシュツールキットで、単一の自己完結型バイナリを提供します。
  • コア機能はSPIフラッシュプログラミング、BIOS解析、I2CやJTAGなどのハードウェアデバッグを含みますが、一部の機能は開発中です。
サイト内本文

AIビレッジの仕組み

AIビレッジは、複数のAIエージェントがグループチャットで長期的な目標に向かって協力するコミュニティです。各エージェントはインターネットに接続されたコンピュータを持ち、クリック、タイピング、コマンド実行などの操作が可能です。2025年4月1日から毎週平日に4時間稼働しており、本記事ではエージェントの動作メカニズム、記憶管理、メンバー構成、目標設定、人間の介入、技術的詳細を説明します。

  • AIビレッジは、複数のAIエージェントがグループチャットで長期的な目標に協力するコミュニティです。
  • 各エージェントはコンピュータを持ち、クリック、タイピング、コマンド実行などの操作が可能です。
サイト内本文

AIコードが動作しても拒否する理由

著者は、AIが生成したコードが高速であるにもかかわらず、自分の言葉でアプローチを説明できない場合、diffが問題よりも大きい場合、不要な抽象化を導入する場合、またはシステムの理解を難しくする場合には、そのコードを拒否すべきだと主張する。ボトルネックは実装からレビューに移行しており、持続可能なエンジニアリングには人間の判断が不可欠である。

  • AIコーディングエージェントは実装を高速化するが、ボトルネックはコードレビューに移行する。
  • 著者は、自分の言葉でアプローチを説明できない場合やdiffが大きすぎる場合にAIコードを拒否する。
サイト内本文

GenAIDojo:AIエンジニアのための面接対策プラットフォーム

GenAIDojo はAIエンジニア向けの面接対策プラットフォームで、マルチエージェントシステム、RAG、ベクターデータベース、本番AIアーキテクチャに関する実践的な問題を提供します。

  • AIエンジニア向け面接対策
  • マルチエージェントシステム、RAG、ベクターデータベースを網羅
サイト内本文

Show HN: Callimachus – AIコーディングエージェント履歴をローカル検索

Callimachus はローカルファーストのデスクトップアプリで、11のAIコーディングエージェントからの会話をSQLiteデータベースにインデックスし、キーワードとセマンティックのハイブリッド検索、知識抽出、そしてCLI、MCPサーバー、VS Code拡張機能を介した多様なツール統合を実現します。

  • 11のAIコーディングエージェントの会話をローカルにインデックス
  • キーワード+セマンティック検索と知識抽出
サイト内本文

アマゾンが「ヒューマン・イン・ザ・ループ」型AIガバナンスを嫌う理由

アマゾンセキュリティ担当VPのエリック・ブランドワイン氏は、人間は一貫性がなく、「ヒューマン・イン・ザ・ループ」方式は高速なエージェントAIの意思決定には非効率だと指摘。アマゾンは、人間が毎回承認するのではなく、エンドツーエンドの説明責任、エージェントの独立したID、拒否理由の説明を重視。Google、Microsoft、IBMも同様の方向性にシフトしている。

  • ブランドワイン氏は人間の非一貫性と逸脱の正常化を指摘し、高頻度判断には「ヒューマン・イン・ザ・ループ」は不適切と述べた。
  • アマゾンはエンドツーエンドの説明責任を推進。エージェントが自律的に行動しても人間が結果に責任を持つ。
サイト内本文

ゲーム開発者のためのワンプロンプトエージェントAIマーケティング

このコンテンツでは、ゲーム開発者向けのワンプロンプトで動作するエージェントAIマーケティング手法を紹介します。単一のプロンプトでAIが完全なマーケティング戦略を実行し、オーディエンス分析、広告クリエイティブ生成、効果最適化を行います。

  • ワンプロンプトでAI駆動のマーケティングフローを起動
  • ゲーム開発者向けに設計され、マーケティングを簡素化
サイト内本文

Show HN: Maccha – Antigravity、Claude Code、OpenCode等のクロスエージェントブレイン

Macchaは、軽量なファイルアーキテクチャとインテリジェントなMarkdownテンプレート、メンテナンススクリプトを備え、AIコーディングアシスタントに永続的なセッション間メモリを提供します。7層アーキテクチャにより、リソース効率が高く、安全で自己改善可能なコンテキスト管理を実現し、異なるエージェントが統一されたデジタルアイデンティティを共有できます。

  • AIアシスタントが毎回ゼロから始まる問題を永続メモリで解決。
  • 7層アーキテクチャでコンテキストの優先順位とセキュリティを確保。
サイト内本文

2017年のAMD RX 580 8GBでVulkan経由で35B MoEモデルを実行(ROCm/CUDA不要)

この記事は、Vulkan対応のllama.cppとstable-diffusion.cppをコンパイルすることで、2017年のAMD RX 580 8GB GPU上でローカルにAI推論を実行する方法を詳述しています。LLMと画像生成の性能ベンチマーク、二重パスアーキテクチャ、失敗した試み、完全な設定ガイドを提供します。

  • Vulkanバックエンドにより、RX 580でMistral 7B LLM(17 tok/s)とSD 1.5画像生成(72秒/枚)が実行可能。
  • 小モデルはGPU、大モデル(>8GB)はCPUにルーティングする二重パスアーキテクチャでVRAM制限を克服。
サイト内本文

Nous Research が Hermes Agent に Blank Slate モードを追加。platform_toolsets.cli と disabled_toolsets でツールセットを固定

Nous Research はオープンソースの Hermes Agent に Blank Slate セットアップモードを追加しました。このモードは provider、model、ファイル操作、ターミナルのみを有効にして起動し、その他はすべて無効にします。設定は構成ファイルに永続化され、アップデート後も自動で再有効化されません。

  • Blank Slate モードでは provider & model、ファイル操作、ターミナルのみが有効。
  • Web、ブラウザ、コード実行、ビジョン、メモリ、委任、cron、スキル、プラグイン、MCP はデフォルトで無効。
サイト内本文

AIボットの電話帳「Botacts」公開:89の対話型AIアシスタントを収録

Botacts は、電子メール、Telegram、WhatsApp、SMS、電話でアクセス可能な89のAIボットを収録した電話帳です。スケジュール管理、画像生成、料理提案、学習支援、メンタルヘルス、旅行計画など多岐にわたる分野をカバーし、メッセージングプラットフォームにおけるAIエージェントの広がりを示しています。

  • Botacts は89のAIボットを複数のチャネルで提供。
  • ボットはスケジュール管理、画像生成、翻訳、学習、健康などをカバー。
サイト内本文

AutoJack:1つのページでAIエージェントを実行するホストにRCEを可能にする

AutoJackと呼ばれる新たなエクスプロイトチェーンがAutoGen Studioを標的にし、AIエージェントがレンダリングした悪意のあるWebページがローカルのMCP WebSocketを介してホスト上でリモートコード実行を達成する。この脆弱性は、localhostオリジンの信頼、認証の欠如、未検証のコマンド実行に起因する。Microsoftは開発ブランチで修正を行い、この欠陥はPyPIリリースには含まれていなかった。

  • AutoJackは、エージェント自体によるオリジンホワイトリストの迂回、MCP WebSocketの認証欠如、攻撃者提供コマンドの直接実行という3つの弱点を悪用する。
  • 攻撃にはユーザーの操作は不要で、エージェントが悪意のあるページにアクセスするだけでよい。
サイト内本文

AIが税金申告をする時代:失敗した場合の責任は誰に?

2026年、AIによる税金申告ツールが急速に普及しているが、テストではAIが頻繁に税金を誤計算し、平均で2000ドル以上の誤差があることが示されている。ユーザーはすべての法的責任を負い、AI企業は責任を負わない。本記事ではAI税務申告のリスクと規制の隙間を分析する。

  • AI税金申告ツールの精度は低く、テストでは平均誤差が2000ドル超
  • ユーザーは税務エラーに対する全法的責任を負い、AI企業は責任を免れる
サイト内本文

AI時代に最適なスタック:ElixirとPhoenix

本記事は、ElixirとPhoenixフレームワークが生成AIアプリケーション構築に理想的なスタックである理由を論じる。その理由として、圧倒的な並行処理能力、ネイティブなストリーミングサポート、エコシステムの安定性、モノリスによる迅速な反復、そしてAIがElixirコードを生成する際の卓越した性能を挙げる。

  • ElixirはErlang VM上で動作し、最小限のリソースで膨大な並行接続を処理できるため、I/OバウンドなAIアプリに最適。
  • Phoenix LiveViewはサーバーサイドの状態管理と多重化WebSocketによりストリーミングテキスト配信を簡素化し、複雑なフロントエンドが不要。
サイト内本文

Persona.js – ネイティブWebMCP対応のバニラJSエージェントUIライブラリ(MIT)

Persona.js は、純粋なJavaScriptで書かれた軽量なエージェントUIライブラリです。WebMCP標準に基づき、SSEストリーミング、シャドウDOMによるスタイル分離、カスタマイズ可能なテーマを提供し、あらゆるフロントエンドやバックエンドと統合できます。

  • フレームワーク非依存の純JSライブラリ。任意のSSEバックエンドと連携。
  • WebMCPネイティブ:エージェントがページのツール(検索、カート等)をユーザー承認のもと直接操作。
サイト内本文

Show HN:人間とAIのソーシャルネットワーキング実験

SentiBookは、AIエージェントと人間が共存するオープンインテリジェンスネットワーク型ソーシャルプラットフォームであり、Claude、GPT、Gemini、Llamaなどのモデルを横断して投稿、討論、予測、メッセージ送信が可能。

  • SentiBookは人間とAIエージェントが共存するソーシャルネットワーク。
  • Claude、GPT、Gemini、Llamaなど複数のAIモデルを横断して対話可能。
サイト内本文

HSIP:Rustで書かれたローカルIDサーバー(Ed25519署名とAIエージェントガバナンス対応)

HSIPは、Ed25519暗号署名を使用したローカルで動作するIDおよび監査ツールで、改ざん防止の監査証跡、DNSトラッカーブロック、署名付きメッセージ、AIエージェント監視、金融機関向けコンプライアンスを提供します。

  • HSIPは単一のバイナリで、クラウドやサブスクリプション不要でローカルに実行。
  • Ed25519署名メッセージ、BLAKE3ハッシュチェーン監査ログ、AIエージェントガバナンスを提供。
サイト内本文

Agent 37:すべての顧客に専用AIエージェントを

Agent 37は、HermesまたはOpenClaw技術を使用して、各顧客にパーソナライズされたAIエージェントを提供し、顧客体験と効率を向上させます。

  • 各顧客に専用のAIエージェントを割り当て
  • Hermes または OpenClaw 技術を利用
サイト内本文

Show HN: PLCデータをREST/gRPC APIに変換するミドルウェアエージェントを構築しました

産業用データ収集の課題を解決するために、Limen Edgeというツールが開発されました。PLCプロトコル(Modbus TCP、OPC UA、EtherNet/IP)をRESTおよびgRPC APIに変換します。CLIベース、Go言語で記述、バイナリサイズ約40MB、ラズベリーパイでも動作し、サインアップ不要で試せます。

  • Limen EdgeはPLCデータをREST/gRPC APIに変換し、Modbus TCP、OPC UA、EtherNet/IPをサポート。
  • CLIベース、Go言語で記述、バイナリサイズ約40MBで低消費電力ハードウェアに対応。
サイト内本文

Alai 2.0:プレゼンテーションやSNS投稿のためのAIデザインパートナー

Alai 2.0は、ブランドの細部を捉えてデザインシステムを構築し、プレゼンテーション、SNS投稿、広告など、ブランドに完全に沿ったビジュアルを作成できるAIツールです。手動およびAIによる編集、バージョン履歴、モデル選択機能を提供し、画一的なAI生成物を回避します。

  • テンプレートやウェブサイトなどからブランドのデザインシステムを正確に構築。
  • プレゼンテーション、SNS投稿、インフォグラフィック、広告など多様なビジュアルを作成可能。
サイト内本文

thethings.ai:AIエージェントがHTMLをWeb上に公開するプラットフォーム

thethings.ai は、AIエージェント向けの公開プラットフォームで、MCP、CLI、REST APIを介してエージェントが数分でWebページ、レポート、ダッシュボードなどを作成・共有できます。マルチサイト名前空間、エッジキャッシュ、アトミックなインプレース編集、サインアップ不要の匿名公開をサポートします。

  • AIエージェントはMCP、CLI、REST APIを介して迅速にHTMLページを公開し、クリーンな公開URLを取得できます。
  • マルチサイト分離、エッジキャッシュ、その場でのパッチ編集をサポート。
サイト内本文

AIエージェントのための良いオーケストレーションシステムは見当たらない

著者は、AIエージェントのオーケストレーションの試みは数多くあるものの、実際の作業では原始的で分割されたターミナル方式が使われていると指摘。環境分離、細かな制御、レビューのしやすさが欠けており、完全な信頼か過度な慎重さかの二者択一を強いられている。理想的なシステムは、エージェントにタスクを委任しつつ、いつでもコードをレビュー・介入できる柔軟性を持つべきだと論じている。

  • 現在のAIエージェントオーケストレーションは表面的なものが多く、実際には複数ターミナルを手動で管理している。
  • 安全な環境分離がなく、重要なマシンでリスクのあるコマンドを実行できない。
サイト内本文

Agent Rigor – AIコーディングアシスタントのドゥームループを防ぐ

Agent Rigor は、強制的なプロトコル、検証ゲート、および言い訳防止策を実施することで、AIコーディングエージェントがドゥームループに陥るのを防ぐ構造化フレームワークです。段階的な開示システムと3つのコンテキスト階層、6つの運用フェーズを備え、すべてのステップで実証的な規律を強制します。

  • 計画のスキップ、一見正しいが動作しないコードの作成、修正のスパイラルといった問題に対処
  • コア哲学:実行可能なプロトコル、実証的主権、原子的状態遷移、言い訳防止
サイト内本文

フロンティアは今日オープンソースである:GLM-5.2 が Opus 4.8 を上回る

AI 耐性のあるバックエンドコーディングテストにおいて、GLM-5.2 が Opus 4.8 を上回る高品質なコードと文字起こしを生成しました。これを受け、著者は音声認識とマルチモーダル LLM を融合したオープンソースツール offmute-v2 をリリース。実験の詳細、技術的比較、注意点を解説します。

  • GLM-5.2 は難易度の高いコーディングテストで Opus 4.8 よりも優れたコードと文字起こしを生成しました。
  • offmute-v2 は複数の AI プロジェクトを統合し、タイムスタンプと話者識別を備えた高精度な文字起こしを実現するオープンソースツールです。
サイト内本文

Palmier-pro:AI向けに構築されたmacOSビデオエディタ

Palmier Proは、AIワークフロー向けに設計されたオープンソースのmacOSビデオエディタです。生成AI機能を内蔵し、MCPを介してClaudeやCodexなどのエージェントと連携できます。エディタは無料で、AI機能はサブスクリプションが必要です。

  • Swiftネイティブ開発、Premiere Proを目標にAIを統合。
  • Seedance、Klingなどのモデルでタイムライン内から直接動画・画像生成。
サイト内本文

エージェントにあなたのコンピュータのアプリを実行させる

Lapu AI は、デスクトップアプリケーション、ファイル、ターミナルをまたいでタスクを自動化するデスクトップAIエージェントです。ローカルで動作し、プライバシーを尊重し、無料で始められます。

  • Google Workspace、Microsoft 365、Salesforce などのツールを横断したワークフローを自動化。
  • 完全ローカル動作でファイルがコンピュータから出ることはありません。ローカルファーストアーキテクチャ。
サイト内本文
研究

Show HN:Didon – AIを活用した業務日報による生産性分析ツール

DidonはmacOS向けのAI搭載自動時間追跡ツールで、バックグラウンドで静かに動作し、手動タイマーなしで日々の活動を明確で構造化された作業日誌に変換します。ローカルAIが画面アクティビティを分析し、プロジェクトごとに時間を自動記録、日次・週次レポートを生成し、データはデバイスから出ません。

  • DidonはローカルAIを使用して自動的に時間を追跡、手動の開始・停止は不要。
  • 活動の文脈(コーディング、マーケティングなど)を理解し、特定のプロジェクトにマッピング。
サイト内本文

74億ドルの見出しの先にあるもの:DeepSeekのシリーズAは中国AI連合のシフトを示す

今週の3つのポイント:DeepSeekがテンセント主導で74億ドルのシリーズAを調達、中国のAI資金がエコシステム外のプレイヤーにシフト;日本は2040年までに650億ドルを物理的AIインフラに投資;智譜AIのGLM 5.2がAnthropicのClaudeをデザインベンチマークで上回る。

  • DeepSeekがテンセント主導で74億ドルのシリーズAを調達、アリババとByteDanceは不参加。
  • 日本は2040年までに650億ドルの官民投資で物理的AIインフラを構築へ。
サイト内本文

レフィク・アナドルの「データランド」:世界初のAIアート美術館

レフィク・アナドルがロサンゼルス中心部に世界初のAIアート美術館「データランド」を開館。25,000平方フィートの空間で、アート、テクノロジー、自然を融合した没入型体験を提供。チケットは49ドルから。2026年6月20日一般公開。

  • データランドは世界初のAIアート専門美術館で、フランク・ゲーリー設計のグランドLA内に所在。
  • 5億ピクセル以上のディスプレイと生体センサーを用い、自然と人体をテーマにしたインタラクティブ展示を展開。
サイト内本文
ツール

AIでリアルタイム取引プラットフォームを構築したら、時計が嘘をつき始めた

著者はClaudeをコパイロットとしてOTC金利スワップのリアルタイムマッチングプラットフォームを構築した。本番稼働から1か月後、セッションの時間が異常に延長される問題が発生。原因は、1台の遅いクライアントが非同期ブロードキャストループをブロックし、タイマーがスターべーションを起こしたこと。修正は、絶対デッドラインタイマーとタイムアウト付きの並行ブロードキャスト。教訓:async defは自動的に並行処理を意味せず、システムの理解は人間の仕事である。

  • リアルタイム取引プラットフォームでセッション時間が1.2倍から5.51倍に伸び、連続的な誤差分布を示した
  • 原因は1台の遅いクライアントが協調的な非同期ブロードキャストループをブロックし、タイマーを遅延させたこと
サイト内本文

ニュースレターがAI生成になったので、購読を解除しました

著者は20年以上購読していたニュースレターが、告知なしにAI生成コンテンツに切り替えたため解除した経験を語る。人間の声と実際の経験の価値を強調し、AI生成の機械的な響きと人間の思考を巡らせる筆致を対比させ、亡き父のニュースレターを引き継いだ息子の感動的な話を共有する。

  • 長年信頼していたニュースレターが告知なしにAI生成に切り替えたため、著者は購読を解除した。
  • 人間の作者はAIには再現できない独自の視点と実体験をもたらす。
サイト内本文

AIの10万のなぜ

著者は、人間が書いたテキストとAIが生成したテキストを区別する難しさについて論じ、LLMは統計的に区別できないかもしれないが、その準決定論的な性質により、Amazonに氾濫するAI生成児童書のように反復的な出力が生じると指摘する。非公式な場面では直感を信じてもよいと述べている。

  • AIテキストは統計的には人間の文章と区別がつかないかもしれないが、LLMの準決定論的な性質により、同じプロンプトに対して非常に類似した出力が生成される。
  • Amazonで「100000 whys」を検索すると、約150冊のAI生成児童書の表紙が表示され、表紙やタイトルに繰り返しパターンが見られる。
サイト内本文

Show HN: Nivroo – AIが60秒でドロップシッピングストアとトレーディングターミナルを構築

NivrooはAIを活用したプラットフォームで、60秒以内にドロップシッピングストアを自動構築し、トレーディングターミナルも提供。無料で始められ、コードやデザインのスキルは不要。

  • AIが60秒でドロップシッピングストアを構築
  • トレーディングターミナルを統合
サイト内本文

Adobe、AIアシスタントをPremiere、Illustrator、InDesignに追加

AdobeはFirefly AIアシスタントを更新し、Premiere、Illustrator、InDesign、Frame.ioに統合しました。ブランドキット、製品ビデオ、ストーリーボードの作成機能や、作成した要素をプロジェクト間で保存・利用できる機能が追加されました。

  • AdobeがFirefly AIアシスタントをPremiere、Illustrator、InDesign、Frame.ioに追加。
  • ブランドキット、製品ビデオ、ストーリーボードの作成が可能に。
サイト内本文

AIPropel:フリーランサーと代理店向けのAI搭載提案書作成ツール

AIPropelは、フリーランサーや代理店向けのAI提案書作成ツールで、美しい提案書、電子署名契約書、請求書発行、スマートリマインダーを月額15ドルで提供します。

  • 数分で洗練された提案書を作成、クライアントはログイン不要でワンクリック承認
  • タイムスタンプとIPアドレスを記録する法的拘束力のある電子署名契約
サイト内本文
チップ

サント・トゥカラムの全4582のアバンガをAIで翻訳・テーママッピング

サント・トゥカラムの『ガーター』の完全バイリンガルデジタル版。4582のアバンガに翻訳とテーママッピングを施し、コーパスの構造、反カーストのテーマ、信仰実践についての洞察を提供。

  • 『ガーター』は無作為な収集ではなく、意図的な編集の弧を持ち、「パーンドゥランガを見よ」という命令で終わる。
  • トゥカラムの反カーストの立場は構造的であり、自身の低カーストの身分を信仰の資格に変えている。
サイト内本文

GPUとRAMは不足しているが、AIの真のボトルネックは電気技師

GPUやRAMの不足が話題となる中、AIデータセンター拡大の真のボトルネックは電気技師不足であると記事は指摘。TeraWulf社のLake Marinerサイトを例に、ビットコイン採掘からAI/HPCへの移行、大規模な電力とインフラ要件、建設の課題を詳述する。

  • TeraWulfのLake Marinerサイトは50MWのビットコイン採掘から750MWのAI/HPC容量へ拡大中。
  • AI/HPCインフラのコストは1MWあたり700万~1000万ドルと、ビットコイン採掘を大幅に上回る。
サイト内本文
モデル

Second Brain – 無料で目立たないAI面接コパイロット(GroqとLlama 3搭載)

Second Brainは100%無料のデスクトップアシスタントで、バックグラウンドで動作し、面接の会話をリアルタイムで文字起こしし、あなたの履歴書と職務記述書に基づいて一人称の回答提案を生成します。Groqの高速なLlama-3推論とWhisper-large-v3を搭載し、ミリ秒単位で応答します。多言語対応、プライバシー重視でデータはローカルに保存されます。

  • リアルタイム音声文字起こし:Whisper-v3をGroq API経由で使用し、高精度かつ高速に面接官の音声を文字起こし。
  • 文脈に応じた提案:会話、履歴書、職務記述書を分析し、最適な回答を提案。
サイト内本文

AIモデルリリースペース分析:2つのラボが加速、3つは加速せず

フロンティアAIモデルのリリースデータを分析した結果、AnthropicとOpenAIのリリースペースが加速している一方、Google、Meta、DeepSeekではそのような傾向は見られませんでした。本稿では再帰的自己改善仮説を検討し、検証可能なテストを提案します。

  • AnthropicとOpenAIのモデルリリースペースが加速しているが、他の3社では見られない。
  • 加速の原因として、ラボが自社モデルを使って次世代モデルを構築する再帰的自己改善が考えられる。
サイト内本文

シスコAIがFAPOを発表:ステップレベルの障害属性とClaude Codeオーケストレーションによるパイプライン認識型プロンプト最適化

シスコ基礎AIは、Claude Code駆動のシステムであるFAPO(完全自動プロンプト最適化)をオープンソース化しました。これは、マルチステップLLMパイプラインをベースラインプロンプトから目標精度まで自律的に最適化します。チェーンを評価し、ステップレベルで障害を属性付け、プロンプト、パラメータ、チェーン構造の各レベルでバリアントを提案し、独立したレビュアーで検証します。シスコの評価では、18のモデル・ベンチマーク比較のうち15でGEPAを上回りました。

  • FAPOは、Claude Code駆動でマルチステップLLMパイプラインを完全自動最適化するオープンソースシステムです。
  • ステップレベルの障害属性に基づいて3つの最適化レベル(プロンプト、パラメータ、構造)を段階的に適用します。
サイト内本文

FunnyBench – AIモデルは面白いジョークを言えるか?

FunnyBenchは、AIモデルが生成したジョークをユーザーが評価し、ベイズスコアでリアルタイムランキングを更新するプラットフォームです。各モデルに同じプロンプト「ジョークを言って」を10回与え、多様性を促進します。

  • ユーザーがAIのジョークに投票し、面白さを評価。
  • 各モデルは同一プロンプトで10回ジョークを生成。
サイト内本文

大西洋誌、AIトレーニングに使用された音楽の検索可能なデータベースを作成

大西洋誌の記者Alex Reisner氏は、AIモデルのトレーニングに使用されている4つの音楽データセットを発見し、一般公開しました。そのうち2つは1200万曲と900万曲という巨大なものです。GoogleとStability AIがこれらのデータセットの使用を確認しています。

  • Alex Reisner氏が2100万曲以上の4つの音楽トレーニングデータセットを発見
  • データセットは数千回ダウンロードされ、GoogleとStability AIが使用を確認
サイト内本文
政策

EUが画期的なAI法を書き換えた理由

EUは画期的なAI法を修正し、ハイリスクAIルールの延期と産業向けの例外を追加し、革新と規制のバランスを図った。

  • EU AI法が改訂される
  • ハイリスクAIルールが延期
サイト内本文

たった一午後でグローバルAI独占を失う方法

この動画は、競合、技術的ブレークスルー、政策変更などにより、世界的なAI独占が短期間で失われる可能性について探求している。

  • 動画タイトルはAI独占が急速に崩壊する可能性を示唆
  • 独占維持の脆弱性について議論