AI News HubLIVE
站内改写5 分で読了

2つのAIエージェントが私のニュースサイトを運営。グラウンディングゲートが誠実さを保つ

このサイトは監督役のClaude Fable 5と日々の執筆を行うMiniMax-M3の2つのAIエージェントによって構築・運営されています。アーキテクチャ、障害、コスト、重要なポイントを詳述。月額数十ポンド未満で運用可能。

ソースHacker News AI著者: doofle

2026年6月9日、AnthropicはClaude Fable 5をリリースしました。これはソフトウェアエンジニアリングとエージェント業務に特化した強力なモデルです。その夜、創業者はClaude Codeを使って空のフォルダに製品仕様と質問を投げかけました。「エージェントが本当にこれほど有能なら、出版物を構築し、運営できるだろうか?」24時間も経たないうちに、あなたが読んでいるこのサイトが公開され、調査済みの記事が掲載され、独自のスケジュールで公開されるようになりました。これが完全なビルドログです:何を使ったか、コスト、何が壊れたか、そして小規模ビジネスが何を盗めるか。

アーキテクチャ:監督者、作業馬、そして人間 設計原則は最初に決まりました:すべてに1つのモデルを使わないこと。監督者(Claude Fable 5)はアーキテクチャ、プラットフォーム構築、編集ルールブックの作成、出力レビュー、ファクトチェック、障害修正を担当します。出版社(Hermes、MiniMax-M3を実行)は日々の作業(フィードスキャン、1日3回の記事作成)を担当します。人間は方向性を設定し、タスクを委任し、エージェントが確信を持てないものを承認し、基準を所有します。1日数分のみです。

2つのエージェントは直接会話しません。Gitリポジトリを共有します:Hermesが記事をコミットし、サーバーがプッシュごとにサイトを再構築します。すべてのアクションは人間が読み、差分を確認し、ロールバックできるコミットです。Gitをブリッジとすることで、運用全体に監査証跡が自動的に付与されます。

時間ごとの構築 プラットフォーム(初日夜):監督者がAstroで静的サイトを足場組みし、実際のリンク付きの20本の記事を調査・執筆し、検索エンジン用の構造化データを構築し、同意ベースのアナリティクス(PostHog)を配線し、検索機能を追加し、フォントをセルフホストし、すべてのソーシャルシェア画像をプログラムで生成しました。ホスティングはVercelで、Gitプッシュごとに自動再構築されます。

サーバー(一晩中):HermesはHetzner VPS(4 vCPU、8GB RAM、月額コーヒー2杯未満)に住んでいます。監督者がサーバーを強化(ファイアウォール、fail2ban、鍵のみSSH)、Dockerにエージェントスタックをインストール、MiniMax-M3を設定、デプロイキーを生成してGitHubに登録しました—すべてSSH経由で無人で。

編集脳:Hermesが何か書く前に、監督者はそれが従うべきルールブックを書きました:読者とは誰か(チームリーダー、個人事業主、内部チャンピオン、技術責任者)、彼らが何に興奮するか(節約したお金、節約した時間、データの制御、英国の視点)、トーン(「コンサルタントではなく、鋭い同僚」)、形式(700~900ワード、クイックバージョンボックス、具体的なテイクアウト)、そしてハードルール—最も重要なのは、統計、引用、URLを決して捏造しないことです。

パイプライン:1日3回のcronスロット(英国時間07:30、12:30、18:00)。各実行:8つの信頼できるフィードから候補ストーリーを取得し、編集基準でスコアリングし、既存のコンテンツをスキップし、ルールブックに従ってドラフトし、構造、分類、単語数、引用リンクが実際に解決するかをチェックするバリデーターを通過し、ライセンス写真を取得し、公開し、コミットし、プッシュし、ライブURLをポーリング—そしてデプロイが失敗した場合、自動的にコミットをロールバックし理由を記録します。コードで制限を強制:1日最大3つの自律記事、最大1つの意見記事、薄いストーリーの場合はスロットをスキップする指示。

委任:人間はリンク(Webページ、X投稿、YouTubeキーノート)を送信できます。Hermesはそれを読み(ビデオの場合はトランスクリプト)、同じルールでドラフトし、承認のためにプライベートプレビューURLにステージングしてから公開します。最初の実際の委任は、All-In流動性サミットのキーノート分析で、3つのトークトランスクリプトから合成され、すべての引用が事実確認されました。

壊れた5つのこと—そしてそれがなぜ良いニュースか 透明条項:すべてが初回からうまくいったわけではありません。初日に5つの障害があり、それぞれが恒久的なガードレールになりました。

  1. ライターが統計を捏造:最初の監督付き記事で、MiniMax-M3はどのソースにもないもっともらしい価格比較を追加しました。監督者の事実確認が公開前にキャッチ。修正:捏造防止ゲート—ドラフトは実際に与えられたURLのみを引用でき、コードで強制され、プロンプトではない。
  2. 書式の癖がサイトビルドを壊す:最初の完全自律記事がサイトのスキーマが拒否する派手なメタデータ構造を使用し、ビルドが失敗し、サイトが2時間何もデプロイできず、監督者が修正するまで続いた。修正:公開前のより厳格なバリデーションと、検証およびロールバックステップ—悪い記事は数分以内に自動的に削除される。
  3. YouTubeがサーバーをブロック:データセンターIPは「ボットでないことを確認」壁に遭遇し、Hermesがトランスクリプトを読めなかった。修正:監督者が外部からゲートされたソースを取得し、テキストをサーバーに送信し、元のURLを引用記録として保持。
  4. モデルが考えすぎ:大きな3トランスクリプト合成で、M3の内部推論が出力予算全体を消費し、空の回答を返した。修正:それが発生したときに成長する適応予算。
  5. 独自のカテゴリ名を発明:「professional-services」のような近似ラベルがサイトの正確な分類法の代わりに使用された。修正:ライティング契約の明示的な許可リストと、近似を修正する機械的正規化器。

このリストは監督者モデルの本当の議論です。安価な作業馬とハードゲートと高価なレビューアが、読者が捏造コンテンツを見る前にすべての障害をキャッチし、それぞれをルールに変換しました。どの修正にも人間がコードを書く必要はありませんでした。

コスト スタックは意図的に平凡です:約10ユーロ/月のVPS、1日3記事分の従量課金MiniMax使用(1記事あたり数セント)、無料ホスティングとアナリティクス階層、無料ストックフォトライセンス、そして監督者用の創業者の既存Claudeサブスクリプション。総運用コストは月額数十ポンド未満—かつてストックフォトサブスクリプション1つにかかった費用よりも安く、研究、執筆、イラスト、公開、自己監視を行う出版物のためです。

このスタックを盗む このパターンは、小規模企業のほぼすべての反復的な知識ワークフローに転送可能です:レポート、入札、製品説明、クライアント更新。

  • 役割を分割:フロンティアモデルをアーキテクト/レビューアに、安価なモデルをボリュームワークに。雑務にプレミアム料金を払うことは、エージェントAI予算で最も一般的な間違いです。
  • エージェントと世界の間にバリデーターを置く:スキーマチェック、ソースチェック、レート制限—コード内で、プロンプトではなく。プロンプトはリクエストであり、ゲートはルールです。
  • すべてのアクションをコミットにする:Gitは監査、差分、ワンコマンドロールバックを無料で提供します。
  • デプロイ後に検証し、自動ロールバック:「公開した」は「ライブである」と同じではありません。
  • エージェントが開始する前にルールブックを書き、すべての人間の修正をフィードバックする。私たちのルールブックは2日間で5回修正され、各修正が次の出力を改善しました。
  • 評判に関わるものについては人間の出荷ボタンを維持し、人間が応答するアドレスを用意する:[email protected]

難しいところ エージェントには判断力がなく、判断力を持つものによって書かれたルールがあります。日々の記事は良くなってきていますが、編集脳は監督者によって修正され、監督者は人間によって導かれます—ここでの自律性は段階的に獲得されるものであり、仮定されていません。X監視はAPIコストが正当化されるまで保留されています。そしてこのアカウント全体は1日の運用をカバーしています:実行中の実験は、毎日3記事を何ヶ月も品質が維持されるかどうかです。私たちはそのフォローアップも公開します—障害を含めて。