AI News HubLIVE
サイト内リライト2 分で読了

Show HN: Shotlist – AIエージェントに実際のスクリーンショットで作業を証明させる

Shotlist は、単一の .shotlist.yaml 設定ファイルからドキュメント用のスクリーンショット(Webページ、ターミナルウィンドウ、CLIセッション)を自動生成するオープンソースツールです。再現性を確保し、CIと統合でき、複数のキャプチャモードをサポートして、スクリーンショットを常に最新に保ちます。

ソースHacker News AI著者: softie123

Shotlist は、ドキュメントスクリーンショットのメンテナンス問題を解決する新しいオープンソースツールです。開発者は .shotlist.yaml 設定ファイルを1つ作成するだけで、アプリケーションの起動方法とキャプチャする内容を記述し、ローカルまたはCI環境でワンクリックですべてのスクリーンショットを生成できます。このツールの核となる利点は再現性です:同じ設定とアプリケーション状態を使用すれば、常に完全に同一のスクリーンショットが生成されます。

Shotlist は4つのスクリーンショットタイプを提供します:Webスクリーンショット(Playwright と Chromium ブラウザを使用)、ネイティブターミナルスクリーンショット(macOSのみ、AppleScript と screencapture で実際の Terminal.app ウィンドウをキャプチャ)、レンダリングCLIスクリーンショット(プラットフォーム非依存、コマンド出力を PTY→ANSI→HTML 変換後、Chromium で描画)、セッションスクリーンショット(同一の持続ターミナル内で複数のコマンドを実行し、各ステップ後にキャプチャ)。この設計により、複雑なワークフローのスクリーンショットも簡単かつ確実に取得できます。

基本的なスクリーンショット機能に加えて、Shotlist は index.html ギャラリーページと manifest.json メタデータファイルも生成し、共有と統合を容易にします。CIパイプラインでは、shotlist check コマンドがベースラインからの予期しない差分を検出し、--diff オプションでベースライン、現在、差分の画像をレンダリングします。また、GitHub Action も同梱されています。

Shotlist の設計哲学は「AI不要」です:AI(Claudeなど)は初回の .shotlist.yaml 生成時のみ使用され、以降のスクリーンショット操作は100%決定論的なプログラム実行です。スクリーンショットエンジンは高速で無料、CI上で何度でも再実行可能であり、モデルは一切関与しません。プロジェクト自体も「自己ビルド」で検証されています:ドキュメント内のスクリーンショットはすべて自身の shotlist で生成されています。

現在、Shotlist は MIT ライセンスで初期バージョンがリリースされています。ソースコードは GitHub で公開され、Python 3.11 および 3.12 をサポートし、完全な開発およびテストフローが用意されています。