AI News HubLIVE
サイト内リライト2 分で読了

より安価で安全なエージェント型AIワークフロー

ある開発者がGLM-5.2やDeepSeek V4 Flashなどのモデルを使い、低コスト(0.034ドル)で効率的なエージェント型AIコーディングを実現し、VirtualBoxのサンドボックスでプライバシーを保護した経験を共有。具体的な手順、コスト比較、AI業界のビジネスモデルへの考察を述べている。

ソースHacker News AI著者: danuker

最近、ある開発者が実際のエージェント型AIコーディングを試しました。そのエージェントタスクは0.034ドル、3分で完了し、2つの誤りがありました。対照的に、本人が手動で行った場合は1時間かかり、4つの誤りを犯しました。この経験から、より安価で安全なAIワークフローを探究することになりました。

最初にGLM-5.2モデルを試しました。このモデルはベンチマークで3ヶ月前の主要な専用AIに匹敵します。GMI Cloudサービスを通じて5ドルの無料クレジットを取得し、Debian仮想マシンでプロジェクト環境を隔離してプライバシーを保護しました。仮想マシンにインストールしたpiエージェントは5分でタスクを完了し、0.435ドルかかりましたが、完全な結果でした。

さらにコストを下げるため、DeepSeek V4 Flashモデルに切り替えました。このモデルはやや冗長ですが、コストはGLM-5.2の10分の1未満です。同じタスクを3分で完了し、0.034ドルしかかかりませんでしたが、2つの小さな誤り(不規則なデータ系列を「毎日」と誤表示)がありました。また、DeepSeek V4 Proもテストし、誤りゼロ、2分27秒、0.229ドルでした。最終的にProを主力とし、Flashを日常的に使用することにしました。

コスト最適化のため、piツールのハードコードされた制限を変更し、デフォルトの最大バイト数を50KBから5KBに減らしました。これにより入力トークン数が大幅に削減され、DeepSeek V4 Flashではプロンプトトークンが604kから431kに減り、総コストが0.034ドルから0.026ドルに低下しました。

著者は、作業方法が根本的に変わったと述べています。手動でコードをコピーペーストする代わりに、エージェントにタスクを依頼し、ファイルの差分を確認するようになりました。オープンウェイトモデルは数ヶ月遅れているだけであり、AnthropicのClaude Code排他性や突然の値上げは反競争的だと批判。ハードウェアプロバイダー(GMI CloudやDeepInfra)は柔軟な価値を提供し、ハードウェアの減価償却は少なくとも数年かかるのに対し、モデルの価値は急速に低下すると指摘。モデルの持続可能な収益化方法として、クラウドファンディング、非営利、公共事業などを提案しています。