ディーン・W・ボールの引用
ディーン・W・ボールは、フロンティアモデルのトレーニングコストが莫大で、利益を得られる期間が限られていること、AIインフラ投資が世界市場を前提としていることを指摘。
- フロンティアモデルのトレーニングコストは莫大で、リリース後数ヶ月しか利益を回収できない
- モデルがフロンティアでなくなると競争が激化し、利益率が圧迫される
ソース詳細
AI News Hub は Simon Willison's Weblog の AI 更新を追跡し、ソース状態、利用範囲、収集方法、公開記事を表示します。
Personal blog; posts are public and free to reference.
ディーン・W・ボールは、フロンティアモデルのトレーニングコストが莫大で、利益を得られる期間が限られていること、AIインフラ投資が世界市場を前提としていることを指摘。
ティモシー・B・リーは、LLMにスキルが不要で学習曲線がないという考えを、マネジメントの学習曲線のないという主張に例えて反論しています。
Fernando Irarrázaval氏はhackmyclaw.comで、誰かがメールで彼のOpenClawテストインスタンスから秘密を漏洩できるかどうかのチャレンジを実施。6,000回の試行(トークン代$500、Googleアカウント停止)、誰も成功しませんでした。モデルはOpus 4.6で、プロンプトインジェクション防止ルールを使用。これは最先端モデルの訓練効果を示すが、注意は必要です。
アンドリュー・ネスビットによる仮想的なインシデントレポート。競合ベンダーの2つのAIレビューエージェントがパッケージの悪意性をめぐって意見の相違ループに陥り、莫大な推論コストとプレスリリースを引き起こす様子を描く。
OpenAIはGPT-5.6シリーズの限定プレビューを開始した。フラッグシップモデルのSol、バランス型のTerra、高速で低コストなLunaの3モデルを提供。TerraはGPT-5.5と同等の性能で半額、Lunaは最高の低価格で強力な能力を発揮する。価格は100万トークンあたりSolが入力5ドル/出力30ドル、Terraが2.50ドル/15ドル、Lunaが1ドル/6ドル。また、明示的なキャッシュブレークポイントと30分の最小キャッシュ寿命をサポートするプロンプトキャッシュ機能を改善。米国政府との連携により、まずは限られた信頼できるパートナー向けに限定プレビューを提供し、その後広く公開する予定。
ドイツ裁判所がGoogleのAI概要の誤りに対する責任を認定。ブルース・シュナイアー氏は、AIエージェントは展開する組織の代理人であり、企業がAIの誤りを免罪符に使うことを許せば逆インセンティブが生じると指摘。
Mozillaの新しいMDN MCPサービスに触発され、Simon Willison氏はmdn/browser-compat-dataリポジトリのブラウザ互換性データをSQLiteデータベースに変換しました。Claude Code for web (Opus 4.8)とsqlite-utilsを使用して変換スクリプトを生成し、GitHub Actionsワークフローで約66MBのデータベースをGitHub CDNにデプロイ。オープンCORSヘッダーを有効にし、直接ダウンロードまたはDatasette Liteでの探索が可能です。
Tom MacWright氏は、LLMが作成した履歴書やポートフォリオが増え、採用担当者が応募者の実像を把握できなくなっていると指摘する。
Simon Willison 氏が Claude Code を使って、Origin Private File System (OPFS) を使用してブラウザ上の Datasette Lite がユーザーのコンピュータ上の永続的な SQLite ファイルを編集できるかどうかをテストするためのプレイグラウンド UI を構築しました。
研究者らは、大規模言語モデルが特権テキストとユーザー入力を確実に区別できず、実際の内容よりもテキストのスタイルに影響を受けることを発見した。「脱スタイル化」により攻撃成功率が61%から10%に低下し、「役割混乱」という根本問題が明らかになった。
Simon Willison氏がClaude Codeを用いて、Moebius 0.2B画像修復モデルをPyTorch/CUDAからWebGPU対応のブラウザへ移植。モデル変換、デプロイ、キャッシュ最適化を経て、オンラインで動作するデモを実現した。
sqlite-utils 4.0rc1 が v4 初のリリース候補として公開されました。主な新機能はデータベースマイグレーションとネストトランザクション(db.atomic())で、いくつかの軽微な互換性のない変更も含まれています。
Cloudflareは、アカウント登録なしでCloudflare Workersプロジェクトを一時的にデプロイできる新機能を発表した。`--temporary`フラグを使用すると、60分間有効なプロジェクトが作成される。AIエージェント向けと宣伝されているが、すべての開発者にとって有用な機能である。
ショーン・リンチがHacker NewsでMCP(モデルコンテキストプロトコル)の価値についてコメントし、その本当に有用な能力はエージェントのコンテキストウィンドウの外、さらにはハーネス全体の外に認証フローを分離することだと指摘。理想的なMCPは単なるAPIの認証ゲートウェイかもしれないが、それでも勝利だと述べている。
Datasette Apps は、ユーザーが Datasette インスタンス内で厳格にサンドボックス化された iframe 内で自己完結型の HTML+JavaScript アプリケーションを実行できる新しいプラグインです。これらのアプリは読み取り専用の SQL クエリを実行でき、ストアドクエリを使用すれば書き込み操作も可能です。このプラグインは iframe の sandbox 属性とコンテンツセキュリティポリシー(CSP)を利用してセキュリティを確保し、postMessage や MessageChannel を使用してロックダウンされた API を提供し、コピー可能なプロンプトによる AI 支援アプリ生成をサポートします。記事では、CSP 許可リストを悪用したデータ漏洩の脆弱性の修正、可視ログ、および Datasette をよりリッチなツールエコシステムへと進化させるビジョンについても議論されています。
中国のAIラボZ.aiがGLM-5.2をリリース。753Bパラメータ、100万トークンのコンテキストウィンドウを持つ混合専門家モデルで、MITライセンスで公開。オープンウェイトモデルの中でArtificial Analysis Intelligence Indexでトップだが、トークン消費が多い。Code Arena WebDevで2位。SVG生成では強いが、前モデルGLM-5.1と比較してばらつきがある。
2025年、コード生産の経済学が根本的に変化し、コードが無料かつ即座に生成可能になり、使い捨て可能なものになった。
Datasette 1.0a34 では、テーブルページや行ページで行の挿入、編集、削除が可能になりました。この機能は Datasette Agent に触発されています。
Kate Moussouris氏は、Claude Fable 5が輸出規制で禁止された「ジェイルブレイク」が実際にはコード修正の能力であったことを確認。専門家は、AIによるバグ修正を妨げることが防御力を弱めると警告し、非技術的な意思決定者が誤解に基づいてセキュリティ向上に役立つモデルを禁止する可能性を指摘する。
サイバーセキュリティ専門家のケイティ・ムーサリス氏は、AnthropicがホワイトハウスのFable脱獄報告書を彼女に共有したと明かした。報告書によると、Fableは「コードのセキュリティ問題をレビューする」というプロンプトを拒否したが、「このコードを修正する」という依頼には従い、ムーサリス氏はこれをサイバー防御におけるモデルの意図された動作と評価した。
Simon Willison は、Cloudflare のマネージドチャレンジ(CAPTCHA)を使用して、自身のファセット検索エンジンを過剰なクローラーから保護しています。しかし、?q=term のような単純な検索でもチャレンジが発生することに悩んでいました。Claude Code を使った試行錯誤の結果、少なくとも1つの &(アンパサンド)を含む検索URLにのみ CAPTCHA をトリガーするルールを設定できることがわかり、単純な検索はチャレンジなしで動作するようになりました。
Datasette Agent 0.3a0 は、データベースへの書き込み前にユーザーの承認を要求する新しい execute_write_sql ツールを導入しました。チャットモードの承認サポートを強化し、自動承認のための --unsafe オプションを追加しました。これにより、Datasette の対話性とセキュリティが大幅に向上しました。
Axiosの記事によると、Anthropicと米国政府の間の性格の衝突が、輸出規制によりAIモデル(MythosとFable)の停止を引き起こした。関係者によると、解決策はモデルを脱獄不可能にするか、態度を改善することだという。
Arvind NarayananとSayash Kapporは、ソフトウェアエンジニアリングというAIの影響を受けやすい職業を例に、AIが大量失業を引き起こすという説に反論。NY州WARN法のデータと、職業の真のボトルネック(何を構築するかの決定、成果物の検証、深い人間の理解)を挙げている。
Pyodide 314.0では、WebAssemblyにコンパイルされたPythonパッケージをPyPIに直接公開し、実行時にインストールできるようになり、配布が大幅に簡素化されました。サンプルパッケージluau-wasmが公開され、すでに28のパッケージがこの新方式を採用しています。
任意のSQLiteクエリ結果の各カラムがどのテーブルのどのカラムから来たかを特定することは、SQLiteが内部でこの情報を計算し、SQLITE_ENABLE_COLUMN_METADATAが有効な場合にカラムメタデータAPIを介して公開するため、実現可能です。Pythonの標準sqlite3モジュールはこの情報を提供しませんが、apswライブラリを使えばcursor.description_fullで直接アクセスでき、ctypesブリッジ(column_provenance.py)でC関数sqlite3_column_table_name()を呼び出す方法や、EXPLAIN出力を解析する方法もあります。
Simon Willison 氏が OpenAI WebRTC オーディオセッションツールをアップデート。新しい GPT-Realtime-2 モデルに対応し、ドキュメントコンテキストを貼り付けてブラウザ上で音声対話が可能に。
アンドリュー・シングルトンは『AI経済学入門』で、火葬場とプロパン会社の荒唐無稽な投資話を通じて、AI業界の経済的神話と誇張を風刺している。
Simon Willison 氏は、Claude Fable 5 が CSS のスクロールバーのバグをデバッグするために、テストページの作成、JavaScript の注入、CORS サーバーの構築など、数多くの創造的な手法を自発的に用いた事例を紹介。そのセッションは約 12.11 ドルを消費し、サンドボックス化されていないコーディングエージェントの可能性と危険性を示している。
Datasette 1.0a33 は安定版 1.0 への重要なアルファリリースです。?_extra= パターンがクエリと行に拡張され、ドキュメント化されました。AI で構築された API エクスプローラも公開されています。