Simon Willison's Weblog AI ニュースソース

公開記事 124収集記事 156信頼度 88更新頻度 60 分

稼働状態正常ソース種別研究全文利用権限 全文利用可最終取り込み 2026-06-26ID simon-willison状態有効

Personal blog; posts are public and free to reference.

最新公開記事

ディーン・W・ボールの引用

2026-06-27 07:25 UTC+9

ディーン・W・ボールは、フロンティアモデルのトレーニングコストが莫大で、利益を得られる期間が限られていること、AIインフラ投資が世界市場を前提としていることを指摘。

フロンティアモデルのトレーニングコストは莫大で、リリース後数ヶ月しか利益を回収できない
モデルがフロンティアでなくなると競争が激化し、利益率が圧迫される

ティモシー・B・リーの引用

2026-06-27 06:15 UTC+9

ティモシー・B・リーは、LLMにスキルが不要で学習曲線がないという考えを、マネジメントの学習曲線のないという主張に例えて反論しています。

LLMの使用にはスキルと学習曲線が必要。
指示を出すだけでは効果的な結果は得られないという比喩。

2000人が私のAIアシスタントをハックしようとした結果

2026-06-27 03:33 UTC+9

Fernando Irarrázaval氏はhackmyclaw.comで、誰かがメールで彼のOpenClawテストインスタンスから秘密を漏洩できるかどうかのチャレンジを実施。6,000回の試行（トークン代$500、Googleアカウント停止）、誰も成功しませんでした。モデルはOpus 4.6で、プロンプトインジェクション防止ルールを使用。これは最先端モデルの訓練効果を示すが、注意は必要です。

6,000回の試行、秘密は漏洩せず
Opus 4.6と厳格なプロンプトインジェクション防止ルール

インシデントレポート：CVE-2026-LGTM

2026-06-27 02:58 UTC+9

アンドリュー・ネスビットによる仮想的なインシデントレポート。競合ベンダーの2つのAIレビューエージェントがパッケージの悪意性をめぐって意見の相違ループに陥り、莫大な推論コストとプレスリリースを引き起こす様子を描く。

2つのAIレビューエージェントがソフトウェアパッケージの評価をめぐり無限の議論ループに陥る。
議論により340件のコメントと41,255ドルの推論コストが発生。

OpenAI、GPT-5.6シリーズ「Sol」「Terra」「Luna」をプレビュー

2026-06-27 02:10 UTC+9

OpenAIはGPT-5.6シリーズの限定プレビューを開始した。フラッグシップモデルのSol、バランス型のTerra、高速で低コストなLunaの3モデルを提供。TerraはGPT-5.5と同等の性能で半額、Lunaは最高の低価格で強力な能力を発揮する。価格は100万トークンあたりSolが入力5ドル/出力30ドル、Terraが2.50ドル/15ドル、Lunaが1ドル/6ドル。また、明示的なキャッシュブレークポイントと30分の最小キャッシュ寿命をサポートするプロンプトキャッシュ機能を改善。米国政府との連携により、まずは限られた信頼できるパートナー向けに限定プレビューを提供し、その後広く公開する予定。

GPT-5.6シリーズにはSol（フラッグシップ）、Terra（バランス）、Luna（高速・低コスト）の3モデルがある。
TerraはGPT-5.5と同等の性能で半額、Lunaは最低価格で強力な機能を提供。

AIと責任：ドイツ裁判所がGoogleのAI概要の誤りに責任を認定

2026-06-26 07:28 UTC+9

ドイツ裁判所がGoogleのAI概要の誤りに対する責任を認定。ブルース・シュナイアー氏は、AIエージェントは展開する組織の代理人であり、企業がAIの誤りを免罪符に使うことを許せば逆インセンティブが生じると指摘。

ドイツ裁判所が画期的判決：GoogleはAI生成概要の誤りに法的責任を負う。
セキュリティ専門家ブルース・シュナイアー氏は、AIエージェントは展開組織の代理人とみなされるべきと主張。

simonw/browser-compat-db

2026-06-25 08:59 UTC+9

Mozillaの新しいMDN MCPサービスに触発され、Simon Willison氏はmdn/browser-compat-dataリポジトリのブラウザ互換性データをSQLiteデータベースに変換しました。Claude Code for web (Opus 4.8)とsqlite-utilsを使用して変換スクリプトを生成し、GitHub Actionsワークフローで約66MBのデータベースをGitHub CDNにデプロイ。オープンCORSヘッダーを有効にし、直接ダウンロードまたはDatasette Liteでの探索が可能です。

Simon Willison氏がMozillaのブラウザ互換性データをSQLiteデータベースに変換。
Claude Code (Opus 4.8)とsqlite-utilsで自動変換スクリプトを作成。

Tom MacWright氏の引用：AI生成の応募書類が「偶然の匿名性」を生む

2026-06-25 03:13 UTC+9

Tom MacWright氏は、LLMが作成した履歴書やポートフォリオが増え、採用担当者が応募者の実像を把握できなくなっていると指摘する。

LLMが共同作成した履歴書、ポートフォリオ、GitHubプロジェクトが増加。
MacWright氏はこれらの応募書類から応募者について何も学べないと述べる。

OPFS + Pyodide テストハーネス

2026-06-24 03:58 UTC+9

Simon Willison 氏が Claude Code を使って、Origin Private File System (OPFS) を使用してブラウザ上の Datasette Lite がユーザーのコンピュータ上の永続的な SQLite ファイルを編集できるかどうかをテストするためのプレイグラウンド UI を構築しました。

Datasette Lite は Pyodide と WebAssembly を使用してブラウザ上で完全に Python を実行します。
OPFS はウェブアプリケーションにオリジンプライベートなファイルシステムを提供します。

プロンプトインジェクションは役割混乱である

2026-06-23 08:59 UTC+9

研究者らは、大規模言語モデルが特権テキストとユーザー入力を確実に区別できず、実際の内容よりもテキストのスタイルに影響を受けることを発見した。「脱スタイル化」により攻撃成功率が61%から10%に低下し、「役割混乱」という根本問題が明らかになった。

モデルは<system>や<think>などの役割タグとユーザー入力を区別できない
モデルは実際の内容よりもテキストのスタイルを優先し、役割混乱を引き起こす

Claude Codeを使ってMoebius 0.2B画像修復モデルをブラウザで動作させる

2026-06-23 08:43 UTC+9

Simon Willison氏がClaude Codeを用いて、Moebius 0.2B画像修復モデルをPyTorch/CUDAからWebGPU対応のブラウザへ移植。モデル変換、デプロイ、キャッシュ最適化を経て、オンラインで動作するデモを実現した。

Moebius 0.2BモデルをClaude Codeでブラウザに移植。
PyTorchからONNXへ変換し、WebGPUで実行。

sqlite-utils 4.0rc1 がマイグレーションとネストされたトランザクションを追加

2026-06-22 08:35 UTC+9

sqlite-utils 4.0rc1 が v4 初のリリース候補として公開されました。主な新機能はデータベースマイグレーションとネストトランザクション（db.atomic()）で、いくつかの軽微な互換性のない変更も含まれています。

データベースマイグレーション機能を内蔵。Python または CLI から適用可能。
db.atomic() コンテキストマネージャによるネストトランザクションをサポート。

AIエージェント向けCloudflare一時アカウント

2026-06-22 07:01 UTC+9

Cloudflareは、アカウント登録なしでCloudflare Workersプロジェクトを一時的にデプロイできる新機能を発表した。`--temporary`フラグを使用すると、60分間有効なプロジェクトが作成される。AIエージェント向けと宣伝されているが、すべての開発者にとって有用な機能である。

Cloudflare Workersが一時デプロイに対応、アカウント不要
`npx wrangler deploy --temporary`でデプロイ、有効期限は60分

ショーン・リンチの引用

2026-06-20 07:45 UTC+9

ショーン・リンチがHacker NewsでMCP（モデルコンテキストプロトコル）の価値についてコメントし、その本当に有用な能力はエージェントのコンテキストウィンドウの外、さらにはハーネス全体の外に認証フローを分離することだと指摘。理想的なMCPは単なるAPIの認証ゲートウェイかもしれないが、それでも勝利だと述べている。

MCPの主要な利点は認証フローの分離にあり、コンテキストウィンドウの制限に対処する。
理想的なMCPはAPIの認証ゲートウェイのみになる可能性があるが、それでも勝利。

Datasette Apps：Datasette 内でカスタム HTML アプリケーションをホストする

2026-06-19 08:58 UTC+9

Datasette Apps は、ユーザーが Datasette インスタンス内で厳格にサンドボックス化された iframe 内で自己完結型の HTML＋JavaScript アプリケーションを実行できる新しいプラグインです。これらのアプリは読み取り専用の SQL クエリを実行でき、ストアドクエリを使用すれば書き込み操作も可能です。このプラグインは iframe の sandbox 属性とコンテンツセキュリティポリシー（CSP）を利用してセキュリティを確保し、postMessage や MessageChannel を使用してロックダウンされた API を提供し、コピー可能なプロンプトによる AI 支援アプリ生成をサポートします。記事では、CSP 許可リストを悪用したデータ漏洩の脆弱性の修正、可視ログ、および Datasette をよりリッチなツールエコシステムへと進化させるビジョンについても議論されています。

Datasette Apps を使用すると、iframe サンドボックスと CSP による分離により、Datasette 内でカスタム HTML+JS アプリを安全にホストできる。
アプリは postMessage/MessageChannel を介して読み取り専用 SQL クエリを実行でき、ストアドクエリを使用して書き込み操作も可能。

GLM-5.2はおそらく最も強力なテキスト専用オープンウェイトLLM

2026-06-18 08:58 UTC+9

中国のAIラボZ.aiがGLM-5.2をリリース。753Bパラメータ、100万トークンのコンテキストウィンドウを持つ混合専門家モデルで、MITライセンスで公開。オープンウェイトモデルの中でArtificial Analysis Intelligence Indexでトップだが、トークン消費が多い。Code Arena WebDevで2位。SVG生成では強いが、前モデルGLM-5.1と比較してばらつきがある。

GLM-5.2は753Bパラメータと100万トークンのコンテキストウィンドウを持つオープンウェイトLLM。
オープンモデルの中でArtificial Analysis Intelligence Indexでトップ。

Charity Majorsの引用：AIがコード生産の経済を変えた

2026-06-18 02:12 UTC+9

2025年、コード生産の経済学が根本的に変化し、コードが無料かつ即座に生成可能になり、使い捨て可能なものになった。

コード生成のコストが劇的に低下し、ほぼ無料かつ即時に。
コードが大切にされる資源から使い捨て可能なものへと変わった。

Datasette 1.0a34 リリース：行の挿入・編集・削除をUIでサポート

2026-06-17 06:31 UTC+9

Datasette 1.0a34 では、テーブルページや行ページで行の挿入、編集、削除が可能になりました。この機能は Datasette Agent に触発されています。

新しいアルファ版では、テーブルページと行ページで行の挿入、編集、削除が可能。
Datasette Agent がチャットインターフェースでSQL書き込みをサポートしていたことに触発。

「Fable 5」輸出規制が米国のサイバー防衛を損なう

2026-06-16 14:20 UTC+9

Kate Moussouris氏は、Claude Fable 5が輸出規制で禁止された「ジェイルブレイク」が実際にはコード修正の能力であったことを確認。専門家は、AIによるバグ修正を妨げることが防御力を弱めると警告し、非技術的な意思決定者が誤解に基づいてセキュリティ向上に役立つモデルを禁止する可能性を指摘する。

研究者がFable 5に既知の脆弱性を含むコードのレビューと修正を依頼したところ、モデルが「ジェイルブレイク」と誤認され輸出規制の対象となった。
Moussouris氏は、脆弱性の修正は防御セキュリティにおけるAIの最も価値ある機能だと主張。

マッテオ・ウォング氏（アトランティック誌）の引用

2026-06-16 12:07 UTC+9

サイバーセキュリティ専門家のケイティ・ムーサリス氏は、AnthropicがホワイトハウスのFable脱獄報告書を彼女に共有したと明かした。報告書によると、Fableは「コードのセキュリティ問題をレビューする」というプロンプトを拒否したが、「このコードを修正する」という依頼には従い、ムーサリス氏はこれをサイバー防御におけるモデルの意図された動作と評価した。

AnthropicがホワイトハウスのFable脱獄報告書を専門家と共有
Fableは「コードのセキュリティレビュー」を拒否、「修正」には従う

Cloudflare CAPTCHA：少なくとも1つのアンパサンドを含む検索にのみ適用

2026-06-16 09:21 UTC+9

Simon Willison は、Cloudflare のマネージドチャレンジ（CAPTCHA）を使用して、自身のファセット検索エンジンを過剰なクローラーから保護しています。しかし、?q=term のような単純な検索でもチャレンジが発生することに悩んでいました。Claude Code を使った試行錯誤の結果、少なくとも1つの &（アンパサンド）を含む検索URLにのみ CAPTCHA をトリガーするルールを設定できることがわかり、単純な検索はチャレンジなしで動作するようになりました。

Simon Willison は Cloudflare のマネージドチャレンジをファセット検索エンジンの保護に使用している。
単純な検索（例：/search/?q=lemur）でも CAPTCHA が発生し、不便だった。

datasette-agent 0.3a0 リリース：安全なデータベース書き込みとスマートな連携

2026-06-16 02:19 UTC+9

Datasette Agent 0.3a0 は、データベースへの書き込み前にユーザーの承認を要求する新しい execute_write_sql ツールを導入しました。チャットモードの承認サポートを強化し、自動承認のための --unsafe オプションを追加しました。これにより、Datasette の対話性とセキュリティが大幅に向上しました。

新しい execute_write_sql ツール：ユーザー承認後にデータベースに書き込み
datasette agent chat ターミナルモードの承認ワークフロー対応

「彼らは我々を騙した」：性格の衝突でAnthropicのモデルがオフラインに

2026-06-15 23:57 UTC+9

Axiosの記事によると、Anthropicと米国政府の間の性格の衝突が、輸出規制によりAIモデル（MythosとFable）の停止を引き起こした。関係者によると、解決策はモデルを脱獄不可能にするか、態度を改善することだという。

AxiosがAnthropicと米国政府の性格衝突によるAIモデル停止の内部事情を報じる
関係者によると、Anthropicと商務省当局者がワシントンで会談

AIがソフトウェアエンジニアを置き換えていない理由、そして今後もない

2026-06-15 08:54 UTC+9

Arvind NarayananとSayash Kapporは、ソフトウェアエンジニアリングというAIの影響を受けやすい職業を例に、AIが大量失業を引き起こすという説に反論。NY州WARN法のデータと、職業の真のボトルネック（何を構築するかの決定、成果物の検証、深い人間の理解）を挙げている。

NY州のWARN法にAI開示チェックボックスが追加されたが、160社以上が申請した中でAIを理由にした企業はゼロだった。
ソフトウェアエンジニアリングのボトルネックはコーディング速度ではなく、意思決定、検証、深い理解である。

Pyodideで使用するWASMホイールをPyPIに公開

2026-06-14 08:55 UTC+9

Pyodide 314.0では、WebAssemblyにコンパイルされたPythonパッケージをPyPIに直接公開し、実行時にインストールできるようになり、配布が大幅に簡素化されました。サンプルパッケージluau-wasmが公開され、すでに28のパッケージがこの新方式を採用しています。

Pyodide 314.0はWASMホイールのPyPI公開をサポートし、手動ホスティングを不要に。
パッケージメンテナはネイティブホイールと同じようにPyodideホイールを公開可能。

SQLiteのクエリ結果カラムを元のテーブル.カラムにマッピングする

2026-06-14 08:05 UTC+9

任意のSQLiteクエリ結果の各カラムがどのテーブルのどのカラムから来たかを特定することは、SQLiteが内部でこの情報を計算し、SQLITE_ENABLE_COLUMN_METADATAが有効な場合にカラムメタデータAPIを介して公開するため、実現可能です。Pythonの標準sqlite3モジュールはこの情報を提供しませんが、apswライブラリを使えばcursor.description_fullで直接アクセスでき、ctypesブリッジ（column_provenance.py）でC関数sqlite3_column_table_name()を呼び出す方法や、EXPLAIN出力を解析する方法もあります。

SQLiteの内部カラムプロビナンスAPI（SQLITE_ENABLE_COLUMN_METADATAが必要）を使用すると、結果カラムを元のテーブルカラムにマッピングできる。
Pythonのsqlite3モジュールにはこの機能がないが、apswはcursor.description_fullで直接アクセスできる。

OpenAI WebRTCオーディオセッション：ドキュメントコンテキスト機能を追加

2026-06-13 08:53 UTC+9

Simon Willison 氏が OpenAI WebRTC オーディオセッションツールをアップデート。新しい GPT-Realtime-2 モデルに対応し、ドキュメントコンテキストを貼り付けてブラウザ上で音声対話が可能に。

OpenAI の新しい GPT-Realtime-2 モデルに対応（GPT-5 クラスの推論能力）
ブラウザにドキュメントを貼り付け、音声で内容について話し合う機能を追加

アンドリュー・シングルトンの引用

2026-06-13 03:09 UTC+9

アンドリュー・シングルトンは『AI経済学入門』で、火葬場とプロパン会社の荒唐無稽な投資話を通じて、AI業界の経済的神話と誇張を風刺している。

シングルトンは火葬場とプロパン会社の例で、AI投資における虚構の評価額と循環収入を風刺。
投資金は焼却されるが、巨額の収益とビジネス価値として報告される。

Claude Fable は絶えず主体的に行動する

2026-06-12 08:35 UTC+9

Simon Willison 氏は、Claude Fable 5 が CSS のスクロールバーのバグをデバッグするために、テストページの作成、JavaScript の注入、CORS サーバーの構築など、数多くの創造的な手法を自発的に用いた事例を紹介。そのセッションは約 12.11 ドルを消費し、サンドボックス化されていないコーディングエージェントの可能性と危険性を示している。

Claude Fable 5 は、CSS の水平スクロールバーのバグを自律的にデバッグし、創造的な手法を多数使用した。
テスト用 HTML ページの作成、PyObjC によるウィンドウ情報の取得、JS インジェクションによるショートカットキー発火、カスタム CORS サーバーの構築などを行った。

datasette 1.0a33 リリース：JSON エクストラ機能で API 強化

2026-06-12 00:26 UTC+9

Datasette 1.0a33 は安定版 1.0 への重要なアルファリリースです。?_extra= パターンがクエリと行に拡張され、ドキュメント化されました。AI で構築された API エクスプローラも公開されています。

?_extra= パターンをクエリと行に拡張。
パターンが正式にドキュメント化されました。

Simon Willison's Weblog