Mythosと協働する感覚 2026-06-10 02:11 UTC+9 著者は、初の一般公開されたMythosクラスのAIモデル「Claude 5 Fable」を早期体験。Fableは等時地図の作成や高度なデータ分析ソフトウェアの開発といった複雑なタスクで、従来モデルを大きく上回る性能を発揮する。ユーザーの役割は積極的な構築者から、結果を委託し評価するパトロンへと変化する。AIは自律的にリサーチ、コーディング、意思決定を行い、ブラックボックス化する。高いトークン消費や過敏なガードレール、透明性の欠如といった制限も存在する。
Fableは多様な複雑タスクで既存モデルを凌駕し、自律的に数時間にわたる作業を実行。 サブエージェントを起動してリサーチや検証を行い、人間の介入は最小限。 共存とコ・インテリジェンスの終焉 2026-06-05 06:13 UTC+9 著者は『コ・インテリジェンス』から2年、新著『共存』でAIの協力的利用から自律エージェントへの移行を考察。AIを使った執筆体験や、AIを読者・ゲートキーパーとして扱う必要性について語る。
新著『共存』は10月20日発売、予約受付中 著者は全章を自ら執筆したが、AIをフィードバックや事実確認、行き詰まり解消に活用 未来の兆し:GPT-5.5 2026-04-24 05:00 UTC+9 著者はGPT-5.5を先行体験し、特にコーディング、画像生成、統合アプリケーションにおいてAIの能力が大きく進歩したと評価する。モデル、アプリ、ツールの改善が進む一方、AIの「ギザギザしたフロンティア」は依然として存在し、特に長編創作において課題が残る。3D都市の進化シミュレーション、博士レベルの論文生成、ロールプレイングゲーム作成など、その能力を実例で示す。
GPT-5.5 Proはコーディングタスクで前世代より高速かつ高精度で、動的な3D街の進化をシミュレート。 OpenAIはモデル、アプリ(Codex)、ツール(テキスト描画可能な新画像生成モデル)で進歩。 Claude Dispatchとインターフェースの力 2026-04-01 07:34 UTC+9 AIの能力は一般に認識されているよりもはるかに高いが、ほとんどのユーザーはチャットボット経由でのみアクセスしており、これが認知負荷を生んでいる。この記事では、プログラミングエージェント(Claude Code)、Googleの実験的ツール、そしてOpenClawやClaude Coworkのようなパーソナルエージェントが、より良いインターフェースを通じてAIの可能性を引き出す方法を探る。
チャットボットインターフェースは認知税を課し、作業効率を低下させる Claude Codeのような特化型インターフェースはプログラマーには有効だが、非技術者向けの最適化は不足 物事の形状 2026-03-12 23:10 UTC+9 この記事は、AI能力の指数関数的成長と、それが仕事、市場、政策に与える深遠な影響について論じています。Claude CodeやCodexなどのAIエージェントが複雑なタスクを独立して完了できるようになり、「コ・インテリジェンス」から「AIの管理」への移行が起きています。著者は「カワウソテスト」や各種ベンチマークを通じてAIの急速な進歩を示し、その能力は驚異的であるものの、実際の採用はまだ初期段階であると指摘します。StrongDMの過激な「ソフトウェアファクトリー」実験や、市場変動、企業の人員削減、政策対立などAIによる「ローリングディスラプション」を紹介します。最後に、再帰的自己改善(RSI)が変化を加速させる可能性について警告しつつ、現在がAIの未来を形作る重要な窓口であると強調します。
AI能力は指数関数的に成長し、コ・インテリジェンスからAIエージェントの管理へと移行している。 強力なベンチマークは、AIが人間のエキスパートに迫るか超えるパフォーマンスを示している。 エージェント時代におけるAI選択ガイド 2026-02-18 10:45 UTC+9 本記事では、チャットボットからエージェントへの移行について深く分析し、AIを選ぶ際に考慮すべきモデル、アプリ、ハーネスの3要素を紹介します。GPT、Claude、Geminiの最新モデルとそのアプリケーション、フレームワークを詳しく比較し、さまざまなニーズに応じた実用的なアドバイスを提供します。
AIの使い方はチャットボットから自律的にタスクを実行するエージェントへと変化した。 AI選択にはモデル、アプリ、ハーネスの3つを考慮する必要がある。 経営がAIのスーパーパワーになる 2026-01-28 01:55 UTC+9 ペンシルベニア大学の実験で、MBA学生がAIツールを使って4日間でゼロからスタートアップを創り上げ、AIがいかに起業プロセスを加速するかを示した。記事では、エージェント的作業の方程式と、効果的な委任(マネジメントスキル)がAIの成功率を高める方法について考察する。
学生は4日間でAIを使い機能するプロトタイプを構築し、従来の起業サイクルを大幅に短縮した。 AI作業の価値は、人間の基準時間、成功確率、AI処理時間の3変数に依存する。 Claude Codeとその先にあるもの 2026-01-08 08:00 UTC+9 Claude Codeのような新しいAIコーディングツールは、自律的に複雑なタスクを完了し、エラーを自己修正する顕著な能力を示しています。本記事では、長時間の自律動作、コンテキスト圧縮、スキル、サブエージェントなどの機能を探り、プログラミングへの深い影響について論じます。現在は主にプログラマ向けですが、これらのツールは知識作業におけるAIの幅広い応用を示唆しています。
Claude Codeなどのツールは、コーディングタスクで長時間自律的に動作し、自己修正できる。 コンテキスト圧縮、スキル、サブエージェントなどのメカニズムでLLMの限界を克服。 AIの形状:ギザギザのフロンティア、ボトルネック、そして突出点 2025-12-21 02:32 UTC+9 AIの能力は不均一であり、「ギザギザのフロンティア」と表現されます。進歩はしばしばボトルネックによって阻まれますが、それが解決されると、GoogleのNano Banana Proが画像生成を改善し、PowerPoint作成などの新たな能力を引き出したように、突然の飛躍がもたらされます。
AIのギザギザのフロンティアは、あるタスクでは優れているが他のタスクでは失敗するという、予測不可能な性質を指す。 画像生成の貧弱さなどのボトルネックが、システム全体を阻害することがある。 GPT-3からGemini 3へ:3年間のAI進化 2025-11-19 01:55 UTC+9 著者は、3年前のChatGPTと現在のGemini 3を比較し、AIがチャットボットからエージェントへと進化したことを示す。Gemini 3はコーディング、ゲーム作成、博士レベルの研究を自律的に行い、「デジタル同僚」の時代の到来を告げている。
3年前には詩を書く程度だったAIが、今ではインタラクティブなゲームを構築し、複雑な研究を自律的に実行 GoogleのGemini 3とエージェントツールAntigravityは、AIの対話から行動へのシフトを示す AIに就職面接を行う 2025-11-12 11:46 UTC+9 AIのアドバイスの重要性が増すにつれ、それを評価する能力も向上させる必要があります。現在のベンチマークにはデータ漏洩、意味の不明確さ、難易度の未較正などの問題があります。しかし、総合的には基礎的な能力を測定しています。ただし、文章作成やビジネスアドバイスなどの特定のタスクでは不十分です。著者は「雰囲気ベース」のベンチマーク(例えば、ペリカンが自転車に乗っている絵を描かせる)や、OpenAIのGDPvalのような実世界タスクのテストを提案し、組織は従業員を採用するかのようにAIを体系的に評価すべきだと論じています。
現在のAIベンチマークにはデータ漏洩、意味の不明確さ、較正の問題がある 総合ベンチマークは上昇傾向を示すが、特定タスクには不十分 今すぐAIを使うための私見的ガイド 2025-10-20 03:45 UTC+9 本記事は、2025年後半におけるAIの使い方についての私見的ガイドです。無料・有料のAIモデルの選び方、主要なAIシステム(Claude、Gemini、ChatGPTなど)の比較、より良い回答を得るための方法(ディープリサーチやデータ連携)、マルチモーダル入力、画像・動画生成などをカバーしています。著者は実際の利用パターンに基づいてアドバイスを提供し、実験と直感の重要性を強調しています。
現在、人類の約10%が週に一度AIを利用しており、ほとんどは無料ツールを使用している 有料のAIシステムとしてはClaude、Gemini、ChatGPTの3つが推奨される(月額20ドル)