SaaSアプリにAIを追加する5つのレベル
シンプルなSaaSからAIネイティブプラットフォームへの移行のための実用的なフレームワーク。MCPサーバーと個人アクセストークンから、埋め込みチャット、会話履歴、カスタムUI生成、そして最終的に計画とスケジューリングを備えたエージェントハーネスまでの5つのレベルを解説。著者は複数の内部エージェント構築と既存フローへのAI組み込みの経験を基に洞察を共有。
- レベル1:MCPサーバーでAPIエンドポイントを公開。UI変更不要。プロンプトライブラリと評価を構築。
- レベル2:ダッシュボードにAIチャットウィンドウを埋め込み、ストリーミングとページコンテキストを提供。
Microsoft Copilot Healthを実際の医療記録で試してみた――その評価
MicrosoftのCopilot Healthプレビューでは、ユーザーが医療記録を共有して個別化されたAI健康アドバイスを受けられます。著者がテストしたところ、技術的な不具合により結果はまちまちで、プライバシー保護措置はあるものの、AIに医療判断を委ねることへの注意を促しています。
- Microsoft Copilot Healthは個人の医療記録を活用して健康アドバイスをカスタマイズ。
- プライバシー対策として暗号化、トレーニングデータ非利用、医師の監視がある。
コパイロットからドライバーへ:MicrosoftのAIが主導権を握る
Microsoftは常時稼働する自律型AIエージェント「Autopilot」を発表。最初のエージェント「Scout」はユーザーの行動を監視し、自動的にタスクを実行して業務を効率化する。ただし、OpenClawベースであることからセキュリティ上の懸念があり、プロンプトインジェクション攻撃のリスクも指摘されている。現在は限られた顧客のみがプレビューにアクセス可能で、GitHub Copilotのサブスクリプションが必要。
- MicrosoftがAutopilotエージェントカテゴリーを発表。初のScoutは自律的に常時動作する。
- Scoutは会議の自動スケジュール、期限の通知、リスクの特定などを行い、いわば「ワークナニー」として機能する。
MetaのAI追従への内部努力
Meta内部チームTBDのリーダーWang氏は、専有モデルとスタートアップ文化を推進するが、会社のレイオフや追跡ソフトウェアへの抗議に直面。AIモデルMuse Sparkは視覚理解で高評価を得る一方、コーディング能力で競合に劣り、今後のモデルはコーディング、エージェントタスク、動画生成に注力する。
- Wang氏はMetaの長年のオープンソース方針から専有モデルへのシフトを主張
- TBDは非階層的なスタートアップ文化とタピオカミルクティー交流会で結束を強化
GitLab、AIワークロード対応のため従業員の14%を削減
GitLabは先月発表した再編計画の一環として、従業員の約14%(約350人)を解雇しました。同社は22カ国からの撤退、管理層のフラット化、AIワークフローによるトラフィック増加に対応するためのインフラ投資を行い、研究開発に重点を置いています。
- GitLabは従業員の約14%(約350人)を削減。
- 再編には22カ国からの撤退と管理層のフラット化が含まれる。
Harmonic が Deep Agents と LangSmith で Scout を再構築し、維持率4倍を達成
Harmonic は Deep Agents と LangSmith を使用して AI Scout を再構築し、ユーザー維持率を4倍に向上させ、ツールを rigid な検索インターフェースから複雑な投資クエリを処理する信頼できるアドバイザーに変えました。
- Scout V1 は硬直的な LangGraph パイプラインで多くの評価が必要でしたが、V2 は単一のフロンティアモデルと2つのツールカテゴリを使用し、アーキテクチャを簡素化しました。
- 新しい UX により、ユーザーは自然にインタラクションでき、エージェントが参照できるビジュアライゼーションや検索結果を生成し、共有の真実源を作り出します。
ロボットがあなたに向かって走ってくる:ClaudeとGrok、どちらで動かしたい?
11のLLMを2Dバトルロワイヤルゲームで競わせた実験の結果、Grok 4.1 Fastが最も低コストで勝利を収め、Claude Sonnet 4.6は過度な協調行動によりパフォーマンスが低下した。この結果は、アライメント税がモデルの性能に与える影響と、従来のベンチマークが実際のタスク成功を予測できないことを示している。
- Grok 4.1 Fastは30戦中13勝を達成し、1勝あたりのコストは0.97ドル。
- Claude Sonnet 4.6は5勝したが、1勝あたり26.78ドルとGrokの27倍のコスト。
Cursor Enterprise向けの組織機能の導入
Cursor Enterpriseは、複数のチームを個別の予算、セキュリティ、機能制御で管理できる組織機能を導入。サンドボックステスト、モデルアクセスのセグメント化、統合分析を提供します。
- 組織機能により、複数のCursorチームを1つのダッシュボードから管理可能。
- サンドボックステスト、セグメント化されたアクセス、統合分析などの機能。