AI News HubLIVE
サイト内リライト3 分で読了

Flowly:デスクトップとiPhoneで動作する個人用AIエージェント

Flowlyは、アプリやブラウザのタブをまたいでアクションを実行するネイティブAIアシスタントです。macOS、Windows、Linuxに対応し、グローバルホットキーで呼び出せます。バージョン1.4.0では、コンピュータ操作、リアルタイムツールパネル、ナレッジグラフの改良、画面認識コーチなどの新機能を導入。エージェントコア全体がオープンソース化(Apache-2.0)され、ユーザー自身のAIキーを使用し、学習と自己修正を行うプライベートメモリを保持します。

ソースProduct Hunt AI著者: Hakan

Flowlyは、アプリやブラウザのタブを横断してアクションを実行するネイティブAIアシスタントです。macOS、Windows、Linux上でグローバルホットキー一つで呼び出せ、フルチャット、メニューバー、またはノッチオーバーレイとして表示できます。ローンチ期間中は無料で提供されており、これまでに3回の主要リリースを経て、今回のv1.4.0では多数の重要なアップデートが導入されました。

まず、新たに追加された「コンピュータ操作」機能により、FlowlyはMac上で直接アプリを開いたり、ボタンをクリック、ウィンドウを切り替え、画面上のテキストを読み取ることが可能になりました。VoiceOverのセマンティックUI構造を利用してピクセル座標ではなくラベルで要素を識別するため、ユーザーの意図を正確に理解できます。すべての操作はデフォルトでサンドボックス化され、アクティビティタブでリアルタイムに確認できます。さらに、新しい「リアルタイムツールパネル」は、各アシスタントメッセージに折りたたみ可能なパネルを添付し、ツール呼び出し(ファイル編集、シェル、検索、コンピュータ操作)をリアルタイムでストリーミング、各ツールにカスタムレンダラーを提供します。アクティビティタブの監査ビューは同じレンダラーを使用するため、履歴がライブチャットと同一に見えます。

知識管理面では、「ナレッジグラフ」が全面刷新され、フローティング詳細パネル、エンティティ関係のクリックスルー、アプリ内エンティティ削除(トリプルにカスケード)、リキッドガラスズームコントロール、ちらつきのないノードドラッグを実装。ユーザーは自分の知識ネットワークをより直感的に探索・管理できるようになりました。macOS向けにはオプトインの「画面認識コーチ」が追加され、ScreenCaptureKitサイドカーがカーソル下のウィンドウのロスレスキャプチャをオーディオとともにモデルに共有し、ヒントがユーザーの現在の作業を参照できるようにします。同時に、ElevenLabs Scribe v2音声認識が話者ラベルを追加。さらに、「Hey Flowly」ウェイクワードも導入され、ハンズフリー操作が可能になりました。

その他の新機能として、アプリ内ファイルプレビュー(ボットが言及したファイルパスをクリックすると、サイズ変更可能でシンタックスハイライト付きのサイドパネルが開く)、Artifactsのクラウド同期(キャンバス、スライド、ドキュメント、コードがサインイン済みデバイス間で自動同期、オフライン対応キューと10MBサイズ制限をサポート)、および30以上の新しい組み込みスキルが含まれます。スキルは財務モデリング(3ステートメントモデル、DCF、Excel作成)、GitHubワークフロー(PRレビュー、リポジトリ管理、コードレビュー)、デザインとドキュメント(コンセプト図、Excalidraw、PowerPoint作成、nano-pdf)、SaaS統合(Notion、Linear、Airtable、Google Workspace)をカバーしています。ユーザーはDashboard Skillsで完全なカタログを閲覧できます。

改善点として、Flowlyはデフォルトでサンドボックスを有効化(macOSはsandbox-exec、Linuxはbubblewrap)、拒否リストプロファイルがワークスペース外への書き込みをブロックし、マスタースイッチで制御可能。Composerアタッチメントはアップロード優先フローに変更され、ファイルごとのステータスが表示され、50MBの動画アップロードをサポート。Windows/Linuxのキーボードショートカット、修飾キーラベル、音声ショートカットヒント、スマートポーズプロセス検出がプラットフォーム対応に。コーチクォータの可視性が向上し、設定にライブ進行バーが追加され、プリフライトゲーティングがSTT 429でセッションをクリーンに停止。コーチング設定はフローティングパネルに変更され、アプリの他のサイドパネルパターンに統一。ダッシュボードは再編成され、AIツールとセキュリティがトップレベルグループに昇格。Pre-Sonoma macOSには機能警告が表示。共有AlertDialogはアプリ全体でリキッドガラステーマを採用し、角が柔らかくなりました。

さらに、v1.4.0では多くの問題が修正されました:アクティビティタブがスクロール可能に;ツール出力のレンダリングがよりクリーンに;Artifactsの8つの小規模UXバグを修正;コーチのスクリーンショットが品質とカーソル表示ターゲットを使用し、小さい画面テキストがモデルに判読可能に;macOSアクセシビリティ許可の付与がオンボーディングからライブでグローバルホットキーを登録、アプリ再起動不要;コーチの開始がFlowly AIゲートウェイの可用性に依存するようになり、404を防止;コンピュータ操作がターゲットをより確実に検出、複数の要素属性でマッチングし、近似候補を提案;ターミナルエミュレータ(iTerm2、Terminal、Alacritty、Kitty、Ghostty、Wezterm)が合成キーイベントではなくクリップボードペーストを使用。内部改善として、Artifact同期にSentryエラー監視と永続同期カーソルを追加。

Flowlyのエージェントコア全体は、Apache-2.0ライセンスで完全にオープンソース化されました。ユーザー自身のマシンとiPhone上でネイティブに動作し、すでに支払っているAIキー(Anthropic、OpenAI、OpenRouter、またはローカルモデル)を使用、データはデバイスから出ません。メモリ機能は単なるチャットログではなく、ユーザーの世界(人、プロジェクト、仕事の進め方)のモデルに近く、変更を追跡し、間違いがあれば静かに自己修正します。開発チームのNoceticは、三つの原則に焦点を当てています:ユーザーのマシンとキーで動作すること、ユーザーの世界の記憶を持つこと、そしてMac、Windows、Linux、iPhoneのネイティブアプリでどこでも利用できること。現在、メモリとセッションを超えた学習はライブで日常的に使用されていますが、まだ初期段階であり、使用量が増えるにつれて精度が向上します。