Cortex – Markdownベースのエージェントネイティブ知識OS(KarpathyのLLM Wiki、MCP経由)
PULSE8.ai Cortexは、Markdownをベースにしたエージェントネイティブの知識OSで、AIエージェントと人間が共有できる知識ベースを提供します。型付き知識グラフ、全文検索、MarkItDownベースのコンパイラを備え、統一されたMCPインターフェースでアクセス可能です。Andrej KarpathyのLLM Wikiパターンに触発されており、データベースは不要です。
PULSE8.ai Cortexは、Markdownを基盤としたエージェントネイティブな知識オペレーティングシステムです。このシステムは、AIエージェントと人間が共有できる知識ベースを提供し、Andrej KarpathyのLLM Wikiパターンに着想を得ています。すべての知識はMarkdownファイルとして保存され、データベースを必要としません。
Cortexの主な機能は以下の通りです:
- 知識グラフ:NetworkXベースのグラフエンジンが、ウィキリンク、タグ、カスタムエッジを自動的に維持し、ファイル変更時に同期します。
- 全文検索:QMD検索エンジンを使用し、ハイブリッド(BM25+ベクトル+再ランク)、キーワード、セマンティックの各モードを選択可能。結果はキャッシュされます。
- ファイルコンパイラ:MarkItDownを利用してPDF、DOCX、PPTX、XLSX、HTML、画像などをMarkdownに変換。LLMはクロスリファレンス時のみ使用されます。
- MCPサーバー:ストリーミングHTTPとstdioトランスポートをサポートし、Claude Desktop、CursorなどのMCPクライアントと連携できます。
- フィードバックと通知:vault_feedbackは品質フィードバックをキャプチャし、オプションのMicrosoft Teams Webhookが各送信ごとにアダプティブカードを投稿します。
- 日次アクティビティログ:すべての書き込み、インポート、コンパイル操作が日次のMarkdownファイルにミラーリングされ、追跡可能です。
- バルクインジェスト:多数のファイルを一度にインポート可能。SHA-256ハッシュで重複を排除し、並列コンパイルに対応。サーバーを起動せずにスクリプトで実行できます。
- REST API:FastAPIエンドポイントがすべてのMCPツールを/api/v1/でミラーリングし、マルチパートファイルアップロードとバルクインジェストをサポート。
- ボールトウォッチャー:リアルタイムのファイルシステム監視により、グラフが自動的に同期されます。
- ゼロデータベース:すべてのデータはMarkdownとJSONとしてファイルシステムに永続化されます。
アーキテクチャはDockerコンテナで構成され、Cortex API/MCPサービス(ポート8420)とQMD検索サービス(ポート3100)が含まれます。ボリュームにはwiki/、raw/、agents/、sessions/、daily/、feedback/などのフォルダと.cortex/内部ディレクトリがマウントされます。すべてのデータはMarkdownとJSONファイルとして永続化されます。
ボールトレイアウト:Cortexは各ファイルをタイプノードに分類します:wiki/(ノート)、raw/(未処理ソース)、agents/(エージェント定義)、sessions/(セッションノート)、daily/(日次ノート)、feedback/(フィードバック)。分類の優先順位:frontmatterタイプ > フォルダプレフィックス > ファイル名サフィックス。例えば、daily/2026-06-10.mdは自動的に日次ノートとして分類されます。
日次アクティビティログ:各vault_write、vault_ingest、および成功したコンパイルイベントは、daily/YYYY-MM-DD.mdに自動的にミラーリングされ、## [HH:MM] event | summaryブロックとウィキリンクが追加されます。
バルクインジェスト:./scripts/bulk_ingest.shスクリプトを使用して、ローカルディレクトリから直接読み取り、SHA-256で重複排除し、並列コンパイル後、インデックスを再構築します。dry-run、force再インポート、並行性制御などのオプションがあります。Python CLIまたはREST APIでも使用可能です。
設定は.envファイルで管理され、LLM_API_KEY(クロスリファレンスのみ)、COMPILER_MODEL、VAULT_DIR、QMD検索パラメータ、AUTH_METHOD(none/apikey/oidc)などの変数が含まれます。認証は、認証なし、APIキー、Microsoft Entra ID OIDCをサポートします。
Cortexは、AIエージェントとワークフローを深く統合したい開発者やチームにとって、軽量で拡張性の高い知識管理基盤を提供します。