AI News HubLIVE
站内改写2 分鐘閱讀

Cortex – 基於Markdown的Agent原生知識操作系統(Karpathy的LLM Wiki,通過MCP)

PULSE8.ai Cortex是一個基於Markdown的Agent原生知識操作系統,為AI代理和人類提供共享的知識庫,支持知識圖譜、全文搜索、文件編譯等功能,通過統一的MCP接口訪問。靈感來源於Andrej Karpathy的LLM Wiki模式,無需數據庫即可運行。

來源Hacker News AI作者: jiekepan

PULSE8.ai Cortex是一個面向AI代理的、基於Markdown的知識操作系統,旨在為AI和人類提供一個共享的、持續積累的知識庫。該系統受Andrej Karpathy的LLM Wiki模式啓發,所有知識以Markdown文件形式存儲,並通過知識圖譜、全文搜索和文件編譯等核心功能實現高效管理。

Cortex的核心特色包括:

  • 知識圖譜:基於NetworkX的圖引擎,自動維護維基鏈接、標籤和自定義邊,每次文件變更時同步更新。
  • 全文搜索:使用QMD搜索引擎,支持混合模式(BM25+向量+重排序)、純關鍵字和純語義搜索,結果可緩存。
  • 文件編譯器:通過MarkItDown將PDF、DOCX、PPTX、XLSX、HTML、圖片等原始文件轉換為Markdown,僅交叉引用時使用LLM。
  • MCP服務器:支持流式HTTP和stdio傳輸,可無縫連接Claude Desktop、Cursor等MCP客户端。
  • 反饋與通知:vault_feedback捕獲質量反饋,可選Microsoft Teams Webhook每提交發送自適應卡片。
  • 日常活動日誌:每次寫入、導入和編譯操作自動記錄到每日Markdown文件中,便於追蹤。
  • 批量導入:一次性導入數十或數百個文件,通過SHA-256去重,併發編譯,無需運行服務器。
  • REST API:FastAPI端點鏡像所有MCP工具,位於/api/v1/,支持多文件上傳和批量導入。
  • 倉庫監控:實時文件系統監控,圖譜自動保持同步。
  • 零數據庫:所有數據持久化為Markdown和JSON文件。

系統架構上,Cortex通過Docker容器化部署,默認包含Cortex API/MCP服務(端口8420)和QMD搜索服務(端口3100)。存儲層為掛載的卷,包含wiki/、raw/、agents/、sessions/、daily/、feedback/等文件夾,以及.cortex/內部目錄。所有數據持久化為Markdown和JSON文件,無需傳統數據庫。

倉庫佈局方面,Cortex將每個文件分類為類型節點:wiki/(筆記)、raw/(原始源)、agents/(代理定義)、sessions/(會話筆記)、daily/(每日筆記)、feedback/(反饋)。分類優先級:frontmatter類型 > 文件夾前綴 > 文件名後綴。例如,daily/2026-06-10.md自動歸類為每日筆記。

日常活動日誌:每次vault_write、vault_ingest和成功編譯事件自動鏡像到daily/YYYY-MM-DD.md,格式為## [HH:MM] event | summary,幷包含維基鏈接。

批量導入:推薦使用./scripts/bulk_ingest.sh腳本,直接從本地目錄讀取,通過SHA-256去重,併發編譯,最後重建索引。支持dry-run、force重導入、併發控制等選項。也可通過Python CLI或REST API實現。

配置通過.env文件完成,關鍵變量包括LLM_API_KEY(僅用於交叉引用)、COMPILER_MODEL、VAULT_DIR、QMD搜索參數、AUTH_METHOD(none/apikey/oidc)等。認證支持無認證、API密鑰和Microsoft Entra ID OIDC。

總之,Cortex為AI代理提供了一個輕量級、可擴展的知識管理基礎設施,特別適合希望將知識庫與AI工作流深度集成的開發者和團隊。