AI News HubLIVE
站内改写2 分鐘閱讀

Cortex – 基於Markdown的Agent原生知識作業系統(Karpathy的LLM Wiki,透過MCP)

PULSE8.ai Cortex是一個基於Markdown的Agent原生知識作業系統,為AI代理和人類提供共享的知識庫,支援知識圖譜、全文搜尋、檔案編譯等功能,透過統一的MCP介面訪問。靈感來源於Andrej Karpathy的LLM Wiki模式,無需資料庫即可執行。

來源Hacker News AI作者: jiekepan

PULSE8.ai Cortex是一個面向AI代理的、基於Markdown的知識作業系統,旨在為AI和人類提供一個共享的、持續積累的知識庫。該系統受Andrej Karpathy的LLM Wiki模式啟發,所有知識以Markdown檔案形式儲存,並透過知識圖譜、全文搜尋和檔案編譯等核心功能實現高效管理。

Cortex的核心特色包括:

  • 知識圖譜:基於NetworkX的圖引擎,自動維護維基連結、標籤和自定義邊,每次檔案變更時同步更新。
  • 全文搜尋:使用QMD搜尋引擎,支援混合模式(BM25+向量+重排序)、純關鍵字和純語義搜尋,結果可快取。
  • 檔案編譯器:透過MarkItDown將PDF、DOCX、PPTX、XLSX、HTML、圖片等原始檔案轉換為Markdown,僅交叉引用時使用LLM。
  • MCP伺服器:支援流式HTTP和stdio傳輸,可無縫連線Claude Desktop、Cursor等MCP客戶端。
  • 反饋與通知:vault_feedback捕獲質量反饋,可選Microsoft Teams Webhook每提交傳送自適應卡片。
  • 日常活動日誌:每次寫入、匯入和編譯操作自動記錄到每日Markdown檔案中,便於追蹤。
  • 批次匯入:一次性匯入數十或數百個檔案,透過SHA-256去重,併發編譯,無需執行伺服器。
  • REST API:FastAPI端點映象所有MCP工具,位於/api/v1/,支援多檔案上傳和批次匯入。
  • 倉庫監控:即時檔案系統監控,圖譜自動保持同步。
  • 零資料庫:所有資料持久化為Markdown和JSON檔案。

系統架構上,Cortex透過Docker容器化部署,預設包含Cortex API/MCP服務(埠8420)和QMD搜尋服務(埠3100)。儲存層為掛載的卷,包含wiki/、raw/、agents/、sessions/、daily/、feedback/等資料夾,以及.cortex/內部目錄。所有資料持久化為Markdown和JSON檔案,無需傳統資料庫。

倉庫佈局方面,Cortex將每個檔案分類為型別節點:wiki/(筆記)、raw/(原始源)、agents/(代理定義)、sessions/(會話筆記)、daily/(每日筆記)、feedback/(反饋)。分類優先順序:frontmatter型別 > 資料夾字首 > 檔名字尾。例如,daily/2026-06-10.md自動歸類為每日筆記。

日常活動日誌:每次vault_write、vault_ingest和成功編譯事件自動映象到daily/YYYY-MM-DD.md,格式為## [HH:MM] event | summary,幷包含維基連結。

批次匯入:推薦使用./scripts/bulk_ingest.sh指令碼,直接從本地目錄讀取,透過SHA-256去重,併發編譯,最後重建索引。支援dry-run、force重匯入、併發控制等選項。也可透過Python CLI或REST API實現。

配置透過.env檔案完成,關鍵變數包括LLM_API_KEY(僅用於交叉引用)、COMPILER_MODEL、VAULT_DIR、QMD搜尋引數、AUTH_METHOD(none/apikey/oidc)等。認證支援無認證、API金鑰和Microsoft Entra ID OIDC。

總之,Cortex為AI代理提供了一個輕量級、可擴充套件的知識管理基礎設施,特別適合希望將知識庫與AI工作流深度整合的開發者和團隊。