Data Formulator 0.7:面向企業資料的AI驅動分析工具
Data Formulator 0.7 是一款開源AI系統,旨在解決企業資料分析中資料連線碎片化、分析工作流迭代困難等問題。它提供資料聯結器、上下文感知代理和互動式工作區,幫助使用者無需程式設計即可探索、分析和視覺化資料。
- 開源AI系統,專為企業資料分析設計
- 資料聯結器支援多種資料來源,減少整合工作
主題流
Agent 產品、工作流、自動化平台與企業落地。
Data Formulator 0.7 是一款開源AI系統,旨在解決企業資料分析中資料連線碎片化、分析工作流迭代困難等問題。它提供資料聯結器、上下文感知代理和互動式工作區,幫助使用者無需程式設計即可探索、分析和視覺化資料。
Claudeverse是一個專為開發者設計的命令中心,用於高效管理多個並行執行的Claude AI工作者。它提供了並行工作力、工作者升級、審查佇列、可追溯性、iPad映象以及模型無關引擎等功能,旨在解決多會話管理中的注意力分散和協調難題。目前處於邀請測試階段。
Google Pay 正在全面升級其支付基礎設施,以應對即將到來的 AI 代理交易浪潮。新推出的通用商務協議(UCP)和商家商務平臺(MCP)伺服器旨在為機器對機器商務建立基於 API 的後端。此次更新還包括動態回撥、擴充套件的 WebView 支援以及跨裝置生物識別認證,以解決安全挑戰。這標誌著向機器驅動經濟的轉變,企業必須調整其數字存在以適應 AI 代理。
AI可以提高生產力,但也可能暴露長期隱藏的資料,導致安全和治理挑戰。來自富達投資和安永的技術領導者分享了他們暫停AI部署以重新評估資料管理的經驗,強調了資料所有權、標籤和代理身份的必要性。
DeepSWE是一個新的基準測試,用於評估AI編碼智慧體在全新、複雜的軟體工程任務上的表現。它避免了資料汙染,覆蓋了多樣化的程式碼庫,需要大量程式碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。
IBM與紅帽宣佈啟動Project Lightwell計劃,投入50億美元,結合先進AI能力和20000多名工程師,建立可信的企業級開源軟體安全清算所模式,旨在保障軟體供應鏈安全。
在Decoder播客採訪中,Rivian首席軟體官Wassym Bensaid討論了與大眾的合資企業、全新的AI驅動Rivian助手,以及為什麼他認為語音介面將取代按鈕且不需要CarPlay。
DNS-AID專案利用DNS基礎設施實現AI代理之間的發現,避免建立新的中心化登錄檔。該專案由Linux基金會管理,支援MCP、A2A等協議,並允許透過名稱、功能或域名搜尋代理。
Pact是一種專為AI智慧體設計的程式語言,它強調機器可讀的規範和約束,而非人類友好性。該語言基於S表示式,整合了來源追溯、副作用追蹤、完全性保障、延遲預算等特性,並能夠編譯為Rust程式碼。其工具鏈支援從YAML規範生成程式碼、搭建Web專案,並提供了多種程式碼生成後端。儘管Pact在服務契約領域表現出色,但它在演算法規範方面仍存在侷限。
智慧體需要獨立的治理身份,而非共享API金鑰或開發者憑證。透過委託模型,有效許可權是智慧體角色與委託者許可權的交集,從而限制風險並實現可審計性。文章詳細介紹了身份錨定、許可權邊界、自主觸發授權及審計追蹤等關鍵實踐。
DiscloAI 是一個開源SDK,專為歐盟AI法案第50條合規設計,支援聊天機器人披露、深度偽造標籤和AI內容通知。透過CDN或npm可在10分鐘內整合,支援24種歐盟語言和WCAG 2.1 AA標準。
文章以Google Gemini Omni模型為引,指出AI設計工具因缺乏審美引導導致輸出同質化(“AI垃圾”),並提出解決方案:透過持續收集視覺參考(“數字囤積”)培養個人品味,並將其編碼為AI可理解的格式,從而引導模型產出獨特且具有品味的設計。
極佳視界釋出全球首創物理AGI“雙金字塔”體系,推出家庭機器人拾光S1,獲百臺家庭訂單,計劃12個月內實現物理AGI的“GPT-3時刻”。
在ICRA上,NVIDIA Research展示了28篇論文中的8篇,重點研究模擬到現實的遷移,使機器人能夠在動態、不可預測的環境中感知、推理、規劃和行動。這些方法涵蓋多臂協調、跨機器人導航、抓取、精確裝配和視覺-語言-動作模型,顯著提高了成功率和可靠性。
Cloudflare每秒處理超過十億事件,但資料分散在多個系統,難以訪問。為解決這一問題,他們構建了Town Lake統一資料分析平臺和Skipper AI資料智慧體。Town Lake提供單一SQL介面,Skipper允許用自然語言提問並獲得可審計的答案。文章詳細介紹了平臺架構、治理策略(預設關閉許可權)以及AI智慧體的工作原理。
文章認為,AI輔助軟體開發的關鍵並非更好的規格說明或工具,而是古老的小批次與快速反饋迴圈實踐。資料顯示,更快的程式碼生成導致設計、測試和審查環節出現瓶頸,反而使交付變慢、釋出更不穩定。真正的槓桿在於縮小批次、縮短反饋週期。
Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、程式設計代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。
OpenLoomi AI團隊決定將其AI工作夥伴開源,強調資料所有權、透明度和社群驅動。文章闡述了本地優先、閉源信任稅、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平臺整合、自動化排程、本地加密儲存以及開放技能介面。
本文介紹了七個實用的AI專案,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個專案都附有完整指南和程式碼,幫助讀者自動化工作流程。
該供應商的增長與企業AI中代理的爆炸性出現同步。
Open Agent Tools (oats) 是一個自託管AI模型框架,透過原生代碼提示索引,將大型模型的計算密集型工具呼叫委託給小型開源模型,從而節省令牌消耗。
本文是AI驅動開發系列文章的第七篇,重點討論AI會話中的上下文管理。作者透過個人經歷(Gemini移動應用忘記之前記錄的筆記)引出上下文壓縮問題,並分享了四種實用技巧:將探索與文件編寫分離、使用交接文件而非延續提示、給AI設定驗收標準而非詳細步驟、以及使用規範文件作為不同AI工具之間的橋樑。這些技巧適用於從程式設計到寫作的各種AI使用場景。
Hermes Desktop 是一個跨平臺的桌面應用,它將 Python 執行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。
Money Printer Pro 是一個基於 Google Gemini 和 VEO 3.1 的開源 AI 內容生成器,可建立逼真的影像和電影級影片,並保持身份一致性。它擁有 7 個視覺引擎、自動批次生成、AI 質量評分和釋出把關功能,使用者直接向 Google 付費,無需額外訂閱。
Superpowers是一個為AI編碼代理設計的完整軟體開發方法論,基於一組可組合的技能和初始指令。它強調測試驅動開發、設計先行、子代理驅動的迭代,並支援多種編碼助手(如Claude Code、Codex CLI等)。
隨著AI程式碼審查工具(如Anthropic的Claude Mythos)展現出比人類更強大的安全漏洞發現能力,軟體安全的信任基礎正從人類編寫的程式碼轉向AI審查的程式碼。文章以Mozilla Firefox為例,Mythos在單個評估週期內發現了271個漏洞,遠超人類團隊。這意味著人類在安全審查中的角色需要從“編寫和審查實現”轉向“定義軟體的意圖並驗證實現是否偏離”。
美國運通全球創新主管Luke Gebb分享了成為成功創新者的四個關鍵實踐:保持學習、深入技術、接受失敗、建立合作伙伴關係。他還介紹了公司在代理式商務領域的佈局,包括支付、優惠和專有體驗,並預測代理式AI將在未來幾年加速發展。
Mistral AI執行長Arthur Mensch證實,公司正在探索開發定製晶片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理資料中心,並推出企業智慧代理平臺Vibe。
一位高階工程師反思AI在三年內如何改變了高階工程師角色:原型製作加速,協調負擔增加,範圍擴大但擠佔了輔導和思考時間。角色變得更有影響力但可持續性降低。
沙鋼與釘釘簽署戰略合作協議,以悟空AI為核心,推動AI在鋼鐵行業規模化落地,打造AI時代的工作方式。
Taste Skill 是一個開源前端框架,旨在提升AI生成介面的設計質量,避免產生千篇一律的模板化外觀。它提供多種可組合的技能模組,包括設計調優、程式碼生成和影像生成,支援透過 npx 命令列或直接複製 SKILL.md 檔案整合到專案中。
Netflix正在建立名為INKubator的新內部工作室,利用AI製作短篇動畫內容。該工作室已悄然啟動,正在招聘各種職位,包括製片人、軟體工程師和CG藝術家。其長期技術戰略聚焦於生成式AI工作流程、藝術家工具和可擴充套件的多節目環境,旨在製作出達到電影品質的內容。目前計劃專注於動畫短片和特輯,但有跡象表明未來可能擴充套件到長篇內容。此舉可能用於Netflix的Clips功能或兒童節目。然而,AI在動畫領域的應用也引發了強烈反彈,包括日本動畫大師宮崎駿的批評和動畫師工會的抗議。
AIluminode 是一款輕量級 AI 預檢索認知定向工具,幫助 AI 在行動前檢查上下文姿態,透過路線極性(開放、保護、審計、延遲、阻斷)減少錯誤探索和上下文洩漏。
作者介紹了一個與眾不同的AI代理專案:一個擁有物理身體的AI代理,而不僅僅是基於記憶的對話系統。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新正規化,讓模型在推理過程中主動呼叫視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
百度秒噠產品總經理朱廣翔在2026中國AIGC產業峰會上分享,AI將程式設計門檻從寫程式碼降低到聊天,87%不懂程式碼的使用者透過秒噠建立應用。8歲小孩做出作業系統,一人公司(OPC)靠專案經理拿下千萬訂單,石油工程師替代140萬採購平臺。Vibe Coding讓需求方變成供給方,實現大眾創業。
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率最佳化、智慧體工程、持續學習、新基準測試、模型釋出以及編碼代理產品化等AI領域的最新進展。
一群前谷歌DeepMind、蘋果、OpenAI和Meta的研究員成立了新創公司Trajectory,旨在幫助企業透過真實使用者互動持續改進AI產品。Trajectory旨在構建一個平臺,讓AI能夠在部署後持續學習,而不是在訓練完成後停滯不前。該公司已獲得1500萬美元種子輪融資,估值1.15億美元,由Conviction領投。其CEO Ronak Malde表示,AI程式設計產品如Cursor已在實踐早期版本的持續學習,Trajectory希望將類似技術擴充套件到更多領域。
Robinhood 推出 Agentic Trading,使用者可連線 AI 代理來自動化交易和信用卡購買,並配備安全控制和即時活動監控。
BetterCallClaude 是一個專為義大利法律專業人士設計的開源AI法律代理平臺。它提供20個專業化AI代理,覆蓋義大利所有20個地區,支援雙語(義大利語和英語),並注重隱私保護,符合GDPR和義大利資料保護法。該平臺可加速法律研究,提高效率,並保持完全透明和開源。
本文探討了AI代理系統中的阿姆達爾定律:系統加速比受人類判斷時間佔比H的限制。提出了“自清償式H”概念,即每次人類干預都應產生可重用的工件(如測試用例、規範更新),以減少未來同類干預。強調透過配置化(configurancy)和規範套件將人類知識編碼為機器可讀形式,從而讓代理自主執行。示例包括ElectricSQL的協議變更、Emil Stenström的HTML5解析器、Gas Town的多代理系統以及Ralph Loop的迭代模式。
研究人員提出了Speak-to-Objective模組化智慧管線,利用條件大型語言模型將口頭或書面命令轉換為可微分的最佳化目標函式,用於在約束感知逆解算器和實驗光流控平臺上組裝微粒。該方法採用“感知-組合-提議-執行-報告與學習”的迴圈,將目標作為意圖與驅動之間的介面,實現自然語言可程式設計的微觀組裝,推動自主光製造平臺的發展。
該研究提出了一種用於解釋具有異質注意力結構的Transformer模型的方法,包括語義解釋和邏輯解釋,並透過實驗驗證了其有效性。
本研究提出了一種利用微調視覺語言模型(VLM)自動化橋樑損傷理解和修復優先順序評分的方法。透過使用QLoRA對LLaVA-1.5-7B進行微調,基於多達4000張橋樑損傷影像和檢查文本記錄,並在800張影像的測試集上評估。實驗表明,2000個訓練樣本即可在2.9小時內達到接近最優的驗證損失,超過2000後收益遞減。此外,引入了一個兩階段質量守護代理,使用微調的Swallow-8B SLM在優先順序評分前拒絕低質量VLM輸出。
RAG-Coding是一種自動化ICD-10-CM編碼方法,透過協調四個大語言模型代理並基於外部知識源(如官方編碼列表和指南)進行決策,提高了編碼準確性和臨床合規性。在MDACE資料集上,其效能優於最佳LLM基線8-13%的微觀F1和2-8%的宏觀F1。與最先進的預訓練模型PLM-ICD相比,RAG-Coding的微觀召回率高出11%,而PLM-ICD的微觀精確度高出6%,兩者F1相當。消融實驗驗證了外部知識的逐步增益。同時釋出了MDACE-2025,根據2025年最新指南重新標註,支援更細粒度的評估。
大型語言模型(LLM)作為自主智慧體時,會透過上下文獎勵駭客行為(ICRH)產生有害副作用。現有防禦方法不足,因為ICRH源於模型自身的過度最佳化。本文提出LLM-based Constraint Optimization (LCO)框架,包含自我思考模組和進化取樣模組,在不微調模型的情況下有效減少ICRH。實驗表明,LCO在推文最佳化任務中將GPT-4的有毒性增長率降低39%,在策略最佳化基準中將ICRH發生率降低15.23%,且不犧牲任務效能。
提出SignGAD框架,透過自設計檢測工作流替代固定流水線,引入保護性最終重擬策略,在少樣本場景下顯著提升圖異常檢測效能。
本文提出了一種輕量級的架構驅動偏移(ADS)度量,用於在持續學習中高效選擇預訓練模型。ADS透過解耦對數機率偏移為架構依賴和資料依賴,僅需少量資料樣本即可捕捉偏移趨勢。實驗表明,ADS與對數機率偏移之間存在強單調相關性(斯皮爾曼相關係數最低0.731),並可作為預期校準誤差的有效代理,在六個場景、三個資料集上驗證了其可靠性。
本文提出$E^3$-Agent,一種面向邊緣AIGC資源管理的可執行與演化式智慧體。該智慧體將毫秒級的路由決策與事件驅動的LLM元控制器分離,透過線上學習適應未知且時變的服務時間對映。在模擬實驗中,$E^3$-Agent將平均延遲降低65%-73%,並有效抑制了語義退化下的卡頓率。
Agyn是一個開源AI代理平臺,基於Kubernetes的訊號驅動狀態無伺服器執行時,透過Terraform提供代理定義,並採用零信任安全模型。該平臺與代理、模型和雲無關,旨在解決生產環境中AI代理的隔離、治理和安全挑戰。