AI News HubLIVE
公開文章 26採集文章 28可信度 88刷新頻率 30 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-25ID github-ai-ml運行狀態 已啟用

Official GitHub AI and ML feed; confirm reuse terms before full body display.

最新公開文章

評估GitHub Copilot代理框架在多種模型和任務中的性能與效率

GitHub Copilot代理框架在多個基準測試中實現了與模型供應商框架相當的任務完成率,但token消耗更低,並支持20多種模型。

  • GitHub Copilot代理框架在SWE-bench等基準測試中實現與模型供應商框架相當的任務解決率,但token消耗更低。
  • 該框架支持GPT、Claude、Gemini等20多種模型,允許開發者根據成本和能力選擇。
站內正文

我將工作自動化了(這讓我成為更好的領導者)

GitHub高級總監分享如何使用40個自動化工具管理工作流程,騰出精力專注於真正重要的事。她介紹了自動化如何幫助她處理會議準備、跟蹤承諾、保持團隊一致等,特別是作為一名ADHD和自閉症患者,自動化成為她重要的輔助工具。

  • 自動化並非取代人際連接,而是為領導者騰出心力去真正關注團隊成員
  • 從最讓你感到摩擦的一點開始(例如會議準備),逐步建立自動化流程
站內正文

我們如何構建內部數據分析智能代理

GitHub 內部使用 Copilot 驅動的 Qubot 智能代理,讓員工能夠用自然語言查詢數據倉庫,無需分析師介入。本文介紹了 Qubot 的架構、上下文層、評估框架及經驗教訓。

  • Qubot 通過 Slack、VS Code 和 Copilot CLI 提供接口,支持探索性數據分析。
  • 上下文層對提升準確性和響應速度至關重要,結構化上下文使 Qubot 準確率更高、速度提升三倍。
站內正文

從每個 Token 中獲取更多價值:Copilot 如何改進上下文處理與模型路由

GitHub Copilot 通過提示緩存和按需工具加載減少冗餘上下文,並引入 Auto 模型選擇功能,根據任務意圖和模型實時健康狀態自動選擇最佳模型,從而在保持質量的同時節省 AI 積分。

  • 提示緩存和工具搜索減少了每次交互中重複的上下文,提升了效率。
  • Auto 模型選擇根據任務類型和模型健康狀態動態路由,避免一刀切。
站內正文

GitHub Copilot CLI 初學者指南:常用斜槓命令概覽

本文介紹了GitHub Copilot CLI中的斜槓命令,包括切換模型、管理上下文、恢復會話、檢查更改、導航目錄和重置權限等,幫助用户更高效地控制終端AI代理。

  • 斜槓命令是GitHub Copilot CLI的內置控制功能,可引導行為、檢查更改、管理上下文。
  • 使用 /model 切換模型以優化性能和成本。
站內正文

加速研究人員和開發者構建多語言AI的新開放數據集

GitHub發佈多語言倉庫數據集(CC0-1.0),包含超過80百萬分類行,涵蓋4000萬以上公共倉庫的README、問題和PR的語言分類。該數據集旨在幫助研究人員和開發者發現非英語開發者內容,促進多語言AI工具的開發。

  • 數據集提供README、問題、PR的語言分類及三種分類器的置信度評分。
  • 數據集覆蓋超過4000萬個倉庫,共80百萬分類行。
站內正文

我們如何讓 GitHub Copilot CLI 更審慎地委託任務

GitHub Copilot CLI 通過更智能的子代理委託機制,減少了不必要的任務交接和等待時間。在生產 A/B 測試中,工具故障率降低了 23%,用户等待時間減少了 5%。文章詳細介紹瞭如何識別委託瓶頸、改進策略以及驗證效果。

  • Copilot CLI 現在更審慎地使用子代理,僅在必要時委託任務。
  • 生產 A/B 測試顯示工具故障減少 23%,等待時間降低 5%。
站內正文

讓秘密掃描更可信:大規模減少誤報

GitHub 通過引入基於 LLM 的上下文驗證,將秘密掃描的誤報率降低了 75.76%,提升了警報的可靠性和開發者的信任度。

  • GitHub 與微軟安全與 AI 團隊合作,利用上下文感知的 LLM 推理改進秘密掃描驗證。
  • 通過提取高信號上下文(如 API 調用、身份驗證頭等使用方式),而非分析整個代碼庫。
站內正文

使用語言服務器為 GitHub Copilot CLI 提供真正的代碼智能

GitHub Copilot CLI 現在可以通過 LSP 設置技能來安裝和配置語言服務器,從而獲得精確的代碼語義理解,不再依賴暴力 grep 或反編譯。本文介紹了該技能的工作原理、配置格式以及 14 種支持的語言。

  • GitHub Copilot CLI 以前通過文本搜索和二進制提取來理解代碼,效率低且不準確。
  • LSP 設置技能可自動安裝和配置語言服務器,支持 14 種語言。
站內正文

從一次性提示到工作流程:如何在GitHub Copilot CLI中使用自定義代理

GitHub Copilot CLI引入了自定義代理功能,允許開發者使用Markdown文件定義代理配置文件,將團隊上下文編碼為可重複、可審查的工作流程。本文詳細介紹了自定義代理的概念、如何創建和使用它們,並提供了三個實用的工作流示例:安全審計、基礎設施即代碼合規和發佈文檔生成。

  • 自定義代理通過Markdown文件定義,可指定角色、工具、護欄和輸出格式。
  • 代理配置文件存儲在倉庫的.github/agents目錄中,支持版本控制和團隊審查。
站內正文

隨時隨地掌控您的本地GitHub會話

GitHub Copilot會話的遠程控制功能現已全面上線,支持在github.com和GitHub Mobile上使用。開發者可以在VS Code或CLI中啓動會話,然後在手機或其他設備上繼續監控和調整。該功能支持實時監控、中途更改指令、審批權限請求等,實現跨設備的無縫工作流,且默認保持私有。

  • 遠程控制GitHub Copilot CLI會話現已在github.com和GitHub Mobile上正式可用。
  • 支持在VS Code和JetBrains IDE中使用遠程控制,實現多設備切換。
站內正文

構建通用無障礙智能體——過程中的經驗與教訓

GitHub 正在試點一個實驗性的通用無障礙智能體,旨在為工程師提供實時無障礙問題解答,並在代碼上線前自動捕獲和修復簡單的無障礙問題。該智能體已審查 3535 個拉取請求,解決率達 68%,主要涉及結構清晰性、控件命名、通知、文本替代和鍵盤焦點順序等問題。文章還分享了構建過程中的心態、歷史數據利用、子智能體架構、線性指令執行、模板化內容傳遞,以及對複雜模式和高風險區域的處理策略。

  • GitHub 試點通用無障礙智能體,目標是為工程師提供即時無障礙支持並自動修復常見問題。
  • 智能體已審查 3535 個 PR,解決率 68%,主要問題包括結構清晰、控件命名、通知、文本替代和鍵盤導航。
站內正文

地牢與桌面:使用 GitHub Copilot CLI 構建程序生成的地牢爬行遊戲

一位開發者利用 GitHub Copilot CLI 構建了一款終端地牢遊戲,該遊戲能將任意代碼庫轉化為獨特的 rogue-like 地牢。文章詳細介紹瞭如何使用 BSP 算法進行程序化生成、Copilot CLI 的 /delegate 命令如何協助開發,以及如何安裝和遊玩這個有趣的項目。

  • GitHub Dungeons 是一款基於代碼庫提交哈希生成地牢的終端遊戲,每個倉庫產生不同的地圖。
  • 使用 BSP(二叉空間分割)算法生成結構化且可重現的地牢佈局。
站內正文

提高 GitHub 代理工作流中的令牌效率

GitHub 通過 API 代理監控、自動審計和優化工具,系統性地降低了其代理工作流的令牌消耗,實現了高達 62% 的成本節約。

  • GitHub 使用 API 代理統一記錄令牌使用情況,並開發了每日令牌審計和優化工作流。
  • 最常見的效率問題是未使用的 MCP 工具註冊,移除它們可減少每調用上下文 8–12 KB。
站內正文

Agent拉取請求無處不在:如何審查它們

隨着AI編碼助手的普及,Agent生成的代碼審查成為新的挑戰。本文提供了實用的審查指南,包括如何識別CI遊戲、代碼複用問題、幻覺正確性等危險信號,並提出了系統化的審查流程。

  • Agent生成的代碼往往表面乾淨但隱藏技術債務,審查者需要更仔細。
  • 審查時需重點檢查CI弱化、代碼重複、邏輯正確性和安全性。
站內正文

當“正確”並非確定時驗證智能體行為

傳統測試方法在非確定性環境中頻繁產生誤報。本文提出一種基於支配分析的結構化驗證框架,通過構建“信任層”來區分關鍵結果與環境噪聲,實現對AI智能體的可靠驗證。

  • 當前測試工具假定確定性行為,導致智能體驅動的工作流出現大量假陰性。
  • 信任層框架使用前綴樹接收器和支配分析提取必需狀態,忽略可選的執行變化。
站內正文

GitHub Copilot CLI 入門:交互式與非交互式模式

本文介紹了 GitHub Copilot CLI 的兩種主要模式:交互式模式和非交互式模式。交互式模式允許用户與 Copilot 進行來回對話,適合深入協作;非交互式模式則提供快速的一次性答案,適合簡單任務。

  • 交互式模式默認啓動,支持連續對話和迭代。
  • 非交互式模式使用 -p 參數,快速獲取答案後返回終端。
站內正文

使用 GitHub Copilot CLI 構建表情符號列表生成器

在 Rubber Duck Thursday 直播中,GitHub 團隊使用 GitHub Copilot CLI 構建了一個 AI 驅動的表情符號列表生成器。該工具運行在終端,用户輸入要點後按 Ctrl+S 即可自動替換為相關表情符號並複製到剪貼板。項目使用了 OpenTUI、Copilot SDK 和 clipboardy,是開源的。

  • 在 Rubber Duck Thursday 直播中實時構建
  • 使用 GitHub Copilot CLI 的計劃模式和自動模式
站內正文

使用 GitHub Copilot CLI 構建個人組織指揮中心

GitHub 工程師 Brittany Ellich 利用 AI 支持,從構思到實現僅用一天時間構建了一個個人組織指揮中心,將分散在多個應用中的信息統一到一箇中央空間。她分享了使用 Copilot 進行規劃和實施的經驗,並提供了技術棧和工具清單。

  • Brittany Ellich 構建了一個個人組織指揮中心,解決了數字碎片化問題。
  • 通過 AI 進行規劃,使用 GitHub Copilot 實現,v1 版本在一天內完成。
站內正文

黑掉AI代理:通過GitHub安全代碼遊戲構建智能體AI安全技能

GitHub Secure Code Game第四季專注於智能體AI安全,玩家通過五個逐步升級的挑戰,利用自然語言誘使一個故意存在漏洞的AI助手泄露秘密。該遊戲免費開源,已在GitHub Codespaces中運行,超過10,000名開發者使用過。

  • 第四季針對智能體AI安全,模擬真實世界漏洞。
  • 玩家通過自然語言操縱ProdBot獲取password.txt。
站內正文

GitHub Copilot CLI 初學者指南:入門教程

本教程介紹了 GitHub Copilot CLI 的基本概念、安裝方法、身份驗證、文件夾權限設置以及常見用例,幫助開發者在終端中直接利用 AI 編程助手。

  • GitHub Copilot CLI 將 AI 編程能力帶入終端,支持自主執行代碼構建和測試任務。
  • 安裝方式包括 npm、WinGet 或 Homebrew,首次使用需通過 GitHub 登錄。
站內正文

GitHub Copilot CLI 引入“橡皮鴨”模式:跨模型家族提供第二意見

GitHub Copilot CLI 推出實驗性“橡皮鴨”功能,利用不同 AI 家族的模型作為獨立審查者,評估代理的計劃和工作,以捕捉單模型可能遺漏的錯誤。評估顯示,Claude Sonnet 搭配橡皮鴨可縮小與 Opus 74.7% 的性能差距,尤其擅長處理多文件複雜任務。用户可選擇在關鍵節點自動或手動觸發審查。

  • 橡皮鴨通過不同模型家族提供第二意見,提升代碼質量。
  • 實驗表明,Sonnet + 橡皮鴨解決了 Sonnet 與 Opus 之間 74.7% 的性能差距。
站內正文

在Copilot CLI中使用/fleet同時運行多個代理

GitHub Copilot CLI 引入 /fleet 命令,可協調多個 AI 子代理並行處理不同文件。瞭解如何編寫有效提示、聲明依賴並避免常見陷阱。

  • /fleet 將任務分解為獨立工作項並並行調度子代理。
  • 編寫具體提示,明確文件邊界和依賴關係。
站內正文

Copilot應用科學中的智能體驅動開發

AI研究員通過GitHub Copilot構建編碼智能體,自動化了自身繁瑣的分析工作,並總結了三大策略:提示策略、架構策略和迭代策略,使團隊在三天內創建了11個新智能體、4項新技能和全新工作流。

  • 使用Copilot CLI和Claude Opus 4.6模型構建編碼智能體,自動化重複性分析任務。
  • 核心策略包括:對話式詳細提示、頻繁重構與文檔更新、以及“歸咎於流程而非智能體”的迭代哲學。
站內正文

使用 Copilot SDK 構建 AI 驅動的 GitHub 問題分類應用

本文介紹瞭如何利用 GitHub Copilot SDK 在 React Native 應用中集成 AI 功能,構建一個名為 IssueCrush 的問題分類工具。文章詳細説明了服務器端集成架構、SDK 的生命週期管理、提示工程技巧以及優雅降級策略,幫助開發者快速理解並實現 AI 輔助的問題分類工作流。

  • Copilot SDK 需要在服務器端運行,通過 JSON-RPC 與本地 Copilot CLI 進程通信。
  • 提示結構(包括標籤、作者等元數據)比原始文本長度更重要,能顯著提升摘要質量。
站內正文

全部來源