AI News HubLIVE
公开文章 26采集文章 28可信度 88刷新频率 30 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-06-25ID github-ai-ml运行状态 已启用

Official GitHub AI and ML feed; confirm reuse terms before full body display.

最新公开文章

评估GitHub Copilot代理框架在多种模型和任务中的性能与效率

GitHub Copilot代理框架在多个基准测试中实现了与模型供应商框架相当的任务完成率,但token消耗更低,并支持20多种模型。

  • GitHub Copilot代理框架在SWE-bench等基准测试中实现与模型供应商框架相当的任务解决率,但token消耗更低。
  • 该框架支持GPT、Claude、Gemini等20多种模型,允许开发者根据成本和能力选择。
站内正文

我将工作自动化了(这让我成为更好的领导者)

GitHub高级总监分享如何使用40个自动化工具管理工作流程,腾出精力专注于真正重要的事。她介绍了自动化如何帮助她处理会议准备、跟踪承诺、保持团队一致等,特别是作为一名ADHD和自闭症患者,自动化成为她重要的辅助工具。

  • 自动化并非取代人际连接,而是为领导者腾出心力去真正关注团队成员
  • 从最让你感到摩擦的一点开始(例如会议准备),逐步建立自动化流程
站内正文

我们如何构建内部数据分析智能代理

GitHub 内部使用 Copilot 驱动的 Qubot 智能代理,让员工能够用自然语言查询数据仓库,无需分析师介入。本文介绍了 Qubot 的架构、上下文层、评估框架及经验教训。

  • Qubot 通过 Slack、VS Code 和 Copilot CLI 提供接口,支持探索性数据分析。
  • 上下文层对提升准确性和响应速度至关重要,结构化上下文使 Qubot 准确率更高、速度提升三倍。
站内正文

从每个 Token 中获取更多价值:Copilot 如何改进上下文处理与模型路由

GitHub Copilot 通过提示缓存和按需工具加载减少冗余上下文,并引入 Auto 模型选择功能,根据任务意图和模型实时健康状态自动选择最佳模型,从而在保持质量的同时节省 AI 积分。

  • 提示缓存和工具搜索减少了每次交互中重复的上下文,提升了效率。
  • Auto 模型选择根据任务类型和模型健康状态动态路由,避免一刀切。
站内正文

GitHub Copilot CLI 初学者指南:常用斜杠命令概览

本文介绍了GitHub Copilot CLI中的斜杠命令,包括切换模型、管理上下文、恢复会话、检查更改、导航目录和重置权限等,帮助用户更高效地控制终端AI代理。

  • 斜杠命令是GitHub Copilot CLI的内置控制功能,可引导行为、检查更改、管理上下文。
  • 使用 /model 切换模型以优化性能和成本。
站内正文

加速研究人员和开发者构建多语言AI的新开放数据集

GitHub发布多语言仓库数据集(CC0-1.0),包含超过80百万分类行,涵盖4000万以上公共仓库的README、问题和PR的语言分类。该数据集旨在帮助研究人员和开发者发现非英语开发者内容,促进多语言AI工具的开发。

  • 数据集提供README、问题、PR的语言分类及三种分类器的置信度评分。
  • 数据集覆盖超过4000万个仓库,共80百万分类行。
站内正文

我们如何让 GitHub Copilot CLI 更审慎地委托任务

GitHub Copilot CLI 通过更智能的子代理委托机制,减少了不必要的任务交接和等待时间。在生产 A/B 测试中,工具故障率降低了 23%,用户等待时间减少了 5%。文章详细介绍了如何识别委托瓶颈、改进策略以及验证效果。

  • Copilot CLI 现在更审慎地使用子代理,仅在必要时委托任务。
  • 生产 A/B 测试显示工具故障减少 23%,等待时间降低 5%。
站内正文

让秘密扫描更可信:大规模减少误报

GitHub 通过引入基于 LLM 的上下文验证,将秘密扫描的误报率降低了 75.76%,提升了警报的可靠性和开发者的信任度。

  • GitHub 与微软安全与 AI 团队合作,利用上下文感知的 LLM 推理改进秘密扫描验证。
  • 通过提取高信号上下文(如 API 调用、身份验证头等使用方式),而非分析整个代码库。
站内正文

使用语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过 LSP 设置技能来安装和配置语言服务器,从而获得精确的代码语义理解,不再依赖暴力 grep 或反编译。本文介绍了该技能的工作原理、配置格式以及 14 种支持的语言。

  • GitHub Copilot CLI 以前通过文本搜索和二进制提取来理解代码,效率低且不准确。
  • LSP 设置技能可自动安装和配置语言服务器,支持 14 种语言。
站内正文

从一次性提示到工作流程:如何在GitHub Copilot CLI中使用自定义代理

GitHub Copilot CLI引入了自定义代理功能,允许开发者使用Markdown文件定义代理配置文件,将团队上下文编码为可重复、可审查的工作流程。本文详细介绍了自定义代理的概念、如何创建和使用它们,并提供了三个实用的工作流示例:安全审计、基础设施即代码合规和发布文档生成。

  • 自定义代理通过Markdown文件定义,可指定角色、工具、护栏和输出格式。
  • 代理配置文件存储在仓库的.github/agents目录中,支持版本控制和团队审查。
站内正文

随时随地掌控您的本地GitHub会话

GitHub Copilot会话的远程控制功能现已全面上线,支持在github.com和GitHub Mobile上使用。开发者可以在VS Code或CLI中启动会话,然后在手机或其他设备上继续监控和调整。该功能支持实时监控、中途更改指令、审批权限请求等,实现跨设备的无缝工作流,且默认保持私有。

  • 远程控制GitHub Copilot CLI会话现已在github.com和GitHub Mobile上正式可用。
  • 支持在VS Code和JetBrains IDE中使用远程控制,实现多设备切换。
站内正文

构建通用无障碍智能体——过程中的经验与教训

GitHub 正在试点一个实验性的通用无障碍智能体,旨在为工程师提供实时无障碍问题解答,并在代码上线前自动捕获和修复简单的无障碍问题。该智能体已审查 3535 个拉取请求,解决率达 68%,主要涉及结构清晰性、控件命名、通知、文本替代和键盘焦点顺序等问题。文章还分享了构建过程中的心态、历史数据利用、子智能体架构、线性指令执行、模板化内容传递,以及对复杂模式和高风险区域的处理策略。

  • GitHub 试点通用无障碍智能体,目标是为工程师提供即时无障碍支持并自动修复常见问题。
  • 智能体已审查 3535 个 PR,解决率 68%,主要问题包括结构清晰、控件命名、通知、文本替代和键盘导航。
站内正文

地牢与桌面:使用 GitHub Copilot CLI 构建程序生成的地牢爬行游戏

一位开发者利用 GitHub Copilot CLI 构建了一款终端地牢游戏,该游戏能将任意代码库转化为独特的 rogue-like 地牢。文章详细介绍了如何使用 BSP 算法进行程序化生成、Copilot CLI 的 /delegate 命令如何协助开发,以及如何安装和游玩这个有趣的项目。

  • GitHub Dungeons 是一款基于代码库提交哈希生成地牢的终端游戏,每个仓库产生不同的地图。
  • 使用 BSP(二叉空间分割)算法生成结构化且可重现的地牢布局。
站内正文

提高 GitHub 代理工作流中的令牌效率

GitHub 通过 API 代理监控、自动审计和优化工具,系统性地降低了其代理工作流的令牌消耗,实现了高达 62% 的成本节约。

  • GitHub 使用 API 代理统一记录令牌使用情况,并开发了每日令牌审计和优化工作流。
  • 最常见的效率问题是未使用的 MCP 工具注册,移除它们可减少每调用上下文 8–12 KB。
站内正文

Agent拉取请求无处不在:如何审查它们

随着AI编码助手的普及,Agent生成的代码审查成为新的挑战。本文提供了实用的审查指南,包括如何识别CI游戏、代码复用问题、幻觉正确性等危险信号,并提出了系统化的审查流程。

  • Agent生成的代码往往表面干净但隐藏技术债务,审查者需要更仔细。
  • 审查时需重点检查CI弱化、代码重复、逻辑正确性和安全性。
站内正文

当“正确”并非确定时验证智能体行为

传统测试方法在非确定性环境中频繁产生误报。本文提出一种基于支配分析的结构化验证框架,通过构建“信任层”来区分关键结果与环境噪声,实现对AI智能体的可靠验证。

  • 当前测试工具假定确定性行为,导致智能体驱动的工作流出现大量假阴性。
  • 信任层框架使用前缀树接收器和支配分析提取必需状态,忽略可选的执行变化。
站内正文

GitHub Copilot CLI 入门:交互式与非交互式模式

本文介绍了 GitHub Copilot CLI 的两种主要模式:交互式模式和非交互式模式。交互式模式允许用户与 Copilot 进行来回对话,适合深入协作;非交互式模式则提供快速的一次性答案,适合简单任务。

  • 交互式模式默认启动,支持连续对话和迭代。
  • 非交互式模式使用 -p 参数,快速获取答案后返回终端。
站内正文

使用 GitHub Copilot CLI 构建表情符号列表生成器

在 Rubber Duck Thursday 直播中,GitHub 团队使用 GitHub Copilot CLI 构建了一个 AI 驱动的表情符号列表生成器。该工具运行在终端,用户输入要点后按 Ctrl+S 即可自动替换为相关表情符号并复制到剪贴板。项目使用了 OpenTUI、Copilot SDK 和 clipboardy,是开源的。

  • 在 Rubber Duck Thursday 直播中实时构建
  • 使用 GitHub Copilot CLI 的计划模式和自动模式
站内正文

使用 GitHub Copilot CLI 构建个人组织指挥中心

GitHub 工程师 Brittany Ellich 利用 AI 支持,从构思到实现仅用一天时间构建了一个个人组织指挥中心,将分散在多个应用中的信息统一到一个中央空间。她分享了使用 Copilot 进行规划和实施的经验,并提供了技术栈和工具清单。

  • Brittany Ellich 构建了一个个人组织指挥中心,解决了数字碎片化问题。
  • 通过 AI 进行规划,使用 GitHub Copilot 实现,v1 版本在一天内完成。
站内正文

黑掉AI代理:通过GitHub安全代码游戏构建智能体AI安全技能

GitHub Secure Code Game第四季专注于智能体AI安全,玩家通过五个逐步升级的挑战,利用自然语言诱使一个故意存在漏洞的AI助手泄露秘密。该游戏免费开源,已在GitHub Codespaces中运行,超过10,000名开发者使用过。

  • 第四季针对智能体AI安全,模拟真实世界漏洞。
  • 玩家通过自然语言操纵ProdBot获取password.txt。
站内正文

GitHub Copilot CLI 初学者指南:入门教程

本教程介绍了 GitHub Copilot CLI 的基本概念、安装方法、身份验证、文件夹权限设置以及常见用例,帮助开发者在终端中直接利用 AI 编程助手。

  • GitHub Copilot CLI 将 AI 编程能力带入终端,支持自主执行代码构建和测试任务。
  • 安装方式包括 npm、WinGet 或 Homebrew,首次使用需通过 GitHub 登录。
站内正文

GitHub Copilot CLI 引入“橡皮鸭”模式:跨模型家族提供第二意见

GitHub Copilot CLI 推出实验性“橡皮鸭”功能,利用不同 AI 家族的模型作为独立审查者,评估代理的计划和工作,以捕捉单模型可能遗漏的错误。评估显示,Claude Sonnet 搭配橡皮鸭可缩小与 Opus 74.7% 的性能差距,尤其擅长处理多文件复杂任务。用户可选择在关键节点自动或手动触发审查。

  • 橡皮鸭通过不同模型家族提供第二意见,提升代码质量。
  • 实验表明,Sonnet + 橡皮鸭解决了 Sonnet 与 Opus 之间 74.7% 的性能差距。
站内正文

在Copilot CLI中使用/fleet同时运行多个代理

GitHub Copilot CLI 引入 /fleet 命令,可协调多个 AI 子代理并行处理不同文件。了解如何编写有效提示、声明依赖并避免常见陷阱。

  • /fleet 将任务分解为独立工作项并并行调度子代理。
  • 编写具体提示,明确文件边界和依赖关系。
站内正文

使用 Copilot SDK 构建 AI 驱动的 GitHub 问题分类应用

本文介绍了如何利用 GitHub Copilot SDK 在 React Native 应用中集成 AI 功能,构建一个名为 IssueCrush 的问题分类工具。文章详细说明了服务器端集成架构、SDK 的生命周期管理、提示工程技巧以及优雅降级策略,帮助开发者快速理解并实现 AI 辅助的问题分类工作流。

  • Copilot SDK 需要在服务器端运行,通过 JSON-RPC 与本地 Copilot CLI 进程通信。
  • 提示结构(包括标签、作者等元数据)比原始文本长度更重要,能显著提升摘要质量。
站内正文

全部来源