客厅里的智能电视:AI数据抓取经济中的节点
本文探讨了Bright Data公司如何通过其住宅代理网络,利用用户家中的智能电视等设备为AI模型抓取训练数据。文章详细分析了SDK的工作原理、合作伙伴、隐私问题,以及为何联网电视成为理想的代理节点。
- Bright Data的SDK嵌入在合作伙伴应用中,将用户设备变成代理出口节点。
- 智能电视因其始终在线、网络稳定、用户注意力低等特性,成为理想的代理设备。
日报
2026-06-06 精选 10 条,按主题聚合。其余新闻折叠归档。
本文探讨了Bright Data公司如何通过其住宅代理网络,利用用户家中的智能电视等设备为AI模型抓取训练数据。文章详细分析了SDK的工作原理、合作伙伴、隐私问题,以及为何联网电视成为理想的代理节点。
在这篇客座文章中,Patrick Nadeau讲述了他利用AI编码代理从头构建Intellivision模拟器的历程。他使用现有模拟器jzintv的测试oracle验证CPU核心,AI加速了开发进程——从第5小时显示第一个像素到第36小时完成可玩的系统。他还添加了调试端口,让AI能实时控制游戏。尽管成功,Nadeau反思了AI利用他人代码的伦理问题以及与人机协作的复杂感受。
这是一次自动检查,用于过滤大多数机器人。如果启用了JavaScript,页面将很快重定向到真实页面。否则,它仍然应该很快重定向,但如果您速度够快,可以点击此处。
Y Combinator发布了Paxel,一个免费的开源工具,用于分析Claude、Codex和Cursor的AI编码会话,帮助开发者了解自己的构建方式。该工具在本地Docker中运行,保障代码隐私,提供构建者档案、原型分析和发展建议。已有70,154次会话被上传分析。
本教程提供了使用Qualcomm AI Hub模型的端到端工作流程,涵盖设置、本地推理(MobileNet-V2和YOLOv7)以及通过云设备管道进行编译和部署。
一篇关于在Build Small Hackathon中构建的微型多智能体经济模拟的现场报告,使用Qwen2.5-3B模型驱动五个林间生物进行贸易、囤积和恐慌。文章探讨了小型模型在实时仿真中的可行性、设计稀缺性的必要性以及如何通过提示工程弥补模型推理能力的不足。
一位34岁的软件工程师因宗教信仰获得豁免,无需在工作中使用AI。此事源于教皇方济各(注:原文为Pope Leo XIV,实为虚构,但按原文处理)警告AI可能损害人类尊严并取代工人。法律要求雇主考虑基于信仰的请求,这引发了关于宗教豁免AI的讨论。
ToTra 是一个开源 AI 网关和治理平台,内置配额管理、PII 屏蔽、成本追踪和合规(GDPR、欧盟 AI 法案)功能。它使用 Go 编写,延迟增加不到 2 毫秒,支持多种 LLM 提供商,无需更改代码即可接入。
OpenRouter 提供可配置的安全和治理工具,用于预算执行、零数据保留、模型和供应商限制、提示注入防御以及数据丢失防护,从而保护您的智能体、数据和成本。
Anthropic发布报告警告,AI开发速度可能最终导致人类无法控制AI系统。报告显示,Claude现已编写了其代码库中超过80%的合并代码,并展示了性能的显著提升。公司呼吁在开发前沿技术时保留放缓或暂停的可能性,但表示只有竞争对手也这样做时才会采取行动。
微软内部战略文件显示,其新推出的AI个人助手Scout旨在让用户“上瘾”,然后逐步推出更多功能。文章批评了微软通过锁定机制让用户依赖其产品的长期做法。
Hermes Agent 是由 Nous Research 开发的开源自主 AI 代理,具有持久记忆、自动技能创建和多平台支持。它可在自托管服务器上运行,学习用户偏好和项目,并通过 Telegram、Discord 等平台与用户交互。还支持批量处理、强化学习训练和轨迹导出,适用于 MLOps 和 AI 训练。
每周AI和初创新闻摘要,涵盖趋势、融资、开源等。
随着品牌和垃圾信息发送者利用Reddit操纵AI聊天工具,Reddit的垃圾信息问题愈发严重。r/biohackers版块因发现公司系统性地植入赞助内容而限制相关帖子。这种现象被称为生成式AI引擎优化(GEO)或AI引擎优化(AEO),是传统SEO的演变。Reddit表示正在使用自动化工具打击此类内容,但版主认为检测越来越依赖模式识别。Reddit既向AI公司出售数据,又努力防止AI驱动的操纵。
Cloudflare首席执行官马修·普林斯表示,代理型人工智能产生的网络流量已首次超过人类用户,达到总流量的57.4%,而人类流量降至42.6%。这一变化比预期提前了一年多。不同地区差异显著,北美地区机器人流量占68.6%,而亚洲、南美洲和大洋洲仍以人类流量为主。这一趋势加剧了“死互联网理论”的讨论,即网络活动越来越多由机器而非人类主导。
Michael Bolin,OpenAI Codex技术主管,分享了其简单直接的AI辅助工程工作流程:编写规范、简单提示、审查代码。他通过Notion文档管理需求,利用Codex的Notion连接器自动读取上下文,将工作拆分为适当大小的PR,并让Codex自动处理合并冲突和CI监控。该方法强调代码评审质量和快速迭代。
Replit通过Shopify集成、RevenueCat合作及Visa投资,逐步构建面向AI生成应用的金融堆栈,帮助开发者实现应用盈利,从订阅支付到电商销售再到自主交易。
OpenClaw 是一个开源 AI 代理项目,通过透明度和社区贡献显著提升了安全性。尽管面临大量虚假漏洞报告,该项目修复了真实漏洞,强化了平台,并与 NVIDIA、微软、腾讯等公司合作,使其更适合生产环境。
一种名为Miasma的新型蠕虫利用AI编码代理的配置文件,通过GitHub仓库传播。它劫持了Claude Code、Gemini CLI、Cursor和VS Code等工具的自动运行功能,在执行恶意负载前窃取云凭证并自我复制。该攻击已影响113个以上仓库,包括Azure示例和主流开源项目。
本文列出了当前支持或部分支持在HTTP请求中发送Accept: text/markdown头的AI代理,并提供了验证方法。截至2026年5月,仅Claude Code、Cursor、OpenClaw、OpenCode和Codex CLI(部分支持)支持此功能,其他主流代理如ChatGPT、Claude.ai、Copilot等仅获取HTML。
Sakana AI宣布在东京成立RSI实验室,致力于构建样本高效、递归自我改进的AI系统。该实验室建立在包括AI科学家(发表于《自然》)在内的研究组合之上,旨在从静态模型过渡到自主、自我改进的智能引擎。该方法强调优雅、自适应的架构而非暴力扩展,愿景是实现AI的民主化。
Runcap 是一个免费、本地的 CLI 工具,用于在运行 AI 编码代理之前估算成本,并强制执行硬性支出上限。它提供成本估算、运行时上限强制、令牌压缩以及代理卡住时的救援提示。与现有的事后观察工具不同,Runcap 像断路器一样防止超支。
AI代理执行代码需要安全的隔离环境。LangSmith Sandboxes通过硬件虚拟化的微VM为每个代理提供独立的计算机,支持快速启动、持久状态和批量扩展,适用于代码生成、数据分析、CI代理等场景。
技术大臣承诺支持因自动化而失业的工人,并强调政府可以塑造AI的采用方式,以应对公众对就业影响的担忧。
Gito v4.1.0 版本带来性能优化,并新增对 Claude Code 等 CLI 代理的支持,开发者可替代 HTTP LLM API 使用。
在开发者大会旺季,英伟达CEO黄仁勋描绘了AI驱动的新型笔记本电脑和使用方式,引发用户是否真正需要这些产品的疑问。本期The Vergecast回顾了微软Build和谷歌I/O上发布的众多AI产品,包括Gemini Spark、英伟达RTX Spark等,并讨论了AI代理的普及趋势。
Amanuensis 是一个本地优先的 AI 角色系统,用于在 Mastodon 和 Bluesky 上发布内容。它通过严格的流程防止模型编造技术细节,包括事实来源摘要、确定性清理、正则表达式预检查、LLM 基础检查,以及人工通过 Telegram 审批每篇帖子。项目是 MIT 许可的实验性代码。
企业AI采用通常经历五个阶段,从实验到AI原生转型。大多数企业卡在第二、三阶段之间,面临数据访问、信任和模型过时恐惧等障碍。本文聚焦从试点到生产的跨越,提出建设内部平台、统一数据架构、可观测性和模型可选性等建议。
Cohere 宣布开源 Command A+,一款 218B 总参数(25B 活跃)的混合专家(MoE)模型,采用 Apache 2.0 许可证。该模型专为企业级智能体工作流设计,支持 128K 输入上下文和 64K 生成长度,可处理文本、图像和工具使用。相比前代 Command A 系列,它在推理、多模态理解和多语言能力上有显著提升,同时通过低比特量化和推测解码实现高效部署。Command A+ 目前可在 Hugging Face 和 Model Vault 上获取。
模型上下文协议(MCP)是一个开放标准,帮助AI应用连接企业系统,简化数据访问和操作执行。本文详解MCP的工作原理、与API、RAG、函数调用及代理的区别、常见用例和安全考虑。
AI正越来越多地应用于商业智能,使数据更易访问和有用。本文解释了AI在BI中的含义、价值创造点及企业采用前应考虑的因素。
RWS与Cohere合作开发了一款专用翻译模型,为Language Weaver Pro提供动力。该模型结合了Cohere的大语言模型基础和RWS的全球语言与文化专业知识,在32种语言中的31种上超越了竞争对手。它提供文化智能、高安全性和合规性,适合复杂和受监管的环境。
研究过程中,可视化工具帮助研究人员更清晰地理解数据和工作。Cohere Labs 开发了 co/plot,一个快速迭代且保持数据准确性的可视化工具,已在多个项目中得到验证,并开源供社区使用。
Cursor 更新了 Design Mode,用户可通过点击、绘制或语音直接在页面上向智能体传达指令,从而加速设计迭代。该模式利用 Composer 2.5 模型,支持多选、多任务处理,让编辑流程更直观高效。
MIT施瓦茨曼计算机学院的社会与伦理责任计算倡议(SERC)举办了年度研究研讨会,探讨AI如何塑造世界及其社会影响。研讨会涵盖AI对齐、AI教育等主题,强调在快速发展技术中保留人类判断和价值的重要性。
佛罗里达州成为美国首个起诉OpenAI及其CEO萨姆·阿尔特曼的州,指控其对未成年人风险、缺失年龄审核及安全投入不足。这份83页的诉状将ChatGPT视为需承担产品责任的产品,并索赔数十亿美元。该法律路径可能为整个聊天机器人行业树立先例。
随着企业AI采用从受控试点扩展到全公司范围,治理框架与实际使用之间可能出现脱节。本文探讨了常见的AI治理挑战和失败模式,并概述了企业可以采取的应对步骤,包括建立AI清单、明确所有权、应用基于风险的控制以及持续监控。
大公司可以部署本地小语言模型作为过滤器,处理简单查询,从而减少对昂贵的云端LLM的依赖,显著降低AI成本并提升隐私保护。
Google DeepMind为Gemma 4系列发布了量化感知训练(QAT)检查点,旨在支持边缘设备和消费级GPU的本地部署。本文基于官方数据比较了BF16、Q4_0 QAT和新型移动QAT三种格式,分析其内存占用、质量保持和设备适配性。
谷歌发布采用量化感知训练(QAT)的Gemma 4新检查点,显著降低内存需求,支持在边缘设备和消费级GPU上本地运行。自定义移动量化格式将E2B模型内存占用降至1GB以下,同时保持模型质量。
谷歌在 Google I/O 2026 上发布了以速度为核心的 Gemini 3.5 Flash,而 Cerebras 上的 Kimi K2.6 在推理速度上全面领先。本文从智能水平、输出速度、端到端响应、延迟和开闭源等维度进行了详细对比。
瑞士下议院投票决定扩大联邦情报局的权力,包括进行人工智能分析和电信监控。
terradev-cli 是一个用于编排 AI 工作负载的命令行界面,可在 PyPI 上获取。
一场关于“氛围编码”的精彩演讲让许多管理者兴奋,但深入了解后发现,这种快速推进的方式往往留下混乱和清理工作,加剧了 AI 乐观派与谨慎派之间的裂痕。
Fitbit Air 是一款出色的无屏幕健身追踪器,舒适且价格合理。但谷歌强行将聊天式AI健康教练设为焦点,反而降低了使用体验。免费版界面信息更密集,更实用。用户可以关闭AI功能,但操作选项隐藏较深。
国际足联将在世界杯期间扩大AI使用,以减少球员和球队在社交媒体上看到的辱骂信息。该服务自2022年卡塔尔世界杯后推出,现已免费向所有参加2026年世界杯的足协提供,但英足总尚未确认是否采用。
据《金融时报》报道,Meta可能通过股票发行筹集数百亿美元以资助AI基础设施投资,导致股价下跌逾5%。公司未正式聘请银行,Meta发言人称报道为“纯属猜测”。
Cohere 和 Mila 宣布了一项新的学术研究合作,旨在改善人工智能在不同语言和文化中的评估,首先从魁北克法语的文化背景开始。此次合作将帮助前沿 AI 模型更好地反映魁北克法语的语音、社会及制度细微差别,推动更具文化相关性和可信赖的 AI 系统。