KDnuggets AI 新闻来源

公开文章 56采集文章 84可信度 76刷新频率 60 分钟

健康状态健康来源类型社区原文权限 站内改写最近入库 2026-06-26ID kdnuggets运行状态 已启用

Data science and AI analysis source; summary-only unless authorization is obtained.

最新公开文章

使用MLX在Apple Silicon上微调语言模型

2026-06-26 23:00 UTC+8

本文详细介绍了如何在配备Apple Silicon芯片的Mac上，利用MLX框架本地微调开源语言模型，无需云GPU和额外成本。涵盖环境搭建、数据集准备、LoRA适配器训练、量化减少内存使用、测试及模型融合部署等完整流程。

MLX是苹果专为Apple Silicon统一内存架构设计的开源数组库，支持在Mac上高效进行模型微调。
通过MLX LM工具包，用户只需几条命令即可完成从安装、数据准备到训练、测试和部署的全流程。

5种智能体工作流，自动化你的数据科学管道

2026-06-26 21:34 UTC+8

本文介绍了五种智能体工作流，分别对应数据科学管道的不同阶段，从自动探索性数据分析到特征工程，帮助数据科学家将精力从重复性任务中解放出来。

数据科学家约45%的时间花在数据准备和清洗上，这些任务可被智能体自动化。
文章提供了五种具体的智能体工作流，包括自动EDA和特征工程，并附有代码示例。

使用 Gemini 创建 Google 表格

2026-06-26 00:00 UTC+8

本教程介绍了三种利用 Gemini 创建 Google 表格的方法：在电子表格内直接使用内置集成、通过 Gemini 网页应用生成并导出、以及使用 Gemini 编写 Google Apps Script 实现高级自动化。同时提供优化提示以获得更好结果的建议。

Gemini 是 Google 表格中的 AI 集成工具，可通过自然语言创建、填充和分析电子表格。
方法一：在 Google 表格内部使用 Gemini 边栏，通过提示生成表格、公式和分析。

5个开源全能AI模型：处理文本、图像、音频和视频

2026-06-25 22:00 UTC+8

本文介绍五个开源全能AI模型，它们统一处理多模态输入。从NVIDIA Nemotron的企业级应用到MiniCPM-o的实时流媒体，这些模型代表了向单一架构多模态理解的转变。

全能模型正从多个专用模型转向统一架构，能够处理多种输入类型。
NVIDIA Nemotron 3 Nano Omni在企业工作流（如视频分析和文档智能）方面表现出色。

2026年成为AI架构师的路线图

2026-06-25 20:00 UTC+8

涵盖五个能力领域的逐步指南：技术基础、系统架构设计、技术选型、规模与成本、治理与业务对齐。包含练习和资源，帮助从工程师过渡到架构师。

AI架构师需要技术基础和数据分析的广度，而非深度实现。
关键模式包括RAG、多智能体编排、批量/实时处理、模型路由。

2026年可在本地运行的7大编码模型

2026-06-24 18:00 UTC+8

本地编码模型已成熟，可在消费级GPU上运行，提供隐私和效率。本文介绍7款最佳模型，涵盖通用编码、多模态、推理等场景。

Qwen3.6 27B MTP是最佳全能本地编码模型，适合推理和智能体工作流。
Gemma 4 31B IT QAT支持多模态，可处理截图、UI问题等。

每位有志数据科学家在写第一行代码前必须掌握的数学技能

2026-06-24 01:00 UTC+8

本文详细解析了数据科学所需的四大数学基石：线性代数、微积分、概率与统计、离散数学，并提供了高效学习路径。强调数学直觉而非仅会调用代码，是在2026年AI自动化时代的真正竞争力。

数据科学的核心是数学运算，理解数学原理比编写代码更重要
统计学与概率是日常分析最常用的数学分支

WebMCP为何令人兴奋

2026-06-23 22:00 UTC+8

WebMCP是一项开放的Web标准，允许网站向浏览器代理暴露结构化的可调用工具，替代了传统的像素点击和DOM抓取方式，大幅提升代理的可靠性和效率。本文介绍了WebMCP的核心概念、两种API（声明式和命令式）、认证突破以及实际用例。

WebMCP是浏览器原生代理协议，由Google和Microsoft共同开发，2026年2月发布草案，Chrome 149已支持。
提供声明式（HTML表单）和命令式（JavaScript）两种API，使网站能明确告诉代理可用工具及其输入输出。

Abacus AI 的 ChatLLM 评测：为日常工作打造的多模型 AI 工作空间

2026-06-23 01:00 UTC+8

ChatLLM 是 Abacus AI 开发的一个 AI 工作空间，它集成了多个领先的大语言模型、AI 代理、文档分析、图像生成、自动化及团队协作功能。本文详细评测了其支持的模型、功能、定价、使用限制，并对比了 ChatGPT。

ChatLLM 在一个订阅中提供对 GPT、Claude、Gemini、Grok 等数十种 AI 模型的访问。
平台包含多模型聊天、文档分析、数据可视化、图像与视频生成、代码执行、AI 代理及企业集成。

关于代理型AI，大家都搞错了什么

2026-06-22 22:00 UTC+8

代理型AI并非因为技术差而失败，而是团队在首次部署时携带了五个特定的误解，每一个都可以纠正。

自主性意味着结构化监督，而非完全放手
演示环境与生产部署的成功率相差巨大

损失函数小白指南（模型如何知道自己错了）

2026-06-19 22:00 UTC+8

本文用简单的比喻和实例解释了机器学习中损失函数的概念，包括均方误差、平均绝对误差和交叉熵损失，以及它们如何帮助模型改进。

损失函数量化模型预测的错误程度，高损失意味着大错误。
均方误差（MSE）通过平方惩罚大错误，适用于回归任务。

我如何（以及为何）构建了一个AI助手

2026-06-17 22:00 UTC+8

本文讲述了作者为何选择自建AI助手而非使用现有工具，详细介绍了系统架构、技术栈选择及实现过程，包括LLM、LangChain、内存管理和工具集成。

自建AI助手可提供更高控制力、数据隐私保护和定制化工作流。
技术栈包括GPT-4o、LangChain、SQLite持久化内存及DuckDuckGo搜索等工具。

使用OpenAI Codex的5个有趣项目

2026-06-17 20:00 UTC+8

本文介绍了五个使用OpenAI Codex构建的有趣项目，从简单的应用到复杂的全栈克隆，展示了Codex在软件开发中的多样性和实用性。

五个项目涵盖简单应用、移动应用、创业原型、全栈克隆和2D游戏。
每个项目都强调使用Codex作为编程伙伴，通过迭代改进。

2026年成为LLM工程师的路线图

2026-06-16 22:00 UTC+8

本文详细介绍了从机器学习从业者转型为LLM工程师的五个技能阶段：基础、提示与工具调用、检索增强生成、微调与对齐、服务与运营，并提供了具体项目和资源推荐。

LLM工程师与通用机器学习工程师不同，专注于适配、编排和服务预训练的大语言模型。
2026年LLM功能已从演示阶段进入生产系统，对具备特定技能的工程师需求大增。

使用sktime在Python中构建时间序列机器学习模型

2026-06-15 22:00 UTC+8

本文介绍如何使用sktime库在Python中构建时间序列机器学习模型，包括数据预处理、预测管道构建、模型评估和交叉验证。通过一个工业HVAC传感器温度预测的完整案例，展示了sktime与scikit-learn风格一致的API，以及如何处理季节性和趋势等时间序列特有结构。

sktime提供scikit-learn风格的API，专为时间序列预测、分类、回归和聚类设计。
通过TransformedTargetForecaster可链式组合插值、去趋势、去季节化等变换与预测器。

将Claude Code与本地模型配对使用

2026-06-12 22:00 UTC+8

本文介绍了如何将Claude Code与本地推理后端（Ollama、LM Studio、llama.cpp）配对，以降低API成本并避免速率限制。详细说明了环境变量配置、模型选择建议以及常见问题的解决方法。

本地模型在2026年已足够胜任代码补全、重构、调试等日常任务，且零成本、无速率限制。
通过设置ANTHROPIC_BASE_URL和环境变量，Claude Code可直接连接本地推理服务器。

从零构建特征存储：最小可用实现

2026-06-11 22:00 UTC+8

本文从零开始用Python、DuckDB、Parquet、Redis和FastAPI构建最小特征存储，涵盖注册表、离线存储、在线存储、物化管道和检索API五个组件，并探讨AI时代特征存储的设计变化。

五个核心组件：特征注册表、离线存储、在线存储、物化管道、检索API。
特征存储解决训练-服务偏差，并为LLM提供低延迟上下文。

Hugging Face 上目前最好的免费图像生成器！

2026-06-09 22:00 UTC+8

本文从 Hugging Face 上超过 90,000 个文本到图像模型中精选出七个值得在 2026 年使用的模型，涵盖 FLUX.1 Schnell、FLUX.1 Dev、FLUX.1 Kontext Dev、Stable Diffusion 3.5 Large、FLUX.2 Dev、Playground v2.5 和 Kolors，并提供了每个模型的许可证、最佳用途和实际权衡。

FLUX.1 Schnell 是唯一一个采用 Apache 2.0 许可证的主流模型，支持商用且生成速度快。
FLUX.1 Kontext Dev 擅长基于文本指令编辑图像，并能在多次迭代中保持身份一致。

10个用于Python Web开发的GitHub仓库

2026-06-09 20:00 UTC+8

本文介绍了10个流行的Python Web开发框架和工具，包括FastAPI、Django、Flask等，涵盖了API构建、全栈开发、数据仪表盘、机器学习演示等场景，并提供了作者的个人使用经验。

Python在Web开发中应用广泛，不仅限于脚本和数据科学。
本文介绍了10个GitHub仓库，涵盖从API到全栈应用的多种框架。

为什么将任务委托给LLM会导致文档损坏？

2026-06-09 00:00 UTC+8

最新研究揭示，将文档编辑等任务委托给大型语言模型（LLM）时，模型可能会在交互过程中默默损坏文档内容。研究构建了DELEGATE-52基准测试，发现即使最先进的模型在20次交互后也会导致25%的内容损坏，原因包括错误累积、弱模型删除与强模型幻觉、上下文过载以及领域熟悉度不足。代理式AI工具对此问题帮助有限。

研究发现，将任务委托给LLM会导致文档内容逐渐退化，顶级模型在20次交互后损坏率达25%，弱模型可达50%。
错误累积、弱模型倾向于删除内容、强模型则幻觉式地篡改信息，且上下文过载加剧问题。

Anthropic Claude技能构建完全指南

2026-06-08 22:00 UTC+8

本指南全面介绍Claude Skills的概念、规划、文件结构、编写方法、测试分发及故障排除，帮助用户快速构建可复用的专业技能。

Claude Skills是一个包含SKILL.md文件的文件夹，采用渐进式信息披露系统，节省令牌并保持专业性。
规划技能时需先明确使用场景、多步骤工作流、所需工具和领域知识。

AI工程师必知的5个Python概念

2026-06-08 20:00 UTC+8

本文介绍了AI工程师必须掌握的五项Python核心概念：张量与自动求导、__call__方法、序列化（Pickle vs ONNX）、抽象基类以及环境配置，每个概念都附有笨拙实现与生产级实现的对比，帮助读者构建可扩展、安全且稳健的AI系统。

张量与自动求导：利用PyTorch的autograd自动计算梯度，无需手动推导。
__call__方法：使Python类实例可调用，便于在PyTorch模型中执行钩子函数。

语言模型校准深度解析：Platt缩放、等渗回归与温度缩放

2026-06-05 22:00 UTC+8

本文详细探讨了三种后处理校准方法——温度缩放、Platt缩放和等渗回归，用于缩小大型语言模型置信度与准确率之间的差距。分析了LLM校准的挑战、RLHF带来的问题，并给出实际应用建议。

温度缩放适用于基线模型，但对于RLHF微调后的模型，自适应温度缩放（ATS）效果更好。
Platt缩放数据高效，适合小校准集，但可能降低强模型性能。

智能体时代对数据科学的意义

2026-06-04 22:00 UTC+8

本文探讨了AI智能体如何重塑数据科学工作流程，自动化日常任务，并需要系统设计、工具集成和智能体可观测性等新技能。介绍了LangGraph、AutoGen和smolagents等框架，以及从程序性到评估性工作的转变和新兴角色。

智能体时代已至：AI智能体自主规划、执行多步骤任务并评估结果，重新定义数据科学。
数据科学家需掌握新技能：系统设计、提示工程、工具设计、智能体可观测性和多智能体架构。

用Python掌握时间序列分析的7个步骤

2026-06-04 20:00 UTC+8

本文详细介绍了使用Python进行时间序列分析和预测的7个关键步骤，从理解时间序列数据的独特性到部署监控系统，涵盖了经典统计模型、机器学习模型和深度学习模型的实践方法。

时间序列数据具有时间依赖性、平稳性和季节性等独特属性，需要特殊处理。
掌握pandas的时间数据结构（DatetimeIndex、PeriodIndex、重采样和滚动操作）是基础。

五篇有趣的论文，清晰解释LLM

2026-06-03 20:00 UTC+8

本文介绍了五篇核心论文，分别涵盖Transformer架构、GPT-3的上下文学习、缩放定律、RLHF指令微调以及检索增强生成（RAG），帮助读者系统理解现代大语言模型的工作原理。

《Attention Is All You Need》提出Transformer架构，自注意力机制是LLM的基础。
《Language Models Are Few-Shot Learners》展示GPT-3通过上下文学习完成多种任务。

LLM可解释性入门指南

2026-06-02 22:00 UTC+8

本文探讨了大语言模型（LLM）的可解释性，概述了这一重要研究领域的进展、趋势和持续发展。文章介绍了从静态评估向动态评估的转变，模型无关的局部解释方法（如SMILE框架），以及通过代理模型和观测平台实现低成本可解释性的工程实践。

动态评估框架取代传统静态基准，以应对模型记忆问题。
SMILE等框架通过统计距离测量提供局部解释。

10个现代数据库系统与工具的开源GitHub仓库

2026-06-02 20:00 UTC+8

本文精选了10个备受开发者喜爱的开源GitHub仓库，涵盖实时分析、嵌入式SQL、缓存、监控、复制、AI代理内存等现代数据库工具，包括ClickHouse、DuckDB、Supabase、Redis、Prometheus、Vitess、LiteFS、OpenViking、pgAdmin和Adminer，适合开发者、数据科学家和AI工程师。

ClickHouse和DuckDB分别面向大规模实时分析和嵌入式分析SQL场景。
Supabase和Redis提供全栈后端加速和高速缓存能力。

使用Mimesis模拟一整年物联网传感器时间序列数据

2026-06-01 22:00 UTC+8

本文详细介绍了如何利用Mimesis、pandas和NumPy生成一整年的每日温度读数，模拟季节性变化并加入设备元数据、随机噪声和网络延迟，生成逼真的物联网传感器数据集。

使用Mimesis生成设备元数据（ID、位置、固件版本、IP地址）
通过正弦函数建模季节性温度变化

使用Ollama调整本地语言模型设置

2026-05-28 22:00 UTC+8

本文深入探讨Ollama的配置引擎，介绍如何使用Modelfile微调本地语言模型参数、优化硬件性能并格式化提示流。涵盖采样参数、惩罚设置、上下文窗口管理及服务器环境变量等关键内容。

Ollama Modelfile类似于Dockerfile，用于定义模型行为，包括基础模型、系统指令和参数。
采样参数（温度、Top-K、Top-P、Min-P）控制模型的创造性和确定性。

KDnuggets