AI News HubLIVE
公开文章 56采集文章 84可信度 76刷新频率 60 分钟
健康状态 健康来源类型 社区原文权限 站内改写最近入库 2026-06-26ID kdnuggets运行状态 已启用

Data science and AI analysis source; summary-only unless authorization is obtained.

最新公开文章

使用MLX在Apple Silicon上微调语言模型

本文详细介绍了如何在配备Apple Silicon芯片的Mac上,利用MLX框架本地微调开源语言模型,无需云GPU和额外成本。涵盖环境搭建、数据集准备、LoRA适配器训练、量化减少内存使用、测试及模型融合部署等完整流程。

  • MLX是苹果专为Apple Silicon统一内存架构设计的开源数组库,支持在Mac上高效进行模型微调。
  • 通过MLX LM工具包,用户只需几条命令即可完成从安装、数据准备到训练、测试和部署的全流程。
站内正文

5种智能体工作流,自动化你的数据科学管道

本文介绍了五种智能体工作流,分别对应数据科学管道的不同阶段,从自动探索性数据分析到特征工程,帮助数据科学家将精力从重复性任务中解放出来。

  • 数据科学家约45%的时间花在数据准备和清洗上,这些任务可被智能体自动化。
  • 文章提供了五种具体的智能体工作流,包括自动EDA和特征工程,并附有代码示例。
站内正文

使用 Gemini 创建 Google 表格

本教程介绍了三种利用 Gemini 创建 Google 表格的方法:在电子表格内直接使用内置集成、通过 Gemini 网页应用生成并导出、以及使用 Gemini 编写 Google Apps Script 实现高级自动化。同时提供优化提示以获得更好结果的建议。

  • Gemini 是 Google 表格中的 AI 集成工具,可通过自然语言创建、填充和分析电子表格。
  • 方法一:在 Google 表格内部使用 Gemini 边栏,通过提示生成表格、公式和分析。
站内正文

5个开源全能AI模型:处理文本、图像、音频和视频

本文介绍五个开源全能AI模型,它们统一处理多模态输入。从NVIDIA Nemotron的企业级应用到MiniCPM-o的实时流媒体,这些模型代表了向单一架构多模态理解的转变。

  • 全能模型正从多个专用模型转向统一架构,能够处理多种输入类型。
  • NVIDIA Nemotron 3 Nano Omni在企业工作流(如视频分析和文档智能)方面表现出色。
站内正文

2026年成为AI架构师的路线图

涵盖五个能力领域的逐步指南:技术基础、系统架构设计、技术选型、规模与成本、治理与业务对齐。包含练习和资源,帮助从工程师过渡到架构师。

  • AI架构师需要技术基础和数据分析的广度,而非深度实现。
  • 关键模式包括RAG、多智能体编排、批量/实时处理、模型路由。
站内正文

2026年可在本地运行的7大编码模型

本地编码模型已成熟,可在消费级GPU上运行,提供隐私和效率。本文介绍7款最佳模型,涵盖通用编码、多模态、推理等场景。

  • Qwen3.6 27B MTP是最佳全能本地编码模型,适合推理和智能体工作流。
  • Gemma 4 31B IT QAT支持多模态,可处理截图、UI问题等。
站内正文

每位有志数据科学家在写第一行代码前必须掌握的数学技能

本文详细解析了数据科学所需的四大数学基石:线性代数、微积分、概率与统计、离散数学,并提供了高效学习路径。强调数学直觉而非仅会调用代码,是在2026年AI自动化时代的真正竞争力。

  • 数据科学的核心是数学运算,理解数学原理比编写代码更重要
  • 统计学与概率是日常分析最常用的数学分支
站内正文

WebMCP为何令人兴奋

WebMCP是一项开放的Web标准,允许网站向浏览器代理暴露结构化的可调用工具,替代了传统的像素点击和DOM抓取方式,大幅提升代理的可靠性和效率。本文介绍了WebMCP的核心概念、两种API(声明式和命令式)、认证突破以及实际用例。

  • WebMCP是浏览器原生代理协议,由Google和Microsoft共同开发,2026年2月发布草案,Chrome 149已支持。
  • 提供声明式(HTML表单)和命令式(JavaScript)两种API,使网站能明确告诉代理可用工具及其输入输出。
站内正文

Abacus AI 的 ChatLLM 评测:为日常工作打造的多模型 AI 工作空间

ChatLLM 是 Abacus AI 开发的一个 AI 工作空间,它集成了多个领先的大语言模型、AI 代理、文档分析、图像生成、自动化及团队协作功能。本文详细评测了其支持的模型、功能、定价、使用限制,并对比了 ChatGPT。

  • ChatLLM 在一个订阅中提供对 GPT、Claude、Gemini、Grok 等数十种 AI 模型的访问。
  • 平台包含多模型聊天、文档分析、数据可视化、图像与视频生成、代码执行、AI 代理及企业集成。
站内正文

关于代理型AI,大家都搞错了什么

代理型AI并非因为技术差而失败,而是团队在首次部署时携带了五个特定的误解,每一个都可以纠正。

  • 自主性意味着结构化监督,而非完全放手
  • 演示环境与生产部署的成功率相差巨大
站内正文

损失函数小白指南(模型如何知道自己错了)

本文用简单的比喻和实例解释了机器学习中损失函数的概念,包括均方误差、平均绝对误差和交叉熵损失,以及它们如何帮助模型改进。

  • 损失函数量化模型预测的错误程度,高损失意味着大错误。
  • 均方误差(MSE)通过平方惩罚大错误,适用于回归任务。
站内正文

我如何(以及为何)构建了一个AI助手

本文讲述了作者为何选择自建AI助手而非使用现有工具,详细介绍了系统架构、技术栈选择及实现过程,包括LLM、LangChain、内存管理和工具集成。

  • 自建AI助手可提供更高控制力、数据隐私保护和定制化工作流。
  • 技术栈包括GPT-4o、LangChain、SQLite持久化内存及DuckDuckGo搜索等工具。
站内正文

使用OpenAI Codex的5个有趣项目

本文介绍了五个使用OpenAI Codex构建的有趣项目,从简单的应用到复杂的全栈克隆,展示了Codex在软件开发中的多样性和实用性。

  • 五个项目涵盖简单应用、移动应用、创业原型、全栈克隆和2D游戏。
  • 每个项目都强调使用Codex作为编程伙伴,通过迭代改进。
站内正文

2026年成为LLM工程师的路线图

本文详细介绍了从机器学习从业者转型为LLM工程师的五个技能阶段:基础、提示与工具调用、检索增强生成、微调与对齐、服务与运营,并提供了具体项目和资源推荐。

  • LLM工程师与通用机器学习工程师不同,专注于适配、编排和服务预训练的大语言模型。
  • 2026年LLM功能已从演示阶段进入生产系统,对具备特定技能的工程师需求大增。
站内正文

使用sktime在Python中构建时间序列机器学习模型

本文介绍如何使用sktime库在Python中构建时间序列机器学习模型,包括数据预处理、预测管道构建、模型评估和交叉验证。通过一个工业HVAC传感器温度预测的完整案例,展示了sktime与scikit-learn风格一致的API,以及如何处理季节性和趋势等时间序列特有结构。

  • sktime提供scikit-learn风格的API,专为时间序列预测、分类、回归和聚类设计。
  • 通过TransformedTargetForecaster可链式组合插值、去趋势、去季节化等变换与预测器。
站内正文

将Claude Code与本地模型配对使用

本文介绍了如何将Claude Code与本地推理后端(Ollama、LM Studio、llama.cpp)配对,以降低API成本并避免速率限制。详细说明了环境变量配置、模型选择建议以及常见问题的解决方法。

  • 本地模型在2026年已足够胜任代码补全、重构、调试等日常任务,且零成本、无速率限制。
  • 通过设置ANTHROPIC_BASE_URL和环境变量,Claude Code可直接连接本地推理服务器。
站内正文

从零构建特征存储:最小可用实现

本文从零开始用Python、DuckDB、Parquet、Redis和FastAPI构建最小特征存储,涵盖注册表、离线存储、在线存储、物化管道和检索API五个组件,并探讨AI时代特征存储的设计变化。

  • 五个核心组件:特征注册表、离线存储、在线存储、物化管道、检索API。
  • 特征存储解决训练-服务偏差,并为LLM提供低延迟上下文。
站内正文

Hugging Face 上目前最好的免费图像生成器!

本文从 Hugging Face 上超过 90,000 个文本到图像模型中精选出七个值得在 2026 年使用的模型,涵盖 FLUX.1 Schnell、FLUX.1 Dev、FLUX.1 Kontext Dev、Stable Diffusion 3.5 Large、FLUX.2 Dev、Playground v2.5 和 Kolors,并提供了每个模型的许可证、最佳用途和实际权衡。

  • FLUX.1 Schnell 是唯一一个采用 Apache 2.0 许可证的主流模型,支持商用且生成速度快。
  • FLUX.1 Kontext Dev 擅长基于文本指令编辑图像,并能在多次迭代中保持身份一致。
站内正文

10个用于Python Web开发的GitHub仓库

本文介绍了10个流行的Python Web开发框架和工具,包括FastAPI、Django、Flask等,涵盖了API构建、全栈开发、数据仪表盘、机器学习演示等场景,并提供了作者的个人使用经验。

  • Python在Web开发中应用广泛,不仅限于脚本和数据科学。
  • 本文介绍了10个GitHub仓库,涵盖从API到全栈应用的多种框架。
站内正文

为什么将任务委托给LLM会导致文档损坏?

最新研究揭示,将文档编辑等任务委托给大型语言模型(LLM)时,模型可能会在交互过程中默默损坏文档内容。研究构建了DELEGATE-52基准测试,发现即使最先进的模型在20次交互后也会导致25%的内容损坏,原因包括错误累积、弱模型删除与强模型幻觉、上下文过载以及领域熟悉度不足。代理式AI工具对此问题帮助有限。

  • 研究发现,将任务委托给LLM会导致文档内容逐渐退化,顶级模型在20次交互后损坏率达25%,弱模型可达50%。
  • 错误累积、弱模型倾向于删除内容、强模型则幻觉式地篡改信息,且上下文过载加剧问题。
站内正文

Anthropic Claude技能构建完全指南

本指南全面介绍Claude Skills的概念、规划、文件结构、编写方法、测试分发及故障排除,帮助用户快速构建可复用的专业技能。

  • Claude Skills是一个包含SKILL.md文件的文件夹,采用渐进式信息披露系统,节省令牌并保持专业性。
  • 规划技能时需先明确使用场景、多步骤工作流、所需工具和领域知识。
站内正文

AI工程师必知的5个Python概念

本文介绍了AI工程师必须掌握的五项Python核心概念:张量与自动求导、__call__方法、序列化(Pickle vs ONNX)、抽象基类以及环境配置,每个概念都附有笨拙实现与生产级实现的对比,帮助读者构建可扩展、安全且稳健的AI系统。

  • 张量与自动求导:利用PyTorch的autograd自动计算梯度,无需手动推导。
  • __call__方法:使Python类实例可调用,便于在PyTorch模型中执行钩子函数。
站内正文

语言模型校准深度解析:Platt缩放、等渗回归与温度缩放

本文详细探讨了三种后处理校准方法——温度缩放、Platt缩放和等渗回归,用于缩小大型语言模型置信度与准确率之间的差距。分析了LLM校准的挑战、RLHF带来的问题,并给出实际应用建议。

  • 温度缩放适用于基线模型,但对于RLHF微调后的模型,自适应温度缩放(ATS)效果更好。
  • Platt缩放数据高效,适合小校准集,但可能降低强模型性能。
站内正文

智能体时代对数据科学的意义

本文探讨了AI智能体如何重塑数据科学工作流程,自动化日常任务,并需要系统设计、工具集成和智能体可观测性等新技能。介绍了LangGraph、AutoGen和smolagents等框架,以及从程序性到评估性工作的转变和新兴角色。

  • 智能体时代已至:AI智能体自主规划、执行多步骤任务并评估结果,重新定义数据科学。
  • 数据科学家需掌握新技能:系统设计、提示工程、工具设计、智能体可观测性和多智能体架构。
站内正文

用Python掌握时间序列分析的7个步骤

本文详细介绍了使用Python进行时间序列分析和预测的7个关键步骤,从理解时间序列数据的独特性到部署监控系统,涵盖了经典统计模型、机器学习模型和深度学习模型的实践方法。

  • 时间序列数据具有时间依赖性、平稳性和季节性等独特属性,需要特殊处理。
  • 掌握pandas的时间数据结构(DatetimeIndex、PeriodIndex、重采样和滚动操作)是基础。
站内正文

五篇有趣的论文,清晰解释LLM

本文介绍了五篇核心论文,分别涵盖Transformer架构、GPT-3的上下文学习、缩放定律、RLHF指令微调以及检索增强生成(RAG),帮助读者系统理解现代大语言模型的工作原理。

  • 《Attention Is All You Need》提出Transformer架构,自注意力机制是LLM的基础。
  • 《Language Models Are Few-Shot Learners》展示GPT-3通过上下文学习完成多种任务。
站内正文

LLM可解释性入门指南

本文探讨了大语言模型(LLM)的可解释性,概述了这一重要研究领域的进展、趋势和持续发展。文章介绍了从静态评估向动态评估的转变,模型无关的局部解释方法(如SMILE框架),以及通过代理模型和观测平台实现低成本可解释性的工程实践。

  • 动态评估框架取代传统静态基准,以应对模型记忆问题。
  • SMILE等框架通过统计距离测量提供局部解释。
站内正文

10个现代数据库系统与工具的开源GitHub仓库

本文精选了10个备受开发者喜爱的开源GitHub仓库,涵盖实时分析、嵌入式SQL、缓存、监控、复制、AI代理内存等现代数据库工具,包括ClickHouse、DuckDB、Supabase、Redis、Prometheus、Vitess、LiteFS、OpenViking、pgAdmin和Adminer,适合开发者、数据科学家和AI工程师。

  • ClickHouse和DuckDB分别面向大规模实时分析和嵌入式分析SQL场景。
  • Supabase和Redis提供全栈后端加速和高速缓存能力。
站内正文

使用Mimesis模拟一整年物联网传感器时间序列数据

本文详细介绍了如何利用Mimesis、pandas和NumPy生成一整年的每日温度读数,模拟季节性变化并加入设备元数据、随机噪声和网络延迟,生成逼真的物联网传感器数据集。

  • 使用Mimesis生成设备元数据(ID、位置、固件版本、IP地址)
  • 通过正弦函数建模季节性温度变化
站内正文

使用Ollama调整本地语言模型设置

本文深入探讨Ollama的配置引擎,介绍如何使用Modelfile微调本地语言模型参数、优化硬件性能并格式化提示流。涵盖采样参数、惩罚设置、上下文窗口管理及服务器环境变量等关键内容。

  • Ollama Modelfile类似于Dockerfile,用于定义模型行为,包括基础模型、系统指令和参数。
  • 采样参数(温度、Top-K、Top-P、Min-P)控制模型的创造性和确定性。
站内正文

全部来源