AI News HubLIVE
公开文章 13采集文章 14可信度 84刷新频率 120 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-06-12ID ollama-blog运行状态 已启用

Official local AI model runtime blog; confirm reuse terms before full body display.

最新公开文章

Ollama在Apple Silicon上通过MLX实现最高性能

Ollama的MLX引擎更新后,在Apple Silicon上实现了最高性能。通过更充分利用苹果统一内存和Metal支持的MLX框架,模型输出质量更高,响应更快,内存占用更低。新支持NVFP4格式,输出速度提升高达20%,并引入快照系统优化代理工作流。

  • Ollama MLX引擎更新,支持NVFP4格式,量化质量损失减半。
  • 输出速度提升高达20%,得益于融合的Metal内核和优化采样。
站内正文

GGUF 提升性能与模型支持

Ollama 0.30 现已发布,通过 llama.cpp 带来更优性能和 GGUF 模型兼容性,增强了 Apple Silicon 上的 MLX 引擎,支持更多硬件和模型。

  • NVIDIA GPU 性能提升高达 20%
  • Vulkan 默认启用,扩展 AMD/Intel 支持
站内正文

NVIDIA Nemotron 3 Ultra:专为长期代理工作流打造的5500亿参数开放模型

NVIDIA Nemotron 3 Ultra 是一款5500亿总参数(550亿活跃参数)的开放模型,专为长时间运行的代理驱动工作流设计,支持百万token上下文,并采用NVFP4优化,在代理任务上具有领先的准确性和成本效益。

  • 5500亿总参数(550亿活跃),针对代理编排、编码代理和深度研究优化。
  • 支持100万token上下文窗口,可保留整个代码库和工具历史。
站内正文

OpenJarvis v1.0 发布:支持 Ollama 的本地优先个人 AI 框架

OpenJarvis 是一个开源框架,用于构建运行在本地硬件上的个人 AI 代理。由斯坦福大学 Hazy Research 和 Scaling Intelligence 实验室开发,v1.0 版本现已集成 Ollama,实现本地优先、云端可选,并跟踪能耗、成本和延迟。

  • OpenJarvis v1.0 现已发布,支持 Ollama。
  • 框架由斯坦福大学研究团队开发,专注于高效本地 AI。
站内正文

Ollama 在 Apple Silicon 上由 MLX 驱动,现提供预览版

Ollama 宣布推出基于 Apple MLX 框架的预览版,针对 Apple Silicon 性能大幅优化,支持 NVFP4 精度和智能缓存,显著提升预填和解码速度。

  • Ollama 预览版利用 MLX 框架,在 Apple Silicon 上实现最快速度。
  • 支持 NVFP4 格式,推理质量提升且兼容生产环境。
站内正文

设置OpenClaw最简单快捷的方法

通过Ollama 0.17,只需一条命令即可在本地硬件上部署OpenClaw个人AI助手,支持管理邮件、日历和通过消息应用执行任务。本文详细介绍了安装步骤、模型选择和安全注意事项。

  • Ollama 0.17引入`ollama launch openclaw`单命令安装。
  • OpenClaw可作为个人AI助手,处理收件箱、发送邮件和管理日程。
站内正文

Claude Code 中的子代理与网络搜索

Ollama 现已支持在 Claude Code 中使用子代理和网络搜索功能,无需额外配置。子代理可并行执行文件搜索、代码探索和研究等任务,而网络搜索则内置于 Anthropic 兼容层,为模型提供实时信息。

  • Ollama 将子代理和网络搜索集成到 Claude Code 中。
  • 子代理可并行处理代码探索、研究等任务,保持上下文清晰。
站内正文

OpenClaw:本地运行的AI编程助手

OpenClaw是一款个人AI助手,能将你的消息应用连接到本地AI编程代理,所有操作都在你自己的设备上运行,确保隐私安全。它支持WhatsApp、Telegram、Slack、Discord、iMessage等服务,并通过Ollama集成本地或云端模型,推荐使用至少64k上下文长度的模型。

  • OpenClaw将消息应用与本地AI编程代理连接,所有数据在本地处理。
  • 支持WhatsApp、Telegram、Slack、Discord、iMessage等主流消息平台。
站内正文

Ollama 发布 launch 命令:一键配置并运行编码工具

Ollama 推出新命令 `ollama launch`,可自动配置并运行 Claude Code、OpenCode、Codex 等编码工具,支持本地或云端模型,无需手动设置环境变量或配置文件。

  • 新命令 `ollama launch` 简化了编码工具的启动流程。
  • 支持 Claude Code、OpenCode、Codex 和 Droid 等工具。
站内正文

Claude Code 现支持 Anthropic API 兼容,可在 Ollama 上运行

Ollama v0.14.0 及以上版本现兼容 Anthropic Messages API,使 Claude Code 等工具能与开源模型配合使用。用户可在本地或通过 ollama.com 连接云端模型运行。

  • Ollama v0.14.0 开始支持 Anthropic Messages API,使 Claude Code 等工具可用于开源模型。
  • 可通过环境变量配置连接本地或云端 Ollama 模型。
站内正文

OpenAI Codex与Ollama集成

Ollama宣布支持OpenAI的Codex CLI,允许用户通过本地或云端开源模型运行Codex,实现代码读取、修改和执行。

  • OpenAI Codex CLI现可通过Ollama使用开源模型,如gpt-oss:20b和gpt-oss:120b。
  • 用户需安装npm包并使用--oss标志启动Codex,默认模型为本地gpt-oss:20b。
站内正文

OpenAI gpt-oss-safeguard 安全分类模型

Ollama 与 OpenAI 和 ROOST 合作,推出基于 Apache 2.0 许可的 gpt-oss-safeguard 推理模型,用于安全分类任务。模型提供 20B 和 120B 两种参数规模,支持自定义安全策略、可解释推理过程以及可配置的推理努力,能够灵活应用于内容过滤、标注等场景。

  • Ollama 与 OpenAI 和 ROOST 合作推出 gpt-oss-safeguard 安全推理模型。
  • 模型有 20B 和 120B 两种参数规模,采用 Apache 2.0 许可,便于商用和定制。
站内正文

MiniMax M2:专为编程和智能体工作流打造的开源模型

MiniMax M2 现已通过 Ollama 云平台提供。该模型拥有 100 亿激活参数(总计 2300 亿),在通用智能、编程和智能体任务上表现出色,在开源模型中综合评分排名第一。文章还介绍了在 VS Code、Zed 和 Droid 等工具中的使用方法。

  • MiniMax M2 是专为编程和智能体工作流优化的开源模型,已登陆 Ollama 云平台。
  • 在 Artificial Analysis 的基准测试中,其综合智能评分位居全球开源模型之首。
站内正文

全部来源