Ollama Blog AI 新闻来源

公开文章 13采集文章 14可信度 84刷新频率 120 分钟

健康状态健康来源类型官方原文权限 官方原文最近入库 2026-06-12ID ollama-blog运行状态 已启用

Official local AI model runtime blog; confirm reuse terms before full body display.

最新公开文章

Ollama在Apple Silicon上通过MLX实现最高性能

2026-06-11 08:00 UTC+8

Ollama的MLX引擎更新后，在Apple Silicon上实现了最高性能。通过更充分利用苹果统一内存和Metal支持的MLX框架，模型输出质量更高，响应更快，内存占用更低。新支持NVFP4格式，输出速度提升高达20%，并引入快照系统优化代理工作流。

Ollama MLX引擎更新，支持NVFP4格式，量化质量损失减半。
输出速度提升高达20%，得益于融合的Metal内核和优化采样。

GGUF 提升性能与模型支持

2026-06-05 08:00 UTC+8

Ollama 0.30 现已发布，通过 llama.cpp 带来更优性能和 GGUF 模型兼容性，增强了 Apple Silicon 上的 MLX 引擎，支持更多硬件和模型。

NVIDIA GPU 性能提升高达 20%
Vulkan 默认启用，扩展 AMD/Intel 支持

NVIDIA Nemotron 3 Ultra：专为长期代理工作流打造的5500亿参数开放模型

2026-06-04 08:00 UTC+8

NVIDIA Nemotron 3 Ultra 是一款5500亿总参数（550亿活跃参数）的开放模型，专为长时间运行的代理驱动工作流设计，支持百万token上下文，并采用NVFP4优化，在代理任务上具有领先的准确性和成本效益。

5500亿总参数（550亿活跃），针对代理编排、编码代理和深度研究优化。
支持100万token上下文窗口，可保留整个代码库和工具历史。

OpenJarvis v1.0 发布：支持 Ollama 的本地优先个人 AI 框架

2026-05-28 08:00 UTC+8

OpenJarvis 是一个开源框架，用于构建运行在本地硬件上的个人 AI 代理。由斯坦福大学 Hazy Research 和 Scaling Intelligence 实验室开发，v1.0 版本现已集成 Ollama，实现本地优先、云端可选，并跟踪能耗、成本和延迟。

OpenJarvis v1.0 现已发布，支持 Ollama。
框架由斯坦福大学研究团队开发，专注于高效本地 AI。

Ollama 在 Apple Silicon 上由 MLX 驱动，现提供预览版

2026-03-30 08:00 UTC+8

Ollama 宣布推出基于 Apple MLX 框架的预览版，针对 Apple Silicon 性能大幅优化，支持 NVFP4 精度和智能缓存，显著提升预填和解码速度。

Ollama 预览版利用 MLX 框架，在 Apple Silicon 上实现最快速度。
支持 NVFP4 格式，推理质量提升且兼容生产环境。

设置OpenClaw最简单快捷的方法

2026-02-23 08:00 UTC+8

通过Ollama 0.17，只需一条命令即可在本地硬件上部署OpenClaw个人AI助手，支持管理邮件、日历和通过消息应用执行任务。本文详细介绍了安装步骤、模型选择和安全注意事项。

Ollama 0.17引入`ollama launch openclaw`单命令安装。
OpenClaw可作为个人AI助手，处理收件箱、发送邮件和管理日程。

Claude Code 中的子代理与网络搜索

2026-02-16 08:00 UTC+8

Ollama 现已支持在 Claude Code 中使用子代理和网络搜索功能，无需额外配置。子代理可并行执行文件搜索、代码探索和研究等任务，而网络搜索则内置于 Anthropic 兼容层，为模型提供实时信息。

Ollama 将子代理和网络搜索集成到 Claude Code 中。
子代理可并行处理代码探索、研究等任务，保持上下文清晰。

OpenClaw：本地运行的AI编程助手

2026-02-01 08:00 UTC+8

OpenClaw是一款个人AI助手，能将你的消息应用连接到本地AI编程代理，所有操作都在你自己的设备上运行，确保隐私安全。它支持WhatsApp、Telegram、Slack、Discord、iMessage等服务，并通过Ollama集成本地或云端模型，推荐使用至少64k上下文长度的模型。

OpenClaw将消息应用与本地AI编程代理连接，所有数据在本地处理。
支持WhatsApp、Telegram、Slack、Discord、iMessage等主流消息平台。

Ollama 发布 launch 命令：一键配置并运行编码工具

2026-01-23 08:00 UTC+8

Ollama 推出新命令 `ollama launch`，可自动配置并运行 Claude Code、OpenCode、Codex 等编码工具，支持本地或云端模型，无需手动设置环境变量或配置文件。

新命令 `ollama launch` 简化了编码工具的启动流程。
支持 Claude Code、OpenCode、Codex 和 Droid 等工具。

Claude Code 现支持 Anthropic API 兼容，可在 Ollama 上运行

2026-01-16 08:00 UTC+8

Ollama v0.14.0 及以上版本现兼容 Anthropic Messages API，使 Claude Code 等工具能与开源模型配合使用。用户可在本地或通过 ollama.com 连接云端模型运行。

Ollama v0.14.0 开始支持 Anthropic Messages API，使 Claude Code 等工具可用于开源模型。
可通过环境变量配置连接本地或云端 Ollama 模型。

OpenAI Codex与Ollama集成

2026-01-15 08:00 UTC+8

Ollama宣布支持OpenAI的Codex CLI，允许用户通过本地或云端开源模型运行Codex，实现代码读取、修改和执行。

OpenAI Codex CLI现可通过Ollama使用开源模型，如gpt-oss:20b和gpt-oss:120b。
用户需安装npm包并使用--oss标志启动Codex，默认模型为本地gpt-oss:20b。

OpenAI gpt-oss-safeguard 安全分类模型

2025-10-29 08:00 UTC+8

Ollama 与 OpenAI 和 ROOST 合作，推出基于 Apache 2.0 许可的 gpt-oss-safeguard 推理模型，用于安全分类任务。模型提供 20B 和 120B 两种参数规模，支持自定义安全策略、可解释推理过程以及可配置的推理努力，能够灵活应用于内容过滤、标注等场景。

Ollama 与 OpenAI 和 ROOST 合作推出 gpt-oss-safeguard 安全推理模型。
模型有 20B 和 120B 两种参数规模，采用 Apache 2.0 许可，便于商用和定制。

MiniMax M2：专为编程和智能体工作流打造的开源模型

2025-10-28 08:00 UTC+8

MiniMax M2 现已通过 Ollama 云平台提供。该模型拥有 100 亿激活参数（总计 2300 亿），在通用智能、编程和智能体任务上表现出色，在开源模型中综合评分排名第一。文章还介绍了在 VS Code、Zed 和 Droid 等工具中的使用方法。

MiniMax M2 是专为编程和智能体工作流优化的开源模型，已登陆 Ollama 云平台。
在 Artificial Analysis 的基准测试中，其综合智能评分位居全球开源模型之首。

Ollama Blog