Soro:专为塔吉克语打造的轻量级基础模型与聊天机器人
Soro是一系列专为塔吉克语优化的对话大语言模型,基于Gemma 3检查点,通过19亿标记的塔吉克语持续预训练和4万示例的指令微调,显著提升了塔吉克语任务表现,同时保持英语性能。模型支持FP8和INT4量化,适用于边缘部署,已在塔吉克斯坦教育领域试点。
- Soro基于Gemma 3,使用19亿标记的塔吉克语语料进行持续预训练和4万示例的指令微调。
- 在塔吉克语基准测试中大幅超越同等规模的Gemma 3基线,保持英语性能。
实时监测
按可信来源汇总的多语言 AI 新闻流,优先保留出处、权限和阅读模式。
Soro是一系列专为塔吉克语优化的对话大语言模型,基于Gemma 3检查点,通过19亿标记的塔吉克语持续预训练和4万示例的指令微调,显著提升了塔吉克语任务表现,同时保持英语性能。模型支持FP8和INT4量化,适用于边缘部署,已在塔吉克斯坦教育领域试点。
本文介绍了一种基于大型语言模型(LLM)的架构,用于检测和量化文本中人类价值的强度。该架构包含三个协调模块,可适应多种价值理论,并在ValueEval数据集上表现出良好的检测性能。
一篇论文认为,随着生成式AI消除了人类编写正确代码的能力这一约束,软件工作围绕两大支柱重组:混音模式(人类像音响工程师一样连续操作多个判断轴)和元软件(观察、验证、上下文化和治理其他软件的软件)。这两个支柱不可分割,借鉴了从手工艺到统计控制的批量生产的历史转型。
诺亚·史密斯认为,随着AI能力增强,人类将从技术工作转向确保AI对齐——使AI专注于人类目标。他将其与《上班一条虫》类比,并警告AI生成内容“污泥”正在泛滥。
Safescript 是一种为 AI 代理设计的编程语言,通过静态分析在运行前证明所有安全属性,无需沙箱或虚拟机,彻底消除供应链攻击。它编译成有向无环图(DAG),可追踪数据流和宿主机调用,性能开销为零,启动时间为零。
AIPass 是一个基于命令行的开源框架,为 AI 智能体提供持久性记忆、身份标识和协作能力。智能体共享文件系统,通过 JSON 文件存储记忆,无需云服务或额外 API 密钥。项目包含 13 个核心智能体,支持多智能体协作、任务调度、质量审计和实时监控。
本文提出了一种基于语言模型的蛋白质生物学世界模型,展示了如何通过大规模语言建模来理解和预测蛋白质的结构与功能。
伊利诺伊州参议院第315号法案(SB 315)要求人工智能实验室聘请独立审计师验证其安全承诺,该法案现已提交州长JB·普利兹克签署。普利兹克表示计划签署,称需要让大型科技公司负责。此举在联邦层面缺乏AI监管的背景下,凸显了州级立法的重要性。
这是一份关于AI作弊的PDF报告,但无法直接解析内容。
来自Sakana AI和东京大学的研究人员提出了DiffusionBlocks,这是一种块状训练框架,可将Transformer网络划分为独立训练的块,从而将训练内存减少B倍(B为块数),同时在不同架构上保持性能。该方法通过将残差连接解释为扩散模型中的欧拉步骤,利用分数匹配目标实现块级独立训练。
Simple Wearable Report利用AI从Oura Ring数据中提取更多见解。本文介绍了作者如何使用它,以及它如何与Gemini等AI工具配合提供详细分析。
股票交易应用Robinhood在高度监管的行业中率先允许AI代理进行交易,此举可能推动其他金融公司效仿。
本文探讨了AI系统中的授权悖论问题,即谁真正拥有对AI系统的控制权。文章以视频形式呈现,讨论了相关的安全和隐私问题。
苹果将在2026年6月3日至7日于丹佛举行的CVPR大会上赞助并展示多项研究,包括视频生成、多模态理解、图像压缩等领域,并在展位进行海报演示。
探索OpenAI的前沿治理框架,了解我们的人工智能安全、安保和风险实践如何与新兴的欧盟和加利福尼亚法规保持一致。
Liiists 是一款基于Markdown的列表应用,可在终端、iOS设备和AI代理上通过MCP服务器使用,所有操作都基于相同的纯文本.md文件。它提供了命令行工具、原生iOS应用(支持分享扩展和Siri)以及用于AI集成的MCP服务器。无需账户、无锁定,支持iCloud同步或指向任何文件夹(包括Obsidian vault)。
SQLite 新增了 AGENTS.md 文件,明确了其对 AI 生成贡献的政策:不接受未经事先同意的拉取请求,不接受代理生成的代码,但欢迎附带可重现测试用例的 bug 报告。由于 AI 生成的 bug 报告泛滥,论坛现已拆分出专门的 bug 论坛。
Uvilox AI 通过下一代视觉 AI 技术,提供实时手语翻译、紧急响应和无障碍通话,延迟低于 80 毫秒,准确率高达 97.4%,支持 200 多种手语变体,并具备军事级安全保护和 HIPAA/GDPR 合规架构。目前正开放 Beta 测试,早期会员可免费永久使用。
NeuralAgent 2.5 带来了语音模式、观察学习与并行代理三大功能,让AI助手能听、能看、能同时处理多项任务。用户可通过自然语言指挥它操作整个电脑,无需键盘鼠标。新版还优化了工作流、@提及和记忆系统。
LangChain 在 Interrupt 2026 大会上发布了 LangSmith Engine 和 Sandboxes 正式版,并推出了 LangChain Labs 以推进代理的持续学习。大会所有演讲现已可按需观看。
Databricks构建了独特的推理平台,为众多前沿模型提供推理服务,每月处理超过120万亿个令牌。通过引入“模型单元”抽象,实现了成本感知的负载均衡和自动缩放,相比静态配置节省了80%以上的GPU成本。运行时可靠性机制包括黑盒健康检查,可自动检测和恢复静默故障。此外,通过分析多模态瓶颈,吞吐量提升了3倍。
您的BI仪表盘速度缓慢,调优消耗大量时间和金钱。本文从物理布局到治理语义层,逐步介绍Databricks的BI接入栈,提供改善查询性能和降低总拥有成本的实用指导。
Snowflake与AWS签署五年60亿美元合作协议,使用AWS Graviton和GPU实例进行AI训练和推理,并扩展至10个新区域。此举表明Snowflake在AI时代的雄心,同时通过Cortex AI产品套件推动企业AI应用。
AWS生成式AI创新中心与Works Human Intelligence合作,利用Amazon Bedrock AgentCore构建了两个AI代理,分别用于通勤津贴审批和浏览器操作,实现了高达97%的成本降低并提升了运营效率。
Verizon Connect利用AWS构建智能代理AI解决方案,每天将超过5000万数据点转化为10万用户的可操作洞察。本文详细介绍了其架构决策、实施挑战和可衡量的成果,包括使用无服务器统计模型进行异常检测、采用Strands Agents实现动态推理、以及通过Amazon Nova Lite将输入令牌成本降低70%。
AWS SMGS使用NarrateAI(基于Amazon Bedrock AgentCore构建的智能对话解决方案)实现大规模商业智能。该方案采用双层架构:批量叙事生成和实时交互,通过专用AI代理进行路由和验证,支持自然语言查询、行级安全及个性化角色体验,显著提升决策效率。
微软的MAI-Image-2.5模型在Arena文本到图像排行榜上位列第三,与谷歌的Nano Banana 2性能相当,但仍落后于OpenAI的Image-2。该模型在图像内文本渲染和商业视觉内容方面有明显改进。
Cognition公司为其AI软件开发工具Devin融资超10亿美元,估值达260亿美元,显示了投资者对AI编程工具的热情,尽管其实际价值仍存争议。
DuckDuckGo作为一款无AI的搜索替代品,因谷歌AI概览的兴起而用户激增。本文介绍了如何无AI地使用DuckDuckGo进行私密搜索和浏览。
AWS 销售团队使用 Amazon Bedrock AgentCore 构建了 Field Advisor,以编排超过 20 个领域特定代理,减轻销售代表认知负担并提高效率。该解决方案每周为每位代表节省最多 2 小时,并将延迟降低 41%。