谷歌DeepMind的Gemma 4 12B將多模態AI壓縮到僅需16GB RAM的筆記本電腦上
谷歌DeepMind發佈開源模型Gemma 4 12B,原生處理文本、圖像和音頻,可在僅16GB RAM的筆記本電腦上運行。其性能幾乎與兩倍大小的26B模型相當,並採用Apache 2.0許可證,可用於商業用途。
- Gemma 4 12B是開源多模態模型,支持文本、圖像和音頻。
- 僅需16GB RAM即可在筆記本電腦上運行。
日報
2026-06-04 精選 10 條,按主題聚合。其餘新聞摺疊歸檔。
谷歌DeepMind發佈開源模型Gemma 4 12B,原生處理文本、圖像和音頻,可在僅16GB RAM的筆記本電腦上運行。其性能幾乎與兩倍大小的26B模型相當,並採用Apache 2.0許可證,可用於商業用途。
Google DeepMind 發佈 Gemma 4 12B,這是一款 120 億參數的密集多模態模型,採用無編碼器設計,直接將視覺和音頻輸入 LLM 主幹。該模型可在 16GB RAM 的消費級筆記本電腦上本地運行,並採用 Apache 2.0 許可證。它原生支持文本、圖像、音頻和視頻,是首個具備原生音頻功能的中型 Gemma 模型。
Ideogram 發佈4.0版本文本生成圖像模型,作為開源權重模型,提供原生2K分辨率、邊界框控制和改進的文本渲染。在DesignArena排行榜中,該模型在所有開源模型中排名第一;只有OpenAI和Google的閉源系統得分更高。商業使用需要付費許可。
谷歌首次在Search Console中為網站運營商提供退出AI搜索功能(如AI概覽和AI模式)的開關,這些功能已覆蓋超過35億月活躍用户。新性能報告單獨展示展示次數。此舉是由英國競爭與市場管理局(CMA)推動的,該機構認為網站運營商處於嚴重劣勢。
英國工黨議員傑斯·阿薩託對埃隆·馬斯克的AI公司提起訴訟,指控其Grok工具被用來生成她的虛假性化圖片。這些圖片在今年早些時候大量出現在X平台上,阿薩託稱看到自己被AI以不雅形象呈現感到“被侵犯”。
本教程展示瞭如何使用iii引擎構建文檔智能工作流,包括安裝引擎、註冊模塊化函數、組合分析管道,並通過直接調用、HTTP端點、即發即棄執行和定時cron觸發器複用相同邏輯。
本文提出了“AI領結”框架,幫助管理者決定團隊工作流中何時使用AI,避免過度依賴或完全迴避的極端。框架包括五個階段:研究探索、綜合提煉、獨立思考(無AI)、計劃準備、執行實施。
本文認為,人工智能(尤其是大語言模型)應被理解為一種計算形式,而非人造智能體。文章探討了循環、組合性和代理框架在實現計算中的作用,引入了“Verplankalkül”作為非正式編程語言的概念,並分析了將計算結構整合到訓練中的未來方向。
儘管AI基礎設施的討論常聚焦於GPU和TPU,但CPU在AI從聊天機器人轉向自主代理的過程中扮演着關鍵角色,作為“空中交通管制員”協調任務,並支持沙盒環境以確保安全。ARM和Google的專家解釋了CPU在處理工具調用、內存管理和輕量級模型運行中的優勢。
研究表明,使用AI可能增加工作量而非減少,導致認知疲勞。專家建議聚焦工具、遵循準則和優化輸出,以平衡效率與質量。
本文批評了谷歌Gemini Spark等AI生產力工具,指出它們解決了科技公司自己製造的問題,而忽視了工資停滯、工作不安全感等系統性經濟問題。作者認為,AI提升的生產力並未惠及工人,反而可能加劇不平等,且缺乏社會保障。
本文將精益製造原則應用於AI推理,識別了LLM推理中的七大浪費,並提出了即時上下文、標準化工作、節拍時間和提示緩存等核心原則,通過一個倉庫分析代理的案例展示了13倍成本降低和3.3倍延遲改進。
本文提出了一個從簡單SaaS到AI原生平台的實用框架,描述了五個層次的AI集成:從提供個人訪問令牌和MCP服務器,到嵌入AI聊天窗口,再到對話歷史、自定義UI生成,最終實現自主代理框架。作者分享了自己的實踐經驗,並強調了每個層次的關鍵考慮因素。
本文介紹了使用LangChain的create_agent和中間件構建自定義代理腳手架的方法。代理由模型和腳手架組成,腳手架負責將模型連接到真實世界。通過中間件,可以在代理循環的各個階段插入自定義邏輯、工具、狀態管理等,從而實現高度定製化的代理。
微軟Copilot Health預覽版允許用户分享病歷以獲得個性化的AI健康建議。作者測試後發現結果好壞參半,存在技術故障,同時提及隱私保護措施,並警告不要依賴AI做出醫療決策。
微軟推出名為“Autopilot”的新型自主AI代理,首發代理“Scout”將全天候監控用户操作並自動執行任務,旨在簡化工作流程。然而,該代理基於OpenClaw構建,存在安全隱患,且可能被惡意操縱。目前僅限部分客户預覽,並需訂閲GitHub Copilot。
Meta內部團隊TBD在Wang的帶領下,推行專注專有模型和初創文化,但面臨公司裁員、員工抗議追蹤軟件等挑戰。其AI模型Muse Spark在視覺理解上獲好評,但編程能力落後競爭對手。
GitLab裁減約14%員工(約350人),作為上個月宣佈的重組計劃的一部分。公司退出22個國家,精簡管理層,投資基礎設施以擴展平台,應對AI工作流帶來的流量增長,並聚焦研發。
Harmonic 使用 Deep Agents 和 LangSmith 重建了其 AI Scout,將用户留存率提高了 4 倍,並將工具從僵化的搜索界面轉變為能夠處理複雜投資查詢的可信賴顧問。
本文通過一場2D大逃殺遊戲實驗,比較了11個大型語言模型的表現。結果顯示,Grok 4.1 Fast以最低成本贏得最多比賽,而Claude Sonnet 4.6則因過度合作而表現不佳。實驗揭示了校準税對模型性能的影響,以及傳統基準測試無法預測實際任務表現的問題。
Cursor Enterprise 推出組織功能,允許企業統一管理多個團隊,每個團隊可獨立設置預算、安全和功能控制。該功能包括沙盒測試、模型訪問分段和統一分析,並支持在組織級別管理身份和成員資格。
DeepLearning.AI與Red Hat合作推出免費中級課程《使用vLLM實現快速高效的LLM推理》,由Red Hat高級開發者倡導者Cedric Clyburn授課。課程涵蓋量化、vLLM服務部署及基準測試,時長1小時38分鐘,包含9個視頻課程、3個代碼示例和1個評分作業。
本文對比了三種常用的智能體可觀測性工具:LangSmith、Langfuse 和 Arize。通過設置一個基於 LangChain 的測試智能體,展示了各工具的集成方式、追蹤能力和評估工作流。LangSmith 與 LangChain 原生集成,提供完整的執行樹視圖和提示調試功能;Langfuse 是開源且框架無關的,支持會話分組和事後評分;Arize 專注於生產級 ML 監控,使用 OpenInference 標準。文章幫助讀者根據需求選擇合適的工具。
Trilogy 的 AI 卓越中心評估了 Fireworks AI 作為推理基礎設施,以標準化開源權重模型的使用,降低了成本並實現了十億級 token 的代理工作流。
白宮發佈行政令,要求五角大樓和CISA等機構在30天內利用AI工具加強網絡防禦。AI開發者可自願提交模型進行安全測試,但命令明確排除強制批准。鑑於近期政府對AI公司的壓力,這種合作的自願性仍存疑問。
英國競爭與市場管理局(CMA)命令谷歌改變其AI搜索結果中使用出版商內容的方式,賦予新聞網站屏蔽其內容用於AI摘要的權力,此舉將產生全球影響。
讀者回應Nesrine Malik關於信任機器而非人類的文章,指出AI對寫作和證據的影響,擔憂偽造引文和不可靠研究對真相和公眾信任的威脅。
Impermeabiliza 是瓦倫西亞的一家防水專家,通過集成人工智能來提升診斷、規劃和執行水平,確保住宅、工業和商業結構的耐久性,防止滲漏、濕氣和黴菌。
在AI市場不斷變化的背景下,SaaS企業不僅需要適應AI,更要主動構建上下文並將這些技術整合到自身產品中,這是生存的關鍵。
歐盟委員會提出技術主權提案,旨在減少對美中等外國供應商在雲計算、人工智能和半導體生產領域的依賴,確保外國政府或公司無法通過“關閉開關”中斷歐洲關鍵科技服務。
AWS Deep Learning AMI和Deep Learning Containers現已支持SOCI快照器和索引,通過選擇性文件下載(延遲加載)和並行拉取模式,顯著縮短容器啓動時間。本文介紹了SOCI的工作原理、適用場景以及性能基準測試結果。