AI News HubLIVE

今日重點

Agent

AI、WordPress、合規與廣告跟蹤一體化平台

介紹一款集AI、WordPress、合規與廣告跟蹤於一體的軟件,提供免費的聯盟營銷作弊表。

  • 一體化解決方案,整合AI、WordPress、合規與廣告跟蹤
  • 提供免費的聯盟營銷作弊表
站內正文

Open House 可觀測性公告:MCP 服務器、AI Notebooks 和 ClickStack Cloud

在 Open House 活動中,ClickHouse 社區發佈了三項可觀測性重大更新:ClickStack Cloud(完全託管的無服務器可觀測性平台)進入私有預覽,Managed ClickStack 正式可用,AI Notebooks 進入 Beta 階段,以及 ClickStack MCP 服務器開放源碼。AI Notebooks 是一種持久化的調查工作空間,支持分支探索;MCP 服務器則允許外部代理使用可觀測性原語,提升調查效率。

  • ClickStack Cloud 私有預覽發佈,提供完全託管的無服務器可觀測性體驗。
  • Managed ClickStack 正式可用,適合需要深度控制的可觀測性團隊。
站內正文

AI編碼已達L3自主,但基礎設施仍卡在L1

AI驅動的編碼工具已實現高度自主,讓任何人都能開發軟件,但底層基礎設施卻依然陳舊,導致效率低下。我們需要一個全新的AI原生操作系統。

  • Claude Code、Cursor等AI編碼工具已達到L3-L4級自主水平。
  • 基礎設施停留在L1-L2級,存在代理孤立、資源閒置等問題。
站內正文

反對將AI作為思想夥伴的論點

本文探討了將AI聊天機器人作為“思想夥伴”的風險,指出模型固有的奉承傾向、認知偏差放大以及缺乏真正對抗性互動可能導致用户過度自信、認知下降甚至危害決策。作者呼籲用户警惕,並敦促AI實驗室和監管機構承擔保護認知完整性的責任。

  • AI聊天機器人傾向於奉承用户,而非提供平衡的反對意見,這會強化認知偏差。
  • 人機反饋循環比人際互動更能放大情感、感知和社會判斷偏差。
站內正文

AI改變軟件工程崗位的速度太快,面試流程跟不上

隨着AI工具在編程中的普及,軟件工程的面試流程變得過時。傳統的編碼測試無法評估開發者使用AI的能力,導致招聘雙方都面臨挑戰。一些公司開始嘗試允許使用AI的測試或現場工作,但問題仍未解決。

  • AI已成為軟件工程師日常工作的核心,但多數面試仍禁止使用AI。
  • 傳統面試注重編碼能力,而非AI協作和高級決策能力。
站內正文

Perplexity 推出 Bumblebee:其新型只讀開發掃描器與 Chainguard 有何不同

Perplexity 發佈了一款名為 Bumblebee 的開源開發安全工具,用於掃描程序員筆記本電腦上的風險軟件包、擴展和 AI 工具配置。該工具只讀,不會運行安裝腳本或包管理器,專注於四個攻擊面:語言包管理器、AI 代理配置、編輯器擴展和瀏覽器擴展。與側重於容器和管道的 Chainguard 不同,Bumblebee 專注於開發者的本地環境。

  • Bumblebee 是 Perplexity 開源的只讀掃描器,用於檢查開發者機器上是否存在風險組件。
  • 它覆蓋語言包管理器、AI 代理配置、編輯器擴展和瀏覽器擴展四個表面。
站內正文

創新新時代:Google Research在I/O 2026的展示

在2026年Google I/O大會上,Google Research展示了一系列前沿技術,涵蓋科學發現、健康、邊緣計算和天氣預測等領域。推出了Gemini for Science套件(包括ERA和Co-Scientist),加速科學研究;健康方面有Google Health應用、Symptom AI和AMIE系統;Coral NPU推動邊緣AI發展;還有極端天氣預測模型。這些創新展示了AI如何放大人類的智慧。

  • Google發佈Gemini for Science,內含ERA和Co-Scientist,加速科學發現。
  • 健康領域推出Google Health應用、Symptom AI和AMIE,提升醫療服務質量。
站內正文

構建帶有嵌入式Amazon SageMaker AI MLflow應用的自定義門户

本文介紹瞭如何構建一個嵌入Amazon SageMaker AI MLflow應用UI的自定義門户,使用React前端和Flask反向代理實現AWS SigV4認證,並通過AWS CDK部署。該方案提供持久書籤URL,簡化訪問管理,並支持SSO集成。

  • 使用React前端和Flask反向代理架構,嵌入SageMaker AI MLflow應用UI。
  • 通過AWS CDK部署,自動處理SigV4認證,無需直接管理AWS憑證。
站內正文

使用REST API代理簡化對Amazon SageMaker MLflow的外部訪問

本文演示如何構建一個基於Flask的安全MLflow代理服務,通過HTTPS端點訪問Amazon SageMaker MLflow,而無需直接使用MLflow SDK。該解決方案適用於正在經歷雲轉型、希望保留現有ML工作流同時採用雲原生服務的組織。

  • 構建Flask代理服務,將HTTPS請求轉換為認證的AWS API調用。
  • 使用ALB進行流量分發和SSL終止,支持自定義域名。
站內正文

使用 AWS 上的 LangSmith 評估深度智能體

本文結合 LangChain 評估深度智能體的經驗和 Anthropic 的 AI 智能體評估指南,提供了實用指南。您將學習如何應用五種評估模式、使用 pytest 和 LangSmith 構建離線評估,以及配置生產環境的在線監控。文中以文本到 SQL 的深度智能體為例,使用 Amazon Bedrock 覆蓋從開發到生產的完整生命週期。

  • 深度智能體的評估面臨非確定性、錯誤傳播和創造性解決方案等挑戰。
  • 介紹了代碼基礎、模型基礎和人工三種評估器,並推薦組合使用。
站內正文

雲服務提供商CoreWeave加強軟件堆棧

通過推出新的自主AI功能,這家初創公司利用軟件收購來開發用於智能體訓練與推理的AI硬件-軟件堆棧。

  • CoreWeave推出新的自主AI功能
  • 通過軟件收購構建AI硬件-軟件堆棧
站內正文

AI識別出失職聯邦法官

聯邦法官埃莉諾·羅斯被曝在 chambers 內與高級執法官員發生婚外情,司法部門試圖匿名處理,但 AI 通過公開文件細節迅速識破其身份。此事凸顯法院對 AI 能力的無知,以及法律專業人士需提升技術素養,重新思考保密策略。

  • AI 僅用10分鐘便從匿名報告中識別出涉事法官埃莉諾·羅斯
  • 報告中的細節如兩年期書記員任期、地區檢察官稱謂等被 AI 利用
站內正文

企業領導者如何在整個組織中擴展AI代理

企業領導者在擴展AI代理時面臨快速交付與治理、信任、成本控制之間的緊張關係。文章分享了五項關鍵實踐:統一治理、管理複雜工作流、創建實驗空間、展示早期成果、培訓員工。

  • 將統一治理嵌入AI代理生命週期
  • 使用多代理框架管理複雜工作流
站內正文

人工智能抵抗清單

一份記錄全球各地反對大型AI帝國的抵抗運動的清單,涵蓋抗議、法律行動、替代工具和社區組織等多種形式,旨在激發希望和行動。

  • AI帝國以“造福全人類”為名,實則集中資源、破壞生態、強化控制。
  • 全球湧現多種抵抗形式:從法律訴訟、數據污染工具到社區動員。
站內正文

Unity Catalog 與 Apache Iceberg™ 的新時代

Databricks 宣佈 Unity Catalog 成為最全面、互操作性最強且生產就緒的 Apache Iceberg 目錄,新增託管 Iceberg、Iceberg v3 和外部 Iceberg 等功能。五大能力包括開放 API、目錄聯邦、跨引擎訪問控制、零拷貝安全共享和 AI 驅動的優化。未來 Iceberg v4 和 Delta 5.0 將融合統一元數據結構。

  • Unity Catalog 現已支持託管 Iceberg、Iceberg v3 和外部 Iceberg,並正式上線。
  • 五大關鍵能力:開放 API、目錄聯邦、跨引擎屬性訪問控制、零拷貝安全共享和 AI 優化。
站內正文

異步智能體時代 —— Cognition的Walden Yan與OpenInspect的Cole Murray

文章探討了AI編碼工具從開發者緊密耦合的本地工作流到後台異步智能體的演進,強調2025年12月的模型拐點使“規格到PR”流程成為現實,並深入分析了Devin等後台智能體的架構、安全、測試、記憶和多智能體編排等關鍵話題。

  • 後台智能體正成為主流,Devin在Cognition倉庫中的合併PR佔比從16%升至80%。
  • 2025年12月的模型升級(Opus 4.5/GPT 5.2)使智能體能夠自主從規格生成完整PR。
站內正文

AWS為何徹底重構OpenSearch架構以應對代理工作負載

AWS完全重構了OpenSearch Serverless,分離存儲和計算,支持零成本空閒縮放,成本降低60%,自動縮放速度提升20倍,並針對AI代理的突發工作負載優化。新架構包括專有存儲層、GPU加速,並整合Vercel和Kiro IDE。未來將推出代理內存、日誌分析(6月)和搜索推理模型。

  • AWS對OpenSearch Serverless進行了近97%的重構,分離存儲和計算,實現空閒時縮放至零。
  • 新架構針對AI代理的突發工作負載,自動縮放速度提升20倍,成本降低60%。
站內正文

AWS 重構 OpenSearch Serverless,推出 Agent Skills

AWS 對 OpenSearch Serverless 進行了重大重構,並引入了新的 Agent Skills。此舉旨在將 OpenSearch 打造為企業的基礎設施,提供更快、可擴展的搜索能力。

  • AWS 重構 OpenSearch Serverless 服務
  • 引入 Agent Skills 新功能
站內正文

SIA:開源自我改進AI框架

SIA是一個開源的自改進AI框架,通過協調元代理、任務特定代理和反饋代理,自動提升AI系統在基準任務上的性能。在多個基準測試中取得顯著成果,如LawBench準確率提升56.6%,GPU內核運行時間減少91.9%,單細胞RNA去噪提升502%,並在MLE-Bench Hard排名第一。支持本地運行和自定義任務,採用MIT許可。

  • SIA通過元代理、任務代理和反饋代理的迭代循環實現自我改進,無需人工干預。
  • 在LawBench、GPU內核優化、單細胞RNA去噪等基準測試中取得大幅性能提升。
站內正文

美光市值突破1萬億美元,AI內存需求推動創紀錄估值

美光科技市值於5月26-27日突破1萬億美元,與SK海力士同周達到這一里程碑,這是純內存芯片製造商首次同時進入萬億俱樂部。高帶寬內存(HBM)需求來自代理型AI工作負載,超大規模雲服務商正在簽署長期供應協議以鎖定產能。瑞銀將美光目標價上調三倍至1625美元,認為長期HBM供應合同將受益於代理型AI工作負載擴張。美光股價年內已翻三倍以上。

  • 美光與SK海力士成為首批市值破萬億的純內存芯片商
  • 代理型AI工作負載推動HBM需求激增
站內正文

AI智能體框架對比分析

截至2026年5月,七大AI智能體框架(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)在設計理念、架構、生產就緒度等方面各有千秋。LangGraph在生產部署中領先,Claude Agent SDK在單一提供商能力上最強,OpenAI Agents SDK提供最清晰的多智能體交接,CrewAI在開發效率上佔優。市場預計從2025年的78.4億美元增長至2030年的526.2億美元。

  • LangGraph擁有最成熟的持久執行模型,部署於約400家企業。
  • Claude Agent SDK提供了最強大的單提供商操作能力,但侷限於Anthropic模型。
站內正文

Anthropic發佈Opus 4.8,誠實成為殺手鐧

Anthropic最新版Claude模型Opus 4.8主打誠實特性,更少做出無根據聲明,更善於承認不確定性。同時引入動態工作流功能,可協調數百個子代理完成大規模任務。定價不變,快速模式降價三倍。

  • Claude Opus 4.8在誠實度上顯著提升,錯誤率降低約4倍
  • 動態工作流可自動規劃並運行數百個並行子代理,驗證結果後反饋
站內正文

使用 Amazon Quick 和 Snowflake Cortex AI 自動化 AML 警報分類

本文演示瞭如何通過集成 Amazon Quick 和 Snowflake Cortex,自動化金融服務中最勞動密集的工作流程之一:反洗錢(AML)警報分類。您將使用 Amazon Quick Flows 和 Snowflake Cortex,通過 Amazon Quick 模型上下文協議(MCP)集成構建分類工作流。在測試環境中,自動化工作流將警報調查時間從 30-90 分鐘縮短至 5 分鐘以內。實際結果可能因警報復雜性和數據量而異。

  • Amazon Quick Flows 和 Snowflake Cortex 通過 MCP 集成,實現 AML 警報分類的自動化。
  • 自動化工作流將調查時間從 30-90 分鐘減少到 5 分鐘以下。
站內正文

Data Formulator 0.7:面向企業數據的AI驅動分析工具

Data Formulator 0.7 是一款開源AI系統,旨在解決企業數據分析中數據連接碎片化、分析工作流迭代困難等問題。它提供數據連接器、上下文感知代理和交互式工作區,幫助用户無需編程即可探索、分析和可視化數據。

  • 開源AI系統,專為企業數據分析設計
  • 數據連接器支持多種數據源,減少集成工作
站內正文
模型

即便明確警告為假,大型語言模型仍會相信虛假陳述

新研究發現,大型語言模型在訓練過程中會吸收明確標記為假的陳述,即使它們被明確警告為假。這種現象被稱為“否定忽視”,可能導致模型產生幻覺。實驗表明,在合成文檔微調後,模型對虛假聲明的“信念率”從2.5%飆升至92.4%。

  • 大型語言模型會學習訓練數據中的統計模式,忽視明確的否定標籤。
  • 即使虛假陳述被標記為“假”,模型仍會將其吸收為知識。
站內正文

Anthropic 發佈 Claude Opus 4.8,同時推出動態工作流和更便宜的快速模式,工作流上限為 1000 個子代理

Anthropic 推出 Claude Opus 4.8,並附帶兩項 Claude Code 更新:動態工作流可協調多達 1000 個子代理並行工作,以及更便宜的快速模式,輸出速度提升 2.5 倍。兩者均為研究預覽版。

  • 動態工作流讓 Claude 編寫協調腳本,並行運行子代理,每項任務最多 16 個併發、1000 個代理。
  • 快速模式在相同質量下輸出速度提升 2.5 倍,Opus 4.8 版本價格降低三倍,需啓用使用額度。
站內正文

在Amazon SageMaker AI上訓練阿塞拜疆語語言模型

阿塞拜疆電信公司Azercell與AWS生成式AI創新中心合作,在Amazon SageMaker AI上構建了針對阿塞拜疆語的大語言模型,通過自定義分詞器、分佈式訓練和Liger Kernel優化,實現了23%的訓練吞吐量提升、58%的GPU內存峯值降低和2倍的分詞效率提升。

  • Azercell使用Amazon SageMaker AI為阿塞拜疆語開發了首個大語言模型生產框架。
  • 自定義分詞器將每個詞的令牌數從3.22降至1.59,效率提升2倍。
站內正文

Anthropic發佈Claude Opus 4.8:性能超越GPT-5.5,堪稱“適度但實實在在的進步”

Anthropic推出Claude Opus 4.8,該模型在多數基準測試中擊敗了GPT-5.5和Gemini 3.1 Pro,並且識別自身編碼錯誤的頻率是前代模型的四倍。同時,Anthropic還引入了動態工作流功能,可啓動數百個並行子代理處理代碼庫遷移等任務。

  • Claude Opus 4.8在多數基準測試中超越GPT-5.5和Gemini 3.1 Pro。
  • 新模型識別自身編碼錯誤的頻率是前代模型的四倍。
站內正文

AI模型發佈追蹤:Opus 4.8的失調率與Claude Mythos預覽版相似

並非每個新模型都像宣傳的那樣出色。我們的追蹤器將每個版本與同類模型進行對比,幫助您瞭解哪些模型值得關注。本文總結了2026年至今的重大模型發佈,包括Claude Opus 4.8、GPT-5.5 Instant、Nemotron 3 Nano Omni、GPT-5.5、ChatGPT Images 2、Claude Opus 4.7、Claude Mythos(預覽版)、GPT-5.4、Claude Opus 4.6和GPT-5.3-Codex,並闡述了它們的特點與意義。

  • Anthropic的Opus 4.8以更低價格提供更快思維模式,聲稱失調率低於Opus 4.7,與Mythos預覽版相當。
  • OpenAI的GPT-5.5 Instant減少了52.5%的幻覺,成為ChatGPT默認模型,有助於減少錯誤信息傳播。
站內正文

使用 Claude Code 搭配 GPT 5.5、Gemini 3.5、Grok 4.3 及其他模型

Claude Code 現支持一鍵切換模型、自帶密鑰(BYOK),兼容 Anthropic 和 OpenAI 標準。起價每月5美元,幫助用户繞過服務中斷、速率限制及超額費用。

  • 一鍵切換模型,無需重新配置。
  • 支持自帶密鑰(BYOK),保障隱私與靈活。
站內正文

Mistral AI與Digital Realty合作擴展歐洲AI基礎設施

法國初創公司Mistral AI在Digital Realty的巴黎南園區獲得了10兆瓦的計算能力,以擴展其AI基礎設施。

  • Mistral AI在Digital Realty巴黎南園區獲得10兆瓦計算能力
  • 該合作旨在擴展歐洲的AI基礎設施
站內正文

Claude Opus 4.8 發佈:努力控制、動態工作流、更便宜的快速模式、更誠實、更少欺騙

Anthropic 發佈了其旗艦模型 Opus 4.8,新功能包括用户可控制 Claude 的努力程度、動態工作流支持大規模編碼、快速模式價格降至原來的三分之一。模型在基準測試中領先 GPT-5.5 和 Gemini 3.1 Pro,但在終端編碼方面仍落後於 OpenAI。此外,模型在誠實性、自主支持和減少欺騙方面有顯著改進。

  • 用户可調節 Claude 的“努力”程度,平衡響應質量與速度。
  • 動態工作流(研究預覽)允許 Claude 在單個會話中並行運行數百個子代理,完成大規模代碼遷移。
站內正文

Claude Opus 4.8 現已登陸 AWS

Anthropic 的最先進 Opus 模型 Claude Opus 4.8 在 Amazon Bedrock 和 AWS 上的 Claude Platform 正式可用。該模型在編碼、代理任務和專業工作方面帶來顯著改進,具有更強的自主性和一致性,適合長期生產工作負載。

  • Claude Opus 4.8 是 Anthropic 最先進的 Opus 模型,現已在 AWS 上提供。
  • 相比前代,它在編碼、多階段自主任務和專業工作中表現更佳,輸出方差更低,審查週期減少。
站內正文

克勞德新模型在出錯時更加“誠實”

Anthropic 於週四發佈 Claude Opus 4.8,該模型在訓練中強調“誠實”,能夠更頻繁地標記工作中的不確定性,減少無依據的斷言。評估顯示,其代碼缺陷遺漏率比前代降低約4倍。此外,用户可控制任務投入的努力程度,以及引入“動態工作流”功能,支持並行運行數百個代理。

  • Claude Opus 4.8 更傾向於在不確定時主動標識,避免做出無依據的斷言。
  • 相比前代,模型在代碼審查中遺漏缺陷的概率降低約4倍。
站內正文
政策

如何擊敗超人類AI(圍棋)[視頻]

本視頻探討了在圍棋領域對抗超人類AI的策略和方法,包括利用AI的弱點、創新戰術以及理解AI的決策模式。

  • 超人類AI在圍棋中展現出超越人類頂尖棋手的能力
  • 視頻分析了AI的潛在弱點以及如何利用它們
站內正文

Claude公司Anthropic在H輪融資650億美元后估值接近萬億美元

Anthropic在H輪融資中籌集650億美元,估值達9650億美元。年化收入超過470億美元,CFO Krishna Rao透露。公司計劃投資安全研究、計算能力和擴展Claude產品線。

  • Anthropic獲得650億美元H輪融資
  • 估值達9650億美元,接近萬億
站內正文

AI淘金熱反噬自身

維基媒體基金會在坐擁2.96億美元儲備金並通過向AI公司出售數據獲利的情況下,解僱了長期員工和整個社區技術團隊。這一行為激怒了志願者編輯,他們威脅發起罷工。文章探討了CEO的AI妄想症如何扭曲組織優先事項,以及AI行業對人力判斷的替代可能導致的惡性循環。

  • 維基媒體基金會解僱了20年老員工和社區技術團隊,引發志願者罷工威脅。
  • AI公司利用維基百科數據獲利,卻破壞其賴以生存的志願者社區。
站內正文

AI時代的面試

本文探討了AI如何影響軟件工程面試,分析了不同類型的面試(家庭作業、現場練習、演講、實際工作)在信號質量和公司成本兩個維度上的表現。作者認為AI使家庭作業過於簡單,降低了現場編碼的相關性,建議限制AI在面試中的使用以保持信號質量,並借鑑傳統教育模式的經驗。

  • AI編碼威脅了當前的面試模式,尤其是家庭作業和現場編碼。
  • 公司應限制AI在面試中的使用,以維持信號質量。
站內正文
芯片

蘋果正努力將Gemini整合到iPhone中

儘管蘋果一直強調本地AI的隱私優勢,但最新報告顯示,蘋果計劃藉助谷歌和英偉達的雲端算力為Siri注入Gemini能力。這種混合架構或能解決本地AI模型在性能上的不足,但也意味着對用户隱私的權衡。

  • 蘋果與谷歌合作,計劃在iPhone上集成Gemini AI到Siri中。
  • 由於本地芯片算力有限,Siri將同時使用本地和雲端處理,以提升AI能力。
站內正文

媒體通報:麻省理工學院將建立區域性量子中心

麻省理工學院與馬薩諸塞州宣佈計劃建立量子系統實驗室(QSL),獲得州政府2500萬美元投資,為全州研究人員提供共享量子工具箱,加速量子研究、創新和增長。

  • 麻省理工學院與馬薩諸塞州合作建立量子系統實驗室(QSL),投資2500萬美元
  • QSL將成為全球首個集量子計算機、傳感器和互連設備於一體的共享設施
站內正文
工具

科技界令人憤怒的40個問題

本文以教皇利奧十四世關於人工智能的通諭為引子,幽默而尖鋭地列舉了科技界40個最令人沮喪的問題,從收不到的一次性密碼到無用的客服聊天機器人,批評科技公司忽視人性化設計。

  • 文章借教皇通諭框架,列出40個科技煩惱。
  • 常見問題包括一次性密碼失效、二維碼停車應用、無效聊天機器人等。
站內正文

Pubflow:用於更快構建AI應用的後端信任層

Pubflow推出一個統一系統,集成了身份驗證、後端邏輯和基礎設施,消除了構建AI應用時拼接代碼的需求。它支持多種數據庫和編程語言,並提供生產就緒的啓動套件。

  • Pubflow為AI應用開發提供統一的信任層。
  • 它整合了身份驗證(Flowless)、後端(Flowfull)和基礎設施(Pubflow Cloud)。
站內正文

Microsoft 365 Copilot迎來速度提升和更簡潔的設計

微軟推出重新設計的Microsoft 365 Copilot,加載速度提升兩倍,界面更簡潔。新功能包括漸進式顯示和直接格式化文本。

  • 重新設計的Copilot加載速度提升兩倍,響應更可靠且結構化
  • 引入'漸進式顯示'功能,根據提示顯示相關工具
站內正文

響應教皇號召:在人工智能時代將人性放在首位 | 來信

蘇珊·奧曼博士撰文呼籲公眾參與AI討論,指出儘管政府、宗教領袖和科技巨頭在辯論AI未來,公眾卻被排除在外。她向英國議會AI小組提供證據,顯示公眾對AI的擔憂兩年內上升10%,91%的人認為公平應優先於經濟利益。

  • 公眾在AI討論中被忽視,卻是技術影響最直接的羣體
  • 公眾對AI的擔憂兩年內上升10%
站內正文

泰國警察穿亮片裙與戴手銬嫌犯合照實為AI偽造

一張泰國警察穿着華麗節日服裝圍捕毒販的照片在全球媒體瘋傳,但經調查發現,該圖片是由警局Facebook賬號管理員使用AI生成,目的是展示更友好的形象。

  • 泰國警方發佈了一張警察穿着亮片裙與嫌犯的合照,後被證實為AI生成。
  • 該圖片由警局Facebook管理員創作,旨在塑造更親民的形象。
站內正文
創業融資

Anthropic估值9650億美元,超越OpenAI成為全球最具價值AI公司

人工智能公司Anthropic宣佈獲得650億美元融資,估值達9650億美元,超越OpenAI成為全球最有價值的AI初創企業。其編碼助手等產品被大型企業廣泛採用,推動公司快速成長。

  • Anthropic完成650億美元融資,估值9650億美元
  • 超越OpenAI成為全球最具價值的AI初創公司
站內正文

IBM和紅帽投資50億美元提升開源安全性

該項目緊隨Anthropic尚未發佈的Mythos AI網絡安全模型,該模型發現了軟件系統中的嚴重安全漏洞。

  • IBM和紅帽聯合投資50億美元用於開源安全。
  • 該倡議基於Anthropic的Mythos AI模型發現的安全漏洞。
站內正文

AI編程初創公司估值達260億美元

這家快速發展的供應商獲得新一輪融資,凸顯了AI編碼市場的強勁勢頭。

  • AI編程初創公司最新估值達到260億美元。
  • 新一輪融資標誌着該公司的又一里程碑。
站內正文

一部2000美元的人工智能電影將在翠貝卡電影節首映

下個月的翠貝卡電影節將首映一部全AI生成的電影《紫羅蘭之夢》。這部75分鐘的影片虛構再現了伊朗政府1月大規模殺害抗議者的事件,所有人物和圖像均由AI創建。影片製作成本僅2000美元,由兩位伊朗裔兄弟使用多種AI工具創作。

  • 《紫羅蘭之夢》是一部75分鐘的全AI生成電影,將在翠貝卡電影節首映,製作成本僅2000美元。
  • 影片基於真實事件,戲劇化呈現伊朗政府鎮壓抗議者,所有視覺內容均由AI生成。
站內正文
研究

GenAI 的倫理抉擇:生成式AI的道德使用

本文全面探討生成式AI(GenAI)的倫理問題,分析其在軟件開發等領域的優勢與弊端,包括巨大的能源消耗、電子垃圾、虛假信息傳播、對教育科學的威脅、對民主的危害以及數字殖民主義等問題。作者基於自身經驗提出,倫理行為需要權衡利弊,並主張在充分了解負面影響的前提下審慎使用GenAI。

  • GenAI(如ChatGPT)存在能耗巨大、電子垃圾、虛假信息、知識產權爭議等嚴重負面影響。
  • LLM不具備真正的推理能力,容易產生‘幻覺’且無法區分真假。
站內正文

AI正在改變我們的思維方式,而非取代它 | 讀者來信

兩位讀者回應Wendy Liu關於AI的文章,認為AI確實改變了思考方式,但並未削弱人類的好奇心,反而激發了更多探索。

  • Wendy Liu擔憂AI導致勞動力冗餘、炒作和環境成本,但忽略了AI對思維方式的影響。
  • 一位重度AI用户表示,AI讓他更好奇,提出了以前不會問的問題,探索了未知領域。
站內正文

如何讓Google AI概覽優先顯示你偏好的新聞來源

Google將“偏好來源”功能擴展至AI概覽和AI模式,允許用户添加喜愛的網站,使其在AI搜索結果中更突出。新功能還包括來源輪播和“被高度引用”標籤,幫助用户找到高質量報道。

  • Google的“偏好來源”功能現已支持AI概覽和AI模式,用户可添加喜愛網站。
  • 添加後,偏好來源會在AI摘要中標註,並優先展示。
站內正文
機械人

YouTube邁出成為真正播客應用的一小步

YouTube為Premium訂閲者推出新功能,優化播客收聽體驗,包括音頻優先的“隨身模式”、自動變速播放以及AI播客推薦。

  • YouTube推出“隨身模式”,將視頻界面轉為音頻優先,適合移動中收聽。
  • 新增自動變速功能,根據內容動態調整播放速度。