AI News HubLIVE
站内改写4 分鐘閱讀

構建巴基斯坦通知助手:一款針對本地安全問題的簡易AI工具

作者為Hugging Face的Build Small黑客馬拉松開發了一款專注於巴基斯坦本地安全問題的AI工具——巴基斯坦通知助手。該工具使用小模型(Qwen3.5 4B)分析可疑消息,提供風險標籤、解釋和下一步安全建議,支持英文和烏爾都語(包括從右到左的佈局)。文章詳細分享了模型選型、技術棧、用户界面設計以及使用Codex加速開發的經驗。

巴基斯坦通知助手是一款為Hugging Face的“Build Small”黑客馬拉松構建的AI工具,旨在解決巴基斯坦當地一個非常實際的安全問題:幫助人們識別可疑消息,避免點擊鏈接、回撥電話、分享驗證碼或進行支付。

項目的靈感來源於一個常見問題:人們經常收到看似來自銀行、快遞公司、税務機關、交通警察、公用事業公司、移動運營商或政府部門的通知。有些是真實的,但很多是詐騙。困難之處通常不在於閲讀消息本身,而在於知道接下來該怎麼做。

該工具並非真實性檢查器,不會聲稱某個消息是真是假,而是作為一個分診工具:接收文本或截圖,返回風險標籤、簡短説明、明顯的危險信號以及安全下一步措施。

為什麼適合“Build Small” 該項目符合“後院AI”賽道,因為它專注於一個具體的本地問題:巴基斯坦的詐騙式通知和可疑消息。作者沒有構建大型通用助手,而是想看看當範圍明確、產品行為定義清晰且界面圍繞真實用户設計時,一個小模型能走多遠。

最初測試了較大的Qwen模型,但最終選擇了通過llama.cpp運行的Qwen3.5 4B Q8。該模型在十個測試案例中通過了所有高風險詐騙案例和兩個截圖案例,使其成為小模型安全助手的實用選擇。

技術棧包括:Hugging Face Space(自定義Gradio前端)、隊列Gradio服務器端點、Modal端點、CUDA llama.cpp、Qwen3.5 4B Q8 MTP GGUF + 視覺投影儀。這個小型模型棧既能處理文本也能處理截圖,同時保持在黑客馬拉松32B模型限制以下。

應用的功能 巴基斯坦通知助手支持英語和烏爾都語。這是最重要的產品決策之一,因為巴基斯坦的可疑消息通常用英語、烏爾都語、羅馬烏爾都語或三者的混合寫成。

烏爾都語模式不僅是翻譯後的界面:當用户切換到烏爾都語時,應用將佈局改為從右到左,翻譯標題、標籤、風險卡片、驗證消息和結果控件,並讓模型用清晰的烏爾都語腳本生成評估。這意味着用户可以提交可疑消息並獲得完整的烏爾都語安全響應,包括風險標籤、説明、危險信號、安全下一步以及在適當時提供可選的回覆草稿。

應用會尋找以下警告信號:緊急威脅或賬户暫停語言;請求OTP、PIN、密碼、CVV、CNIC詳細信息或卡片數據;可疑的支付鏈接或個人手機號碼;冒充銀行、電信公司、快遞公司、税務機關或警察;需要預付費用的獎品、退款、工作或福利。

工具隨後給出更安全的下步操作,例如通過獨立找到的官方渠道進行驗證,而不是使用可疑消息內的鏈接或電話號碼。

構建過程中的經驗教訓 該項目教會作者,用小模型構建更少地追求最高基準分數,更多地找到質量、速度、成本和產品安全性之間的正確平衡。

  1. 小模型在範圍明確時效果最好

最大的教訓之一是,當任務被仔細界定時,小模型可以出人意料地工作良好。巴基斯坦通知助手不需要成為通用的詐騙調查員,它只需要識別可見的風險信號,避免過度聲稱,並給出安全下一步。這使得產品範圍、提示設計和輸出契約與模型本身同樣重要。

  1. 從大模型開始

作者從Qwen3.6 27B開始,質量極佳——處理可疑消息效果很好,產生可靠的解釋。問題在於部署成本和實用性:模型需要更多VRAM、更大的GPU機器,冷啓動恢復時間更長。對於流量不規律的黑客馬拉松演示來説並不理想。質量上作者會打95/100,但僅憑質量不夠。

  1. 測試較小的本地選項

隨後嘗試更小的視覺語言模型MiniCPM-V 4.6 Q8,希望能在本地運行並降低服務成本。但實驗不順利:在GPU上非常慢,通過ZeroGPU運行遇到配額和運行時問題。即使界面顯示還有約35分鐘配額,應用運行也不可靠。然後通過Modal部署,部署快但模型質量不夠好,未能通過足夠多的測試案例。

  1. 找到“金鳳花”模型

作者查看了Artificial Analysis上的小模型排名,找到了Qwen3.5 4B。它足夠小以符合Build Small精神,足夠快以滿足應用體驗,並且能力足以滿足所需的安全行為。與Qwen3.6 27B相比,作者會給80/100,但權衡是合理的:4B模型服務成本更低,加載更快,部署更容易,在較小的Modal機器上更實用。

  1. 提示和輸出契約非常重要

早期版本有一些問題:思考模式消耗了500 token的輸出預算,因此為生產環境禁用了思考;一個密集的羅馬烏爾都語截圖達到了補全限制,因此圖像請求獲得更大的token預算;另一個模型響應建議了一個未經驗證的看似官方的域名,因此更新了系統提示以禁止編造URL、電話號碼、組織和事實。這些修復使系統更安全、更可預測。

  1. 烏爾都語用户體驗需要真正的產品工作

烏爾都語界面需要比預期更多的工作:直接翻譯聽起來不自然,一些標題需要不同的行高,混合的烏爾都語和拉丁語模型名稱可能意外重新排序,移動控件在從右到左佈局中需要更多垂直空間。作者還測試了捆綁的Naastaliq網絡字體,但單獨看很美,在產品UI中降低了可讀性,因此移除並恢復為系統阿拉伯字體堆棧。

  1. 主要教訓

產品的最佳模型不一定是最大的模型。對於這個項目,Qwen3.6 27B提供最佳原始質量,但Qwen3.5 4B提供最佳產品平衡。這種權衡正是該項目適合Build Small的原因。

使用Codex構建 Codex幫助作者在整個項目中更快地推進,因為巴基斯坦通知助手不僅需要簡單的模型演示。它需要自定義前端、Gradio後端、Modal託管的llama.cpp服務器、截圖支持、烏爾都語模式、測試、文檔以及更安全的輸出管道。作者將Codex作為工程協作者,而不是僅作為代碼生成器。

其中一個最有用的部分是構建自定義HTML、CSS和JavaScript界面,同時通過Gradio Server保持Hugging Face Spaces兼容性。該應用使用產品風格的前端,後台與Gradio的隊列API路由和SSE協議通信。這使得最終的Space更像一個真正的本地安全工具,而不是標準的模型遊樂場。

隱私安全的追蹤 作者還添加了可選的公共追蹤功能,讓人們瞭解應用的使用情況而不暴露私人用户內容。追蹤選項在應用內可見,每個請求前可禁用。啓用時僅記錄有限的請求級元數據,不包括完整的用户消息或截圖。文本被編輯並限制長度,圖像通過固定摘要表示且不存儲。追蹤排除原始截圖、鏈接、標識符、生成的解釋、回覆草稿、錯誤、憑證以及可能意外重複私人細節的任何自由格式模型輸出。

結果 小型評估套件並非真實世界的準確性估計,但用於迴歸測試很有用。最終評估:初始嚴格通過9/10,平均分89.5/100;最終迴歸通過10/10,平均分100/100;高風險詐騙案例和截圖案例全部通過。最重要的結果不是分數本身,而是一個範圍明確的4B模型能夠保持所需的安全行為。