AI News HubLIVE
站內改寫2 分鐘閱讀

AI模型可訪問性檢查器

AIMAC項目由GAAD基金會與ServiceNow合作推出,評估了37個頂尖AI模型生成的網頁在可訪問性方面的表現。結果顯示,OpenAI的GPT 5.4 Mini和GPT 5.3 Codex在可訪問性債務上達到0.00,排名前兩位。阿里巴巴的Qwen和Z.ai的GLM 4.7 Flash也表現突出。低對比度文本是AI生成頁面中最常見的可訪問性問題,佔84.2%。

來源Hacker News AI作者: MavisBacon

人工智能正以前所未有的速度編寫代碼,但這些代碼對殘障人士是否友好?AIMAC(AI模型可訪問性檢查器)項目給出了答案。該項目由GAAD基金會與ServiceNow合作推出,於2026年6月20日更新,旨在推動AI模型默認生成可訪問的代碼。

AIMAC團隊對頂尖AI模型進行了測試,讓它們為28個不同的類別構建網頁,然後審計這些頁面的可訪問性。每個生成的頁面都被公開並排展示,以便比較不同模型如何處理相同的設計挑戰。項目還測量了破折號的使用頻率,作為寫作風格的小信號。

在排行榜上,OpenAI的模型佔據了主導地位。GPT 5.4 Mini和GPT 5.3 Codex以0.00的中位可訪問性債務並列第一,這意味着至少一半的類別中它們完全沒有可訪問性問題。GPT 5.5、GPT 5.5 Pro和開源模型gpt oss 120b也位列前五。阿里巴巴的Qwen系列表現強勁,Qwen3.5 397B A17B以4.09的債務排名第六,成本僅為0.76美元。Z.ai的GLM 4.7 Flash以4.19的債務和0.10美元的成本排名第七,展示了極高的性價比。

Google的模型在早期測試中表現不佳,但新發布的Gemini 3.1 Pro Preview已提升至第8位,債務為4.40,表明基準測試正在推動進步。Anthropic的Claude模型則令人失望,其最佳結果Claude Haiku 4.5僅排名第11位,債務為4.57,成本2.30美元。Claude Fable 5雖然被宣傳為強大到危險的模型,但在可訪問性上僅排名第17位。Anthropic聲稱以“全球利益”為核心,但其模型在可訪問性上的表現引發了質疑。

AI生成頁面中最常見的可訪問性問題是低對比度文本,佔所有頁面的84.2%,這與人工構建的網站問題一致。其他常見問題包括空鏈接、缺少表單標籤、空按鈕、目標尺寸過小和僅用顏色區分鏈接。AIMAC還追蹤了破折號的使用,發現不同模型的使用頻率差異巨大,從0到754個不等,但破折號對屏幕閲讀器用户的實際影響有限。

總的來説,AIMAC項目提供了一面鏡子,照出了AI模型在可訪問性方面的現狀。雖然部分模型表現優異,但整體仍有很大改進空間。項目希望激勵模型開發者優先考慮可訪問性,讓AI生成的代碼默認對殘障人士友好。

AI模型可訪問性檢查器 | AI News Hub