2026-06-30 22:21 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 22:28 UTC+8

AI模型可訪問性檢查器

AIMAC項目由GAAD基金會與ServiceNow合作推出，評估了37個頂尖AI模型生成的網頁在可訪問性方面的表現。結果顯示，OpenAI的GPT 5.4 Mini和GPT 5.3 Codex在可訪問性債務上達到0.00，排名前兩位。阿里巴巴的Qwen和Z.ai的GLM 4.7 Flash也表現突出。低對比度文本是AI生成頁面中最常見的可訪問性問題，佔84.2%。

來源Hacker News AI作者: MavisBacon

人工智能正以前所未有的速度編寫代碼，但這些代碼對殘障人士是否友好？AIMAC（AI模型可訪問性檢查器）項目給出了答案。該項目由GAAD基金會與ServiceNow合作推出，於2026年6月20日更新，旨在推動AI模型默認生成可訪問的代碼。

AIMAC團隊對頂尖AI模型進行了測試，讓它們為28個不同的類別構建網頁，然後審計這些頁面的可訪問性。每個生成的頁面都被公開並排展示，以便比較不同模型如何處理相同的設計挑戰。項目還測量了破折號的使用頻率，作為寫作風格的小信號。

在排行榜上，OpenAI的模型佔據了主導地位。GPT 5.4 Mini和GPT 5.3 Codex以0.00的中位可訪問性債務並列第一，這意味着至少一半的類別中它們完全沒有可訪問性問題。GPT 5.5、GPT 5.5 Pro和開源模型gpt oss 120b也位列前五。阿里巴巴的Qwen系列表現強勁，Qwen3.5 397B A17B以4.09的債務排名第六，成本僅為0.76美元。Z.ai的GLM 4.7 Flash以4.19的債務和0.10美元的成本排名第七，展示了極高的性價比。

Google的模型在早期測試中表現不佳，但新發布的Gemini 3.1 Pro Preview已提升至第8位，債務為4.40，表明基準測試正在推動進步。Anthropic的Claude模型則令人失望，其最佳結果Claude Haiku 4.5僅排名第11位，債務為4.57，成本2.30美元。Claude Fable 5雖然被宣傳為強大到危險的模型，但在可訪問性上僅排名第17位。Anthropic聲稱以“全球利益”為核心，但其模型在可訪問性上的表現引發了質疑。

AI生成頁面中最常見的可訪問性問題是低對比度文本，佔所有頁面的84.2%，這與人工構建的網站問題一致。其他常見問題包括空鏈接、缺少表單標籤、空按鈕、目標尺寸過小和僅用顏色區分鏈接。AIMAC還追蹤了破折號的使用，發現不同模型的使用頻率差異巨大，從0到754個不等，但破折號對屏幕閲讀器用户的實際影響有限。

總的來説，AIMAC項目提供了一面鏡子，照出了AI模型在可訪問性方面的現狀。雖然部分模型表現優異，但整體仍有很大改進空間。項目希望激勵模型開發者優先考慮可訪問性，讓AI生成的代碼默認對殘障人士友好。