2026-06-27 10:06 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 10:16 UTC+9

Show HN: Tested – LLMパネル（Claude、GPT、Gemini、Grok）が評価するAIツール

Testedは、4つの主要LLM（Claude、GPT、Gemini、Grok）を審査員として40以上のAIツールをスコアリングする独立したレビュープラットフォームです。有料ランキングを排除し、チャットボット、コーディング、画像、動画など12カテゴリをカバー。透明性の高いスコアと価格情報を提供します。

ソースHacker News AI著者: pro_methe5

AIツールが急速に進化する中、「最良のAIツール」ランキングの多くは有料掲載であり、客観性に欠けることが少なくありません。この問題を解決するために登場したのが、Testedという新しいプラットフォームです。Testedは、AnthropicのClaude、OpenAIのGPT、GoogleのGemini、xAIのGrokという4つのトップLLMからなる独立した審査員団を用いて、各ツールをスコアリングし、すべての数値を公開しています。

「We test the tools so the rankings can't be bought」というスローガンのもと、Testedは現在40以上のツールを評価し、12のカテゴリに分類しています。内訳は、AI自動化（5ツール）、AIチャットボット（2）、AIコーディング（6）、AI画像生成（5）、AIミーティング（4）、AI音楽（2）、AIプレゼンテーション（2）、AI検索（1）、AI SEO（3）、AI動画（5）、AI音声（2）、AIライティング（3）です。

各ツールには10点満点の総合スコアと、4つのLLMそれぞれの個別スコアが表示されます。例えば、音声カテゴリでトップのElevenLabsは総合9.3点で、Geminiからは9.8点、OpenAIからは8.5点と、モデルによる評価の差異も明確です。チャットボットカテゴリではChatGPTが9.4点で首位、Claudeが9.0点で続きます。

インターフェースはシンプルで、カテゴリごとのブラウズや、すべてのツールをスコア順に並べた「On the rack」リストを表示可能です。また、「Bench tests」機能を使えば、ElevenLabsとSynthesiaなど、2つのツールを直接比較できます。

Testedは価格情報も透明に提供しており、月額料金（例：ChatGPTは20ドル/月）やカスタム価格、無料プランの有無が一目でわかります。さらに、ワークフローに合ったツールがなければ、カスタムAIツールの開発も依頼できます。

Testedは、マーケティング予算ではなく客観的なデータに基づいてAIツールを選びたいユーザーにとって、信頼できるリソースです。開発者、マーケター、一般ユーザーを問わず、適切なツールを見つける助けとなるでしょう。今後のAIツール選びの新たな基準として、注目に値します。