Show HN: Tested – LLMパネル(Claude、GPT、Gemini、Grok)が評価するAIツール
Testedは、4つの主要LLM(Claude、GPT、Gemini、Grok)を審査員として40以上のAIツールをスコアリングする独立したレビュープラットフォームです。有料ランキングを排除し、チャットボット、コーディング、画像、動画など12カテゴリをカバー。透明性の高いスコアと価格情報を提供します。
AIツールが急速に進化する中、「最良のAIツール」ランキングの多くは有料掲載であり、客観性に欠けることが少なくありません。この問題を解決するために登場したのが、Testedという新しいプラットフォームです。Testedは、AnthropicのClaude、OpenAIのGPT、GoogleのGemini、xAIのGrokという4つのトップLLMからなる独立した審査員団を用いて、各ツールをスコアリングし、すべての数値を公開しています。
「We test the tools so the rankings can't be bought」というスローガンのもと、Testedは現在40以上のツールを評価し、12のカテゴリに分類しています。内訳は、AI自動化(5ツール)、AIチャットボット(2)、AIコーディング(6)、AI画像生成(5)、AIミーティング(4)、AI音楽(2)、AIプレゼンテーション(2)、AI検索(1)、AI SEO(3)、AI動画(5)、AI音声(2)、AIライティング(3)です。
各ツールには10点満点の総合スコアと、4つのLLMそれぞれの個別スコアが表示されます。例えば、音声カテゴリでトップのElevenLabsは総合9.3点で、Geminiからは9.8点、OpenAIからは8.5点と、モデルによる評価の差異も明確です。チャットボットカテゴリではChatGPTが9.4点で首位、Claudeが9.0点で続きます。
インターフェースはシンプルで、カテゴリごとのブラウズや、すべてのツールをスコア順に並べた「On the rack」リストを表示可能です。また、「Bench tests」機能を使えば、ElevenLabsとSynthesiaなど、2つのツールを直接比較できます。
Testedは価格情報も透明に提供しており、月額料金(例:ChatGPTは20ドル/月)やカスタム価格、無料プランの有無が一目でわかります。さらに、ワークフローに合ったツールがなければ、カスタムAIツールの開発も依頼できます。
Testedは、マーケティング予算ではなく客観的なデータに基づいてAIツールを選びたいユーザーにとって、信頼できるリソースです。開発者、マーケター、一般ユーザーを問わず、適切なツールを見つける助けとなるでしょう。今後のAIツール選びの新たな基準として、注目に値します。