AI News HubLIVE
站内改写3 分で読了

Perplexityの「Search as Code」は、固定APIの代わりにAIモデルが独自の検索パイプラインを記述することを可能にする

Perplexityの新たな「Search as Code」アーキテクチャは、固定の検索APIを廃止し、AIモデルがPythonでカスタム検索スクリプトを記述できるようにする。安全なサンドボックス内で3層構造により動作し、より正確な結果を実現、トークンコストを最大85%削減し、CVE研究タスクでOpenAIやAnthropicを凌駕する。

ソースThe Decoder著者: Jonathan Kemper

Perplexityは、新たな「Search as Code」(SaC)アーキテクチャにおいて、既製の検索APIを呼び出す代わりに、AIモデルがPythonコードとして独自の検索ワークフローを記述できるようにした。同社は、これによりより正確な結果と低いトークン使用量を実現すると約束している。

AIエージェントが複雑な研究タスクに取り組む様子を見たことがある人なら誰でも、同じパターンを目にしたことがあるだろう。モデルがクエリを書き、検索APIが結果リストを返し、モデルがそれを読み、次のクエリを書く。このループが繰り返され、しばしば何度も連続して行われる。

Perplexityは新しいテクニカルレポートでこれをボトルネックと呼んでいる。今日の検索エンジンは、きれいな青いリンクのリストを欲しがる人間向けに構築されているが、数分で何百もの検索を実行しようとするAIエージェントにとって、その設定はあまりにも硬直的だ。エージェントは検索語を調整することしかできず、他のすべてはブラックボックスである。

「Search as Code」(SaC)はその力学を変える。モデルはAPIを呼び出す代わりに、検索を実行するカスタムPythonスクリプトを作成する。スクリプトは安全なサンドボックス内で実行され、Perplexityの検索バックエンドからデータを取得する。取得、フィルタリング、重複排除、再ランク付けといった基本操作は、シンプルなSDK関数としてパッケージ化されている。

アーキテクチャは3層に分かれる。最上層にはタスクを理解し検索戦略を決定するモデル、中間にはコードが実行されるサンドボックス、最下層にはPerplexityの検索エンジンを個別の組み合わせ可能な関数に分解する「Agentic Search SDK」が位置する。標準の検索APIは簡単な質問のためにまだ存在しているが、難しい研究の場合、モデルははるかに深く掘り下げることができる。並列クエリを発行し、プログラムでノイズをフィルタリングし、関連するヒットのみをコンテキストウィンドウに取り込むことができる。

Perplexityによれば、これこそが優位性である。標準の検索パイプラインは、フィルタリングロジックが固定されているため、エージェントのコンテキストウィンドウをジャンクでいっぱいにしてしまう。エージェントが独自のフィルターを書くとき、コンテキストはスリムに保たれ、モデルは長い研究セッションを通じて方向性を維持する。

実際の効果を示すために、Perplexityは複雑なサイバーセキュリティタスクでSaCをテストした。エージェントは2023年から2025年に公開された200件の重大なソフトウェア脆弱性(CVE)を追跡する必要があった。各脆弱性について、公式のベンダー勧告、影響を受けるソフトウェア、バグを修正した正確なバージョンを見つける必要があった。ニュース記事やブログ投稿はカウントされなかった。

SaCを使用して、モデルは3段階のスクリプトを作成した。MozillaやGoogleなどの特定のベンダーがセキュリティ速報をフォーマットする方法に合わせた並列検索を実行した。次に、自身の調査結果をスキャンし、ギャップを発見し、的を絞ったフォローアップクエリを実行した。最後に、スキーマを使用してCVE、製品、修正バージョンがすべて一致することを検証した。

それはうまくいった。Perplexityによると、エージェントは標準パイプラインよりも85%少ないトークンでタスクを達成した。競合システムは4分の1未満のデータしか正しく取得できなかった。

Perplexityは、SaCがOpenAIのResponses APIやAnthropicのManaged Agentsなどの競合を5つのベンチマークのうち4つで上回ったと主張している。最大の差は、近く公開予定のPerplexity独自の広範な研究タスク用ベンチマーク「WANDR」で生じた。もちろん、自己報告ベンチマークは割り引いて聞くべきだが、Perplexity自身の旧アーキテクチャとの比較は、明確で大きなパフォーマンスの飛躍を示している。

PerplexityはSaCをより大きなトレンドの一部として位置づけている。従来のソフトウェアは確定論的な命令に依存している。フロンティアモデルはトークンスペースで推論を追加する。最も強力なシステムは両方を組み合わせる。すなわち、戦略のためのモデル、バッチ処理とフィルタリングのための確定論的ランタイム、そしてI/O層としての検索インフラである。

Search as Codeは現在、Perplexity ComputerとAgent APIで展開されている。

このアップグレードは、現在のAI検索の顕著な問題を解決する可能性がある。最近の研究によると、人気のある検索エージェントはBrowseCompのようなベンチマークでしばしば不正を働く。ライブウェブをスキャンする代わりに、トレーニングデータから答えを単純に引き出し、検索を使って既知の情報を確認する。新しいベンチマークで新鮮な事実を使ってテストされたとき、すべてのシステムのスコアが25〜40ポイント急落した。しかし、それらのシステムはすべて標準的な検索ツールを使用していた。

別の調査論文は、コードを書くことがエージェントが世界と対話するデフォルトの方法になりつつあると示唆している。それはコードをエージェントの新しい運用層として説明し、ツール、サンドボックス、検証メカニズムといった周辺インフラが自律システムの真のボトルネックになりつつあると論じている。

Perplexityの「Search as Code」は、固定APIの代わりにAIモデルが独自の検索パイプラインを記述することを可能にする | AI News Hub