ホットウィールからコンテンツ管理まで:ブランドがMicrosoft AIを活用して生産性と想像力を高める方法
マイクロソフトはDALL·E 2をAzure OpenAI Serviceに統合し、マテルやRTL Deutschlandなどのブランドが画像生成やパーソナライゼーションに活用しています。Microsoft SyntexやPower AutomateなどのAIツールはワークフローやコンテンツ管理を自動化し、生産性を向上させます。
マイクロソフトはIgniteカンファレンスで、OpenAIが開発したDALL·E 2をAzure OpenAI Serviceに統合することを発表しました。これにより、顧客はテキストや画像からカスタム画像を生成できるようになります。玩具メーカーのマテルは、デザイナーがこのツールを使用してホットウィールの新しいモデルのインスピレーションを得ています。プロンプトを繰り返し調整することで、複数のデザインスケッチを生成し、創造性を刺激しています。マテルフューチャーラボの製品デザインディレクター、Carrie Buse氏は、「これは『ああ、そんなことは考えもしなかった!』というプロセスです」と述べ、AI技術がデザイナーに多くのアイデアを生み出すのに役立つと語っています。また、マイクロソフトはDALL·E 2をMicrosoft DesignerやBing Image Creatorなどのコンシューマーアプリに統合する計画です。
マイクロソフトのAIプラットフォーム担当コーポレートバイスプレジデント、Eric Boyd氏は、モデルの品質が閾値を超え、より多くのアプリケーションで有用になっていると指摘します。この傾向は、より多くの計算リソースとデータを活用した非線形なAI機能の進歩によるものです。DALL·E 2は、マイクロソフトがOpenAI専用に構築したAzure上のスーパーコンピューターでトレーニングされました。このスーパーコンピューターはGPT-3やCodexモデルのトレーニングにも使用され、GitHub CopilotやPower Appsの特定機能を支えています。
生産性向上の面では、マイクロソフトはMicrosoft Syntexを導入しました。これはAzure Cognitive Servicesを活用してコンテンツを自動的に分類、タグ付け、インデックス化するもので、TaylorMadeゴルフ会社が知的財産文書を管理し、契約処理を自動化するのに役立っています。従来は弁護士が手動でコンテンツを整理していましたが、Syntexにより文書は自動的に分類され、検索が容易になりました。また、Power AutomateのAI副操縦士機能により、ユーザーは自然言語でワークフローを作成できます。例えば、「上司からメールが届いたら、携帯電話にテキストメッセージを送信し、OutlookにTo Doを追加する」と述べるだけで、自動的にワークフローが生成されます。
ドイツのメディア企業RTL Deutschlandは、DALL·E 2をストリーミングサービスRTL+で使用し、ユーザーの興味に基づくパーソナライズ画像を生成することを検討しています。RTLデータチームのシニアバイスプレジデント、Marc Egger氏は、完璧なレコメンデーションがあっても、ユーザーは視覚的手がかりでクリックするかどうかを判断するため、適切なアートワークが重要だと述べています。例えば、サッカー選手がパリに移籍して恋に落ちるロマンティックコメディ映画では、スポーツファンにはサッカーの試合画像、ロマンス小説ファンにはエッフェル塔でのキスシーンが効果的です。DALL·E 2とユーザーメタデータを組み合わせることで、これまでにない規模でパーソナライズ画像を提供できる可能性があります。また、ポッドキャストエピソードやオーディオブックの章ごとに独自の画像を生成することも検討されています。
マイクロソフトはDALL·E 2の責任ある使用を重視しています。OpenAIはトレーニングデータから最も露骨な性的・暴力的コンテンツを除去し、Azure AIはコンテンツポリシーに違反するプロンプトを拒否するフィルターを実装しています。さらに、有名人の画像生成を防止する技術や、出力側で不適切なコンテンツを除去するモデルも追加されています。Azure AIのプリンシパルグループプロジェクトマネージャー、Sarah Bird氏は、インターフェースを設計してユーザーがより詳細な説明を提供できるようにし、トレーニングデータのバイアスを回避して望む表現を得られるようにしていると述べています。
マテルのCarrie Buse氏は最近フューチャーラボに参加し、メタバースやNFTなどのコンセプトを探求しています。彼女はDALL·E 2を使ってこれらの仮想体験を想像しています。Boyd氏は、DALL·E 2と大規模言語モデルが顧客の創造力を解放し、想像力の燃料となっていると述べ、「最もエキサイティングなのは、これらの大規模言語モデルの力をまだ表面しかかじっていないことです」と語っています。