2024年 9月 2日公開

IT用語辞典

マルチモーダルAI

制作協力:株式会社インプレス

読み方 : まるちもーだるえーあい

マルチモーダルAI

テキスト、画像、音声など複数の情報をまとめて扱うAIをマルチモーダルAI(multimodal AI)と呼ぶ。

マルチモーダルAIは複数のデータ形式を統合して解析できるため、豊富で詳細な情報を扱える。具体的には医療分野で患者の診療情報(テキストデータ)、画像、音声記録などを組み合わせることで、より正確な診断が可能になる。セキュリティの監視システムで画像や音声、センサーのデータを統合解析し、単一の情報では検出が難しい異常を特定するといった利用が期待されている。そのほか自動運転や教育分野の教材開発など、多用途での活用を目指して開発が進められている。

異なるデータ形式を統合する高度な技術、大量のデータを処理するための計算資源やストレージの確保、プライバシー保護などマルチモーダルAIには多くの課題があるが、一つのデータ形式のみを扱うシングルモーダルAIと比べて、データ解析の精度や効率が大きく向上するため、医療・製造・運輸のほか、音声でやりとりを行なうカスタマーサービスなど、さまざまな業界で注目されている。