世界各国のリアルタイムなデータ・インテリジェンスで皆様をお手伝い

【分析レポート:アプリケーション】人工知能(AI)技術:マルチモーダル学習の技術発展と利用ケース

AI Techniques: Multimodal Learning: Technology Development and Use Cases

Application Analysis Report

 

出版社 出版年月価格 ページ数図表数
ABI Research
ABIリサーチ
2019年3月お問い合わせください 34 19

サマリー

マルチモーダル学習の主な目的は、予測や推論のために、さまざまなセンサやその他のデータ入力で取得した異種のデータからの学習プロセスを単一のモデルに統合することである。マルチモーダル学習システムは、モダリティによるお互いの補足的な情報によって、ユニモーダル学習システムを改善することができる。マルチモーダル学習は1970年代半ばからコンピュータサイエンスの研究テーマとなっていたが、最近のディープラーニング(深層学習)の改善によって、マルチモーダル学習への関心が再燃している。マルチモーダル学習の初期段階では、ルールベースのアプローチが主流だった。しかし、ルールベースとディープラーニングベースのマルチモーダル学習のハイブリッド混合がソフトウェア実装で最も一般的となり、マルチモーダル学習システムの特定の実装要件を生み出している。マルチモーダル学習に使用される機器の出荷数は、2018年の2474万から2023年には5億1412万に増加するだろう。マルチモーダル学習を積極的に採用しているのは、自動車産業、ロボット産業、消費者用機器、メディア・エンターテインメント、医療などの分野である。

The primary objective of multimodal learning is to consolidate the learning process from heterogeneous data streamed from various sensors and other data inputs into a single model, either for prediction or inference. Multimodal learning systems can improve on unimodal ones because modalities can carry complementary information about each other, which will only become evident when they are both included in the learning process. Therefore, learning-based methods that combine signals from different modalities can generate more robust inference, or even new insights impossible in a unimodal system. Multimodal learning has been a research topic in computer science since the mid-1970s, but recent improvements in Deep Learning reignited interest in the field. In the initial phase of multimodal learning, rules-based approaches dominated implementations. However, increasingly, a hybrid mixture of rules-based and deep learning based multimodal learning is becoming the most popular style of software implementation, creating specific implementation requirements for multimodal learning systems.

The market is currently experiencing the first wave of multimodal learning applications and products that draw on Deep Learning techniques to both interrupt sensor data and increasingly inform the multimodal learning process itself. Multimodal learning exploits complementary aspects of modality data streams, making it a powerful technology and enabling new business applications that fall into three categories: classification, decision making, and HMI. Shipments of devices using multimodal learning will increase from 24.74 million in 2018 to 514.12 million in 2023. The market sectors most aggressively introducing multimodal learning systems include automotive, robotics, consumer devices, media and entertainment, and healthcare.

At present, several applications are driving the uptake of multimodal learning, creating demand for systems which can support it. Implementing multimodal learning is still challenging, as open source software efforts remain limited, while capable hardware platforms that bring multimodal learning inference to devices at the edge are only just starting to emerge. The inference of hybrid multimodal learning software has compute requirements that are best served by heterogeneous computing architectures. Consequently, some companies are now building specialized chips based on heterogeneous architectures.

 

ABIリサーチの調査レポートの詳細については、サンプルをご請求ください。

(株式会社データリソース 03-3582-2531、office@dri.co.jp)

 



目次

  • 1. EXECUTIVE SUMMARY
    • 1.1. Commercial Momentum for Multimodal Learning
    • 1.2. The Future of Multimodal Learning
  • 2. WHY DOES THE INDUSTRY NEED MULTIMODAL LEARNING?
    • 2.1. Classification
    • 2.2. Decision-Making Systems
    • 2.3. Human Machine Interfaces
  • 3. MULTIMODAL LEARNING DEVELOPMENT AND CHALLENGES
    • 3.1. Current State of Multimodal Learning
    • 3.2. Potential Future of Multimodal Learning
    • 3.3. Compatibility with Existing AI Systems
  • 4. TECHNOLOGY THAT ENABLES MULTIMODAL LEARNING
    • 4.1. Rule-Based versus DNN
    • 4.2. Software
    • 4.3. Hardware
  • 5. CURRENT COMMERCIAL DEVELOPMENT
    • 5.1. Key Application Areas and Forecasts
    • 5.2. Use Cases/End Markets
  • 6. RECOMMENDATIONS
  • 7. CONCLUSION

Companies Mentioned

  • Amazon
  • ARM
  • CPU
  • DSP Group
  • Google
  • IBM Corp
  • Intel Corporation
  • Intuition Robotics
  • Ling Robotics
  • Microsoft Corporation
  • NN, Inc.
  • Nuance
  • NVIDIA
  • Processing Technologies
  • Qualcomm Inc
  • Unisound
  • Xilinx, Inc.

 

 

ページTOPに戻る

あなたが最近チェックしたレポート一覧

  • 最近チェックしたレポートはありません。

お問合は、お電話またはWEBから承ります。お見積もりの作成もお気軽にご相談ください。

webからのお問合せはこちらのフォームから承ります

このレポートへのお問合せ

03-3582-2531

電話お問合せもお気軽に

<無料>メルマガに登録する

 

 

ページTOPに戻る