音声テキストAPIの世界市場規模:2022年に27億1000万ドルを占め、2028年には70億4000万ドルに達すると予測

Stratistics MRCによると、世界の音声テキストAPI市場は、2022年に27億1000万ドルを占め、2028年には70億4000万ドルに達すると予測され、予測期間中に17.2%の年平均成長率で成長するとされています。音声合成と音声認識は、音声テキスト化アプリケーションプログラミングインターフェース(API)のおかげで、さまざまなガジェットや用途で使用することができます。計算言語学の学際的分野であるSpeech-to-Text APIは、コンピュータが話し言葉をテキストに変換し、それを認識するための技術を研究しています。最近、Alexa、Sid、Cortana、Google Assistantなどの音声アシスタントやスマートスピーカーの利用が増加しています。音声アシスタントの録音は、理論的には気分分析やメンタルヘルス関連のような他の分野の顧客のプロファイリングに使用できる情報の新しい証拠を企業に提供します。この音声テキスト化市場は、インテリジェントな音声アシスタントが普及するにつれて成長すると予想されています。

Statistaによると、2024年までに音声アシスタントの数は、2020年の42億台から84億台に倍増する可能性があります。各個人が複数の音声アシスタントを利用するようになる。

Alexa、Siri、Cortana、Google Assistantなどのスマートスピーカーや音声アシスタントは、ここ数年で普及が進んでいる。音声対応アプリは、これらのデバイスを採用する家庭が増えるにつれて、ユーザーのテクノロジーとの関わり方を根本的に変える可能性が高いです。スマートスピーカーの人気は高まっており、専門家は来年、スマートスピーカーを使用する家庭の数が大幅に増加すると予想しています。音声で操作できるスマートスピーカーの開発は、ユーザーが特定のツールを使用したり、インターネットをナビゲートしたりするのを簡単にする、魅力的な可能性を提供します。しかし、音声アシスタントの録音は、理論的には感情分析やメンタルウェルビーイングの側面など、他の領域で顧客のプロファイリングに使用できるデータの新しい証拠を企業に提供することになる。このような高機能な音声アシスタントの普及は、市場の拡大に拍車をかけると思われます。

多くの用語の定義が難しいため、不正確な書き起こしやキャプションが発生し、多数のチャンネルから音声を書き起こす際に、この技術にとって大きな障壁となる。また、文字起こしの精度は、バックグラウンドノイズ、貧弱なマイク、リバーブやエコー、アクセントの変化などによって影響を受ける可能性があります。音声テキスト化APIは、さまざまなデータセットを使ってマルチチャンネル音声認識のための適切なトレーニングを行う必要があります。しかし、企業にとって、さまざまなチャンネルの音声を正確にテキスト化するアプローチやソリューションを確立するためには、さまざまなデータセットを集めることが困難な場合があります。

技術の普及に伴い、スマートスピーカーや携帯電話などのスマートデバイスの需要は過去10年間に拡大し、インターネット上のコンテンツが大きく発展したことで、オンラインビデオコンテンツに広くアクセスする必要性が高まっています。コンテンツの書き起こしや電話会議の分析など、音声で操作できる機能を備えた最新鋭の機器が数多く登場したことで、ユーザーはスマートデバイスで教育や娯楽などの情報にアクセスできるようになりました。顧客の嗜好を理解する必要性の高まりから、音声読み上げアプリが一般的になってきた

音声対応機器のプライバシーに関する懸念が、市場拡大の大きな障壁として作用するようになってきている。音声対応デバイスの導入は、音声で操作する仮想アシスタントによるプライバシーへの懸念に関わる多くの後続事例によって制約されています。例えば、2019年8月、ドイツのデータ保護委員会は、GoogleのAIベースの音声認識技術によるプライバシーへの懸念から、Google LLCがヨーロッパで録音された音声を聞くことを禁じた。このような要素は、市場の成長を阻害する。

COVID-19の結果、オンラインで仕事をする大学や学校は、音声テキスト化技術を急速に導入しました。音声テキスト技術は、オンライン学習や授業で注目され、世界中の学術機関がどんどん導入しています。音声合成技術の活用により、画面上の文字が読みにくい、違和感があるという場合でも、ユーザーとのコミュニケーションが可能になります。音声読み上げ技術の機能向上は、技術の進歩によるものです。しかし、社会的な引きこもりや世界的な自宅待機の動きから、今後、その需要は大幅に増加すると予想されています。また、業務遂行を最適化するために、医療、e-ラーニング、メディア・エンターテインメントなどの分野で広く採用されることが予想されます。

予測期間中、世界の音声テキストAPI市場では、クラウド分野が最大の市場シェアを占めると予想されています。クラウドは柔軟で信頼性の高い選択肢であるため、大手企業はクラウドを導入しています。サーバー、ストレージ、データベース、アナリティクスはすべてクラウドコンピューティングを利用して行うことができます。その速さゆえに、イノベーションがより早く起こる。予測期間中は、音声読み上げソフトの生産性向上が市場を牽引する。

銀行金融サービス・保険(BFSI)分野は、予測期間中に最も高いCAGRを記録すると予想されます。顧客からのフィードバックを分析するために音声テキスト変換ソフトが使用されていることが、このセグメントの成長の主な要因となっています。銀行やその他の金融機関は、毎日、顧客からのフィードバックを受け、問い合わせに対応し、苦情を申し立てています。顧客の大半は、問い合わせ内容を種類別に入力したり、多数のメニューや画面を見たりするよりも、オペレーターと話すことを望んでいます。音声テキスト変換技術は、顧客からのフィードバックに対応し、BFSIの円滑な運営を促進する上で極めて重要です。こうした側面が、市場の成長を後押ししています。

技術支出が多く、サプライヤーが存在感のあるソリューションに広くアクセスできることから、予測期間中、北米が最大のシェアを占めた。音声データからのより適切な洞察が必要とされるため、この地域は今後も成長し続けるでしょう。インテリジェントバーチャルアシスタントは、米国やカナダなどの先進国で広く採用されています。さらに、園芸農業の需要が高まっていることから、米国の音声テキストAPI市場は数年前から比較的堅調であり、予測期間中にさらに拡大すると予測されます。

アジア太平洋地域は、製造、医療、教育などのインフラ整備が進んでいることから、予測期間中に最も高いCAGRを記録すると予測されています。音声ベースの用途は、取引、診断、指導のためにこれらの産業で採用されています。インド、中国、韓国の市場は、ビジネスの拡大や新技術の開発により、生産能力を高めています。これらの分野では、効率的なロジスティクスと良好な顧客体験のために音声技術が必要とされています。こうした利点から、世界の音声テキストAPI市場は、アジア太平洋地域で拡大すると予想されています。

 

主要プレーヤー

 

Speech-to-text API Marketで紹介されている主要なプレーヤーには、Amazon Web Service, Inc.、Deepgram、Google Inc.、Vocapia Research SAS、VoiceBase, Inc.、AmberScript Global B.V.、AssemblyAI, Inc.、IBM Corporation、Voxsciences、Microsoft Corporation、Nuance Communication, Inc、Rev.com、Inc、GL Communications, Contus, Twilio, Speechmatics Ltd、Verint System, Inc、Voci Technologies, Inc および Vonage APIなどがあります。

 

主要な開発状況

 

2021年9月、マイクロソフトは、会話分析のリーディングプロバイダーであるCallMinerと手を結びました。この提携により、CallMiner社の世界トップクラスの会話分析プラットフォームは、マイクロソフト社の音声認識ソリューションと統合されることになります。この統合により、企業は現在のツールでより高い価値を実現し、顧客との会話を徹底的に理解することができるようになります。企業は貴重なインサイトを得ることで、コンタクトセンターが顧客体験とエージェントのパフォーマンスを向上させ、各部門で情報に基づいたビジネス上の意思決定を行うことができるようになります。

2021年1月、マイクロソフトは世界有数の会話型AIプラットフォームであるYellow Messengerと協業した。この協業により、Yellow Messengerは、Azure AI Speech Servicesと自然言語処理(NLP)ツールの助けを借りて、音声自動化ソリューションを変革することになります。本協業により、マイクロソフトはYellow Messengerが、優れた精度と高い意図の理解を可能にするカスタマイズされた音声モデルを開発することを支援します。

2021年1月、Amazon Web Servicesは、革新的な企業のためのクラウドコンタクトセンターであるTalkdeskと提携した。この協業により、Talkdesk Agent AssistとTalkdesk Speech Analyticsは、Amazon Transcribeの潜在能力を活用し、利用可能な製品の言語とアクセントの数を増加させるだろう。

対象となるコンポーネント
– ソフトウェア
– サービス

対象となるデプロイメント
– オンプレミス
– クラウド

対象となる組織サイズ
– 大企業
– 中小企業(SME)

対象となる業界
– 銀行・金融サービス・保険(BFSI)
– IT・テレコム
– 医療
– 小売・eコマース
– 政府・防衛省
– メディア・エンターテインメント
– トラベル&ホスピタリティ
– その他の産業

対象となる用途
– コンタクトセンター、顧客管理
– コンテンツの書き起こし
– 不正の検出と防止
– リスク・コンプライアンス・マネジメント
– サブタイトル・ジェネレーション
– その他の用途について

対象となる地域
– 北アメリカ
オーユー
オー・カナダ
O メキシコ
– ヨーロッパ
o ドイツ
オー・ユーケー
o イタリア
オ・フランス
o スペイン
o その他の欧州
– アジア太平洋
オージャパン
o 中国
オ・インディア
o オーストラリア
o ニュージーランド
o 南朝鮮
o その他のアジア太平洋地域
– 南米
o アルゼンチン
オブラート
オ・チリ
o その他の南米地域
– 中近東・アフリカ
o サウジアラビア
O UAE
オ・カタール
o 南アフリカ
o 中東・アフリカのその他の地域

 

 

【目次】

 

1 エグゼクティブサマリー

2 序文
2.1 抽象度
2.2 ステークホルダー
2.3 調査範囲
2.4 調査方法
2.4.1 データマイニング
2.4.2 データ分析
2.4.3 データバリデーション
2.4.4 リサーチアプローチ
2.5 リサーチソース
2.5.1 一次調査ソース
2.5.2 二次研究ソース
2.5.3 前提条件

3 市場動向の分析
3.1 はじめに
3.2 ドライバ
3.3 阻害要因
3.4 オポチュニティ
3.5 脅威
3.6 用途別分析
3.7 新興国市場
3.8 Covid-19の影響

4 ポーターズファイブフォース分析
4.1 サプライヤーのバーゲニングパワー
4.2 バイヤーのバーゲニングパワー
4.3 代替品への脅威
4.4 新規参入の脅威
4.5 競合他社への対抗意識

5 音声テキストAPIの世界市場:コンポーネント別
5.1 はじめに
5.2 ソフトウェア
5.3 サービス

6 音声テキストAPIの世界市場:デプロイメント別
6.1 はじめに
6.2 オンプレミス
6.3 クラウド

7 音声テキストAPIの世界市場:組織規模別
7.1 はじめに
7.2 大企業
7.3 中小企業(SMEs)

8 音声テキストAPIの世界市場:産業別
8.1 はじめに
8.2 銀行金融サービス・保険業(BFSI)
8.3 IT・テレコム
8.4 医療について
8.5 小売・eコマース
8.6 政府・防衛省
8.7 メディア・エンターテインメント
8.8 トラベル&ホスピタリティ
8.9 その他の産業

9 音声テキストAPIの世界市場、用途別
9.1 はじめに
9.2 コンタクトセンターと顧客管理
9.3 コンテンツの書き起こし
9.4 不正の検出と防止
9.5 リスクとコンプライアンス管理
9.6 サブタイトル生成
9.7 その他の用途

10 音声テキストAPIの世界市場:地域別
10.1 はじめに
10.2 北米
10.2.1 米国
10.2.2 カナダ
10.2.3 メキシコ
10.3 ヨーロッパ
10.3.1 ドイツ
10.3.2 イギリス
10.3.3 イタリア
10.3.4 フランス
10.3.5 スペイン
10.3.6 その他のヨーロッパ
10.4 アジア太平洋地域
10.4.1 日本
10.4.2 中国
10.4.3 インド
10.4.4 オーストラリア
10.4.5 ニュージーランド
10.4.6 韓国
10.4.7 その他のアジア太平洋地域
10.5 南米
10.5.1 アルゼンチン
10.5.2 ブラジル
10.5.3 チリ
10.5.4 その他の南米地域
10.6 中東・アフリカ
10.6.1 サウジアラビア
10.6.2 UAE
10.6.3 カタール
10.6.4 南アフリカ
10.6.5 中東・アフリカの残りの地域

11 主な展開
11.1 契約、パートナーシップ、コラボレーションおよびジョイントベンチャー
11.2 買収・合併
11.3 新製品発表会
11.4 エキスパンション
11.5 その他の重点戦略

12 会社概要
12.1 アマゾン ウェブ サービス株式会社
12.2 ディープグラム
12.3 Google Inc.
12.4 Vocapia Research SAS(ボキャピア リサーチ エスエーエス
12.5 VoiceBase, Inc.
12.6 Amberscript Global B.V.
12.7 AssemblyAI, Inc.
12.8 IBMコーポレーション
12.9 ヴォックス・サイエンス
12.10 マイクロソフト株式会社
12.11 ニュアンス・コミュニケーション株式会社
12.12 Rev.com, Inc.
12.13 GLコミュニケーションズ
12.14 コントゥア
12.15 Twilio
12.16 Speechmatics Ltd.
12.17 Verint System, Inc.
12.18 Voci Technologies, Inc.
12.19 Vonage API

 

 

【お問い合わせ・ご購入サイト】
www.globalresearch.jp/contact
資料コード: SMRC22327