[ 株式会社アドバンスト・メディア ]

AmiVoice(R) 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装 領域特化型エンジンの認識率が大幅向上

リリース発行企業:株式会社アドバンスト・メディア

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を音声認識エンジンに実装しました。これによりエラー改善率が最大で25%(当社調べ)と、自然発話を中心とした認識率が大幅に向上しました。
https://acp.amivoice.com/main/



Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。

[画像1: https://prtimes.jp/i/20223/216/resize/d20223-216-271478-1.png ]

この度「AmiVoice Cloud Platform」で提供している、全ての領域特化型の音声認識エンジンに「Bi-LSTM」を実装しました。「LSTM」を実装したこれまでの音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。

【Bi-LSTMを搭載した音声認識API】

[表1: https://prtimes.jp/data/corp/20223/table/216_1.jpg ]

 

[画像2: https://prtimes.jp/i/20223/216/resize/d20223-216-326250-0.png ]

【AmiVoice Cloud Platform】

[表2: https://prtimes.jp/data/corp/20223/table/216_2.jpg ]

 

アドバンスト・メディアでは、「AmiVoice Cloud Platform」を軸とした音声認識のオープンプラットフォーム化を進めております。AmiVoice 音声認識APIをご利用いただく事で、従来の音声認識開発に要する時間を大幅に短縮するとともに、高い認識精度の音声認識エンジンを簡単に組み込む事が可能になります。
今後も、様々な領域特化型の音声認識APIの公開や随時アップデートを継続していきます。

以上

【お問合せ】
株式会社アドバンスト・メディア PF D&O部
MAIL : info@advanced-media.co.jp
TEL:03-5958-1034
FAX:03-5958-1033

 

PR TIMESプレスリリース詳細へ

 

提供:PR TIMES 

 

バックナンバー
トピックボードAD
  • 野口悠紀雄「経済最前線の先を見る」
  • 食べれば世界がわかる!カレー経済圏
  • コロナ後を生き抜く
  • 井手隊長のラーメン見聞録
トレンドライブラリーAD
アクセスランキング
  • 1時間
  • 24時間
  • 週間
  • 月間
  • シェア
トレンドウォッチAD
悪用された「ドコモ口座」<br>セキュリティーに3つの問題

「ドコモ口座」を使った預金の不正引き出し事件。背景としては、回線契約がなくても口座が使える「ドコモ口座」自体と、安全性の脆弱なシステムで口座接続していた銀行側の双方に問題がありました。情報漏洩の経路も不明で、今後の対応が問われています。

東洋経済education×ICT