2023年5月:音声認識技術の提供者であるVoiceittは、仮想会議中にスピーチ障害を持つ人々のアクセシビリティを向上させるために、ビデオ会議プラットフォームであるCiscoのWebexとの提携を発表しました。Voiceittは、理解しにくい非標準的なスピーチを即座に翻訳するAIベースの音声認識ツールであり、非標準的なスピーチを持つ人々がコミュニケーションを取ることを可能にします。この協力により、Webexの仮想会議では、スピーチに困難を抱える人々が理解されるように、AI対応のリアルタイムキャプションおよびトランスクリプションを使用できるようになります。WebexのApp Hubを通じて、VoiceittのAPIを取得できます。今年後半には、この技術がWebexのプラットフォームに完全に統合される予定です。
2023年2月:フラウンホーファー研究所の研究者たちは、製造業向けに音声認識プログラムを開発しました。このシステムは、騒がしい環境でも信頼性が高く、ユーザーのニーズに適応します。生産現場では、作業者が自然な音声指示を使用し、両手を自由にして作業を大幅に迅速化します。音声認識技術は、忙しい生産現場でも一貫して良好なパフォーマンスを発揮します。聴覚、スピーチ、音声技術のための機関セクションHSAも、スマートヒアラブル技術の開発に取り組んでいます。現在、従業員はワイヤレスヘッドセットまたは固定マイクを介して話しています。
指向性マイクと強力なノイズキャンセリング技術を組み合わせることで、騒音の多い環境音はほぼ完全に除去されます。
2023年2月:アラビア語の自動音声認識(ASR)、別名スピーチ・トゥ・テキスト(STT)は、MENA地域に拠点を置く著名なクラウド通信企業Maqsamのおかげで、世界的な大きな進展を遂げました。中東および北アフリカ(MENA)地域のさまざまな言語を正確に翻訳する競争において、同社の最先端の言語モデルはGoogle、Microsoft、その他の地域の競合を上回りました。
顧客エンゲージメント業務を自動化しようとする企業にとって、MaqsamのASR / STT技術は、さまざまな表記法、音韻、音声学的な違いを持つ日常会話の難しい方言を正確に文字起こしするために開発された、信頼性が高く手頃な選択肢です。
2022年8月:iFLYTEKは、ビデオおよびライブストリームの翻訳と文字起こしサービスを提供するために、多言語AI字幕ソリューションを導入しました。このシステムは、中国語と168の言語間の機械翻訳を提供し、70の言語の音声認識を行います。
2021年9月:IBM Corporationは、IBM Watson Assistantの自動化および人工知能(AI)機能を拡張し、企業が優れた顧客体験を提供しやすくしました。この発表の一環として、音声エージェントのテストがIntelePeerとの新しい関係の一部として行われています。IntelePeerは、通信プラットフォーム・アズ・ア・サービスのベンダーです。
2021年8月:トランスクリプション機能を備えた自動音声認識市場(ASR)エンジンがLumenVoxによって導入されました。ディープマシンラーニング(ML)と人工知能(AI)は、次世代技術の基盤であり、正確な音声対応の顧客体験を提供します。
.webp
コメントを残す