多言語音声翻訳、同時配信ソリューションについて

プロアクシアコンサルティングでオープンソリューション事業部に所属しています E.M です。
今回は弊社で提供している多言語音声翻訳、同時配信ソリューションについて紹介していきたいと思います。

プロアクシアでの役割とこれまでの経験を教えてください

IT 関係の仕事に従事するようになってから、10年以上オープン系のシステム開発を中心に担当しています。それ以外では、お客様先のシステム保守やヘルプデスクなども担当していました。

最近6年ほどは主に音声言語処理ソリューションに関するシステム開発をおこなっています。この中でもユーザーが音声言語処理ソリューションを利用するための Web やスマートフォン用のアプリケーション開発を中心に担当しております。

音声言語処理ソリューションについて

プロアクシアコンサルティングでは、「音声認識トランスクリプションログ配信システム」、「多言語翻訳サーバーシステム 」、「ロボット音声会話プラットフォームソフトウェア」など、音声認識/翻訳/音声合成プラットフォームを活用したシステムを開発しております。

音声を利用した多言語翻訳の機能だけでなく、ロボット上で音声処理を利用するためのプラットフォームも提供しており、組み合わせてご利用いただくことで店舗や展示施設などの施設案内用のロボットに多言語での音声応答機能を実装することができます。

これらの音声言語処理ソリューションは、外部のサービスを利用することなく構築することができるので、パブリッククラウド、ローカルサーバー、ロボット本体など色々な環境に実装でき、ユーザーの利用規模や用途に合わせてシステム構成をカスタマイズすることも可能です。

外部のサービスを利用しないシステム構成では、セキュリティを確保する必要がある機密文書などの翻訳にも利用することができるメリットもあります。
また、自社で利用する専門用語、製品名、型番などの特別な単語を辞書に学習させることで、一般的な翻訳システムより精度の高い翻訳結果を得ることができます。

多言語音声翻訳システムはどういったソリューションでしょうか

多言語音声翻訳システムは音声認識エンジン、機械翻訳エンジン、音声合成エンジン※から構成されています。
利用者が発した音声を音声認識エンジンで解析することで文字変換した後に、機械翻訳エンジンで多言語への翻訳を行います。翻訳結果は音声合成エンジンを利用して音声に変換して出力します。
これにより、音声を利用した翻訳処理を実行できるようになります。

※音声認識・機械翻訳・音声合成エンジンは、 (国研) 情報通信研究機構 (NICT) の研究成果を使用しており、翻訳できる言語としては日本語・英語・中国語・韓国語の4言語が標準で準備されております。それ以外にも、インドネシア語、ベトナム語、タイ語、ミャンマー語、スペイン語、フランス語、台湾語など対応言語を追加することも可能です。

同時配信ソリューションはどういったソリューションでしょうか

同時配信ソリューションは先導自立型ロボットが店舗や展示物を案内する際に、複数言語同時に案内情報を提供するためのソリューションです。案内中のロボットが移動している位置を把握し、その座標を元に、案内すべき情報を判断することで、展示物や施設に合わせた案内内容を提供できます。

案内内容は、多言語音声翻訳システムを利用して複数言語に翻訳され、翻訳結果をHP上のコンテンツに反映します。

同時配信ソリューションを利用することで、美術館や博物館などの静かに鑑賞するような場所でも、タブレットなどにリアルタイムに翻訳された案内を多言語で配信することができます。

多言語音声翻訳システム、同時配信ソリューションの活用事例

東京都にあるすみだ北斎美術館の施設案内ロボット(おーい)運用の社会実験で使用いただきました。

おーいは同施設への訪日外国人来館者へよりよいサービスを提供するために、自立走行しながら日本語、英語、中国語、韓国語の4カ国語で展示物の説明を行います。

他にどういったサービスやソリューションに利用できますか

最近はグローバルでコミュニケーションをとる場面が多くなってきておりますし、リモートワークの普及により Teams や Zoom などのオンライン会議用のアプリケーションの利用が浸透してきております。

音声認識ログ配信システムを利用して音声入力されたデータを AI を利用してリアルタイムにテキスト化し、多言語翻訳サーバーシステムを連携することで、会議中の音声データを即時翻訳することができます。翻訳結果をリアルタイムに オンライン会議用のアプリケーションのチャット画面上に表示することで、多言語でのコミュニケーションを支援することが可能です。

オンライン会議の場面だけでなく、フィ-ルドサービスなどで外国人作業員とのコミュニケーションを支援する場面などでも活用いただけます。
例えば、海外拠点の現地作業担当者と日本にいるエンジニアや設計者と直接連携が取れるようにすることで、作業品質の向上や作業時間の短縮などが目指せます。

それ以外にも訪日外国人が利用することの多い店舗やタクシーなどで、お客様とのコミュニケーションの支援にもご利用いただくことができます。

お客様のニーズを満たすためにどのようなアプローチを行いますか

音声言語ソリューションの場合、一つのサービスを色々なお客様に利用していただくのではなく、それぞれのお客様の要望するものに合わせて個別カスタマイズしてサービスを提供するビジネスです。

このため、それぞれのお客様からの要望事項を一つ一つ丁寧に確認しながらお客様の要望に合わせたカスタマージャーニーを作成し、初期導入から将来的な機能追加までを整理して提案していきます。

その際、開発担当者の主観だけにならないように利用者目線でもレビューを行い、より使いやすく利用してもらえるシステムになるように検討しています。

今後取り組んでいきたい技術や案件について

現状の音声言語処理ソリューションでは、翻訳の分野でのサービスを提供してきましたが、今後は音声を利用した他の分野での利用についても取り組んでいきたいと思ってます。

例えば、入力された音声の話し方や応答内容を解析することで、感情や健康状態を判断し医療分野での評価支援を行えるシステムや、最新の AI 技術と連携して音声対話でサポートを支援できるシステムなど、音声を入口とした新しいサービスを生み出していきたいです。