Select Language : English 日本語

南北アメリカ

ブラジル: English / 日本語 / Português do Brasil
アメリカ: English

ヨーロッパ、中東、アフリカ(EMEA)

EMEA:
(ベルギー, フランス, ドイツ, オランダ, スペイン, アラブ首長国連邦, イギリス)
English / 日本語 / Español / Deutsch / Français
ロシア: English / 日本語 / русский

アジアパシフィック

日本(法人のお客さま): English / 日本語
日本(個人のお客さま): English / 日本語
オーストラリア(NTT Com ICT Solutions): English
中国本土: English / 日本語 / 簡體中文
香港/マカオ: English / 日本語 / 繁体中文 / 簡體中文
インド: English / 日本語
インドネシア: English
韓国: English / 日本語 / 한국어
マレーシア: English
フィリピン(DTSI): English
シンガポール: English / 日本語
台湾: English / 日本語 / 繁体中文
タイ: English / 日本語
ベトナム: English / 日本語

ニュース

このページのPDFを開く

 

2015-R092

2015年7月28日

WebRTCプラットフォーム「SkyWay」にて
世界初のマルチブラウザ対応音声認識APIなどを無償公開

NTTコミュニケーションズ(略称:NTT Com)は、2015年7月28日より、WebRTC*1技術を簡単に活用できるプラットフォーム「SkyWay*2」にて、世界初のマルチブラウザ対応*3の音声認識APIを無償公開します。また、WebRTC技術によるアプリ開発をより容易とする、多人数接続・画面共有ライブラリ、WoT*4サンプルコード、WebRTCセキュリティ文書も併せて無償公開します。

1.背景

「SkyWay」は2013年12月に国内初のWebRTCプラットフォームとして公開を開始しました。これまで、開発者の方に、Webアプリケーションやスマートフォンアプリ用の開発環境を提供しており、それにより、開発登録数は2,200*5を超え、様々なシーンで活用されています。

多くの開発者の方にご利用いただくなかで、音声認識APIについて、マルチブラウザで利用したいというご要望を数多くいただきました。これは、従来、音声認識機能に対応できるブラウザが限られている、ブラウザの種類によってはソフトウェアを別途インストールする必要があるなどの課題があったためです。また、一部のブラウザでは、音声データが第三者の音声認識用サーバーへ外部送信されるため、その二次利用について不安の声もいただいていました。

2.マルチブラウザ対応の音声認識APIについて

今回、SkyWayにて無償公開するマルチブラウザ対応の音声認識APIは、JavaScriptで構成されているため、利用者側のブラウザで新規ソフトウェアのインストールは不要です。また、音声認識サーバーはSkyWay上で提供されるため、個別に音声認識エンジンを構築する必要はありません。加えて、SkyWay上で提供する音声認識APIは、NTT研究所の最先端の技術を活用しており、入力された自由発話音声を高速・高精度で認識します。

【SkyWayの音声認識APIイメージ図】
イメージ
(https://github.com/nttcom/SkyWay-SpeechRecより利用可能)

3.各種ライブラリ・WoTサンプルコード・WebRTCセキュリティ文書について

(1) 多人数接続ライブラリ(https://github.com/nttcom/SkyWay-MultiPartyより利用可能)

SkyWayではWebRTC技術を容易に扱えるようライブラリを提供していますが、多人数が参加するグループチャットなどを開発する場合、複雑な制御をプログラミングする必要がありました。本ライブラリの利用により、多人数参加のグループチャットサービスを、数行程度のコードで実現できるようになります。

(2) 画面共有ライブラリ(https://github.com/nttcom/SkyWay-ScreenShareより利用可能)

WebRTCを利用できるブラウザは、プライバシー上の問題から、初期状態では画面共有機能が具備されておらず、個別開発が必要でした。本ライブラリの利用により、数行程度のコードで、開発者が自由に画面共有用の拡張機能(ChromeであればExtension、FirefoxであればAdd-ons)を開発できるようになります。

(3) WoTサンプルコード(https://github.com/nttcom/SkyWay-DrivingVehicleより利用可能)

WebRTCを活用してロボット操作を可能にするサンプルコードを、オープンソースとして公開いたします。本サンプルコードを参照することにより、ロボット操作を行う Web of Thingsアプリの開発が容易になります。

(4) WebRTCセキュリティ文書(https://webrtc-security.github.io/report_jaより利用可能)

WebRTCのセキュリティに関わる全体像・詳細・関連技術などを伝えるWebRTCセキュリティ文書を、オープンソースと同様の形式で公開します。本文書の活用により、WebRTCを利用したアプリケーションの利用・開発にあたり、セキュリティ上、注意すべき点を確認できます。

4.今後の展望

今回公開する音声認識API、各種ライブラリやWebRTCセキュリティ文書を活用していただくことで、音声認識機能を持つ新たなアプリケーションや、より安全なアプリケーションの開発などが効率的に実現できます。NTT Comは、これからもアプリケーション開発者の皆様と連携しながら、社会を変革するイノベーティブかつセキュアなサービスの創出を目指していきます。


関連リンク

*1:Web Real-Time Communicationsの略。パソコンやスマートフォンのブラウザやネイティブアプリで、サーバーを介さないP2Pのリアルタイム通信(音声・データ)を実現するオープン技術。広義のHTML5の一つとして、W3CとIETFで標準化が進められている。

*2:NTT Comが無償提供する、WebRTC技術を活用するために開発したプラットフォーム。ソフトウェア開発支援サービスGitHub上でライブラリ・ソースコードを公開するなど、積極的にオープンソースプロジェクトに参加している。

*3:「Chrome」「Firefox」「Opera」に対応。次期マイクロソフト社製ブラウザ「Edge」にも対応予定。

*4:Web of Thingsの略。IoT(Internet of Things)アプリケーションの作成を簡単にするアプリケーションレイヤを提供する。

*5:2015年7月15日現在のAPIキーの発行数。

本件に関するお問い合わせ先

技術開発部

大津谷、小松、岩瀬

このページのトップへ