平成16年3月3日


世界初のリアルタイム双方向映像通信システムを開発
-映像品質制御が可能な圧縮技術を用いて実現-


 NTTコミュニケーションズ(略称:NTT Com)はこのたび、映像品質制御を可能とする圧縮技術「スケーラブル映像符号化技術」(※1)を利用した、インターネット上で遅延なく双方向映像通信を実現する映像システムの開発に成功しました。
 本システムは、利用する回線帯域や端末性能に適した画質をやり取りすることで、様々な環境下での遅延のない双方向映像通信を、世界で初めて実現するものです。端末については、PCだけでなくPDAやFOMA(※2)との通信においても実現可能なため、将来のユビキタス環境にも適応します。また、プロキシ(※3)などのセキュリティ環境にも対応しているため、安全に映像通信を行うことができます。

1.開発の背景と目的
 現在のインターネットを利用したテレビ会議や携帯電話におけるテレビ電話では、受信側の利用環境に関わらず送信側からは固定品質の映像を送信しているため、受信側がナローバンド回線を利用していたり、CPU(※4)能力の低い端末を利用していたりする場合には、遅延発生によってリアルタイム性が欠けるなど品質の悪い映像を受信することがありました。また、ブロードバンド回線やCPU能力の高い端末を利用していても、受信側の回線帯域や端末性能が劣る場合は、それに合わせた映像のやり取りをせざるをえませんでした。

 このたび開発した映像システムでは、ユーザのインターネットの利用環境の設定に合わせ、ネットワーク上に設置された「スケーラブル変換サーバ」においてやり取りする映像の品質を適宜変更することができるため、回線帯域や端末性能に合った映像品質で遅延なくリアルタイムに双方向通信を実現することができます。


2.本システムの特徴(別紙12参照)
 本システムの基盤となっているスケーラブル映像符号化技術は、一つの映像フレームを複数階層に分けて画像圧縮するものです。また、再生時には、階層ごとに圧縮された画像データを複合化して重ね合わせることで、粗い画質から鮮明な画質まで再現することができます。そのため、受信側の回線帯域や端末性能に合わせて、必要な階層の画像データを重ね合わせることで、最適な品質の映像を遅延なく受信できます。

 このたび開発した映像通信システムでは、双方向通信を行うユーザの全ての回線帯域や端末性能などの情報をスケーラブル変換サーバにおいて管理しています。そして、各端末にて圧縮された映像は、サーバにおいて利用者情報に基づき最適な階層の画像データで受信側の端末に送信される仕組みとなっています。そのため、各利用者の環境に合った画質で遅延のない双方向映像通信を利用することができます。


3.主な機能
  ・リアルタイムでの画質の変更が可能
 事前の環境設定だけでなく、通信中の回線帯域の変動や利用機器の処理能力の変動に応じて、適宜画質を変更することができます。
・ユビキタス環境への適用(別紙3参照
 ISDNからFTTHまでの、様々なアクセス回線同士の映像通信をスムースに行うことができるようになります。また、無線LANサービスにおけるホットスポットなどのユビキタス環境での利用を視野に入れ、PDAでの利用も可能です。また、FOMA端末についても、通信相手がPC、PDA、FOMAのいずれの場合でも利用可能です。
・プロキシなどのセキュリティ環境でも利用可
 プロキシなどのセキュリティ環境でも利用できるため、企業間での会議、企業とお客さまとの通信、または在宅勤務の方が自宅から利用するなど、多くの利用シーンにおいて、安全に通信が行うことができます。


4.今後の予定
 社内外における検証実験を実施し各種データの収集を進めるなど、本システムをNTT Comの提供するテレビ会議システムなどに将来組み込むことができるよう、技術レベルおよび利便性の向上を進めていく予定です。

※1 スケーラブル映像符号化技術:日本電信電話株式会社サイバースペース研究所が開発した映像符号化技術
※2 FOMA:「FOMA」は株式会社NTTドコモの商標または登録商標
※3 プロキシ:企業などの内部ネットワークとインターネットの境にあって、直接インターネットに接続できない内部ネットワークのコンピュータに代わって、「代理」としてインターネットとの接続を行うコンピュータのこと。また、そのための機能を実現するソフトウェア
※4 CPU(Central Processing Unit):コンピュータの中で、各装置の制御やデータの計算・加工を行なう中枢部分。一回の命令で同時に処理できるデータの量によって8ビット、16ビット、32ビットなどの種類があり、値が大きいものほど性能が高い。また、同じビット数でも、1秒間に実行できる命令の回数(「Hz」で表される)や、バスと呼ばれる周辺装置とのデータ伝走路が一度に運べるデータの量(「ビット」で表される)、バスが1秒間に行える転送の回数(「Hz」で表される)などに違いがあり、これらの値が大きいものほど性能が高い

<本件に関するお問い合わせ先>