本文とサイドメニューへジャンプするためのナビゲーションスキップです。

スタートアップガイド

J-Net21 中小企業ビジネス支援サイト

  • J-Net21とは
  • スタートアップガイド
中小機構
  • メルマガ登録
  • RSS一覧
  • お問い合わせ

HOME > 製品・技術を開発する > デジ・ステーション

デジ・ステーション


初級ネットワーク講座
第23回 IP電話を支える技術「VoIP」徹底解説!

現在、急速に発展してきたIP電話。なんといってもその魅力はコストである。しかし、一般の電話に比べて音声の品質が劣ったり、音声が途切れたりする。その原因は、音声パケットの「遅延/遅延揺らぎ(ジッタ)/損失」などである。そこで今回の初級ネットワーク講座では、IP電話の仕組みについて説明するとともにその問題点、回避法をあわせて説明する。

1 インターネットによる音声・映像配信の方法

1-1 ダウンロードとストリーミング

VoIPは、インターネットやイントラネットといったIPネットワークを用いて音声通話を実現する技術の総称で、音声をデータ化したものをIPパケットにし、インターネットなど、IPのプロトコルを用いることが可能な通信網を用いて、音声通話ができるものだ。音声や映像などのコンテンツ(マルチメディアデータ)をインターネットなどで配信する方法の1つである。
 インターネットで音声や映像を配信する方法は次の2通りあり、VoIPではストリーミングを用いる。

ダウンロード

音声や映像などのコンテンツを受信側ですべてディスクにダウンロードしてから再生する方法。ダウンロードする時間が必要なため再生までには時間がかかり、リアルタイム性はないものの、保存されたデータからいつでも過去の映像を見ることができる。通信媒体の帯域は問わない。

ストリーミング

音声や映像などのコンテンツを一方が送信し、これと同時にもう一方が受信しながら再生する方法。同時再生可能でリアルタイム性がある。受信側のディスクに保存しないのでディスク容量や著作権保護などの面において有利。その反面、通信媒体には広帯域を必要とする。更に、「遅延/遅延揺らぎ(ジッタ)/パケット損失」によって音声の途切れ、画像の乱れなどが生じる。また、音声と動画が同期がとれるようにRTPというプロトコルが必要である。ストリーミングをデータとして保存し、後日再生できるソフトウェアもある。動画投稿サイト「YouTube」や各放送局のニュース配信サイトもストリーミングである。
 なお、ストリーミングには「ライブ放送」と「オンデマンド放送」がある。ライブ放送はテレビやラジオのように、入力した映像や音声をリアルタイムに配信するもので、インターネットを利用した電話(VoIP)やテレビ電話は、双方向のライブ放送になる。オンデマンド放送とは、ビデオのように見たい、聴きたいときにいつでも見ることができる放送形態のことである。

1-2 符号化の方式

音声や画像はもともとアナログデータである。コンテンツ配信をするためには、音声や画像を通信媒体で送信できるようにデジタル化、すなわち“0”か“1”かの符号に変換しなければならない。そのための仕組みがCODECである。
 CODECは、COder DECoderの略で、符号器、復号器と訳される(COmpression DECompressionともいう)。音声や映像など容量の大きいメディアを圧縮・符号に変換し、あわせて復号・伸張(再生)などを行うソフトウェア規格である。

映像符号化

映像符号化方式の主な規格としては、以下があげられる。

ITU-T勧告:
通信分野の標準策定を行う、国際電気通信連合 電気通信標準化部門(ITU-T)で策定した規格は勧告と
呼ばれる。
  • H.261
    いわゆる映像符号化の原点。ISDN、N-ISDNによるテレビ会議システム、テレビ電話に対応するために開発された。圧縮率が非常に高いものの、動きの激しい映像には不向き。
  • H.263
    H.261の改良版。アナログ電話網(低ビットレート)やISDN、N-ISDNでのテレビ会議システム、テレビ電話に対応する。低ビットレートでより効率の高い映像処理ができるように開発されている。
ISO/IEC JTC1/SC29/WG11:
ISO(国際標準化機構)とIEC(国際電気標準会議)が設立した組織であるMPEGの公式名称。
  • MPEG1
    H.261をベースに標準化された。Video CD、1.5Mbpsの通信回線に対応できるようになっている。
  • MPEG2
    DVD、デジタルBS放送、 地上波S・ケーブル放送、衛星放送やケーブルテレビ、4〜15Mbpsの通信回線に対応できるようになっている。また、洋画の英語副音声などマルチチャンネルに対応。フレーム間圧縮を行う動画形式で、画質が良いもののファイルサイズが巨大となる。なお、MPEG3はMPEG2へ統合された。
  • MPEG4
    最近主流となってきた携帯端末や移動体通信、テレビ電話、384Kbps〜38.4Mbpsに対応できるようになっている。低ビットレートでの高画質を実現し、マルチメディアに対応している。通信帯域が一定でないインターネットで、マルチメディア情報を扱うことを前提としているため高圧縮率である。そのため画質は劣る。
その他
  • WMV
    Microsoft社がMPEG4をもとに開発した動画形式。10kbps〜20Mbpsと低速回線から高品質動画まで対応している。
コラム:MP3はMPEG3の省略形?
 最近の音楽データの主流はMP3である。MP3はMPEG3の省略形のような気がするのだが、実は「MPEG1 Layer3」の略でMPEG1であり、MPEG1仕様の音質はMPEG2より上だ。ちなみにMPEG1のLayerは以下のとおりとなっている。
 Layer1:MD/Layer2:VideoCD/Layer3:MP3
音声符号化

音声符号化は、大別して波形符号化方式と音源符号化方式に分類される。

波形符号化方式:
音声波形を標本化(サンプリング)し、量子化して符号化する。
  • G.71:PCM(Pulse Code Modulation)<64kbps、48kbps、56kbps>
    最も基本的な音声符号化方式。
  • G.726:ADPCM(Adaptive Differential Pulse Code Modulation)<16kbps、24kbps、32kbps、40kbps>
    PCMをもとにして開発された方式で、1つ前の標本からの差分を量子化していく。標本は変わらないが量子化するビット数を減らしている。PHSは、ADPCM32kbpsである。
音源符号化方式:
符号励振型線形予測、音声をパターン化して個々のパターンを符号化する。携帯電話で使用されている。
  • G.728:LD-CELP(Low Delay-Code Excited Linear Prediction)<16kbps>
    低遅延符号励振線形予測ともいう。入力音声信号を「波形の振幅変化を表すスペクトラム包絡情報」、「音源情報」の2つに分けて、符号化する。
  • G.729/G.729A:CS-ACELP(Conjugate Structure and Algebraic Code Excited Linear Prediction)<8kbps>
    共役構造代数符号励振型線形予測。オプションとしてG.729 Annex B<8kbps>、G.729 Annex D<6.4kbps>、G.729 Annex E<11.8kbps>などが追加されている。
  • G.723.1:ACELP(Algebraic Code Excited Linear Prediction)<5.3kbps>
    代数的符号励振線形予測に基づく音声符号化方式の一種。CS-ACELPに発展した。
  • G.723.1:MP-MLQ(Multi-Pulse Maximum Likelihood Quantization)<6.3kbps>
    低ビットレート音声符号化方式。マルチパルス最尤量子化ともいう。
コラム:デジタル回線の通信速度
 最近はM/G(メガ/ギガ)の時代となってわかりにくくなったが、デジタル回線の通信速度は64kbpsの整数倍となっている。これはPCM64kbpsが基本となっているからだ。デジタル回線64kbpsがアナログ回線1本分相当とされ、例えば384kbpsのデジタル回線があれば、それはアナログ回線6本分(384kbps÷64kbps=6)である。

1-3 RTP/RTCP(Real-time Transport Protocol、RTP Control Protocol)

音声や映像をストリーミング配信する場合、問題点がいくつかある。音声や映像はそれぞれのCODECの仕様で所定の長さ(秒数)で符号化されパケット化される。ストリーミング配信の音声や映像パケットは、速さ優先のためUDPが用いられる。インターネットのような通信媒体を使う場合、パケットの遅延、遅延揺らぎ、順序逆転、紛失の可能性が高くなる。TCPは信頼性が高いが、その反面UDPは、パケットを処理する時間が短い。映像や音声パケットは、遅延、遅延揺らぎを少しでも減らすためUDPを用いる。しかし、UDPにはパケットの順序をあらわすフィールドがないため、パケットが順序逆転、紛失した場合、再生できなくなってしまう。そこで、これらを解決し正しく再生できるようにRTPプロトコルがある。

図1 パケット構造
図1 パケット構造

RTPは、RFC2326で標準化されていて、UDPとIPの上で実行されるプロトコルである。主な内容は、シーケンス番号(順序番号)とタイムスタンプである。

  • シーケンス情報を使ってパケットが順番通りに到着しているかどうかを判断
  • タイムスタンプ情報を使って到着するまでの遅延揺らぎ(ジッタ)を判断

これによって、映像と音声、データのようなマルチメディアであっても同期を取りながらリアルタイム配信・再生を可能にする。
 RTCPは、VoIPのようなインタラクティブ(双方向通信)で、遅延時間、遅延のばらつき、パケットの欠落数、実効帯域幅などの統計値を端末間でやり取りするために使用する。端末は報告された通信状態に合わせてRTPで送信するデータの品質を調整して送信するという形を取る。RTPは、通常はRTCPによる通信状態レポートとセットで用いられる。QuickTimeやRealPlayerがRTPに対応している。

【次回予告:暗号化と認証】
 情報通信が進化し、経済性・操作性・性能などが一段と向上し利用者にとって利便性が増している。しかし、それとともに企業の情報資産の危険性も増している。企業の情報資産を守るために情報セキュリティ対策が必要不可欠となってきている。情報セキュリティには技術的対策・物理的対策・人的対策があるが、このうち技術的対策の最も代表格として暗号化技術がある。暗号化技術は単に機密性だけでなく、認証、改ざんの有無の検出などにも用いられる。次回の初級ネットワーク講座では、暗号化技術の基本について説明する。

取材協力 : 株式会社アイテック

掲載日:2009年10月14日

キーマンズネット

出典元:株式会社リクルート キーマンズネット 2009年09月08日掲載分

検索

このページの先頭へ