AVBの技術 - Synthax Japan Inc. [シンタックスジャパン]

AVBインフォメーション

AVBのテクノロジー

AVBのテクノロジーは、いくつかの重要な概念とそれを実現するためのIEEE標準プロトコル群によって成り立っています。ここでは、AVBの基本的な仕組み、主要な技術要素、メリット、そして関連技術であるTSN (Time-Sensitive Networking) との関わりを含め、解説します。

ストリームの概念とチャンネル数:MADIとの比較例

MADIは一般的に125MBit/sの伝送路で最大64チャンネル (48kHz時) を固定フォーマットで伝送します。これに対し、AVBは主に1 GBit/sのイーサネットを使用し、ストリームごとに柔軟なチャンネル構成が可能です。ネットワーク設計や帯域予約の条件にもよりますが、数百チャンネル(例:500チャンネル以上)を同時に伝送することも可能です。

ここで重要となるのが、AVBにおける「ストリーム」という概念です。

MADIでは、実際の伝送チャンネル数にかかわらず、常に一定の帯域(最大64チャンネル分)を使用します。たとえば、1チャンネルしか使用しない場合でも、64チャンネル分の帯域が占有され、残りの63チャンネルにはデータが含まれません。

一方、AVBでは、複数のオーディオチャンネルをまとめて1つの「ストリーム」として構成し、それぞれのストリーム単位で必要な帯域だけをネットワーク上に予約・使用します。ストリームのチャンネル数はあらかじめ定義されており、必要に応じて1、2、4、8、16チャンネルなどの構成を選択できます。

この仕組みにより、AVBはオーディオ伝送を効率的に行えるだけでなく、ネットワーク上の伝送状況を簡単に監視・管理することが可能となります。

AVBネットワークのレイテンシー / ディレイ

レイテンシー(遅延)の定義

レイテンシーとは、データ転送にかかる時間を指し、オーディオフレームが送信元から受信先に到達するまでの合計時間を意味します。単位はミリ秒(ms)で表され、数値が小さいほど遅延が少なく、よりリアルタイム性が高いことを示します。

MADIの送受信に置けるレイテンシーはわずか4サンプルもしくは83μs(@48 kHz)です。レイテンシーは、例えばマイクの前でヘッドフォンで音声を確認しながら歌う場合などに影響します。一般的な見解としては6msまでのレイテンシーは聴覚認識に影響を与えないという研究結果があります。

この6msの中には、例えばスピードの異なるネットワーク内の複数のネットワーク・ストリームや、シグナル・プロセッサー、アナログ・コンバーターなどの信号伝達の全てのファクターが含まれることを意識する必要があります。最近のDAWで高性能なインターフェイスを使用した場合、2ms〜5msのレイテンシーが生じます。

Danteデバイスは一般的に1msのレイテンシー設定を使用し、これは「入力オーディオ・サンプルのタイムスタンプ情報が再生されるまでの時間」を指します。シンプルなA/D入力の様な100MBit/sの送信には受信側で最低1msのレイテンシー設定が必要になります。またマルチキャスト接続の場合、常に1ms以上のレイテンシーが生じます。 AES67の場合、ネットワーク・ストリームで発生するレイテンシーを「リンク・オフセット」と呼び、これは、設定可能なパケット時間とネットワーク転送時間で構成されています。受信側にも設定され、パケット時間だけの場合はデフォルトで1msになります。全体の遅延はそれにマイクロ秒の1/2程度上乗せします。

レイテンシー値の参考

  • 6msまでのレイテンシー(聴覚認識に影響を与えないと言われる範囲)
  • アナログ・コンバーターのレイテンシー(一般的には0.4ms)
  • DSPレイテンシー(0.1ms〜数ms)
  • リンク・オフセット(MADI=0.08ms、ネットワーク・オーディオ=1ms)

AVBの場合には、上記とは違った方法で動作します。

AVBにおけるディレイ:プレゼンテーション・タイムとgPTP

AVBネットワークの根幹をなすのが、極めて正確な時刻同期です。ネットワークに接続されたすべてのAVB/Milanデバイス(スイッチを含む)は、IEEE 802.1ASとして標準化されたgPTP (generalized Precision Time Protocol) を用いて、ナノ秒精度で共通の時刻情報を共有します。

プレゼンテーション・タイムとgPTP

これにより送信側デバイス(トーカー)は、各オーディオ・サンプルが受信側(リスナー)で再生されるタイミングを指定することができます。送信時にタイム・オフセットが各サンプルに付与され伝送されることで、受信側は最終的な発音タイミングを把握することができ、受信したタイムスタンプを元に発音を行います。ナノ秒精度のこのタイムスタンプは、「プレゼンテーション・タイム(=再生予定時刻)」と呼ばれます。

入力遅延とは、あらかじめ定められた再生時刻までデータを一時的に保持するための待機時間を指します。AVBにおいては、送信時に設定された再プレゼンテーション・タイム(=再生予定時刻)が“再生してよい時刻”として機能し、たとえデータが早く届いたとしても、受信側ではこのタイムスタンプに従って再生が行われます。この仕組みにより、ネットワーク上の多少のレイテンシーのばらつきがあっても、すべてのデバイスで同期の取れた安定した再生が可能になります。

  • スイッチがgPTP(IEEE 802.1AS)による時間管理された伝送を実行(ナノ秒精度)
  • プレゼンテーション・タイムに加える時間的マージン(タイム・オフセット)をソースに追加
  • 出力は発音タイミングまでオーディオをバッファー

AVBにおける最大遅延時間は、AVB標準規格で2 ms(クラスAトラフィック)と定められています。これは6台の100 MBit/sスイッチを経由する非常に大規模なネットワークでも十分な長さです。ほとんどのAVB製品は、この最大伝送遅延時間をもとに、プレゼンテーション・タイムに加える時間の「タイム・オフセット」が、初期設定で有効になっています。ただし、ネットワーク規模が小さくホップ数が少ない場合や、1 Gbpsの高速リンクを使用している場合には、実際の伝送遅延は2msよりはるかに短くなります。そのような環境では、オフセットの値を1ms、0.6ms、0.3msなどに調整することで、システム全体のレイテンシーを削減することが可能です。受信した時点で再生予定時刻を過ぎてしまったオーディオ・データは破棄されます(オフセット設定が低すぎた場合など)。

 

入力遅延について

「最大遅延時間」のタイム・オフセットが送信側(トーカー)であらかじめ付与されることに注目してください。受信側(リスナー)はこのオフセットではなく、「現在時刻(=データが実際に到着した時刻)」と、「プレゼンテーション・タイム(=再生予定時刻)」の2つを使って動作します。

多くのAVB対応機器は、受信したストリームの再生タイミングを監視するため、現在時刻とプレゼンテーション・タイムとのズレを測定・表示する機能を備えています。一部のATDECCコントローラーも、対応機器からこれらのステータス情報をナノ秒単位で取得・表示することが可能です。

例として、現在時刻が「1:00:00.000」で、送信側(Talker)が指定した最大遅延時間(タイム・オフセット)が「2ms」のとき、プレゼンテーション・タイムは「1:00:00.002」に設定されたデータを、受信側(Listener)が「1:00:00.001」に受信したとします。

入力遅延は次のように計算されます。

現在時刻「1:00:00.001」-プレゼンテーション・タイム「1:00:00.002」の差分 = 入力遅延「1ms」

再生予定時刻より1ms早くデータが届いたことを意味し、受信側はこの値を元に再生を1ms遅らせる(プレゼンテーション・タイムちょうどに再生されるよう調整する)ことで、正確なタイミングでの信号再生を実現します。

現在時刻「1:00:00.001」-プレゼンテーション・タイム「1:00:00.002」の差分 = 入力遅延「1ms」

AVBおよびMilanでは、最大遅延時間が2 msと規定されています。これは速度100 MBitでホップ数が7の大規模なネットワークを想定した時間です。実際は、ギガビット・スイッチAVBネットワークを用いることでレイテンシーはより低くなり、300μsの設定でも問題ありません。

 

クロックについて

AVB/Milanでは、プレゼンテーション・タイムが付与されたストリームが伝送され、すべてのデバイスがgPTPを使用します。これにより伝送先でのオーディオ再生の精度がDanteやRavennaなどIPベースのネットワークに比べ遙かに優れているのもAVB/Milanの特徴です。ネットワーク内の他のトラフィックとは完全に独立しているため、IPトラフィックとの混在も問題ありません。

ネットワーク・マネージメント技術

「Credit Based Shaperによる安定したデータ・フロー」

AVBおよびMILANネットワークの高い安定性は、スイッチの動作に密接に関連しています。

AVB規格では、スイッチが「Credit Based Shaper(CBS)」と呼ばれるアルゴリズムを使用して、トラフィックの整形と優先制御を行います。これにより、出力ネットワーク・ポートはオーディオ・トラフィックを一定の間隔で確実に送信し(正確に125 μs毎にパケットを送信)、優先度の高いオーディオ・トラフィックの間に、可能な限り非オーディオ・トラフィックのパケットを追加します。

AVB Network Management

一方、ネットワークから安定したデータ・フローを得られない他のネットワーク・オーディオでは、VoIPやその他のオーディオ・トラフィックに優先度を付けるために、DiffServ QoSなどの技術を使用しますが、AVBと異なり遅延が一定の帯域幅を確保することができず、ITスタイルの設定/管理が必要となります。DiffServは自動設定ができず、またスイッチによって実装が異なるため、汎用的な機能としては一貫性がないためです。

その結果、非AVBネットワークでは、受信側で再生バッファーを常にモニターする必要があります。ネットワーク・パフォーマンスが低下した場合、ユーザーがバッファー・サイズを調整しなければならず、バッファー・サイズが大きくなるとレイテンシーも増加します。

対して、AVBネットワークでは、非常に安定したデータ・フローが確保できるため、送信側で最大遅延時間(ディレイ)を指定することが可能です。つまり、エンドポイントにおけるバッファー・モニタリングがそれほど重要ではなくなります。特にギガビット・スイッチを使用する場合、一度ストリームが確立されると、ネットワーク上の他のトラフィックによって妨害されることがありません。

プラグ・アンド・プレイ

接続とデバイス検出

ポイント・トゥ・ポイントのMADI接続の大きな利点の1つに、検出スピードの速さがあります。MADIの使用経験がある方なら、ケーブルを接続した瞬間に信号が流れるのを体験済みでしょう。ネットワーク・オーディオ製品の場合、同様にはいきません。使用される技術や実装によって異なりますが、伝送が中断してから復帰までに最大2分かかるケースもあります。

2台のデバイスを接続する場合、接続自体は簡単です。しかしケーブルを接続しただけではストリームは開始されません。物理接続の上層で、ソフトウェアによる論理接続が必要となります。

物理的な接続が行われた後、ネットワーク内のデバイスを検出することで、接続確立の準備が整います。検出によって同一ネットワーク内のデバイスがリストアップされます。このリストは、DanteではGUI上で視覚的に表示され、AVBやMilanではGUIを伴わずに動作します。AES67やST2110ではリストそのものが標準仕様には含まれていません。検出の後には、実際にストリームを確立し、デバイス同士を接続するための制御手段(メソッド)が必要になります。

 

コントローラー

ネットワーク・オーディオにおいて、ストリームを作成するにはコントローラーが必要です。

Danteネットワークでは、Dante ControllerをWindowsまたはMac OSにインストールする必要があります。他にはDanteデバイスと独立し、ネットワーク上のバーチャル・マシンで起動するDante Domain Managerを使用する方法もあります。

AES-67の場合は、制御プロトコルに適合したコントローラーを使用する必要があります。本記事執筆時点で汎用コントローラーは存在しないはずですが、複数の制御プロトコルに対応するコントローラーは存在します。

一方AVBでは、ATDECCと呼ばれるオープンな制御プロトコルがIEEE1722.1で策定されており、各AVBデバイスにDante Controllerと同じ機能が実装されていることになります。つまりユーザーは、ウェブ・インターフェイスや機器の設定ダイアログでDante Controllerと同様の設定が行えるのです。

また、Hive、Milan ManagerやmacOSに統合されたAVDECCコントローラーなど、他のATDECCコントローラーもWindowsやMac OSで起動できます。すべてのコントローラーが同一の制御プロトコル(ATDECC)を使用しているため、まるで複数のDante ControllerがDanteネットワークで同時に動作しているかのように利用できます。

チャンネルのルーティングと管理

ルーティング

ATDECCコントローラーがデバイスを検出すると、使用しているネットワーク・オーディオの方式に応じて、2通りの方法で接続を確立できます。

AVB/Milanでは、ストリーム・サイズ(サンプルレート、チャンネル数、フォーマット)を、送信/受信側で設定し、ATDECCコントローラー上で接続を行います。AVBデバイスではエンドポイントが対応している場合に限り、任意のストリーム・サイズを設定可能である一方、Milan認証機器では、規定のストリーム・サイズ(8チャンネル、AAF)を使用します。

MADI入力を搭載するAVBデバイスを使用すれば、SMPTE ST 2110/AES67やAVBなどで定義された64チャンネルのシングル・ストリームを伝送することができます。さらにたとえば、1、2、5、47チャンネルだけを選んで4チャンネルの連続したAVBチャンネル・ストリームとして伝送することもできます。このとき残りの帯域幅は他の接続用に確保することも可能です。

Point!
  • チャンネル・ツー・チャンネル
    送信側と受信側のチャンネル同士を直接1対1で接続する方式。
  • チャンネル・ツー・ストリーム、ストリーム・ツー・チャンネル
    複数のチャンネルを一つのストリーム(束)にまとめて送信し、受信側で必要なチャンネルをストリームから選んで接続する方式。

チャンネル管理

グループだけでなく各チャンネルに名前を付けられることは、MADIや他のネットワーク・オーディオ規格に対するアドバンテージです。設定はコントローラーで行え、各デバイスに保存されます。

チャンネル名は、各デバイス内のAEM(AVDECC Entity Model)パラメーターとして保存されます。使用するATDECCコントローラーが対応していれば、ユーザーはこれらの名称を自由に編集可能です。これらの名称は単なる表示用のラベルではなく、AVBデバイスの内部構造全体をオブジェクト階層として参照・操作するための構成要素です。

つまり、ATDECC準拠のコントローラーとAEMの組み合わせは、AVBデバイスを高度にリモート制御可能にする非常に強力なツールとなります。

Point!
  • ストリームのグループや各チャンネルに名前を付けられる
  • デバイスと入出力を容易に識別可能
  • 説明をデバイスに保存可能

 

 

関連製品

お問い合わせ

システム・インテグレート、お見積もりや資料請求、社内プレゼン資料の作成など、法人購入に関しますことは、すべてSynthax Japan取り扱い製品の販売を行う株式会社ジェネレックジャパンのお問い合わせ窓口にて承ります。どうぞお気軽にお問い合わせください。

 

tl_files/images/tech_info/synthax_logo_grey.png

mi7

ご購入前のご質問はこちら

法人購入のご質問はこちら

メールニュースのご案内

イベント情報、サポート情報、技術情報、お得なキャンペーン情報をはじめ、アーティストのインタビューや現場レポートなど、お役立ち情報を満載でお届けします。さらにはメールニュース限定の情報も!ぜひご登録ください。

シンタックスジャパン・メールニュース登録