ニュース

NTTCom、世界初のIOWN技術による分散データセンターでの生成AIモデル学習実証に成功

 NTTコミュニケーションズは7日、IOWNの技術を使い、分散データセンターでの生成AIモデル学習の実証実験に世界で初めて成功したと発表した。

 実証実験では、IOWN構想の主要技術「オールフォトニクス・ネットワーク」(APN)で接続した複数のデータセンターにNVIDIA GPU搭載サーバーを分散配置し、NVIDIA NeMoを用いた生成AIモデルを学習させた。

 これまで単一のデータセンターでの機械学習が一般的だったが、生成AIモデルサイズの増大に伴い、即座にGPUが確保できなかったり、1つのデータセンターあたりの電力供給に制限があったり、機密度の高いデータの移動が困難だったり課題があった。今回の実証では、データセンターを分散させて処理させることの有効性を確認できたため、これらの課題解決に貢献できる。

 今回の実証では、約40km離れた三鷹と秋葉原のデータセンターに分散配置し、100Gbps回線のAPNで接続した。GPUサーバー同士のデータ転送が迅速かつ効率的に行われ、小規模なAIモデルの事前学習や追加学習など比較的軽量な処理に対して、単一データセンターでの処理と遜色ない性能が発揮できた。たとえば、インターネット経由での分散データセンター処理では単一データセンターの29倍の時間がかかるが、APN経由では1.006倍となり、単一データセンターとほぼ同等の性能が確認できた。

 この実証を元に、APNの専用線プランや、液冷サーバー対応のデータセンターサービス「Green Nexcenter」などを組み合わせたクラウドサービスの提供を目指す。

 なお、同実証は、NTTドコモが開催する法人向けイベント「docomo business Forum'24」(10月10日~11日開催)に展示される。