ニュース
KDDIなど3社、自然に会話できる音声AIコンタクトセンター構築で協業
2026年5月28日 17:02
KDDI、アルティウスリンク、Rechoの3社は、AIコンタクトセンターの構築および展開に向けた協業を発表した。2026年度上期に、まずはKDDIグループ内での実証実験を含め、提供を進めていく。
KDDIの通信基盤とRechoの音声AI技術、アルティウスリンクのコンタクトセンター(サポートセンター、コールセンター)の運営ノウハウを連携させる。音声AIによる一次応対と有人対応へのエスカレーションを組み合わせる。
専門用語や文脈を理解する音声AIエージェント
近年のコンタクトセンター業務は、顧客の文脈を理解した応対や一度での課題解決が求められており、依然として人間への依存度が高い状況が続いている。
そこで今回、Rechoが自社で開発したという高精度な音声認識(ASR)および音声合成技術(TTS)、大規模言語モデル(LLM)で、精度が低下しやすい固有名詞や業界特有の専門用語にも高精度で応答できるようにしたという。
AIコンタクトセンターでは、音声AIによる自動の一次応対と、想定外の問い合わせに対する有人へのスムーズな引き継ぎが提供される。
ユーザーにとっては、電話の待ち時間短縮や、深夜を含めた窓口営業時間の拡大といったメリットがもたらされる。
話しながら考える自然な通話と現場主導のAI育成
実際のシステムでは、住所や電話番号の確実な認識を担保するため、Recho独自の技術が採用されている。Rechoでは、起業当初、汎用的なAIモデルでサービスを提供しようとしたが、顧客企業の満足度をさらに上げるため、自社で技術開発した。
先述した音声認識、音声合成、大規模言語モデルでの処理は、音声合成を同時並行で処理する独自の「音声OS」技術(ストリーミングパイプライン)とされている。
音声認識されたテキストをLLMに投げ、その後に音声を合成するといった“順番に処理する”従来型の手法では応答の遅延が避けられない。一方、Rechoの技術では、各モジュールを並行動作させることで「話しながら考える」人間のような自然な応答を低遅延で実現している。
さらに周囲の騒音やテレビの音の中から本人の声を判別するだけでなく、人間の間を考慮したスムーズな会話を実現している。住所や電話番号といった誤りが許されない重要情報も、高精度で認識・合成できる独自モデルになっているという。
現場の暗黙知を「約1週間サイクル」でAIへ継続反映
システム導入後の継続的な改善サイクルも本協業の大きな特徴とされる。28日に開催された記者説明会では、AIを導入して完了するのではなく、ベテランオペレーターが持つ現場の「暗黙知」をAIに学習させる重要性が強調された。
実際の運用では、現場で発生したイレギュラーなケースや新たな対応ノウハウは、データのノイズ除去や本番環境への影響を評価するテストを経た上で、約1週間程度のサイクルで継続的にAIモデルへと反映されていく。
AIが一次対応を代替することで、人間(スーパーバイザー)はAIの評価や応対データの分析といった高度な判断、あるいはデータ活用を通じた経営貢献に集中できるようになる。
すでに先行事例として、SBI新生銀行の問い合わせ窓口において99%以上の成功率でAI応対が完結した事例や、家賃や保険の督促といった架電(アウトバウンド)業務において人間と同水準の入金率を達成した事例が確認されている。
KDDIの計算基盤を活用したコスト最適化と今後の展開
まずは高度なセキュリティー要件が求められるKDDIグループの金融関連会社において検証を実施する。有人の置き換えによるコスト削減効果や正答率といった具体的な成果目標値については、準備が整い次第発表される予定という。
AIによる音声合成・推論プロセスは時間とともに計算コストの増大がビジネス上の課題となるため、KDDIのAIデータセンターが有する推論・学習環境を活用する。
これにより、増大する推論コストを抑えつつ、安定したサービス提供とAIモデルのさらなる高度化を目指す方針となっている。将来的には、情報システム部門や総務部門における代表電話や社内問い合わせ対応への横展開、さらには多言語対応を含めた海外展開も見据えられている。











