テキスト音声合成

テキストを音声に変換する技術。AIアシスタントに「声」を持たせたり、アクセシビリティの向上、コンテンツの音声化に活用される。

主なエンジン種別

言語ごとに得意なエンジンが異なるため、言語自動判定ルーティングによって複数エンジンを使い分けることが実用的。

この判定は非ASCII文字の有無によって簡易実装できる（日本語UTF-8は非ASCII文字を含む）。

AIアシスタントの応答をTTSで読み上げる場合、バックグラウンド実行にすることで応答が速くなる。音声再生の完了を待たずに次の処理に進めるため、会話のテンポが改善する。