Session Speech Parameters Config
v4.65でアップデート
説明
Session Speech Parameters – Config Nodeは、Flow中にスピーチパラメータを変更できます。
実行すると、設定が残りのセッションに適用されます。
Synthesizer – Text-To-Speech(テキスト読み上げ) – 設定
TTS設定は、Microsoft Azure、AWS、Google、Nuance、またはカスタムベンダーの事前入力済みドロップダウンから選択できます。
パラメータ | タイプ | 説明 |
---|---|---|
TTS Vendor | ドロップダウン | ご希望のTTSベンダーを定義します。カスタムベンダーを選択できます。 |
Custom (Vendor) | CognigyScript | ドロップダウンリストにないTTSベンダーを指定できます。このオプションはVoice Gatewayでのみ使用できます。プリインストールプロバイダの場合は、microsoft、google、awsのようにすべて小文字を使用します。カスタムプロバイダの場合は、Voice GatewayのSpeech Serviceページで指定した名前を使用します。 カスタムフィールドは、TTS Vendor(TTSベンダー)リストからCustom(カスタム)を選択した場合に表示されます。 |
TTS Language | ドロップダウン | 音声バーチャルエージェントの出力言語を定義します。 |
Custom (Language) | CognigyScript | ドロップダウンリストにないTTS言語を選択できます。バーチャルエージェント出力の言語を定義します。使用する形式は、TTSベンダーによって異なります(例:de-DE、fr-FR、en-US)。 カスタムフィールドは、TTS Vendor(TTSベンダー)リストからCustom(カスタム)を選択した場合に表示されます。 |
TTS Voice | ドロップダウン | 音声バーチャルエージェントの出力に使用する声を定義します。 |
Custom (Voice) | CognigyScript | ドロップダウンリストにないTTS音声を選択できるようにします。この設定は、地域固有の音声の場合に使用できます。使用する形式はTTSベンダーによって異なります。(例:de-DE-ConradNeural) |
Enable Advanced TTS Config | トグル | Azure Custom Voice EndpointのURLの追加を有効にします。 この設定は、TTS Vendor Microsoftに対してのみ有効で、表示されます。 |
Disable TTS Audio Caching | トグル | TTSオーディオキャッシュを無効にします。 デフォルトでは、この設定は無効になっています。この場合、過去にリクエストされたTTS音声の結果は、バーチャルエージェントのキャッシュに保存されます。新しいTTSリクエストが作成され、音声テキストが過去にリクエストされたことがある場合、バーチャルエージェントはTTSプロバイダに再度リクエストを送信する代わりに、キャッシュされた結果を取得します。 この設定を有効にすると、バーチャルエージェントはTTS結果をキャッシュしなくなります。この場合、各リクエストは直接音声プロバイダに送信されます。 キャッシュを無効にすると、TTSのコストが増加する可能性があることに注意してください。詳細については、音声プロバイダにお問い合わせください。 |
Recognizer – Speech-To-Text(音声読み上げ) – 設定
STT設定は、Microsoft Azure、AWS、Google、Nuance、Soniox、またはカスタムベンダーの事前入力済みドロップダウンから選択できます。
パラメータ | タイプ | 説明 |
---|---|---|
STT Vendor | ドロップダウン | ご希望のSTT ベンダーを定義します。カスタムベンダーを選択できます。 |
Custom (Vendor) | CognigyScript | ドロップダウンリストにない STT ベンダーを指定できます。ご希望のSTT ベンダーを選択します。このオプションはVoice Gatewayでのみ使用できます。プリインストールプロバイダの場合は、microsoft、google、aws のようにすべて小文字を使用します。カスタムプロバイダの場合は、Voice GatewayのSpeech Serviceページで指定した名前を使用します。 カスタムフィールドは、STT Vendor(STTベンダー)リストからCustom(カスタム)を選択した場合に表示されます。 |
STT Language | ドロップダウン | 認識する言語を定義します。 |
Custom (Language) | CognigyScript | ドロップダウンリストにないSTT言語を選択できます。この設定は、地域固有の音声の場合に使用できます。使用する形式は、STTベンダーによって異なります。(例:de-DE、fr-FR、en-US) カスタムフィールドは、STT Vendor(STTベンダー)リストからCustom(カスタム)を選択した場合に表示されます。 |
STT Hints | テキスト | 音声検出をサポートする単語やフレーズの配列。 備考:これにはSTTエンジンのサポートが必要です。このフィールドは Nuance speech vendor では使用できません。 |
Dynamic Hints | CognigyScript | 配列のヒントを追加するためにコンテキストまたは入力を使用します。例:{{context.hints}} または {{input.hints}} |
Google Model | ドロップダウン | このパラメータは、STTベンダ設定でGoogleが選択されている場合にのみ有効です。 Google Cloud Speech-to-Text 文字起こしモデルのいずれかを使用します。Googleモデルの詳細なリストについては、GoogleドキュメントのTranscription modelsセクションをご参照ください。デフォルト値は Google Modelタイプであり、他のモデルが特定のシナリオに合わない場合に使用できます。 |
Enable Voice Activity Detection | トグル | 音声が検出されるまで、クラウド認識への接続を遅らせます。 |
Disable STT Punctuation | トグル | このパラメータは、STT ベンダ設定でGoogleまたはDeepgramが選択されている場合にのみ有効です。 バーチャルエージェントからのSTT応答に句読点が含まれないようにします。 |
Deepgram Tier | ドロップダウン | このパラメータは、STTベンダ設定で Deepgramが選択されている場合にのみ有効です。 APIリクエストの階層を選択し、選択したSTT言語でそのモデルが使用可能であることを確認します。Deepgram階層の詳細は、Deepgramのドキュメントをご参照ください。 |
Deepgram Model | ドロップダウン | このパラメータは、STTベンダ設定でDeepgramが選択されている場合にのみ有効です。 送信されたオーディオを処理するモデルを選択します。各モデルは階層に関連付けられています。選択した階層が、選択した STT 言語で利用可能であることを確認します。Deepgramモデルの詳細については、Deepgramのドキュメントをご参照ください。 |
Endpointing | トグル | このパラメータは、STTベンダー設定でDeepgramが選択されている場合にのみ有効です。 DeepgramのEndpoint機能は、ストリーミングオーディオを監視して、スピーチの終了を示す長い一時停止を検出します。Endpoint を検出すると、予測を確定してトランスクリプトを返し、speech_finalパラメータをtrueに設定して完了とマークします。Deepgram Endpointingの詳細については、Deepgramのドキュメントをご参照ください。 スピーチ終了を検出する時間は、デフォルト値 (10 ミリ秒) で事前に設定されています。この値を変更する場合は、[Endpointing Time] 設定を使用します。 |
Endpointing Time | 数値 | このパラメータは、STTベンダ設定でDeepgramが選択され、[Endpointing]トグルが有効になっている場合にのみ有効です。 スピーチ終了を検出する時間(ミリ秒)をカスタマイズします。デフォルトは 10 ミリ秒の無音です。トランスクリプトは無音を検出した後に送信され、システムは話し手が再開するか、必要な無音時間に達するまで待ちます。いずれかの条件が満たされると、 speech_finalがtrueに設定されたトランスクリプトが返送されます。 |
Smart Formatting | トグル | このパラメータは、STTベンダ設定でDeepgramが選択されている場合にのみ有効です。 Deepgramのスマートフォーマット機能は、トランスクリプトに追加のフォーマットを適用して、人が読みやすいように最適化します。スマートフォーマットの機能は、モデルによって異なります。スマートフォーマットがオンになっている場合、Deepgramは、選択したモデル、階層、および言語の組み合わせに対して、常に最適なフォーマットを適用します。詳細な例については、Deepgramのドキュメントをご参照ください。 |
Enable Advanced TTS Config | トグル | AzureのカスタムスピーチモデルのデプロイメントにIDの追加を有効にします。 |
Enable Audio Logging | トグル | Azure上のユーザーからのオーディオの録音とロギングを有効にします。 |