Session Speech Parameters Config

v4.65でアップデート

汎用Session Speech Parameters Config

説明

Session Speech Parameters – Config Nodeは、Flow中にスピーチパラメータを変更できます。

実行すると、設定が残りのセッションに適用されます。

Synthesizer – Text-To-Speech(テキスト読み上げ) – 設定

TTS設定は、Microsoft Azure、AWS、Google、Nuance、またはカスタムベンダーの事前入力済みドロップダウンから選択できます。

パラメータタイプ説明
TTS Vendorドロップダウンご希望のTTSベンダーを定義します。カスタムベンダーを選択できます。
Custom (Vendor)CognigyScriptドロップダウンリストにないTTSベンダーを指定できます。このオプションはVoice Gatewayでのみ使用できます。プリインストールプロバイダの場合は、microsoft、google、awsのようにすべて小文字を使用します。カスタムプロバイダの場合は、Voice GatewayのSpeech Serviceページで指定した名前を使用します。

カスタムフィールドは、TTS Vendor(TTSベンダー)リストからCustom(カスタム)を選択した場合に表示されます。
TTS Languageドロップダウン音声バーチャルエージェントの出力言語を定義します。
Custom (Language)CognigyScriptドロップダウンリストにないTTS言語を選択できます。バーチャルエージェント出力の言語を定義します。使用する形式は、TTSベンダーによって異なります(例:de-DE、fr-FR、en-US)。

カスタムフィールドは、TTS Vendor(TTSベンダー)リストからCustom(カスタム)を選択した場合に表示されます。
TTS Voiceドロップダウン音声バーチャルエージェントの出力に使用する声を定義します。
Custom (Voice)CognigyScriptドロップダウンリストにないTTS音声を選択できるようにします。この設定は、地域固有の音声の場合に使用できます。使用する形式はTTSベンダーによって異なります。(例:de-DE-ConradNeural)
Enable Advanced TTS ConfigトグルAzure Custom Voice EndpointのURLの追加を有効にします。

この設定は、TTS Vendor Microsoftに対してのみ有効で、表示されます。
Disable TTS Audio CachingトグルTTSオーディオキャッシュを無効にします。

デフォルトでは、この設定は無効になっています。この場合、過去にリクエストされたTTS音声の結果は、バーチャルエージェントのキャッシュに保存されます。新しいTTSリクエストが作成され、音声テキストが過去にリクエストされたことがある場合、バーチャルエージェントはTTSプロバイダに再度リクエストを送信する代わりに、キャッシュされた結果を取得します。

この設定を有効にすると、バーチャルエージェントはTTS結果をキャッシュしなくなります。この場合、各リクエストは直接音声プロバイダに送信されます。

キャッシュを無効にすると、TTSのコストが増加する可能性があることに注意してください。詳細については、音声プロバイダにお問い合わせください。

Recognizer – Speech-To-Text(音声読み上げ) – 設定

STT設定は、Microsoft Azure、AWS、Google、Nuance、Soniox、またはカスタムベンダーの事前入力済みドロップダウンから選択できます。

パラメータタイプ説明
STT Vendorドロップダウンご希望のSTT ベンダーを定義します。カスタムベンダーを選択できます。
Custom (Vendor)CognigyScriptドロップダウンリストにない STT ベンダーを指定できます。ご希望のSTT ベンダーを選択します。このオプションはVoice Gatewayでのみ使用できます。プリインストールプロバイダの場合は、microsoft、google、aws のようにすべて小文字を使用します。カスタムプロバイダの場合は、Voice GatewayのSpeech Serviceページで指定した名前を使用します。

カスタムフィールドは、STT Vendor(STTベンダー)リストからCustom(カスタム)を選択した場合に表示されます。
STT Languageドロップダウン認識する言語を定義します。
Custom (Language)CognigyScriptドロップダウンリストにないSTT言語を選択できます。この設定は、地域固有の音声の場合に使用できます。使用する形式は、STTベンダーによって異なります。(例:de-DE、fr-FR、en-US)

カスタムフィールドは、STT Vendor(STTベンダー)リストからCustom(カスタム)を選択した場合に表示されます。
STT Hintsテキスト音声検出をサポートする単語やフレーズの配列。

備考:これにはSTTエンジンのサポートが必要です。このフィールドは Nuance speech vendor では使用できません。
Dynamic HintsCognigyScript配列のヒントを追加するためにコンテキストまたは入力を使用します。例:{{context.hints}} または {{input.hints}}
Google Modelドロップダウンこのパラメータは、STTベンダ設定でGoogleが選択されている場合にのみ有効です。

Google Cloud Speech-to-Text 文字起こしモデルのいずれかを使用します。Googleモデルの詳細なリストについては、GoogleドキュメントのTranscription modelsセクションをご参照ください。デフォルト値は Google Modelタイプであり、他のモデルが特定のシナリオに合わない場合に使用できます。
Enable Voice Activity Detectionトグル音声が検出されるまで、クラウド認識への接続を遅らせます。
Disable STT Punctuationトグルこのパラメータは、STT ベンダ設定でGoogleまたはDeepgramが選択されている場合にのみ有効です。

バーチャルエージェントからのSTT応答に句読点が含まれないようにします。
Deepgram Tierドロップダウンこのパラメータは、STTベンダ設定で Deepgramが選択されている場合にのみ有効です。

APIリクエストの階層を選択し、選択したSTT言語でそのモデルが使用可能であることを確認します。Deepgram階層の詳細は、Deepgramのドキュメントをご参照ください。
Deepgram Modelドロップダウンこのパラメータは、STTベンダ設定でDeepgramが選択されている場合にのみ有効です。

送信されたオーディオを処理するモデルを選択します。各モデルは階層に関連付けられています。選択した階層が、選択した STT 言語で利用可能であることを確認します。Deepgramモデルの詳細については、Deepgramのドキュメントをご参照ください。
Endpointingトグルこのパラメータは、STTベンダー設定でDeepgramが選択されている場合にのみ有効です。

DeepgramのEndpoint機能は、ストリーミングオーディオを監視して、スピーチの終了を示す長い一時停止を検出します。Endpoint を検出すると、予測を確定してトランスクリプトを返し、speech_finalパラメータをtrueに設定して完了とマークします。Deepgram Endpointingの詳細については、Deepgramのドキュメントをご参照ください。

スピーチ終了を検出する時間は、デフォルト値 (10 ミリ秒) で事前に設定されています。この値を変更する場合は、[Endpointing Time] 設定を使用します。
Endpointing Time数値このパラメータは、STTベンダ設定でDeepgramが選択され、[Endpointing]トグルが有効になっている場合にのみ有効です。

スピーチ終了を検出する時間(ミリ秒)をカスタマイズします。デフォルトは 10 ミリ秒の無音です。トランスクリプトは無音を検出した後に送信され、システムは話し手が再開するか、必要な無音時間に達するまで待ちます。いずれかの条件が満たされると、 speech_finalがtrueに設定されたトランスクリプトが返送されます。
Smart Formattingトグルこのパラメータは、STTベンダ設定でDeepgramが選択されている場合にのみ有効です。

Deepgramのスマートフォーマット機能は、トランスクリプトに追加のフォーマットを適用して、人が読みやすいように最適化します。スマートフォーマットの機能は、モデルによって異なります。スマートフォーマットがオンになっている場合、Deepgramは、選択したモデル、階層、および言語の組み合わせに対して、常に最適なフォーマットを適用します。詳細な例については、Deepgramのドキュメントをご参照ください。
Enable Advanced TTS ConfigトグルAzureのカスタムスピーチモデルのデプロイメントにIDの追加を有効にします。
Enable Audio LoggingトグルAzure上のユーザーからのオーディオの録音とロギングを有効にします。