[chatbot + AI = 下一代操作模式][34]賦予Chatbot用語音下指令以及翻譯的功能

2018-08-16 Thursday

「chatbot + AI = 下一代操作模式」 ai azure bot framework chatbot cognitive service speech-service

[chatbot + AI = 下一代操作模式][34]賦予Chatbot用語音下指令以及翻譯的功能.jpg — 圖片來源：https://pixabay.com/en/books-spine-colors-pastel-1099067/

在上一篇([33]C#使用Translator Speech API服務達到語音轉文字加翻譯)瞭解了如何用C# Console使用Translator Speech Api的服務達到語音轉文字加翻譯。那麽要整合到Chatbot就更加沒有問題了。

這一篇將介紹如何把Translator Speech Api整合到Chatbot裡面，語音能夠轉文字就能夠達到用說來叫Chatbot做事，并且提供一些多國語言的使用情景，例如不會說中文的客戶，可以透過chatbot達到及時語音翻譯。

這篇的程式碼github頁面是alantsai-samples/mhat-hotelbot:blog/chapter-34

Translator Speech Api整合到Chatbot

建立Translator Speech Api的Service
建立Dialog處理語音邏輯
整合到RootLuisDialog
測試結果

下一步調整
結語

Translator Speech Api整合到Chatbot

要整合到Chatbot和其他幾個有點類似，大概會經歷過幾個步奏：

建立Translator Speech Api的Service
建立Dialog處理語音邏輯
整合到RootLuisDialog
測試

建立Translator Speech Api的Service

這個Service代表著物件導向版本的TranslatorSpeechApi，方便呼叫服務。

整個邏輯和上一篇的Console裡面看到的邏輯差不多，這邊比較特別只是建立這個物件的時候需要注入服務的Key。

另外一個是建立出一個Model叫做：ResponseModel，用來接Translator Speech Api的結果。

詳細的程式碼就不發在部落格上面了，詳細請看：mhat-hotelbot/src/MHAT.HotelBot/Services/TranslatorSpeechService.cs

建立Dialog處理語音邏輯

接下來要建立一個Dialog叫做SpeechTranslationDialog，這個Dialog的主要目的是把Bot Builder SDK得到的内容做處理，然後呼叫TranslatorSpeechService做語音轉文字和翻譯的處理。

這邊要注意一下，一般來説模擬器可以直接發語音做測試，但是可能是我電腦問題，兩個版本的模擬器都無法使用語音，因此我用了一個自定的格式，這個内容格式是：media@{語音檔案路徑}。

因此，這邊的Dialog會用這個格式做處理，整個的邏輯如下：

[Serializable]
public class SpeechTranslationDialog : IDialog<List<ResponseModel>>
{
	public async Task StartAsync(IDialogContext context)
	{
		await context.PostAsync("請輸入：media@RecordMediaPath");

		context.Wait(MessageReceivedAsync);
	}

	private async Task MessageReceivedAsync
	   (IDialogContext context, 
		IAwaitable<IMessageActivity> inResult)
	{
		var activity =  context.Activity as IMessageActivity;

		var textSplit = activity.Text.Split('@');

		var mediaUrl = textSplit.Last();

		var tranlsatorService =
			new TranslatorSpeechService
				(ConfigurationManager
					.AppSettings["TranslatorSpeechApiKey"]);

		var result = await tranlsatorService
			.TranslateSpeech(mediaUrl);

		context.Done(result);
	}
}

整合到RootLuisDialog

接下來就是要把整個組合在一起了。

首先在luis.ai的網站加入一個intent叫做SpeechRecognizer，裡面有個utterance叫做語音，記得要train以及publish模型：

接下來就是調整RootLuisDialog呼叫語音的dialog：

[LuisIntent("SpeechRecognizer")]
public Task SpeechRecognizer
	(IDialogContext context, LuisResult result)
{
	context.Call(new SpeechTranslationDialog(),
		SpeechRecognizerAfterAsync);

	return Task.CompletedTask;
}

private async Task SpeechRecognizerAfterAsync
	(IDialogContext context, IAwaitable<List<ResponseModel>> result)
{
	var finalResult = await result;

	await context.PostAsync($"識別：{finalResult.First().recognition}");
	await context.PostAsync($"翻譯：{finalResult.First().translation}");

	context.Wait(MessageReceived);
}