top of page
CI.Seoa News.png

《 Google 》和 Google 助理更自然的對話

我和其他忙碌的家長一樣,不斷尋找讓生活更輕鬆的方法。Google 助理在這方面給了我許多協助,像是在我為一家大小張羅晚餐時提供烹飪指導,或是分享通勤路線的即時路況。無論在家或出門在外,Google 助理都能協助處理生活大小事,讓我把時間留給更重要的事情。


全球每個月有超過 7 億人透過 Google 助理完成生活大小事,語音成為我們和裝置溝通的主要方式。每當你要求 Google 助理提供協助時,我們知道說出「Ok Google」或按住裝置可能會讓人覺得不自然。因此,今天我們想分享一些新方法,讓你和 Google 助理的互動更加自然,就好像在請朋友幫忙一樣。


談天說地不中斷


第一項全新功能「Look and Talk」已經在美國推出,適用於 Nest Hub Max。使用者只要啟用這項功能,只要單純看著螢幕就可以下達指令。打從一開始,開發 Look and Talk 就將隱私納入考量,這項功能啟用的條件是當使用者同意,而且 Face Match and Voice Match 都能辨識出使用者。互動過程中的影片也都只會在裝置上處理,不會分享給 Google 或其他人。


假設我需要修理廚房漏水的水槽,當我走進房間,我只要看著 Nest Hub Max 說出「附近的水電工」,就能獲得回應,無須先說出「OK Google」。

開發團隊在背後付出了許多努力才完善這項功能,讓系統能成功辨識使用者確實是與裝置進行眼神交流,而非匆匆一瞥。事實上,我們一共用了六個機器學習模型,處理從相機鏡頭及麥克風蒐集超過 100 個訊號,例如鄰近感應距離、頭部轉動角度、凝視方向、脈絡感知、意圖分類等,並據此即時判定。


Look and Talk 經過反覆測試及修正,可為各種膚色的使用者提供服務。我們採用和自然色調功能相同的包容性原則,為 Pixel 6 相機使用者打造更平權的體驗。

我們也在 Nest Hub Max 上推出快速指令語句,讓你在處理日常事務時,無須說出「Ok Google」也能執行動作,像是一進門就直接說「開走廊燈」,或是說「設定 10 分鐘的計時器」。快速語音指令也將隱私納入考量,如果使用者選擇開啟這項功能,可以決定哪些指令語句才需要有所反應,而且在 Voice Match 辨識出使用者的聲音時才會運作。


展望未來:更自然的對話


日常對話說,我們總是很自然地說出「嗯」,然後糾正自已,暫停一下思索正確的用詞。通常別人可以理解我們要說些什麼,因為人類是主動的聆聽者,可以在 200 毫秒內對話提示做出反應,我們相信 Google 助理也能夠做到聆聽並了解你想說的話。


為了實現這個目標,我們打造的全新且更強大的語音及語言模型,掌握人類語音的微妙細節,例如辨識什麼時候是暫停說話,而非說完話了。而且透過 Tensor 晶片,我們越來越能夠掌握即時對話的流暢性,尤其是因為 Tensor 經過客製化設計,能夠超級快速地處理設備上的機器學習工作。展望未來,Google 助理將更能理解人類語音的不完整,不會因為停頓、「嗯」和被打斷而出錯,讓使用者互動起來的感覺,更接近自然對話。

我們努力讓 Google 助理幫助使用者完成家中、車上及旅途中的生活大小事。透過這些最新的科技進展,距離讓你擁有更多時間活在當下、不用花時間思考如何使用科技的目標,我們又更進一步了。


以上內容來自 [ Google Blog ] taiwan.googleblog.com/2022/05/IO-Google-Assistant.html

科技新聞類別 News category

科技新聞影音 News Video

​科技新聞類別  News Category

搜尋新聞 Search News

科技新聞類別 News category

bottom of page