無聲勝有聲!靠感應下巴,人工智慧項鍊開啟你的無聲對話模式!

圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你

 

直接開口詢問、指示 SIRI,進而解決己身需求,已是 3C 智慧產品廣泛使用的日常風景。然而,若是在安靜的環境中呢?想像一下,如果你在靜謐的圖書館或是針落有聲的會議室裡,開口詢問:「嘿 Siri,明天天氣如何?」似乎有點尷尬。

當你亟需向你的人工智慧助理下指令,卻遇到上述需要保持安靜、無法說話的情況怎麼辦?

拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin

不用擔心!為了拯救你的無聲尷尬,康乃爾大學資訊科學助理教授 Cheng Zhang 和博士生  Ruidong Zhang,發明了一款項鍊型的人工智慧語音助理「SpeeChin」。這款項鍊配備了紅外線鏡頭、微處理器、電池和藍牙模組,項鍊外盒配有可提高穩定性的機翼造型平衡器,亦於項鍊盒底部配置了一枚硬幣以平衡配重。

SpeeChin 特性如同一般項鍊,使用銀鍊掛在脖子上,其紅外線鏡頭裝置於 3D 列印的項鍊盒上方,使鏡頭穩定指向佩戴者的下巴。SpeeChin 能夠基於下巴運動軌跡,捕捉「頸部和臉部皮膚變形圖像」,進而辨識無聲語言。目前的實驗結果顯示,SpeeChin 已能辨識簡單的英文和中文單詞。

已可辨識中英文!移動偵測問題仍待解決

在最初的實驗裡,研究人員測量了 10 名英文使用者及 10 名中文使用者,共 20 位參與者的下巴基線,接著使用差分圖像訓練 SpeeChin 辨識簡單指令,應用機器學習演算法將辨識結果傳到配對的智慧型手機,就像用另一種方式溝通的 Siri。隱私問題也不必擔憂,SpeeChin 只會對準佩戴者的下巴,不會拍到使用者的臉。

實驗方式為:10 位英文使用者無聲說出 54 條指令,包括數字、互動、呼叫語音助理、標點和導航,10 位中文參與者的 44 條指令也一樣。最後實驗結果顯示,SpeeChin 的英文/中文命令辨識能力平均準確率分別為 90.5% 和 91.6%。

此外,研究人員還要求其中 6 名參與者在行走時默念 10 個中文和英文片語,然而因為參與者頭部以不可預測的方式移動,所以最後成功率較低。顯示移動偵測的準確度是尚待解決的問題。

為什麼無聲語音辨識要做成項鍊的形式呢?研究人員認為:項鍊是人們習慣的裝飾品,至於耳掛式設備則可能會有不太舒服的佩戴體驗。雖然人們可能會想「我的手機就是語音辨識設備了啊」,但難免還是會遇到無法出聲的人或場合,此時無聲語音辨識的研究就能派上用場。

 

原文出處:https://www.tedu.tw/blog/ai-assistance-necklace-recognizes-english-mandarin-commands.html

 

 

延伸閱讀:

不用一分鐘,糖尿病就在人工智慧面前現出原形!

煞車領域領導品牌Brembo,引進人工智慧系統(上)

讓賈伯斯狂熱的UI圓角設計,不只是好看(上)

元宇宙也有翻譯蒟蒻了!Meta推全球語言都可翻譯的人工智慧

Google提出Android隱私沙盒,標榜保護用戶資料安全

所有的新創業者都需要SEO 的7 個理由!

SEO是什麼?跟AdWords差在哪?如何自學?

這個網誌中的熱門文章

Python控制結構一點就通!(5)while迴圈

前端工程師絕不能搞錯的CSS中:逗號.空格的差別!

網頁前端CSS必學兩屬性:display與visible