人工智慧的導師之一是毛小孩?一起來看看AI如何向牠學習(上)

- 5月 04, 2020

人工智慧也要像狗狗取經啦!毛小孩身上到底有什麼魔力讓AI不得不向牠學習??

人工智慧居然還需要拜狗狗為師?別小看這些厲害的毛小孩~

Google 人工智慧研究團隊最新發表的機器人研究日誌中，詳細介紹了他們所研發的四足機器人如何流暢動作和透過 AI 技術自學行走。

目前的機器人仍需要許多人工參與，而 Google 建立的技術，讓機器人只需 8 分鐘的動作資料，就能自己學會向前、向後以及左右轉彎等運動，再也不用常常得扶起翻倒的機器人。

Google人工智慧研究員讓機器人「向狗學習」

為了開發出行動敏捷且不需要人工協助的機器人，Google 的人工智慧機器人研究科學家可說是日日夜夜絞盡腦汁！在觀察到自然界各種動物矯健又不費力的身手後──如翻身飛躍咬住飛盤的狗兒；研究人員終於決定向大自然取經，讓這些動作靈巧的小生物擔任機器人的老師，學習快速流暢的動作。

運動模仿、強化學習與自適應控制技術

研究人員先建立一套能夠模仿學習的人工智慧技術，旨在讓四足機器人可以通過模仿真實世界的狗來學習敏捷的動作。

首先，研究人員會捕捉真狗的各種動作，像是小跑、跳躍、起身等等，做為機器人執行各種技能的參考運動，並使用強化學習（Reinforcement Learning；RL）技術訓練控制策略，以仿效真實狗狗的動作。

▲強化學習技術用於訓練模擬機器人來仿效狗的動作。

在物理模擬的策略訓練上，通過對不同的參考運動使用不同的獎勵函數，在每個連續時步密切跟蹤參照的動作，訓練模擬機器人模仿各種不同的動態。

研究人員先在模擬環境完成訓練機器人的策略，接著再使用自適應控制技術（Adaptive control）將訓練好的策略實現在真實世界中，利用真實機器人的資料，高效地自適應策略，使研究人員能「教」一台四足機器人快走、跳躍或轉彎。

但由於模擬終究是無法匹敵真實，模擬中訓練的策略應用在真實機器人上一直效果不甚佳。
為此，研究人員使用潛在空間（Latent Space）適應技術，通過改變機器人的質量和摩擦等物理量來隨機化模擬訓練中的動力學，將數值用編碼器映射到一個數字表示（即編碼），在訓練過程中將此編碼作為附加輸入傳遞給控制策略，當將該策略部署到一個真實的機器人上時，研究人員刪除編碼器，並直接在潛在空間中搜索一組允許機器人成功執行技能的變量。

結果呢？這個方式十分成功！讓機器人能夠成功地執行現實世界中所需的動作！並且只要有 8 分鐘的資料供機器人參照，不只能從影片學會狗的走路動態，即使是動畫師製作的動畫，機器人也能從中學會轉頭等一些複雜的動作呢！

本篇為上篇，下篇請點此連結

相關文章：

人工智慧的導師之一是毛小孩?一起來看看AI如何向牠學習(下)

人工智慧甩尾技術竟能這麼無懈可擊!(上)

日本的防拍裸照人工智慧手機,看你還敢不敢亂拍照!(上)

AI人工智慧救地球！Google：AI 保護環境還比人類快 3000 倍

CSS教學-display與visible屬性介紹

用Python寫出唐鳳「番茄鐘工作法」程式，讓AI幫你集中注意力!

AI機器狗Aibo成最新愛寵真狗會被取代嗎？

搜尋此網誌

娶了UI設計師的Python工程師-北歐生活

人工智慧的導師之一是毛小孩?一起來看看AI如何向牠學習(上)

這個網誌中的熱門文章

網頁前端CSS必學兩屬性:display與visible

前端工程師絕不能搞錯的CSS中:逗號.空格的差別!

Python控制結構一點就通!(5)while迴圈