人工智慧的魔法,像哈利波特般,讓靜態照片動起來!

- 5月 22, 2019

現在靠著人工智慧,照片裡的人對我眨眼微笑已經不是夢了!離小時候對哈利波特的憧憬更進一步啦!

過去，AI 人工智慧機器學習研究人員開發了一套系統，它可以利用靜態的人臉照片/肖像呈現逼真的動作。有了這樣的系統，每一張人像照片都可以變成動畫，彷彿畫中的肖像都變成活生生的人一樣！

最近，一篇來自三星人工智慧研究中心（Samsung AI Center）發表的論文中，就描述了這套系統。該論文已經上傳到 Arxiv (註：一個收集物理學、數學、電腦科學等論文預印本的網站)。該系統使用了新的方法，將「來源臉孔（就是人在做動作時的頭部特寫）」影片上的特徵與｢目標臉孔」的數據對應，讓目標臉孔做出來源臉孔的動作。如以下影片所示：

這些三星駐莫斯科的研究人員在這篇論文也表示，僅僅只需一位人臉的模型，就可以使一個圖像呈現出說話、做各種表情的影片。不過在讓這些肖像「活過來」的前提，是需要擁有大量的臉部數據資料。數據越多，表情及動作就越逼真。雖然目前的效果還稱不上完美，但也足夠假以亂真了！

他們能夠讓愛因斯坦或是瑪麗蓮夢露等名人的照片、甚至是世界名畫「蒙娜麗莎」，讓他們呈現栩栩如生的動作、生動的表情、動作，彷彿他們活過來了一樣。
例如下圖的蒙娜麗莎合成動畫，就使用了三個不同的「來源臉孔」的影片。最終呈現的成果都有很大的差異。

而且，這個系統還運用了所謂的「生成對抗網絡（GAN）」，也就是讓兩個模型相互對抗。第一個模型彷彿製造贗品的「工匠」，試圖欺騙第二個「鑒别者」模型：我們現在手上有真實的data，「工匠」要做的事就是要做出這個data的「贗品」，而「鑒别者」則是要分辨給他的data是真的還是假的，並且會給出一個回饋。「工匠」根據「鑒别者」給的回饋來「訓練」他的工藝，也就是調整模型的數值；一旦「工匠」將其數值調整到「鑒别者」分誤以為是真的data時，就可以說我們訓練出了一個能夠模擬真正data的模型。

在這些研究人員提供的其他例子中，有些生成的結果，質量差強人意。例如，有些例子的來源影片是取自於新聞，結果生成出來的目標影片，竟然也有來源影片下方的新聞跑馬燈，而跑馬燈上的字幕是用亂碼填充的。雖說如此，但是這個系統，能達到如此的效果已經算是不錯了！不過現在這個系統仍只適用於臉部，我們還不能讓蒙娜麗莎跳舞，人工智慧-機器學習仍然有很大的進步空間，但相信不久的將來人的AI人工智慧科技就能達到！

🔑不要錯過延伸閱讀：

重視AI人工智慧.物聯網.大數據.VR/AR,就不用怕失業!

對於人工智慧,特斯拉創辦人和臉書創辦人各自的觀點差好多!

嘿!快瞧瞧是怎樣的人工智慧機器讓這個零售業龍頭安心不少!?

別再被惡意抹黑的達內PTT影響了!! 快來看看這些成功的實際案例!!

權威指南說:Java課程是一生必學的事!你學會了嗎?

著名企業皆投入AI領域,快報名Python課程幫自己在未來卡位吧!!

中國IT教育領導品牌　達內教育集團第一家海外授權中心

搜尋此網誌

娶了UI設計師的Python工程師-北歐生活

人工智慧的魔法,像哈利波特般,讓靜態照片動起來!

這個網誌中的熱門文章

人工智慧能否分辨"色情"和"裸露"的不同?猜猜看發生什麼事!

馬賽克被人工智慧破解!模糊的馬賽克照片轉換成看起來像真人的高解析度肖像

獨家Python教學:dir()和help()的使用時機