發表文章

目前顯示的是 2021的文章

輸入文字,由人工智慧幫你作畫!

圖片
人工智慧化身畫家最強小幫手!你輸文字,他畫畫!  繪圖用 人工智慧 發展到「你說我畫」的境界!透過  NVIDIA  於上個月發表的最新版 GauGAN2( 點此繪圖 ),你只要輸入「海灘的日落」 (sunset at a beach) 等短句, 人工智慧 即可自動生成精細的日落海灘圖像!若你覺得還不夠,沒關係!你還可以進一步加入更精確的敘述句如「沿岸的日落」 (sunset at a rocky beach),或是將「夕陽」換成「下午」、「雨天」等字詞,都能讓 GauGAN2 立即調整生成圖像。 過去  NVIDIA  在 2019 年 GPU 技術大會(GTC)上,首次發表了人工智慧繪圖工具—— 「GauGAN」的第一代 ,能透過簡單的手繪草圖自動生成栩栩如生的風景圖;現在又持續更新為第二代的 GauGAN2,加入了能以簡單的描述字句,即可自動建立圖像的功能、且精細度更符合使用者所需結果:如自動形成使用者所構想海灘形式,夕陽呈現的位置等。 依據  NVIDIA  官方說明,GauGAN2 採用分割映射(segmentation mapping)、圖像修復以及文字轉圖像生成功能,能依據文字敘述或手繪生成高品質的精細圖像之外;也是第一個在單一對抗生成網路(Generative Adversarial Network,GAN)運算中,加入文字語意識別,讓藝術創作者能以更簡單的方式,指引 人工智慧 快速生成圖像。 使用者不需畫出心中場景的每個元素,只需輸入短句, 人工智慧 技術就能依照短語,快速生成關鍵特徵和主題:如被白雪覆蓋的山脈;接著,使用者特於特定的山上草草點個幾筆,讓那座山更高;最後還可在前方加入幾棵樹、或天空增加幾朵雲來點綴整副畫作。簡單幾個動作,藝術家就能描繪出栩栩如生的美景圖、或是超現實的蒸氣龐克風格繪畫。 NVIDIA  強調,GauGAN2 背後運算則採用了 NVIDIA Selene 超級電腦運算系統,已經使用 1 千萬張高品質風景圖片訓練 GauGAN2  人工智慧 模型,並讓系統能將描述字詞與風景圖像建立關連,以能快速對應到使用者輸入字詞後產生相應圖像。 透過人工智能,GauGAN2 讓藝術家們的作畫工具變得更強大多元、且作畫速度變得更有效率、更開啟了藝術創作的無限可能性。 GauGAN2 傳送門在此,點我來作畫吧! 使用教學如以下影片所示: 延

為"安樂死"設計的人工智慧及輔助系統裝置(下)

圖片
由人工智慧鑑定安樂死資格?醫療應用AI的不同面向,快來一探究竟吧! 本文為下篇,上篇請看此 連結 。 AI自殺艙會帶來哪些影響?技術、倫理、法律界各持不同觀點 尼奇克會把石棺計畫印在自行創辦的非營利組織「解脫國際」(Exit International)發行的刊物中,並免費提供,只要年滿 50 歲就可取得設計圖、自行用 3D 列印出該自殺機器,如此輕易就可取得「死亡門票」的方式,各界如何看待? 演算法觀察機構:AI 恐削弱人類決定的自主權 讓人工智慧來決定人類的生死,只會削弱、不會增加人類對於 AI 的自主權 對此,關注 人工智慧 倫理議題的非營利組織「演算法觀察(Algorithmwatch)」政策及倡議團隊負責人穆勒(Angela Müller)指出:科技最終為人類開發,而 人工智慧 也是倚賴過去所學習的資料累積來做決定,而這兩者隱含的偏見和歧視,無形中都會影響 AI 的決定,「我擔心依賴它(AI)只會削弱、而不是增加我們的自主權」。 對此,尼奇克也只好承認當前的人工智慧應用與技術仍存者取多限制,上有無法解決的問題。但是他也沒有放棄,打算在「石棺」剛推行時與瑞士的醫師合作,確保每位石棺的用戶都經過醫界的專業判斷,以避免爭議;待此 AI 發展完成後,就採用人工智慧與醫師並行的「雙軌制」,消弭外界疑慮之餘也不斷優化  AI  的判斷力。 倫理研究所主任:過度美化自殺、恐引發自殺率 「像石棺這樣的機器會美化自殺,並增加心靈較脆弱或是心理疾病患者的自殺率。」美國喬治城大學(Georgetown University)甘迺迪倫理研究所(Kennedy Institute of Ethics)的主任 Daniel Sulmasy 認為如此集結最新 人工智慧 科技、富有設計感外觀的 AI 自殺機器根本就是「美化自殺」,恐引發自殺風潮。 法律專家們各持不同看法 尼奇克委託的法律顧問——瑞士聖加侖大學(University of St Gallen)的法律教授赫里曼(Daniel Huerlimann)表示:石棺在瑞士並無違法疑慮。 赫里曼教授指出此石棺並不在瑞士法律所定義的「醫療器材」之內,因此並不會受到《瑞士醫療器材法》(Swiss Therapeutic Products Act)的規範。除此之外,它也沒有違反氮氣、危險化學物質或武器等相關法律的嫌疑。面對這

為"安樂死"設計的人工智慧及輔助系統裝置(上)

圖片
由人工智慧鑑定安樂死資格?醫療應用AI的不同面向,快來一探究竟吧! 當醫療用人工智慧助人恢復健康時⋯⋯這位醫生卻開發自殺用AI! 截至目前,許多醫療界與 AI 工程師聯手推出各式各樣的 人工智慧應用 ,目的都是為了要救活病人、降低死亡率,像是 日前獲 FDA 批准的內視鏡 AI ,可及早預防與醫治大腸癌 、還有  PTT 創辦人杜奕瑾因逝母遺憾,而打造的人工智慧敗血症即時預測 AI 。 當眾多 醫用 AI  在為人類解決問題時⋯⋯有「死亡醫師」之稱的澳洲醫師尼奇克(Philip Nitschke)卻反其道而行,開發了讓人工智能「鑑定」用戶是否該安樂死,並搭配可自行 3D 列印的輔助自殺(assisted suicides)裝置——「石棺(Sarco)」,介紹如以下影片所示: Sarco @ Venice_Design from Philip Nitschke on Vimeo . 瑞士安樂死條件太龜毛?他竟讓 AI 來定義你是否「該死」 AI  自殺裝置「石棺(Sarco)」的樣品 ,首次公開於 2018 年荷蘭的阿姆斯特丹喪葬展上,引發不小爭議。之後經過三年的研發,他打算帶著「進化版」的石棺 AI 輔助自殺系統前進瑞士,期待可在第一個通過安樂死合法的國家派上用場。 安樂死原因有哪些?瑞士接受輔助自殺的死者中「25%無罹患絕症」 而瑞士當前的法律僅允許人們在「特定條件」下接受輔助自殺,執行前亦需經過心理狀態評估等程序,才有機會拿到處方箋、並由醫生或醫療單位協助自殺。 當然心理狀態的評估標準見仁見智,在瑞士,每年通過協助自殺而過世的人群當中,有四分之一的人其實並沒有罹患絕症,純粹只是「厭倦了生活」。像是 2014 年通過安樂死而過世的英國退休藝術教師, 選擇自殺的原因竟只是「厭倦了充斥著電子郵件、電視、電腦和超市快餐的現代世界」 。 他讓 AI 取代醫師決定你生死,讓「找死」的過程更民主? 即便如此,尼奇克仍主觀地認為,瑞士有很多醫師不願意開「死亡處方箋」給無病痛的人:例如對活著感到厭倦的長輩等,而他發明的石棺可解決問題,宣稱可「讓死亡的過程更加『民主化』(democratising)⋯⋯」尼奇克說道:「所有理性的成年人都應享有決定要在何時結束生命的權利,不該是被掌握在其他人手上⋯⋯」 只要 AI 說「yes」,你就可一鍵墜入陰間 所以尼奇

具細膩觸覺感知的人工智慧 ReSkin,讓人類離「元宇宙」更近!(中)

圖片
不到3mm的輕薄柔軟、不到6美元的低成本 由於人工智慧應用與技術的研發,往往需要巨量的數據來產生機器學習模型。所以致力於 人工智慧發展 的  Meta AI  部門,對觸覺 sensor 的需求大。 過往 機器人 皮膚需要內建電子設備,來監控皮膚與表面接觸時產生的電流變化。然而厚度不到 3mm 的可塑型皮膚 ReSkin ,只需要靠近監控設備即可,這意味著我們可以花更低的成本屬於,偵測到寬度不到 1 釐米、力道僅 0.1 牛頓的物件。 Meta  研究科學家古塔(Abhinav Gupta)說:如果生產 100 件以上的 ReSkin,則每一件的材料成本將低於 6 美元。皮膚的薄度可以重複使用 50000 多次,就算磨損,也非常容易搭上磁性粒子替換(更換過程如下方影片所示)。 90%的精確度,能搜集到過去無法得知的數據 ReSkin 的時間解析率高達 400Hz,1 毫米的空間解析度則有 90% 的精確度。這種精準度使其在元宇宙上能具備多種應用,像是機械手臂、觸感手套、袖套、以及任何能追蹤走路、跑步、運動和休息的鞋子(寵物也可用)等,因此它可協助研究人員蒐集過去無法得知的多種觸覺資料。此外,ReSkin 還提供高頻 3 軸觸覺訊號,可執行靈巧的操作動作,如丟、抓、拍手、滑等。 古塔認為這是未來。他說:「當你戴上這些耳機時,你想要產生愈來愈豐富的體驗——而關鍵是觸覺。」 ReSkin的人工智慧原理-磁場x影像SENSOR打造擬人觸覺 依 Meta AI 的研究科學家古塔(Abhinav Gupta)等人的撰文內容表示,目前希望這樣的觸覺感知能力賦予在 AI  機器人 身上,使其獲得更人性化的互動方式。例如:機器手臂順利地拿起桌上的蛋,而不會施予過度的力道讓蛋破碎。 當研究人員想要賦予機器人觸覺時,首先想到的是能不能也給機器人跟人類一樣的皮膚,讓 機器人 全身都有觸感?紐約大學電腦科學的助理教授 Lerrel Pinto 表示,獲得可信賴的觸覺感知數據,是目前機器技術的重大瓶頸。現有的感應器很昂貴、解析度差且重量不輕,ReSkin 將克服以往的這些問題。 ReSkin感測器-內建磁性顆粒,一摸就生成磁場 由 Meta AI 的合作對象——卡內基梅隆大學打造的 ReSkin 感測元件,可模擬「觸覺」:透過模仿人類皮膚的設計,在接觸其他表面時,

具細膩觸覺感知的人工智慧 ReSkin,讓人類離「元宇宙」更近!(上)

圖片
在元宇宙也有觸覺! Meta 養成 ReSkin 人工智慧模擬真實肌膚感知 讓臉書 CEO 祖克柏​​熱血沸騰的「元宇宙」(Metaverse)新虛擬世界,目前是以有限的形式存在,我們只要戴上  VR  眼鏡便可抵達!祖克柏日前更將  Facebook  母公司改名 「 Meta 」,展現將「元宇宙」深入現實世界的野心!緊跟著「元宇宙」的腳步,祖克柏在十一月宣布:自家公司研發了新的觸覺感測器「ReSkin」,質感如真人皮膚,可安裝在  AI 機器人 身上、​​收集 人工智慧 的觸覺資料。 祖克柏:人工智慧皮膚ReSkin,讓我們離「元宇宙」更近 根據祖克柏日前在  Facebook  的貼文所述,自家公司「 Meta 」設計了高階觸控感測器 ReSkin;並與引導全球人工智慧趨勢的「卡內基美隆大學(Carnegie Mellon University)」合作,創造 機器人 及穿戴式裝置專用的塑膠薄皮膚。這能「帶領我們,進一步邁向『元宇宙』擬真虛擬物件與實質肢體的互動」。 Meta AI  (前身為 Facebook AI)的研究人員與卡內基美隆大學合作研發的 ReSkin,快速、大規模地提升了 人工智慧 夠在感測器和系統間共享數據。 Meta 將發佈 ReSkin 的設計、相關文檔、代碼和基礎模型,讓人工智慧的研究人員毋需搜集或訓練他們自己的數據庫,就能立即使用 ReSkin。如此一來,反而有利於提高人工智能的觸覺感應技能。 ReSkin觸覺感應範圍廣,助人工智慧執行高靈敏工作 人造皮膚 ReSkin 能感應到的觸覺非常廣泛,這優點幫助 人工智慧 能進行多種以觸覺為主的工作,包含物件分類、肌肉運動知覺(本體感覺)和 機器人 抓取等;另外,訓練過觸覺感知能力的 人工智慧 模型,有能力從事需要高度靈敏度的工作,如醫療保健機構的工作、或是需要更高靈巧度的工作:如操作小的、柔軟的、敏感的物體等。 ReSkin 還能與其他的感測器結合,在實驗室外等不可控的非結構化環境中,搜集視覺、聽覺和觸覺的數據。

基於音樂生成3D舞蹈!人工智慧運用再進化!(下)

圖片
與其他人工智慧應用相比:FACT編舞能力一流 將 FACT 的性能,針對各個指標,與其他的 人工智慧 應用進行比較: 如上表所示,FACT 與三種最先進的編舞 人工智慧 應用( Li et al 、 Dancenet  和  Dance Revolution )相比,FACT 模型生成的動作更逼真,與輸入音樂的相關性更好,並且在以不同的音樂為條件時更多樣化。*注意的是  Li et al 生成的運動是不連續的,使得平均運動特徵距離異常高。 Google 還透過使用者研究,評估音樂與動作的相關性:讓每位使用者觀看 10 個影片,片中有一個 FACT 模型與一個隨機對照模型所生成的編舞結果然後讓使用者選擇哪個模型生成的舞步比較能夠與音樂同步。使用者共有 30 名,包含專業舞者以及很少跳舞的人。 結果顯示:81% 的使用者喜歡 FACT 模型生成的結果勝於 「Li et al.」的;跟 Dancenet 相比,71% 的人喜歡 FACT 勝過 Dancenet;跟 Dance Revolution 比較, 77% 的人也更喜歡 FACT。。有趣的是,75% 的參與者喜歡 AIST++ 未配對的舞蹈動作勝於透過 FACT 所生成的。這並不奇怪,因為最初的舞蹈紀錄具有很強的表現力。 定性結果 如下圖所示,與先前  DanceNet (左)與  Li et. al. (中)相較之下,使用 FACT 模型(右)生成的 3D 舞蹈更逼真,並且與音樂的相關性更好。 使用 FACT  人工智慧 模型生成更多 3D 舞蹈: 人工智慧發展下一步:為每首歌生成逼真舞蹈 Google 開發了一個 人工智慧 模型,可以學習音頻與動作對應的關係,還可以基於音樂,生成的高質量 3D 動作序列。由於從音樂生成 3D 動作是一個新興的研究領域,Google 希望此項研究成果能為未來跨模組「音頻-3D 動作」的生成鋪道。 透過這項研究,Google 還發布了迄今為止最大的 3D 人類舞蹈資料庫「 AIST++ 」——具有多視角、多種舞蹈形式、跨模態的 3D 動作數據集,不僅對 3D 動作生成研究有幫助,一般來說,也對人類理解研究幫助。Google 將在  GitHub  中發布代碼,並在 此處發布 經過訓練的模型。 雖然此項結果給了這個「基於音樂來生成 3D 動作

基於音樂生成3D舞蹈!人工智慧運用再進化!(中)

圖片
人工智慧編舞一把罩:FACT 模型  Google 使用上述的 AIST 資料庫,訓練 FACT 模型從音樂生成 3D 舞蹈。該模型先使用動作轉換器與音頻轉換器,分別對一段音樂與一個短的(2 秒)種子動作(seed motion)進行編碼。之後再將嵌入碼連接、發送到跨模型轉換器,該轉換器學習兩種模型之間的對應關係,並生成 N 個未來的動作序列。 然後使用這些序列以自我監督的方式訓練模型。在測試時, Google  將此模型用於自回歸框架,其中所預測的動作則作為下一個生成步驟的輸入。因此,FACT 模型能夠一個框架接著一個框架地,生成長時間的舞蹈動作。 FACT 網絡接收音樂片段 (Y) 和 2 秒的種子運動序列 (X),然後生成與輸入音樂相關的長期未來動作。|圖片出處:Google AI Blog Google 用三指標評估 FACT 的性能 Google  依據以下所述之三個指標,評估 人工智慧  FACT 的性能: 動作品質:我們計算 AIST++ 資料庫中的「真實舞蹈動作序列」與 40 個「模型生成的動作序列」之間的  Frechet 起始距離 (FID),每個序列具有 1200 幀鏡頭(20 秒)。我們將基於幾何和動力學特徵的 FID 分別表示為 FIDg 和 FIDk。 生成多樣性:與 之前的工作(指 「 深度 慣性姿勢捕捉」:從少許的慣性量測中學習而重建人體姿勢)類似:Google 從 AIST++ 測試集中的 40 個「模型生成動作特徵空間」中,計算平均歐氏距離,用以評估模型生成各式舞蹈動作的能力。,接著再比較幾何特徵空間 (Dist g ) 和動力學特徵空間 (Dist k )。 Google 使用不同的音樂,來生成四個不同的編舞版本:Break、Ballet Jazz、Krump 和 Middle Hip-hop(右),但有兩秒是相同的 Hip-hop 舞蹈動作(左),這些相同的動作被稱為「種子動作」。|圖片出處:Google AI Blog 運動-音樂相關:由於沒有合適的指標來衡量輸入音樂(音樂節拍)與所生成的 3D 動作(動作節拍)之間的相關性。所以 Google 提出了一種新的「節拍對齊分數 (BeatAlign)」作為指標。 上圖中顯示 FACT 所生成的舞蹈動作的動作速率(藍色曲線)、動作節拍(綠色虛線),及音樂節拍

基於音樂生成3D舞蹈!人工智慧運用再進化!(上)

圖片
人工智慧學編舞,動作搭配音樂複雜度高 Google 正進行一項 人工智慧 研究,開發稱為「FACT (Full-Attention Cross-modal Transformer)」的模型,可以模仿、理解舞蹈動作,甚至可提高個人的編舞能力。 Google  研究團隊為了訓練該模型,也隨之發布一個大規模、多模態的 3D 舞蹈動作資料庫「AIST++」,包含長達 5.2 小時的 1408 個 3D 舞蹈動作序列,涵蓋 10 種舞蹈類型。都包含了已知相機位置的多視角影片,可生成逼真流暢的 3D 舞蹈動作。 Google  提到:雖然隨著音樂節拍編排出動作,是人類的本能;然而舞蹈是「需要練習」的藝術形式。專業的舞者都需要經過大量的、包含各式各樣舞步的曲目來訓練,才有編舞能力。這樣的訓練,對人類來說已不容易;對 ML(Maching Learning, 機器學習 )來說更是難上加難。因為要使用 人工智慧 來實現編舞,需要生成動力複雜度高的連續動作,同時還要捕捉動作與配樂間的非線性關係。 人工智慧如何學舞?Google修正AIST舞蹈資料庫成教材 Google 從現有的  AIST 舞蹈影片資料庫( 一組帶有音樂伴奏的舞蹈影片,但無任何 3D 信息)生成 3D 動作資料庫。AIST 包含 10 種舞蹈類型:Old School(地板舞 Breaking、機械舞 Popping、鎖舞 Locking 和 Waack)以及 New School(Middle Hip-Hop、LA-style Hip-Hop、House、Krump、Street Jazz 和 Ballet Jazz),雖然包含了許多舞者的多視角影片,但鏡頭都沒有經過校準。  Google  依研究人員的需求,根據常用的  SMPL  3D模型參數,修復 AIST 影片的拍攝校準正後的數值和 3D 人體動作,重建為「AIST++ 數位資料庫」,包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。 未經修正的  AIST 舞蹈影片資料庫 如下所示: Google  依研究人員的需求,根據常用的  SMPL  3D 模型參數,修復 AI

書摘撰寫交給人工智慧?地標最強寫手:GPT-3(下)

圖片
    本文為下篇,上篇請看此 連結 GPT-3 不只會寫文,還可從長篇大論中摘要重點 GPT-3  可高度理解原作者的撰文意圖,並有效處理;完全沒有其他早期開發的 人工智慧 模型的缺點(例如低精準度、不容易理解使用者的文字意圖⋯⋯等)。因此研究團隊就聚焦在  GPT-3  ,不斷修正與微調,持續提升 人工智慧 理解問題的精準度,因此  GPT-3  能為原本耗時或難以評估時間的任務,提供除了撰文之外,更多的應用方式。 圖片出處:CC0授權圖庫搜尋 GPT-3 新功能解鎖:將12萬字《傲慢與偏見》精煉成200字重點 OpenAI  研究人員不斷開發  GPT-3  的新應用方向。這次,他們成功將  GPT-3  微調成「抓重點」神器。原本擁有 12 萬字詞編排的《傲慢與偏見》長篇名著,被  GPT-3  精煉出總結不到 200 個字詞的小說摘要。 雖然被 人工智慧 精煉成千分之一的字句,但是原著故事內容都完整保留!其他精簡成摘要的著作還有《愛麗絲夢遊仙境》、《羅密歐與茱麗葉》、《自由之心》從生成少許的文字敘述一窺劇情全貌。 人工智慧「寫手」GPT-3 新功能解鎖:將擁有 12 萬字的《傲慢與偏見》精煉成200字重點(圖片出處: OpenAI ) GPT-3 如何生成文字? 就技術面來看,進行判斷文章長度,總結一段長文本分解成較短內容,而在這些短內容的段落中擷取重點,持續縮減字數並且串接成通順可讀內容。這樣對文章內容的分解方式,無論是數十、數百或數千頁都能夠做出總結摘要。 OpenAI  在  GPT-3  透過小說種類的書籍進行訓練模型,平均超過 100,000 個字詞數。這樣的訓練模式可更換為不同的語言、採樣方式及訓練數據類型,並且藉由強化學習以對抗生成方式,提供輕鬆閱讀文字結果。同時,在強化學習中採用三種變體抽樣訓練方式,藉此讓GPT-3確實能理解小說內容表達主軸。 在訓練過程中,研究人員選取 Goodreads 2020 榜單最受歡迎的 40 本書籍,包含奇幻、恐怖、愛情、推理等 20 多種類別,並由兩名研究人員閱讀每本書後寫出其摘要,再對比  GPT-3  生成的摘要,進行評分。最後,研究人員與 GPT-3 所寫的大綱有 80% 的相似度,是符合人們預期的結果。 此外,研究人員也藉著 GPT-3

書摘撰寫交給人工智慧?地標最強寫手:GPT-3(上)

圖片
人工智慧用200字說完12萬字的故事!GPT-3解鎖「抓重點」新功能 OpenAI  訓練了可以摘要整本書籍的 人工智慧 模型:該模型擁有精煉出整本書重點大綱的能力,像是能快速用 200 字精準描述出 12 萬字的《傲慢與偏見》。 這個人工智慧模型,就是前陣子  OpenAI  的當家技術——自然語言處理模型「 GPT-3 」經過微調過後的版本。 此款微調後的  GPT-3  語言模型,會先依照文章長度進行判斷:文章長度較短的內容就直接擷取結論;長篇文章則先在各片段摘要出重點後,再串接這些重點並摘要出通順的大剛。 再深入了解這個能秒抓重點的人工智慧模型前,我們先來了解一下  GPT-3  的身世! 地表最強寫手—GPT-3 自然語言處理人工智慧 長期致力研究 人工智慧 (AI)的非營利組織── OpenAI  於 2020 年 5 月推出開發出一款自然語言處理模型「 GPT-3 」,目的是為了使用深度學習分類或產生人類可以理解的自然語言。 GPT-2 寫假新聞,獲英國《衛報》認證! 嚇跑創辦人馬斯克? GPT-3 是延續前身  GPT-2  的架構。過去  GPT-2  就以捏造假可亂真的 假新聞 為名,據說因此嚇跑了  OpenAI  創辦人之一的馬斯克! 過去英國媒體《衛報》(The Guardian)就將一則「英國脫歐」的新聞,第一段中的一些句子「餵」給它, GPT-2  可立刻產生另一則似是而非的新聞內容、如同原本的報紙般的編排、以及出現跟原文一樣的人物等。發表過「基於真人真事改編」的英國脫歐 假新聞 。《衛報》甚至認為  GPT-2  產生的句子,幾乎沒有過去 AI 系統撰文所產生的前後語意不一致、或是文法錯誤的問題。 https://www.youtube.com/watch?v=XMJ8VxgUzTc&feature=emb_logo 而  GPT-3 ,身為  GPT-2  的後代,又更是青出於藍。 GPT-3  擁有高達 1750 億個參數的神經網絡,自動生成文字的文字更人性化。只要「餵」給  GPT-3  文章,無論內容多長、且形式不拘(包含 e-mail、詩詞、新聞稿、小說等都難不倒), GPT-3  都能延續原文的形式、思維,生成相應內容!且句句通順,完全就像真人所述。 人工智慧寫勵志文

Google Maps 出現「最省油的路線」,人工智慧帶你降低通勤污染

圖片
環保與省錢兼得:Google人工智慧定義「省油路線」 國際油價漲不停,光是上個月油價國內油價就連四漲。因石油輸出國家組織和俄羅斯等產油國聯盟(OPEC+)僅「適度地」供應市場,加上美國庫存下降,因此今年油價創 2015 年以來最長連續上漲週數。 而  Google  於 10 月 6 日推出 Google Maps 新功能:透過 人工智慧 技術與美國國家可再生能源實驗室(NREL)數據所提供的「環保路線」,能把紅綠燈等因素考量進去,計算出最省燃油消耗量又兼顧到達時間快速的路線,在落實更多環境保護的理念之餘,也替使用者省下汽油費用。 https://www.youtube.com/watch?v=MbHuSHGZf5U&feature=emb_logo 美國優先上線 明年可望推至其他地區 目前此款新功能先於美國上線,讓使用者抵達目的地除了可選最快路徑之餘,也延伸至節能省碳的領域。預計在 2022 年後,歐洲以及其他地區的用戶也能享用到這款兼顧荷包、行車效率與節能減碳的新功能。 根據  Google  執行長皮查伊(Sundar Pichai)所述,人類的生活習慣與氣候變遷是息息相關的。因此 Google 將持續優化「環保路線」功能,並加以推行至各國,有望在 2022 年底累積超過一億的使用人數。如此一來,全球用戶都機會一起解決環境問題、實現永續經營的理念。 省油、省時、省錢兼具 Pichai 指出:很多人每天通勤的方式——開車,是碳排放量較高的選擇之一。從今天開始, Google  地圖會對「位於」美國的用戶顯示「最省油的路線」(如果最省油路線與最快路線的到達時間相近的話);相同也將於 2022 年後適用於歐洲的用戶。此「省油路線」預計每年可減少超過一百萬噸的碳排放量(相當於路上少了超過 20 萬輛車),還能幫使用者節省汽油費用。 另外,如果「省油路線」省下的油耗量過少或使行車時間大幅增加時,Google 地圖會顯示不同路線之間相對省下的油耗量,方便用戶進行比較。 節能減碳優先!Google 搜尋加強曝光油電/電動車 除了「省油路線」之外, Google  也調整自家的搜尋功能,讓用戶更容易看到油電混合或電動車的選項、並且與汽油車進行比較,協助用戶找到折扣、在購買前能全盤掌握價格。此功能將於今年在美國推出

人工智慧醫療神助攻,腸癌準內視鏡AI探測,靈敏度高達99.7%!

圖片
致命大腸癌年奪五千條命!腸道結構複雜漏診率增 根據衛福部最新統計,癌症已蟬聯 39 年國人死因首位,平均一年奪走 5 萬左右的生命;而最新癌症死因的前三名分別為肺癌、肝癌、大腸癌。 隨著醫療科技的進步,腸癌檢查的內視鏡敏感性及準確性都高過其他的檢查方法——透過內視鏡,可直視、活檢或全瘤切除,但礙於大腸的結構、病變差異等原因,時常發生漏診的狀況。 人工智慧醫療 首例!內視鏡輔助 AI 獲FDA批准   「GI Genius」的官方介紹影片(影片嵌入自 https://www.medtronic.com/) 近期,全球首例獲得 FDA(美國食品藥物監督管理局)批准的腸癌瘜肉檢測系統—「GI Genius」系統是內視鏡  AI  輔助檢測工具,也是大腸癌篩檢領域中第一款使用機器學習的 人工智慧醫療 輔助系統。 在大腸鏡檢查過程中,該系統會識別並標示出潛在病變 (例如息肉或疑似腫瘤) 的部位,提醒臨床醫師必須進一步評估或處理,例如組織採樣或切除息肉等。 大大減低大腸癌發生率!人工智慧醫療檢測靈敏度達 99.7%   影片左側、右側分別展示一般內視鏡、GI Genuis 所照出來的畫面。(影片嵌入自  https://www.medtronic.com/ ) 研究結果顯示,GI Genius 檢測速度比醫生還快,靈敏度可達 99.7%、錯誤率低於 1%,大大提高瘜肉的檢出率,甚至連傳統大腸鏡不容易檢出的「扁平息肉」都能驗出!大腸癌主要是由大腸內的腺瘤瘜肉癌化所導致,透過這樣的 人工智慧醫療 系統,就能落實早期發現腺瘤瘜肉並切除之,大大地減少大腸癌的發生。所以醫生可用 GI Genius 提高檢測準確度、降低罹癌風險:體內腺瘤檢出率每增加 1%,腸癌風險就跟著降低 3%。 這次美國 FDA 依據「GI Genius」的臨床試驗數據,首次批准人工智慧醫療器材應用在臨床上,也是第一個智慧醫療案例。「GI Genius」能提高腸胃道病變的篩檢率、減少病灶的遺漏跟誤判,可見 2021 已進入智慧醫療領域的時代,未來會有越來越多的  AI  醫療開始用於臨床來輔助醫師。

洗錢猖獗,人工智慧應戰!重新定義反洗錢新規則(下)

圖片
本文為下篇,上篇請看此 連結 人工智慧應用於防制洗錢的方式: 從大數據中辨識可疑訊息 所有的網路資料,最初都是未整理的大數據,是非結構式的資訊。而 人工智慧 可自動判別非結構式的網路資訊,若偵測到跟金融交易或相關資訊,便能迅速提前通知,以有效防範詐騙或是大量金錢的異常出入。 人工智慧挖掘交易者的人際關係 問題帳戶背後所呈現的個體、群體交易聯繫,可讓 人工智慧 透過最短路徑算法搜尋洗錢個體之間的中介。比如:若是企業與企業之間帳戶,直接交易百萬金額,其洗錢疑慮較低;若是百萬金額分批從數個不同公司轉出,但共同轉入的相同的個人帳戶,其疑慮就比較高。 自然生成可疑活動報告(SAR) 根據 1970 年的銀行保密法(BSA),反洗錢技術通常不會在其他報告(例如:貨幣交易報告)下標記可疑活動。金融機構有責任在 30 天內就其認為可疑或異常的任何賬戶活動提交報告。如有必要收集更多證據,可延長不超過60天。 交易監控閥值 依循交易偵測需求(例如:金額、次數、天期…)可依需求於系統上自行調整,即時監控可疑交易。(例如:個人帳戶與企業帳戶分類不同,交易的監控標不同) 如何判別疑似洗錢的客戶交易 當消費者進行免臨櫃的線上開戶,要如何進行身份認證?如何確認消費者本人真的有交易的意願?歸功於 人工智慧 發展的突飛猛進,AI 擁有「了解你的客戶」(Know Your Customer,KYC)以及「了解你的員工」(Know your Employee,KYE)的反內部詐欺制度。 善用防制洗錢的 人工智慧 應用與技術,便能協助反洗錢的工作人員們能專心擬定更精明的應對策略、工作效率也隨之更高!    

洗錢猖獗,人工智慧應戰!重新定義反洗錢新規則(上)

圖片
從 2020 年開始, COVID-19  疫情所帶來的經濟破壞,導致消費者與金融機構間的交易迅速轉往線上支付。許多面臨物價通膨的民眾,在荷包不斷縮水的情況下開始思考,若只將錢存入銀行過於欠缺彈性,但是使用信用卡、銀行貸款或融資,卻侷限在個人的信用評比而有其限制。因此,非銀行體系的私人金融單位在前述狀況下得以興起;這些單位濫用網路的各種交易工具,利用個人以利滾利的投機心態,催生了購買資產、存入金融機構帳戶或匯至人頭帳戶等洗錢方式。 (示意圖/取自網路) 機會伴隨風險,需投入洗錢防制人力 獲得2020年度最佳「反洗錢解決方案」,全球數據分析領域領導者(SAS)、安侯建業聯合會計事務所(KPMG),及台灣反洗錢推廣協會(ACAMS)最新發布的反洗錢技術研究顯示,美國銀行業每年投入反洗錢的預算已高達 250 億美元,因此各國財政部試圖建立更加嚴謹精準的反洗錢機制。台灣的金融監督管理委員會,作為主管反洗錢政策的政府機關,則在2020年8月正式發布「金融科技發展路徑圖」,積極協助各金融機構尋求新的市場需求與價值,共同打造安全的金融科技生態圈。 目前大部分銀行均採用「規則基礎系統」(rules-based)的方法偵測非法洗錢。但是,面對系統每次數千甚至上萬筆警訊,卻只能先以人工過濾判斷。同時,隨著偵測技術與時俱進,相關工作人員也增加不少負荷心力。因此,在金融單位系統不見得有良好串接或資料管理,便需藉由新的科技工具主導改變環境。 金融資安守門員: 人工智慧 定義反洗錢新規則 在各國不斷構思下,經過改良的資安技術,不只可用來保障網路安全,同時也能減輕人力負擔。SAS 就許多國外金融機構發展的經驗指出,人工智慧(AI)和 機器學習 技術(ML),在反洗錢趨勢下不斷成長,超過半數以上(57%)受訪者已經在反洗錢程序中部署 AI/ML,或預計在 12-18 個月內設置這項技術。因此, 人工智慧 的運用不只作為產品服務面的多樣化,更成為金融業發展洗錢防制的核心技術,有助於在大數據中找出共通模式與連結,實踐資安的核心價值。 下篇請看此 連結

Google針對FLoC取代Cookie4大爭議,提出解決辦法(下)

圖片
本文為下篇,上篇請看此 連結 FloC將使用者分群,取代 Cookie個人識別 https://www.youtube.com/watch?v=J8sBCPYDHJo FLoC  將讓  Google  旗下產品不再倚賴 Cookie來紀錄分析個人使用行為。相較於識別「個人」行為的 Cookie, FLoC 是依據使用的網站瀏覽行為,將行為相似的人們分成多個群組,每個群組擁有一組 ID,廣告主再針對同一群組顯示相關的廣告。 FLoC 的作法雖然可讓人們隱身在興趣相投的群組中,而且所有瀏覽歷史紀錄以及其他數據都將保留在本地。不過還是受到各界不同的質疑意見。 Google  隱私沙盒的核心工程師 Josh Karlin 就將  FLoC  發佈至今所受到的爭議歸納成以下四點,並加以答覆: 爭議一、網站會被自動加入FLoC的廣告投放實驗中 Josh Karlin 回應:現在已不會自動將網站加入  FLoC  的廣告投放實驗中,而是由網站選擇是否透過 API 加入。 爭議二、群組代號太抽象,無論是使用者與技術專家都不易理解 Josh Karlin 回應:為了讓用戶、技術專家更好理解群組概念,他將改以基於領域的主題名稱(Topic)取代原本的群組代號(Cohort)。例如:原本的群組代號為數字「21849」被「美麗與健康」這樣的興趣分類取代。 這些方式讓瀏覽網頁的使用者,清楚的理解自己怎麼被敘述,並透過明確的主題內檢視是否涉及敏感的資訊。 爭議三、FLoC 的群組容易被數位指紋技術(註:fingerprinting,數位指紋提取,用以收集使用者手機、電腦型號等訊息)追蹤; Josh Karlin 回應:說透過上述的主題標籤分類方式,預計可將原本的上萬個代號群組,減少至數百種的主題標籤群組,進一步降低群組被用於指紋追蹤的可能性 爭議四、敏感性資訊仍有被洩露的疑慮。 Josh Karlin 回應:「這些主題名稱將由人為策劃,以確保它們不含敏感性資訊」。就長遠看來,分類方法最好由外界建置與維護。 Google還在考慮,未來新增讓用戶選擇不要加入特定主題的功能。 結論:  Google  正在嘗試以主題取代群組分類的方法,減少外界對  FLoC  的質疑。相關更多信息,請參閱:

Google針對FLoC取代Cookie4大爭議,提出解決辦法(上)

圖片
Google將棄Cookie廣告追蹤 新技術FLoC爭議多 Google 聲明即將在 2022 年終止 Chrome 瀏覽器支援 Cookie,並且以自家開發的廣告追蹤新技術「 FLoC 」取代(詳請可參考本文: Google 為保護隱私,棄 Cookie 卻改用人工智慧? ),不過也引發了不小爭議 (參見: 「恐怕會助長歧視」WordPress 與多家瀏覽器對 Google FLoC 喊停! )。因此 Google 隱私沙盒團隊資深軟體工程師 Josh Karlin 日前就針對四大爭議提出了初步的因應解方。 再了解這四大爭議之前,我們先來了解Cookie 的取代技術「 FLoC  」吧! 隱私權至上,廣告精準投放利器 Cookie 惹議! 無論我們瀏覽什麼樣的網站,上面的廣告都跟曾經看過的產品/服務吻合!這一切都要歸功於瀏覽器所支援的第三方Cookie。Cookie 是經由造訪過的網站所建立的檔案,可儲存個人的網站瀏覽行為。廣告業者可藉由 Cookie 所記錄的個人瀏覽足跡,精準投放「客製化的」廣告、並且檢視廣告成效,是撐起龐大數位廣告生態圈的關鍵之一。 隨著使用者隱私意識提高,Cookie 不斷備受爭議,目前已有多個瀏覽器響應阻擋第三方 cookie 的政策。但少了第三方的追蹤,將對數位廣告界帶來重大的變化。因此  Google  在 2019 年開始針對網頁隱私問題進行許多方式的改善,並發起隱私沙盒(Privacy Sandbox)計畫號召各界提案,希望能在保護使用者隱私為前提下,同時滿足廣告投放需求。 其中的第一個提案,就是Google力推的 FLoC 群組聯合學習技術(Federated Learning of Cohorts)。   下篇請看此 連結

今年總結最好用的12項UI/UX網頁設計工具( 四)

圖片
  ​ 本文為下篇,上篇請看此連結 Origami Studio 打造出 FB 與 IG 的UIUX設計 臉書(Facebook)用來打造Instagram的原型 UI/UX設計 工具。即使不會寫程式的設計師也能快速建立App原型(Prototype),還可匯出原始碼給工程師使用,拉近設計師與工程師溝通的距離。臉書(Facebooke)旗下許多使用者介面是Origami Studio設計和建立而成,例如,Instagram、通訊軟體Messenger、社團功能Groups等。 臉書(Facebooke)在 2013 年推出了這個原型製作工具。起初建立在蘋果圖形視覺化應用程式Quartz Composer上的工具,是原生OS X的應用程式,但 Xcode 環境的那部分並不是最好的原型製作選擇。所以臉書(Facebooke)去年推出了 Origami Studio。 ​ https://www.youtube.com/watch?v=c09YzLXcwr4&feature=emb_logo Marvel:產出APP的設計圖 設計者不需會寫程式便能製作「會動」的app,這裡的會動指的是能夠像真正的app那樣操作,但只能呈現靜態的畫面,也無法在手機中真正運行,不過最大好處就是只要有設計圖,就能快速產生初版的Prototype,不需寫出真正的App就讓使用者體驗到 UI/UX設計 ,如果想要修改畫面也能快速修改完成。 ​ https://www.youtube.com/watch?v=Zdjg9yhBqTU&feature=emb_logo Justinmind 節省UI/UX設計的時間 快速一體化的原型 UI/UX設計 可讓設計人員專注於用戶體驗。很容易與最廣泛使用的設計平台結合,包括Sketch和Photoshop,可從這些平台中、瀏覽器或檔案系統中來新增內容和影像,甚至可使用Justinmind建立自己的UI圖庫,並提供全套模板來創建高擬真原型。 ​ https://www.youtube.com/watch?v=lYkC6qaRBe4 上述任何一個設計平台,都很適合目前的 UI/UX設計 師,與其花時間思考使用哪一個平台時,仍還是需要思考問題的本質,「心態」是最重要的一部分,有健康的心,在面對挑戰時試著使用適合的工具找方法解決,讓這些平台為整個團隊工作

今年總結最好用的12項UI/UX網頁設計工具(三)

圖片
  ​ 本文為下篇,上篇請看此連結 Claritee:不會設計仍可從零上手 一款智慧型線框圖 UI/UX設計 工具,可將想法轉換為可視線框圖,是產品開發的關鍵一步,因為它提供一種低成本的可視化方法,無論設計者僅完成單個頁面還是整個網站,都可自動查看互動式原型。團隊可確認投入時間和資源創建過程中,能在原型設計呈現前解決問題。 ​ InVision:讓團隊不失去方向,保持工作進度 在繁雜的團隊工作中,日復一日,總容易迷失與工作效率低落,藉由這一款強化團隊溝通互動的原型 UI/UX設計 平台,簡化工作流程、掌握整體專案進度,縮短工作的流程與溝通。InVision提供從線框圖轉換到UI設計所需的所有元素,輕鬆實現團隊合作的呈現和原型設計。同時支持即時設計修改和收集團隊的快速反饋,設計師通常也會用來管理自己的工作流程。 ​ https://www.youtube.com/watch?v=0qisGSwZym4 Axure RP:我很醜,可是我有脈絡 有別於Sketch介面的美觀,Axure更專注在使用者互動上,兩者各有特點,但剛開始學習 UI/UX設計 容易過於注重表面的視覺呈現 (Visual Design) 而非核心的使用者需求 (User Needs)。Axure 的簡陋反而讓使用者能夠在產品設計前期排除視覺紛擾、專注在真正重要的事情上,快速繪製低擬真 (low-fidelity) 的 Wireframe,同時也可以做到中高擬真 (mid- to high-fidelity) 的互動原型 (Prototype)。 Axure RP將 SVG 導入、Sketch 和Adob​​e XD集成與原型製作功能相結合。可輕鬆的將Adob​​e XD和Draw共享Axure RP原型和畫板,並在螢幕頂部收集輸入。可檢查佈局介面、獲取CSS片段和下載,同時將靜態圖像轉換為動態Axure Cloud原型。Axure RP還增加綜合文檔、自動化紅線和更完整的移交給開發人員,無需程式語言。 ​ https://www.youtube.com/watch?v=X5I__ZDJmBs&feature=emb_logo Framer:解決溝通上的煩惱 製作 UI/UX設計 原型最重要的目的就是「溝通」,近年來許多設計流程裡,開始重視”原型”的重要性,使用Framer原型設計中,使用者可以

今年總結最好用的12項UI/UX網頁設計工具(二)

圖片
  ​ 本文為下篇,上篇請看此連結 Figma:超人氣線上UI/UX設計 在和團隊討論進行時,腦袋靈光一現便可立即記錄下來的線上工具,擁有自由拖曳的編輯器、框線創建,輕輕鬆鬆就將溝通內容即時落實在高擬真度的原型設計中!不僅如此,內建的動畫素材增添身歷其境的呈現效果。 Figma 從推出至今,愈來愈受到 UI/UX設計 師的青睞。這一款基於瀏覽器的協作式設計工具雖被廣泛稱為UX設計應用程式,但也可使用於快速原型設計的軟體。其他功能包括 Figmotion 和 Autoflow 等外掛程式及Arc Tool和Vector Networks 的可用性。 ​ https://www.youtube.com/watch?v=axDzyLEfYgU Webflow:網站編輯,所見即所得 近來流行的線上網頁架站平台,使用者大多介於「外行平面設計師」及「專業網站工程師」之間,即使不會 Coding 和切版,仍可輕鬆建置出個人風格強烈的網站。此平台提供乾淨、語意化的程式語言和設計加速開發人員的工作,內建程式為大眾皆可使用的零編碼,設計者便可直接創建網站的功能與版型,Webflow 會自動轉換為線上可使用的網站,因此不用等全部架構設計完成,便可即時看見在網路上的呈現。 Sketch:歷久不衰的經典UI/UX設計工具 以簡單功能與UI設計專門為訴求,早期成為 UI/UX設計 師慣用軟體,較資深的設計者大多首選以此為主軸的設計流程。可創建各種形式的使用者介面,例如瀏覽器、行動裝置或程式的按鍵執行,因此使用者已達全球數百萬工程師。 Sketch提供流暢的設計介面與豐富的繪圖功能,設計師可創建高質量圖像。強調介面性能的Sketch和可跨平台線上使用的Figma雖不同特點,但能使設計者專注、快速的解決問題才是重點。 ​ https://www.youtube.com/watch?v=qrgDwQ0Fy1k Mockplus:跨部門神器,讓不同團隊的人都看的懂! 簡潔易用並專注於原型設計的 UI/UX設計 軟體,非常適合跨團隊協作。可幫助專案企劃有效的溝通網頁功能、軟體介面、App 互動,透過畫出原型,讓產品經理、設計師、程式開發、主管、客戶之間能夠了解產品本身的使用流程,把想像或文字化為具體可用的示範。 Mockplus支援不同平台  Axure 、 Sketch 、 Adobe Photosh