發表文章

目前顯示的是 11月, 2021的文章

基於音樂生成3D舞蹈!人工智慧運用再進化!(上)

圖片
人工智慧學編舞,動作搭配音樂複雜度高 Google 正進行一項 人工智慧 研究,開發稱為「FACT (Full-Attention Cross-modal Transformer)」的模型,可以模仿、理解舞蹈動作,甚至可提高個人的編舞能力。 Google  研究團隊為了訓練該模型,也隨之發布一個大規模、多模態的 3D 舞蹈動作資料庫「AIST++」,包含長達 5.2 小時的 1408 個 3D 舞蹈動作序列,涵蓋 10 種舞蹈類型。都包含了已知相機位置的多視角影片,可生成逼真流暢的 3D 舞蹈動作。 Google  提到:雖然隨著音樂節拍編排出動作,是人類的本能;然而舞蹈是「需要練習」的藝術形式。專業的舞者都需要經過大量的、包含各式各樣舞步的曲目來訓練,才有編舞能力。這樣的訓練,對人類來說已不容易;對 ML(Maching Learning, 機器學習 )來說更是難上加難。因為要使用 人工智慧 來實現編舞,需要生成動力複雜度高的連續動作,同時還要捕捉動作與配樂間的非線性關係。 人工智慧如何學舞?Google修正AIST舞蹈資料庫成教材 Google 從現有的  AIST 舞蹈影片資料庫( 一組帶有音樂伴奏的舞蹈影片,但無任何 3D 信息)生成 3D 動作資料庫。AIST 包含 10 種舞蹈類型:Old School(地板舞 Breaking、機械舞 Popping、鎖舞 Locking 和 Waack)以及 New School(Middle Hip-Hop、LA-style Hip-Hop、House、Krump、Street Jazz 和 Ballet Jazz),雖然包含了許多舞者的多視角影片,但鏡頭都沒有經過校準。  Google  依研究人員的需求,根據常用的  SMPL  3D模型參數,修復 AIST 影片的拍攝校準正後的數值和 3D 人體動作,重建為「AIST++ 數位資料庫」,包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。 未經修正的  AIST 舞蹈影片資料庫 如下所示: Goog...

書摘撰寫交給人工智慧?地標最強寫手:GPT-3(下)

圖片
    本文為下篇,上篇請看此 連結 GPT-3 不只會寫文,還可從長篇大論中摘要重點 GPT-3  可高度理解原作者的撰文意圖,並有效處理;完全沒有其他早期開發的 人工智慧 模型的缺點(例如低精準度、不容易理解使用者的文字意圖⋯⋯等)。因此研究團隊就聚焦在  GPT-3  ,不斷修正與微調,持續提升 人工智慧 理解問題的精準度,因此  GPT-3  能為原本耗時或難以評估時間的任務,提供除了撰文之外,更多的應用方式。 圖片出處:CC0授權圖庫搜尋 GPT-3 新功能解鎖:將12萬字《傲慢與偏見》精煉成200字重點 OpenAI  研究人員不斷開發  GPT-3  的新應用方向。這次,他們成功將  GPT-3  微調成「抓重點」神器。原本擁有 12 萬字詞編排的《傲慢與偏見》長篇名著,被  GPT-3  精煉出總結不到 200 個字詞的小說摘要。 雖然被 人工智慧 精煉成千分之一的字句,但是原著故事內容都完整保留!其他精簡成摘要的著作還有《愛麗絲夢遊仙境》、《羅密歐與茱麗葉》、《自由之心》從生成少許的文字敘述一窺劇情全貌。 人工智慧「寫手」GPT-3 新功能解鎖:將擁有 12 萬字的《傲慢與偏見》精煉成200字重點(圖片出處: OpenAI ) GPT-3 如何生成文字? 就技術面來看,進行判斷文章長度,總結一段長文本分解成較短內容,而在這些短內容的段落中擷取重點,持續縮減字數並且串接成通順可讀內容。這樣對文章內容的分解方式,無論是數十、數百或數千頁都能夠做出總結摘要。 OpenAI  在  GPT-3  透過小說種類的書籍進行訓練模型,平均超過 100,000 個字詞數。這樣的訓練模式可更換為不同的語言、採樣方式及訓練數據類型,並且藉由強化學習以對抗生成方式,提供輕鬆閱讀文字結果。同時,在強化學習中採用三種變體抽樣訓練方式,藉此讓GPT-3確實能理解小說內容表達主軸。 在訓練過程中,研究人員選取 Goodreads 2020 榜單最受歡迎的 40 本書籍,包含奇幻、恐怖、愛情、推理等 20 多種類別,並由兩名研究人員閱讀每本書後寫出其摘要...

書摘撰寫交給人工智慧?地標最強寫手:GPT-3(上)

圖片
人工智慧用200字說完12萬字的故事!GPT-3解鎖「抓重點」新功能 OpenAI  訓練了可以摘要整本書籍的 人工智慧 模型:該模型擁有精煉出整本書重點大綱的能力,像是能快速用 200 字精準描述出 12 萬字的《傲慢與偏見》。 這個人工智慧模型,就是前陣子  OpenAI  的當家技術——自然語言處理模型「 GPT-3 」經過微調過後的版本。 此款微調後的  GPT-3  語言模型,會先依照文章長度進行判斷:文章長度較短的內容就直接擷取結論;長篇文章則先在各片段摘要出重點後,再串接這些重點並摘要出通順的大剛。 再深入了解這個能秒抓重點的人工智慧模型前,我們先來了解一下  GPT-3  的身世! 地表最強寫手—GPT-3 自然語言處理人工智慧 長期致力研究 人工智慧 (AI)的非營利組織── OpenAI  於 2020 年 5 月推出開發出一款自然語言處理模型「 GPT-3 」,目的是為了使用深度學習分類或產生人類可以理解的自然語言。 GPT-2 寫假新聞,獲英國《衛報》認證! 嚇跑創辦人馬斯克? GPT-3 是延續前身  GPT-2  的架構。過去  GPT-2  就以捏造假可亂真的 假新聞 為名,據說因此嚇跑了  OpenAI  創辦人之一的馬斯克! 過去英國媒體《衛報》(The Guardian)就將一則「英國脫歐」的新聞,第一段中的一些句子「餵」給它, GPT-2  可立刻產生另一則似是而非的新聞內容、如同原本的報紙般的編排、以及出現跟原文一樣的人物等。發表過「基於真人真事改編」的英國脫歐 假新聞 。《衛報》甚至認為  GPT-2  產生的句子,幾乎沒有過去 AI 系統撰文所產生的前後語意不一致、或是文法錯誤的問題。 https://www.youtube.com/watch?v=XMJ8VxgUzTc&feature=emb_logo 而  GPT-3 ,身為  GPT-2  的後代,又更是青出於藍。 GPT-3  擁有高達 1750 億個參數的神經網絡,自動生成文字的文字更人性化。只要「餵」給...

Google Maps 出現「最省油的路線」,人工智慧帶你降低通勤污染

圖片
環保與省錢兼得:Google人工智慧定義「省油路線」 國際油價漲不停,光是上個月油價國內油價就連四漲。因石油輸出國家組織和俄羅斯等產油國聯盟(OPEC+)僅「適度地」供應市場,加上美國庫存下降,因此今年油價創 2015 年以來最長連續上漲週數。 而  Google  於 10 月 6 日推出 Google Maps 新功能:透過 人工智慧 技術與美國國家可再生能源實驗室(NREL)數據所提供的「環保路線」,能把紅綠燈等因素考量進去,計算出最省燃油消耗量又兼顧到達時間快速的路線,在落實更多環境保護的理念之餘,也替使用者省下汽油費用。 https://www.youtube.com/watch?v=MbHuSHGZf5U&feature=emb_logo 美國優先上線 明年可望推至其他地區 目前此款新功能先於美國上線,讓使用者抵達目的地除了可選最快路徑之餘,也延伸至節能省碳的領域。預計在 2022 年後,歐洲以及其他地區的用戶也能享用到這款兼顧荷包、行車效率與節能減碳的新功能。 根據  Google  執行長皮查伊(Sundar Pichai)所述,人類的生活習慣與氣候變遷是息息相關的。因此 Google 將持續優化「環保路線」功能,並加以推行至各國,有望在 2022 年底累積超過一億的使用人數。如此一來,全球用戶都機會一起解決環境問題、實現永續經營的理念。 省油、省時、省錢兼具 Pichai 指出:很多人每天通勤的方式——開車,是碳排放量較高的選擇之一。從今天開始, Google  地圖會對「位於」美國的用戶顯示「最省油的路線」(如果最省油路線與最快路線的到達時間相近的話);相同也將於 2022 年後適用於歐洲的用戶。此「省油路線」預計每年可減少超過一百萬噸的碳排放量(相當於路上少了超過 20 萬輛車),還能幫使用者節省汽油費用。 另外,如果「省油路線」省下的油耗量過少或使行車時間大幅增加時,Google 地圖會顯示不同路線之間相對省下的油耗量,方便用戶進行比較。 節能減碳優先!Google 搜尋加強曝光油電/電動車 除了「省油路線」之外, Google  也調整自家的搜尋功能,讓用戶更容易看到油電混合或電動車的選項、並且與...

人工智慧醫療神助攻,腸癌準內視鏡AI探測,靈敏度高達99.7%!

圖片
致命大腸癌年奪五千條命!腸道結構複雜漏診率增 根據衛福部最新統計,癌症已蟬聯 39 年國人死因首位,平均一年奪走 5 萬左右的生命;而最新癌症死因的前三名分別為肺癌、肝癌、大腸癌。 隨著醫療科技的進步,腸癌檢查的內視鏡敏感性及準確性都高過其他的檢查方法——透過內視鏡,可直視、活檢或全瘤切除,但礙於大腸的結構、病變差異等原因,時常發生漏診的狀況。 人工智慧醫療 首例!內視鏡輔助 AI 獲FDA批准   「GI Genius」的官方介紹影片(影片嵌入自 https://www.medtronic.com/) 近期,全球首例獲得 FDA(美國食品藥物監督管理局)批准的腸癌瘜肉檢測系統—「GI Genius」系統是內視鏡  AI  輔助檢測工具,也是大腸癌篩檢領域中第一款使用機器學習的 人工智慧醫療 輔助系統。 在大腸鏡檢查過程中,該系統會識別並標示出潛在病變 (例如息肉或疑似腫瘤) 的部位,提醒臨床醫師必須進一步評估或處理,例如組織採樣或切除息肉等。 大大減低大腸癌發生率!人工智慧醫療檢測靈敏度達 99.7%   影片左側、右側分別展示一般內視鏡、GI Genuis 所照出來的畫面。(影片嵌入自  https://www.medtronic.com/ ) 研究結果顯示,GI Genius 檢測速度比醫生還快,靈敏度可達 99.7%、錯誤率低於 1%,大大提高瘜肉的檢出率,甚至連傳統大腸鏡不容易檢出的「扁平息肉」都能驗出!大腸癌主要是由大腸內的腺瘤瘜肉癌化所導致,透過這樣的 人工智慧醫療 系統,就能落實早期發現腺瘤瘜肉並切除之,大大地減少大腸癌的發生。所以醫生可用 GI Genius 提高檢測準確度、降低罹癌風險:體內腺瘤檢出率每增加 1%,腸癌風險就跟著降低 3%。 這次美國 FDA 依據「GI Genius」的臨床試驗數據,首次批准人工智慧醫療器材應用在臨床上,也是第一個智慧醫療案例。「GI Genius」能提高腸胃道病變的篩檢率、減少病灶的遺漏跟誤判,可見 2021 已進入智慧醫療領域的時代,未來會有越來越多的  AI  醫療開始用於臨床來輔助醫師。

洗錢猖獗,人工智慧應戰!重新定義反洗錢新規則(下)

圖片
本文為下篇,上篇請看此 連結 人工智慧應用於防制洗錢的方式: 從大數據中辨識可疑訊息 所有的網路資料,最初都是未整理的大數據,是非結構式的資訊。而 人工智慧 可自動判別非結構式的網路資訊,若偵測到跟金融交易或相關資訊,便能迅速提前通知,以有效防範詐騙或是大量金錢的異常出入。 人工智慧挖掘交易者的人際關係 問題帳戶背後所呈現的個體、群體交易聯繫,可讓 人工智慧 透過最短路徑算法搜尋洗錢個體之間的中介。比如:若是企業與企業之間帳戶,直接交易百萬金額,其洗錢疑慮較低;若是百萬金額分批從數個不同公司轉出,但共同轉入的相同的個人帳戶,其疑慮就比較高。 自然生成可疑活動報告(SAR) 根據 1970 年的銀行保密法(BSA),反洗錢技術通常不會在其他報告(例如:貨幣交易報告)下標記可疑活動。金融機構有責任在 30 天內就其認為可疑或異常的任何賬戶活動提交報告。如有必要收集更多證據,可延長不超過60天。 交易監控閥值 依循交易偵測需求(例如:金額、次數、天期…)可依需求於系統上自行調整,即時監控可疑交易。(例如:個人帳戶與企業帳戶分類不同,交易的監控標不同) 如何判別疑似洗錢的客戶交易 當消費者進行免臨櫃的線上開戶,要如何進行身份認證?如何確認消費者本人真的有交易的意願?歸功於 人工智慧 發展的突飛猛進,AI 擁有「了解你的客戶」(Know Your Customer,KYC)以及「了解你的員工」(Know your Employee,KYE)的反內部詐欺制度。 善用防制洗錢的 人工智慧 應用與技術,便能協助反洗錢的工作人員們能專心擬定更精明的應對策略、工作效率也隨之更高!    

洗錢猖獗,人工智慧應戰!重新定義反洗錢新規則(上)

圖片
從 2020 年開始, COVID-19  疫情所帶來的經濟破壞,導致消費者與金融機構間的交易迅速轉往線上支付。許多面臨物價通膨的民眾,在荷包不斷縮水的情況下開始思考,若只將錢存入銀行過於欠缺彈性,但是使用信用卡、銀行貸款或融資,卻侷限在個人的信用評比而有其限制。因此,非銀行體系的私人金融單位在前述狀況下得以興起;這些單位濫用網路的各種交易工具,利用個人以利滾利的投機心態,催生了購買資產、存入金融機構帳戶或匯至人頭帳戶等洗錢方式。 (示意圖/取自網路) 機會伴隨風險,需投入洗錢防制人力 獲得2020年度最佳「反洗錢解決方案」,全球數據分析領域領導者(SAS)、安侯建業聯合會計事務所(KPMG),及台灣反洗錢推廣協會(ACAMS)最新發布的反洗錢技術研究顯示,美國銀行業每年投入反洗錢的預算已高達 250 億美元,因此各國財政部試圖建立更加嚴謹精準的反洗錢機制。台灣的金融監督管理委員會,作為主管反洗錢政策的政府機關,則在2020年8月正式發布「金融科技發展路徑圖」,積極協助各金融機構尋求新的市場需求與價值,共同打造安全的金融科技生態圈。 目前大部分銀行均採用「規則基礎系統」(rules-based)的方法偵測非法洗錢。但是,面對系統每次數千甚至上萬筆警訊,卻只能先以人工過濾判斷。同時,隨著偵測技術與時俱進,相關工作人員也增加不少負荷心力。因此,在金融單位系統不見得有良好串接或資料管理,便需藉由新的科技工具主導改變環境。 金融資安守門員: 人工智慧 定義反洗錢新規則 在各國不斷構思下,經過改良的資安技術,不只可用來保障網路安全,同時也能減輕人力負擔。SAS 就許多國外金融機構發展的經驗指出,人工智慧(AI)和 機器學習 技術(ML),在反洗錢趨勢下不斷成長,超過半數以上(57%)受訪者已經在反洗錢程序中部署 AI/ML,或預計在 12-18 個月內設置這項技術。因此, 人工智慧 的運用不只作為產品服務面的多樣化,更成為金融業發展洗錢防制的核心技術,有助於在大數據中找出共通模式與連結,實踐資安的核心價值。 下篇請看此 連結

Google針對FLoC取代Cookie4大爭議,提出解決辦法(下)

圖片
本文為下篇,上篇請看此 連結 FloC將使用者分群,取代 Cookie個人識別 https://www.youtube.com/watch?v=J8sBCPYDHJo FLoC  將讓  Google  旗下產品不再倚賴 Cookie來紀錄分析個人使用行為。相較於識別「個人」行為的 Cookie, FLoC 是依據使用的網站瀏覽行為,將行為相似的人們分成多個群組,每個群組擁有一組 ID,廣告主再針對同一群組顯示相關的廣告。 FLoC 的作法雖然可讓人們隱身在興趣相投的群組中,而且所有瀏覽歷史紀錄以及其他數據都將保留在本地。不過還是受到各界不同的質疑意見。 Google  隱私沙盒的核心工程師 Josh Karlin 就將  FLoC  發佈至今所受到的爭議歸納成以下四點,並加以答覆: 爭議一、網站會被自動加入FLoC的廣告投放實驗中 Josh Karlin 回應:現在已不會自動將網站加入  FLoC  的廣告投放實驗中,而是由網站選擇是否透過 API 加入。 爭議二、群組代號太抽象,無論是使用者與技術專家都不易理解 Josh Karlin 回應:為了讓用戶、技術專家更好理解群組概念,他將改以基於領域的主題名稱(Topic)取代原本的群組代號(Cohort)。例如:原本的群組代號為數字「21849」被「美麗與健康」這樣的興趣分類取代。 這些方式讓瀏覽網頁的使用者,清楚的理解自己怎麼被敘述,並透過明確的主題內檢視是否涉及敏感的資訊。 爭議三、FLoC 的群組容易被數位指紋技術(註:fingerprinting,數位指紋提取,用以收集使用者手機、電腦型號等訊息)追蹤; Josh Karlin 回應:說透過上述的主題標籤分類方式,預計可將原本的上萬個代號群組,減少至數百種的主題標籤群組,進一步降低群組被用於指紋追蹤的可能性 爭議四、敏感性資訊仍有被洩露的疑慮。 Josh Karlin 回應:「這些主題名稱將由人為策劃,以確保它們不含敏感性資訊」。就長遠看來,分類方法最好由外界建置與維護。 Google還在考慮,未來新增讓用戶選擇不要加入特定主題的功能。 結論:  Google  正在嘗試以主題取代群組分類的方法,減少外界對  ...

Google針對FLoC取代Cookie4大爭議,提出解決辦法(上)

圖片
Google將棄Cookie廣告追蹤 新技術FLoC爭議多 Google 聲明即將在 2022 年終止 Chrome 瀏覽器支援 Cookie,並且以自家開發的廣告追蹤新技術「 FLoC 」取代(詳請可參考本文: Google 為保護隱私,棄 Cookie 卻改用人工智慧? ),不過也引發了不小爭議 (參見: 「恐怕會助長歧視」WordPress 與多家瀏覽器對 Google FLoC 喊停! )。因此 Google 隱私沙盒團隊資深軟體工程師 Josh Karlin 日前就針對四大爭議提出了初步的因應解方。 再了解這四大爭議之前,我們先來了解Cookie 的取代技術「 FLoC  」吧! 隱私權至上,廣告精準投放利器 Cookie 惹議! 無論我們瀏覽什麼樣的網站,上面的廣告都跟曾經看過的產品/服務吻合!這一切都要歸功於瀏覽器所支援的第三方Cookie。Cookie 是經由造訪過的網站所建立的檔案,可儲存個人的網站瀏覽行為。廣告業者可藉由 Cookie 所記錄的個人瀏覽足跡,精準投放「客製化的」廣告、並且檢視廣告成效,是撐起龐大數位廣告生態圈的關鍵之一。 隨著使用者隱私意識提高,Cookie 不斷備受爭議,目前已有多個瀏覽器響應阻擋第三方 cookie 的政策。但少了第三方的追蹤,將對數位廣告界帶來重大的變化。因此  Google  在 2019 年開始針對網頁隱私問題進行許多方式的改善,並發起隱私沙盒(Privacy Sandbox)計畫號召各界提案,希望能在保護使用者隱私為前提下,同時滿足廣告投放需求。 其中的第一個提案,就是Google力推的 FLoC 群組聯合學習技術(Federated Learning of Cohorts)。   下篇請看此 連結