創新工場“AI蒙汗藥”入選NeurIPS 2019,3年VC+AI佈局進入科研收穫季
本文來自量子位微信公眾號
……………………………………………………………………
NeurIPS 2019放榜,創新工場AI工程院論文在列。
名為“Learning to Confuse: Generating Training Time Adversarial Data with Auto-Encoder”。
一作是創新工場南京國際AI研究院執行院長馮霽,二作是創新工場南京國際人工智慧研究院研究員蔡其志,南京大學AI大牛周志華教授也在作者列。
論文提出了一種高效生成對抗訓練樣本的方法DeepConfuse,通過微弱擾動資料庫的方式,徹底破壞對應的學習系統的性能,達到“資料下毒”的目的。
創新工場介紹稱,這一研究就並不單單是為了揭示類似的AI入侵或攻擊技術對系統安全的威脅,還能協助針對性地制定防範“AI駭客”的完善方案,推動AI安全攻防領域的發展。
NeurIPS,全稱神經資訊處理系統大會(Conference and Workshop on Neural Information Processing Systems),自1987年誕生至今已有32年的歷史,一直以來備受學術界和產業界的高度關注,是AI學術領域的“華山論劍”。
作為AI領域頂會,NeurIPS也是最火爆的那個,去年會議門票在數分鐘內被搶光,而且在論文的投稿錄取上,競爭同樣激烈。
今年,NeurIPS會議的論文投稿量再創新高,共收到6743篇投稿,最終錄取1428篇論文,錄取率為21.2%。
▌“資料下毒”論文入選頂會NeurIPS
那這次創新工場AI工程院這篇入選論文,核心議題是什麼?
我們先拆解說說。
近年來,機器學習熱度不斷攀升,並逐漸在不同應用領域解決各式各樣的問題。不過,卻很少有人意識到,其實機器學習本身也很容易受到攻擊,模型並非想像中堅不可摧。
例如,在訓練(學習階段)或是預測(推理階段)這兩個過程中,機器學習模型就都有可能被對手攻擊,而攻擊的手段也是多種多樣。
創新工場AI工程院為此專門成立了AI安全實驗室,針對人工智慧系統的安全性進行了深入對評估和研究。
在被NeurIPS收錄的論文中,核心貢獻就是提出了高效生成對抗訓練資料的最先進方法之一——DeepConfuse。
▌給數據下毒
通過劫持神經網路的訓練過程,教會雜訊生成器為訓練樣本添加一個有界的擾動,使得該訓練樣本訓練得到的機器學習模型在面對測試樣本時的泛化能力盡可能地差,非常巧妙地實現了“資料下毒”。
顧名思義,“資料下毒”即讓訓練資料“中毒”,具體的攻擊策略是通過干擾模型的訓練過程,對其完整性造成影響,進而讓模型的後續預測過程出現偏差。
“資料下毒”與常見的“對抗樣本攻擊”是不同的攻擊手段,存在於不同的威脅場景:前者通過修改訓練資料讓模型“中毒”,後者通過修改待測試的樣本讓模型“受騙”。
舉例來說,假如一家從事機器人視覺技術開發的公司希望訓練機器人識別現實場景中的器物、人員、車輛等,卻不慎被入侵者利用論文中提及的方法篡改了訓練資料。
研發人員在目視檢查訓練資料時,通常不會感知到異常(因為使資料“中毒”的噪音資料在圖像層面很難被肉眼識別),訓練過程也一如既往地順利。
但這時訓練出來的深度學習模型在泛化能力上會大幅退化,用這樣的模型驅動的機器人在真實場景中會徹底“懵圈”,陷入什麼也認不出的尷尬境地。
更有甚者,攻擊者還可以精心調整“下毒”時所用的噪音資料,使得訓練出來的機器人視覺模型“故意認錯”某些東西,比如將障礙認成是通路,或將危險場景標記成安全場景等。
為了達成這一目的,這篇論文設計了一種可以生成對抗雜訊的自編碼器神經網路DeepConfuse。
通過觀察一個假想分類器的訓練過程更新自己的權重,產生“有毒性”的雜訊,從而為“受害的”分類器帶來最低下的泛化效率,而這個過程可以被歸結為一個具有非線性等式約束的非凸優化問題。
▌下毒無痕,毒性不小
從實驗資料可以發現,在MNIST、CIFAR-10以及縮減版的IMAGENET這些不同資料集上,使用“未被下毒”的訓練資料集和“中毒”的訓練資料集所訓練的系統模型在分類精度上存在較大的差異,效果非常可觀。
與此同時,從實驗結果來看,該方法生成的對抗雜訊具有通用性,即便是在隨機森林和支援向量機這些非神經網路上也有較好表現。
其中,藍色為使用“未被下毒”的訓練資料訓練出的模型在泛化能力上的測試表現,橙色為使用“中毒”訓練資料訓練出的模型的在泛化能力上的測試表現。
在CIFAR和IMAGENET資料集上的表現也具有相似效果,證明該方法所產生的對抗訓練樣本在不同的網路結構上具有很高的遷移能力。
此外,論文中提出的方法還能有效擴展至針對特定標籤的情形下,即攻擊者希望通過一些預先指定的規則使模型分類錯誤,例如將“貓”錯誤分類成“狗”,讓模型按照攻擊者計畫,定向發生錯誤。
例如,下圖為MINIST資料集上,不同場景下測試集上混淆矩陣的表現,分別為乾淨訓練資料集、無特定標籤的訓練資料集、以及有特定標籤的訓練資料集。
實驗結果有力證明,為有特定標籤的訓練資料集做相應設置的有效性,未來有機會通過修改設置以實現更多特定的任務。
對資料“下毒”技術的研究並不單單是為了揭示類似的AI入侵或攻擊技術對系統安全的威脅,更重要的是,只有深入研究相關的入侵或攻擊技術,才能有針對性地制定防範“AI駭客”的完善方案。
隨著AI演算法、AI系統在國計民生相關的領域逐漸得到普及與推廣,科研人員必須透徹地掌握AI安全攻防的前沿技術,並有針對性地為自動駕駛、AI輔助醫療、AI輔助投資等涉及生命安全、財富安全的領域研發最有效的防護手段。
▌還關注聯邦學習
除了安全問題之外,人工智慧應用的資料隱私問題,也是創新工場AI安全實驗室重點關注的議題之一。
近年來,隨著人工智慧技術的高速發展,社會各界對隱私保護及資料安全的需求加強,聯邦學習技術應運而生,並開始越來越多地受到學術界和工業界的關注。
具體而言,聯邦學習系統是一個分散式的具有多個參與者的機器學習框架,每一個聯邦學習的參與者不需要與其餘幾方共用自己的訓練資料,但仍然能利用其餘幾方參與者提供的資訊更好的訓練聯合模型。
換言之,各方可以在在不共用資料的情況下,共用資料產生的知識,達到共贏。
創新工場AI工程院也十分看好聯邦學習技術的巨大應用潛力。
今年3月,“Learning to Confuse: Generating Training Time Adversarial Data with Auto-Encoder”論文的作者、創新工場南京國際人工智慧研究院執行院長馮霽代表創新工場當選為IEEE聯邦學習標準制定委員會副主席,著手推進制定AI協同及大資料安全領域首個國際標準。
創新工場也將成為聯邦學習這一技術“立法”的直接參與者。
▌創新工場AI工程院科研成績單
創新工場憑藉獨特的VC+AI(風險投資與AI研發相結合)的架構,致力於扮演前沿科研與AI商業化之間的橋樑角色。
創新工場2019年廣泛開展科研合作,與其他國際科研機構合作的論文,入選多項國際頂級會議,除上述介紹的“資料下毒”論文入選NeurlPS之外,還有8篇收錄至五大學術頂會,涉及影像處理、自動駕駛、自然語言處理、金融AI和區塊鏈等方向。
┃兩篇論文入選ICCV
Disentangling Propagation and Generation for Video Prediction
https://arxiv.org/abs/1812.00452
這篇論文的主要工作圍繞一個視頻預測的任務展開,即在一個視頻中,給定前幾幀的圖片預測接下來的一幀或多幀的圖片。
Joint Monocular 3D Vehicle Detection and Tracking
https://arxiv.org/abs/1811.10742
這篇論文提出了一種全新的線上三維車輛檢測與跟蹤的聯合框架,不僅能隨著時間關聯車輛的檢測結果,同時可以利用單目攝像機獲取的二維移動資訊估計三維的車輛資訊。
┃一篇論文入選IROS
Monocular Plan View Networks for Autonomous Driving
http://arxiv.org/abs/1905.06937
針對端到端的控制學習問題提出了一個對當前觀察的視角轉換,將其稱之為規劃視角,它把將當前的觀察視角轉化至一個鳥瞰視角。具體的,在自動駕駛的問題下,在第一人稱視角中檢測行人和車輛並將其投影至一個俯瞰視角。
┃三篇論文入選EMNLP
Multiplex Word Embeddings for Selectional Preference Acquisition
提出了一種multiplex詞向量模型。在該模型中,對於每個詞而言,其向量包含兩部分,主向量和關係向量,其中主向量代表總體語義,關係向量用於表達這個詞在不同關係上的特徵,每個詞的最終向量由這兩種向量融合得到。
What You See is What You Get: Visual Pronoun Coreference Resolution in Dialogues
https://assert.pub/papers/1909.00421
提出了一個新模型(VisCoref)及一個配套資料集(VisPro),用以研究如何將代詞指代與視覺資訊進行整合。
Reading Like HER: Human Reading Inspired Extractive Summarization
人類通過閱讀進行文本語義的摘要總結大體上可以分為兩個階段:1)通過粗略地閱讀獲取文本的概要資訊,2)進而進行細緻的閱讀選取關鍵句子形成摘要。
本文提出一種新的抽取式摘要方法來模擬以上兩個階段,該方法將文檔抽取式摘要形式化為一個帶有上下文的多臂老虎機問題,並採用策略梯度方法來求解。
┃一篇論文入選IEEE TVCG
sPortfolio: Stratified Visual Analysis of Stock Portfolios
https://www.ncbi.nlm.nih.gov/pubmed/31443006
主要是對於金融市場中的投資組合和多因數模型進行可視分析的研究。通過三個方面的分析任務來幫助投資者進行日常分析並升決策準確性。
並提出了一個全新的視覺化分析系統sPortfolio,它允許使用者根據持倉,因數和歷史策略來觀察投資組合的市場。sPortfolio提供了四個良好協調的視圖。
┃一篇論文入選NSDI
Monoxide: Scale Out Blockchain with Asynchronized Consensus Zones
https://www.usenix.org/system/files/nsdi19-wang-jiaping.pdf
提出了一種名為非同步共識組 Monoxide 的區塊鏈擴容方案,可以在由 4.8 萬個全球節點組成的測試環境中,實現比比特幣網路高出 1000 倍的每秒交易處理量,以及 2000 倍的狀態記憶體容量,有望打破“不可能三角”這個長期困擾區塊鏈性能的瓶頸。
▌獨特的“科研助推商業”思路
國內VC,發表論文都很少見,為什麼創新工場如此做?
這背後在於其“VC+AI”模式。
最獨特之處在于,創新工場的AI工程院可以通過廣泛的科研合作以及自身的科研團隊,密切跟蹤前沿科研領域裡最有可能轉變為未來商業價值的科研方向。
這種“科研助推商業”的思路力圖儘早發現有未來商業價值的學術研究,然後在保護各方智慧財產權和商業利益的前提下積極與相關科研方開展合作。
同時,由AI工程院的產品研發團隊嘗試該項技術在不同商業場景裡可能的產品方向、研發產品原型,並由商務拓展團隊推動產品在真實商業領域的落地測試,繼而可以為創新工場的風險投資團隊帶來早期識別、投資高價值賽道的寶貴機會。
“科研助推商業”並不是簡單地尋找有前景的科研專案,而是將技術跟蹤、人才跟蹤、實驗室合作、智慧財產權合作、技術轉化、原型產品快速反覆運算、商務拓展、財務投資等多維度的工作整合在一個統一的資源體系內,用市場價值為導向,有計劃地銜接學術科研與商業實踐。
以AI為代表的高新技術目前正進入商業落地優先的深入發展期,產業大環境亟需前沿科研技術與實際商業場景的有機結合。
創新工場憑藉在風險投資領域積累的豐富經驗,以及在創辦AI工程院的過程中積累的技術人才優勢,特別適合扮演科研與商業化之間的橋樑角色。
於是,創新工場AI工程院也就順勢而生。
創新工場人工智慧工程院成立於2016年9月,以“科研+工程實驗室”模式,規劃研發方向,組建研發團隊。
目前已經設有醫療AI、機器人、機器學習理論、計算金融、電腦感知等面向前沿科技與應用方向的研發實驗室,還先後設立了創新工場南京國際人工智慧研究院、創新工場大灣區人工智慧研究院。
目標是培養人工智慧高端科研與工程人才,研發以機器學習為核心的前沿人工智慧技術,並同各行業領域相結合,為行業場景提供一流的產品和解決方案。
而且, 創新工場還與國內外著名的科研機構廣泛開展科研合作。
例如,今年3月20日,香港科技大學和創新工場宣佈成立電腦感知與智慧控制聯合實驗室(Computer Perception and Intelligent Control Lab)。
此外,創新工場也積極參與了國際相關的技術標準制定工作。例如,今年8月,第28屆國際人工智慧聯合會議(IJCAI)在中國澳門隆重舉辦,期間召開了IEEE P3652.1(聯邦學習基礎架構與應用)標準工作組第三次會議。
IEEE聯邦學習標準由微眾銀行發起,創新工場等數十家國際和國內科技公司參與,是國際上首個針對人工智慧協同技術框架訂立標準的專案。
創新工場表示,自身的科研團隊將深度參與到聯邦學習標準的制定過程中,希望為AI技術在真實場景下的安全性、可用性以及保護資料安全、保護使用者隱私貢獻自己的力量。
「景 文 科技大學 放榜」的推薦目錄:
- 關於景 文 科技大學 放榜 在 李開復 Kai-Fu Lee Facebook 的精選貼文
- 關於景 文 科技大學 放榜 在 台灣三六八 Taiwan368 Facebook 的最佳貼文
- 關於景 文 科技大學 放榜 在 景文科技大學-入學服務中心- Posts - Facebook 的評價
- 關於景 文 科技大學 放榜 在 景文科技大學旅遊管理系休閒遊憩管理組 - YouTube 的評價
- 關於景 文 科技大學 放榜 在 景文科技大學放榜、景文cip、景文教務處在PTT/mobile01評價 ... 的評價
- 關於景 文 科技大學 放榜 在 景文科技大學放榜、景文cip、景文教務處在PTT/mobile01評價 ... 的評價
- 關於景 文 科技大學 放榜 在 網路上關於景文科技大學畢業證書-在PTT/MOBILE01/Dcard上 ... 的評價
- 關於景 文 科技大學 放榜 在 網路上關於景文科技大學畢業證書-在PTT/MOBILE01/Dcard上 ... 的評價
- 關於景 文 科技大學 放榜 在 網路上關於景文科技大學畢業證書-在PTT/MOBILE01/Dcard上 ... 的評價
景 文 科技大學 放榜 在 台灣三六八 Taiwan368 Facebook 的最佳貼文
368特輯【我帶高中班導爬玉山】
也許這是很長的一篇文,但適用於人生
-
這裡不講太多當下的過程跟故事,因為這是我的班導,你帶你的班導去爬玉山,創造出來的回憶一定跟我不一樣
-
我為什麼要帶他去爬玉山,因為這是他的人生夢想清單,而她是我所敬重的一名老師,那麼我有能力,當然一定得替他完成這個夢想。
接下來我想跟你們說說,她讓我敬重的原因
-
在求學階段我都是一個很令人頭痛的學生,上課吵鬧、不寫作業、捉弄老師,聯絡簿從小到大都是滿江紅,每天爸媽都要接到老師打電話回家報告我今天在學校又做了什麼好事,而我就是等著回家被修理
-
在我高中以前,每個老師最後都會選擇放棄我,甚至對我有偏見
-
在我高中時期被記了五支大過,一直到被記了第五支大過,有個人還是跟我說:「下次不要再犯了」
-
他說:「他知道我並不壞,只是用錯了方式想要引起別人的注意」
這句話說進我的心坎裡,我從小到大都很調皮,但我也很努力打拼自己的未來,高中被記五支大過,但我還有四支大功
-
數學、國文競試、母親節卡片製作比賽都得過獎,成績一直維持在中上,要不是英文太爛,我也是資優生😂
班級幹部除了被禁選(上課太吵)班長跟風紀股長,其他幹部甚至科聯會的企劃,通通都當過
PS:有次國文段考全班第一名,還被老師叫起來罵,他說你就是這樣上課吵同學,回家自己讀書,來讓自己拿到第一名,說我都用小聰明讀書,大考一定考不好,結果統測全班第一😂
-
高中時期因為家庭因素曾經離家出走過兩次,第一次被抓回家,第二次在統測前幾個禮拜,運用自己的小聰明,趁沒人注意之時,闖進家裡,把需要用的東西(棉被、衣服)都搬走,我跟自己說要自立自強,並無搜刮家裡值錢的東西,只帶走我需要的東西
-
後來為了一張【準考證】,我還是跑去學校上課了,我心想著升學是我唯一能夠讓我的家人刮目相看的管道,結果就在我去學校那天,我的親生媽媽跟我的大姊也跑來抓我…………….
我的養父母不願意來,因為他們說要放棄我這孩子了
-
在輔導室裡,我的生母斥責我厲害的很,我當然句句頂撞回去,我有太多可以替自己抱不平的言論,後來我的班導把我拉了出去
-
他跟我說,他一個外人,家務事他不好意思管太多,他就只說一句話
他說:「生的放一邊,養的大過天」
-
這句話狠狠的打醒了我,後來在冷靜的協議之下,我考量很多,最後還是決定不回家,因為家裡氣氛很…….根本沒辦法好好準備統測
於是我中途入住學校宿舍,最後統測放榜,我考了500分,分發上了國立勤益科技大學
-
雖然我讀不到一年就休學了,但我整個人生,影響最多的就是第二次離家出走以及大學這一年了吧
-
這只是簡單的敘述我求學階段的過往,在這段過往裡面,還有很多內心層面的拉扯,這篇文打到一直哭😭
-
從小我總是認為自己是個缺乏家庭溫暖的小孩
總愛跟姊姊們比較,為什麼姐姐有的東西我沒有
為什麼我調皮搗蛋要被打,姊姊他們做錯事不用被打
到底是不是因為我不是你們親生的
-
一直到現在我才明白…
人一旦開始有了比較之心
想法有了偏差,行為也就開始有了偏差
-
現在的生活我很知足,我希望自己未來真的能給我的家人一個好的生活
-
就像我的高中班導張儷馨說的那句話
-
【生的放一邊,養的大過天】我真的很想報答這份恩情
-
對我來說這些故事也跟我的368計畫息息相關,
因為沒有這些經歷,
也就無法成就現在的我
-
我打出來是希望能夠予以一些人借鏡
這世上沒有冤枉路
也不會有不完美的人生
-
因為
【所有的發生都是最好的發生】
-
#368鄉鎮攝影計劃 #機車環島 #心象攝影 #taiwan #台灣 #臺灣 #nature #風景 #高中 #環島 #台灣好美 #台中市 #南投 #攝影 #夢想 #旅行 #心境 #南投縣 #信義鄉 #信義 #老師 #教師節 #玉山 #台灣最高峰 #所有的發生都是最好的發生 #與誰同行 #高山攝影 #百岳 #玉山主峰
景 文 科技大學 放榜 在 景文科技大學旅遊管理系休閒遊憩管理組 - YouTube 的推薦與評價
歡迎加入 景文科大 休閒遊憩管理組. ... 景文科技大學 旅遊管理系休閒遊憩管理組. 749 views749 views. May 20, 2020. ... <看更多>
景 文 科技大學 放榜 在 景文科技大學放榜、景文cip、景文教務處在PTT/mobile01評價 ... 的推薦與評價
在景文科技大學放榜這個討論中,有超過5篇Ptt貼文,作者TECO2oo也提到幫同學代Po文章目前朋友她27歲,背景是私醫基礎醫學研究所畢業,舊制多益820分主要是做養細胞 ... ... <看更多>
景 文 科技大學 放榜 在 景文科技大學-入學服務中心- Posts - Facebook 的推薦與評價
景文科技大學 -入學服務中心. 4307 likes · 470 talking about this · 5 were here. 您好,我是入學服務中心的小編! 我們會不定期分享有關景文的招生資訊,敬請期待! ... <看更多>