分享好文,中學生要學電腦嗎?
作者:創新工場CTO、人工智慧工程院執行院長 王詠剛
文章来自半轻人微信公众号(ban-qing-ren)
………………………………
朋友的孩子高中剛畢業,已拿到美國頂尖大學(非電腦專業)的錄取通知。疫情影響,不知何時才能去學校報到。孩子想抓緊學習一下程式設計,為大學打好基礎。這孩子找我聊了一個多小時,從如何學程式設計,聊到非電腦專業和電腦專業的路徑差異,又聊到如何從不同角度認識電腦與程式設計。聊得比較寬泛,不知是否對這孩子有用。
回想我自己的高中時代:那時雖迷戀程式設計,卻完全沒有懂行的人指導。在我們那個四線城市的廠礦中學裡,開設電腦興趣課的老師知道的資訊還沒我多。我高一時跑到北京中關村逛街,卻完全沒意識到中國第一代頂尖程式師當時就在我身邊的低矮辦公樓裡寫代碼(這話說得並不準確,比如求伯君那年就主要是在珠海做開發),鼎鼎大名的UCDOS、WPS、CCED就出自他們之手……我在當時街邊的一家書店(位置似乎就在今天的鼎好大廈對面)買到了許多種印刷品質極低劣的電腦圖書。用今天的標準看,那就是一批盜版影印或未授權翻譯的國外圖書。可那批書竟成了我高中時代最寶貴的程式設計知識來源。
顯然,我在高中時根本就是野路子學電腦。現在後悔也沒用,當時我的眼界或能觸及的資源就那麼多。如果能穿越回30年前,我該對喜歡程式設計的自己說些什麼呢?這些年,我與世界上最好的一批程式師合作過,也參與過世界上最有價值的軟體系統研發——我所積累的一些粗淺經驗裡,有哪些可以分享給一個愛程式設計的中學生?
【問題1】中學生要不要學電腦?
當然要!
每個中學生都要學。只不過——建議大部分中學生使用“休閒模式”,小部分(不超過10%)中學生使用“探險模式”。
啊?兩個模式?那我該進入哪個模式?⟹請跳轉至【問題2】
【問題2】選哪個模式?
你癡迷電腦嗎?比如,你玩遊戲時會特別想知道這遊戲背後的代碼是如何編寫的嗎?再比如,就算老師家長不同意你學電腦,甚至當著你的面把電腦砸了,你也要堅持學電腦嗎?如果是,恭喜你進入“探險模式”⟹請跳轉至【問題200】
你對數學有興趣嗎?比如,你看到街邊建築的曲線,就會在腦子裡琢磨曲線對應的函數或方程嗎?每當手裡攥著幾粒骰子,你就會不由自主地計算概率嗎?如果是,歡迎進入“探險模式”⟹請跳轉至【問題200】;當然,如果有些猶豫,也可以先進入“休閒模式”⟹請跳轉至【問題100】
即便你對電腦和數學興趣不大,家長、老師還是強烈建議你學電腦嗎?就算你一百個沒時間一千個不願意,家長、老師還是會逼著你學電腦嗎?如果是,建議你主動進入“休閒模式”並向家長、老師彙報說“我已經按照前谷歌資深軟體工程師的專業建議在認真學程式設計了”⟹請跳轉至【問題100】
其他情況,一律進入“休閒模式”。⟹請跳轉至【問題100】
【問題100】休閒模式 | 主要學什麼?
“休閒模式”將電腦視為我們生活、工作中的必備工具,主要學習如何聰明、高效、優雅地使用計算設備。這裡說的計算設備,包括所有形式的電腦、手機、遊戲機、智慧家電以及未來一定會進入生活的自動駕駛汽車。
什麼什麼?你已經會用電腦、會玩手機、會打遊戲了?別著急,慢慢往下看。
【問題101】休閒模式 | 我會用搜尋引擎嗎?
我知道你會用百度搜習題答案。但,習題答案不是知識。你會用搜尋引擎來搜索和梳理知識嗎?請試著用電腦和你喜歡的搜尋引擎來解決如下兩個問題:
(1)圓周率𝜋的計算方法有多少種?每種不同的計算方法分別是由什麼人在什麼時代提出的?借助電腦,今天人們可以將圓周率𝜋計算到小數點後多少位?將圓周率𝜋計算到小數點這麼多位元,一次大概需要花掉多少度電?
(2)全球大約有多少個廁所?在發展程度不同的國家,分別有多少比例的人可以享用安裝了抽水馬桶的衛生廁所?為什麼比爾·蓋茨曾大力推動一個設計新型馬桶的研發專案?比爾·蓋茨的公益組織在這個專案上大約花費了多少資金,最終收到了多大的效果?
如果你沒法快速得到上述問題的全部答案,那就給自己設一個小目標:一個月內,學會用搜尋引擎系統地獲取、梳理一組知識點的全部技巧。
【問題102】休閒模式 | 接下來學什麼?
建議學好典型的工具軟體。比如,我知道你會用Office了,但用Office和用Office是很不一樣的。對生活、學習、工作來說,學好、學透一個工具軟體比鑽研程式設計技巧更實用。
你會用Excel來管理班級公益基金的預算和實際收支情況嗎?
你會用Excel做出過去20年裡全球大學排名的演變趨勢圖嗎?
你會用Word排版一篇中學生論文嗎?論文中的圖表和最後的參考文獻部分該如何排版?
你會用Word編排一份班級刊物,包含封面、扉頁、目錄、插圖頁、附錄、封底等部分,可以在列印後直接裝訂成冊嗎?
PowerPoint呢?你有沒有研究過蘋果公司發佈會上那些幻燈片的設計?當約伯斯(多年以前)或蒂姆·庫克站在幻燈片前的時候,他們的演講思路是如何與幻燈片完美結合的?
還有哦,別忘了學學如何為數碼照片做後期,如何用電腦或手機剪視頻,如何為剪輯好的視頻配字幕,如何將照片、音樂、視頻等素材結合起來,做出一段吸引人的快手/抖音短視頻。
最後,抽空玩玩那些設計精妙的遊戲吧,比如《紀念碑穀》、《塞爾達傳說:曠野之息》之類;同時,遠離那些滿屏廣告,或者一心騙你在遊戲裡充值花錢的垃圾。
【問題103】休閒模式 | 不學學知識嗎?
當然要學知識。下面每種實用的電腦知識都夠大家學一陣子了。
(1)色彩知識:你知道同一張數碼照片在不同品牌的手機螢幕上、不同的電腦螢幕上、不同的智慧電視上顯示時,為什麼經常有較大色差嗎?你知道有一些色彩只適合螢幕顯示,不適合列印輸出嗎?你知道軟體工具裡常用的RGB、HSL之類的色彩空間都是什麼意思嗎?如何在設計PowerPoint幻燈片時選擇一組和諧美觀的色彩?
(2)字體知識:你知道什麼是襯線字體,什麼是無襯線字體嗎?你知道網頁中常用的英文字體都有哪些嗎?你知道商務演講時最適用于幻燈片的英文字體有哪些嗎?你知道電腦和手機常用的黑體、宋體、仿宋體、楷體等中文字體分別適合哪些實際應用場合嗎?你會將不同字體混排成一個美觀的頁面嗎?
(3)網路知識:你知道5G是什麼嗎?你知道5G和4G在通信頻寬、通信距離上的具體區別嗎?你知道什麼是路由器,什麼是防火牆嗎?你知道如何配置路由器,如何配置防火牆嗎?微信或QQ聊天時,對方發的文字、語音或視頻是如何傳送到你的手機上的?
(4)應用知識:淘寶中搜索得到的商品資訊是從哪裡來的?商品是按什麼方式排序的?為什麼購物APP經常會推薦給你一些曾經買過、看過的商品?你知道如何為自己建立個人網站嗎?你知道如何管理微信公眾號嗎?
(5)安全知識:你知道網路上的釣魚攻擊是怎麼回事兒嗎?你知道什麼是電腦漏洞嗎?你知道駭客為什麼想把一大批受攻擊的電腦變成可以遠端操控的傀儡機嗎?你知道為什麼現在很多手機APP都要通過短信發送驗證碼嗎?如果驗證碼被壞人截獲,你會面臨哪些風險?
這裡只是舉例。實用的電腦知識還有很多。大家可以自己發掘。
【問題104】休閒模式 | 我需要學程式設計嗎?
可以學,但不是必須。即便學,也只需要根據自己的需要,學那些最能幫你解決現實問題的部分。
【問題105】休閒模式 | 我該學什麼程式設計語言?
在“休閒模式”裡,電腦就是工具,程式設計也是工具,夠用就好。學什麼程式設計語言,完全看你想要電腦幫你做什麼。
• 如果你想對資料處理有更多自主權,那不妨學學Python;
• 如果你想做簡單的交互演示程式,那就先把JavaScript學起來;
• 如果你想更好、更快地寫論文,那不妨學學LaTeX(什麼什麼,LaTeX不是程式設計語言?你太小看LaTeX了);
• 如果你想學做簡單的手機APP,那麼,Android手機就學Java,蘋果手機就學Swift好了;
• 如果你只想知道程式設計是怎麼回事,那……從Python或JavaScript開始就行。其實,跟五六歲的小朋友一起學學Scratch圖形程式設計也不錯。
【問題106】休閒模式 | 我需要學人工智慧嗎?
在“休閒模式”裡,最需要學的不是“人工智慧的實現原理”,而是“什麼是人工智慧”,以及“人工智慧能做什麼,不能做什麼”。
• 在手機上試一試,人工智慧做語音辨識時能做到什麼水準?哪些話容易識別,哪些話不容易識別?
• 打開機器翻譯軟體,試一試哪些資訊翻譯得好,哪些資訊翻譯得不好?
• 手機上的拍照軟體一般都有人臉識別功能。試一試人臉識別在什麼場景下做得好,什麼場景下做得不好?
• 找一部講人工智慧的科幻電影,用自己的判斷解讀一下,電影裡哪些技術有可能成為現實,哪些技術存在邏輯矛盾。
【問題107】休閒模式 | 推薦什麼參考書、參考文獻?
書不重要,豆瓣評分7分以上的電腦應用、程式設計甚至科普類圖書都可以拿來翻翻。
直接在知乎裡搜索你想瞭解或學習的知識點可能更有效率。
如果你意猶未盡,覺得自己剛活動開筋骨,還想挑戰更高層次,歡迎進入“探險模式”。⟹請跳轉至【問題200】
否則,“休閒模式”到此結束。⟹請離開此問答
【問題200】探險模式 | 主要學什麼?
“探險模式”需要有挑戰精神。電腦科學的世界技術演進快,脈絡複雜,要想在探索時不迷路,你得通過有順序、有系統地學習電腦知識,慢慢構建出一張可以在未來幫你走得更遠的思維地圖來。
在“探險模式”裡,電腦就不止是一件能快速計算的工具了。電腦更像是我們大腦的一種延伸。這既包括認知能力的延伸,也包括認知邏輯的延伸。隨著學習深入,大家會逐漸體會到電腦所具有的多維度能力:
電腦是一種可以表示不同類型資訊(數、符號、文字、語音、圖像、視頻、虛擬空間、抽象邏輯)的“資訊管理機”;
同時,電腦也是一種可以連續執行指令以完成特定的資訊處理任務的“指令處理機”;
同時,電腦還是一種可以在知識與邏輯層面完成特定推理任務的“知識推理機”;
同時,電腦也是一種可以從人類給定的資料或自我生成的資料中總結規律,建立模型,自主完成某些決策的“智慧學習機”。
“探險模式”的目標就是盡可能準確地認識電腦,掌握有關電腦運行的最基本規律。有了這些基礎。未來在大學期間或工作中,你就能更容易地設計電腦軟硬體系統,或是設計出碳基大腦(人類)與矽基大腦(機器智慧)之間的最佳協作方案。
【問題201】探險模式 | 我的英語水準足夠嗎?
蘋果每年秋季的新品發佈會,不加字幕的話,你能聽懂多少?
能聽懂大部分:建議在學習電腦的過程中,盡可能使用英文教材、英文文檔。
能聽懂小部分:建議將原來準備學電腦的時間,分出一部分來學英語。
只能聽懂“你好”“再見”之類:⟹請離開此問答。然後,把原來準備學電腦的時間用於學英語,六個月後再回來。
【問題202】探險模式 | 我的數學水準足夠嗎?
如果你是數學和數學應用小能手——較複雜的數學問題總能快速找到核心思路,或快速簡化為簡單問題;很容易就能將抽象概念映射到具體的數學圖形,或將數學問題與相應的現實問題關聯在一起:請繼續探險之旅。
如果你應付正常數學課程感到吃力:建議將原來準備學電腦的時間,分出一部分來學數學。
如果你還搞不清楚什麼是方程、函數、集合、概率……:⟹請離開此問答。然後,把原來準備學電腦的時間用於學數學,六個月後再回來。
【問題203】探險模式 | 為什麼強調英語和數學?
(1)統計上說,最好的電腦參考資料大都是英文寫的,最好的電腦課程大都是用英文講的,最新的電腦論文大都是用英文發表的。
(2)函數、方程、坐標系、標量、向量、排列組合、概率這些中學數學裡會初步學習到的數學知識,是電腦科學的基礎。
【問題204】探險模式 | 電腦知識那麼多,正確的學習順序是什麼?
最重要的順序有兩個。建議先從順序一開始,學有餘力時兼顧兩個順序。
順序一:自底向上,即,自底層原理向上層應用拓展的順序。
電腦原理的基礎知識:
為什麼每台電腦(包括手機)都有CPU、記憶體和外部設備?
(馮·諾依曼體系結構的)記憶體中為什麼既可以存儲資料,也可以存儲指令?
CPU是如何完成一次加法運算的?
程式設計語言的基礎知識:
資料類型,值,變數,作用域……
語句,流程控制語句……
過程、方法或函數,類,模組,程式,服務……
編譯系統的基本概念:
電腦程式是如何被解釋或編譯成目標代碼的?
演算法和資料結構的基礎知識:
陣列,向量,鏈表,堆,棧,二叉樹,樹和圖……
遞迴演算法,排序演算法,二叉樹搜索演算法,圖搜索演算法……
應用層的基礎知識:
為什麼電腦需要作業系統?設備驅動程式是做什麼的?
網路通信的基本原理是什麼?流覽器是怎麼找到並顯示一個網頁的?
資料庫是做什麼用的?
虛擬機器是怎麼回事?
人工智慧系統的基礎知識:
先熟悉些線性代數、概率和數學優化的基礎知識。
什麼是機器學習?從簡單的線性回歸中體會機器學習的基本概念、基本思路。
什麼是神經網路?什麼是深度神經網路?為什麼神經網路可以完成機器學習任務?
如何使用PyTorch或TensorFlow實現簡單的深度學習功能?
順序二:自頂向下,即,自頂層抽象邏輯向下層具體邏輯拓展的順序。
• 電腦的本質是什麼?
• 什麼是圖靈機?什麼是通用圖靈機?
• 什麼是讀取﹣求值﹣輸出迴圈(Read–eval–print Loop,REPL)?
如何用自頂向下的方式理解(解析、解釋、編譯)一段程式碼?
• 靜態語言和動態語言的區別?
如何理解變數與資料類型之間的綁定關係?
• 什麼是函數式程式設計?
程式設計語言中,函數的本質是什麼?
函數為什麼可以像一個值一樣被表示、存儲、傳遞和處理?
• 什麼是物件導向?
類的本質是什麼?
如何用物件導向的方式定義個功能介面?
如何依據介面實現具體功能?
• 什麼是事件驅動?
什麼是事件?事件如何分發到接收者?
如何在事件驅動的環境中理解代碼的狀態和執行順序?
【問題205】探險模式 | 如何提高程式設計水準?
在掌握基本知識體系的基礎上,學好程式設計只有一條路:多程式設計,多參加程式設計比賽,多做程式設計題,多做實驗項目,多找實習機會——其中,能參與真實專案是最有價值的。
【問題206】探險模式 | 該從哪一門程式設計語言學起?
我個人推薦的程式設計入門語言(可根據情況任選):
Python
Java
Swift
C#
JavaScript / TypeScript
Ruby
……
可能不適合入門,但適合後續深入學習的語言:
C
C++
Go
Objective-C
組合語言
機器語言(CPU指令集)
Shell Script
Lua
Haskell
OCaml
R
Julia
Erlang
MATLAB
……
【問題207】探險模式 | 如何選參考書和參考資料?
(1)強烈推薦的參考書和參考資料:
• MIT、Stanford、CMU、UC Berkeley這四所大學中任何一個電腦專業方向使用的教學參考書或參考資料。網上可以查到這些學校電腦專業方向的課程體系,有的學校甚至公開了課程視頻。其中往往會列舉參考書和參考資料連結。
• 維琪百科(英文)上的數學、電腦科學相關條目。
• Github上star數在1000以上的開原始程式碼和開來源文件。
(2)強烈推薦但須小心辨別的參考資料:
知乎上的數學、電腦科學相關條目。使用時需要格外注意三件事:
儘量只看高贊答案或高贊文章;
辨別並避開廣告軟文;
辨別並避開純抖機靈的故事或段子。
Stack Overflow上的程式設計問題解答:
自己動手實驗,辨別解答是否有效。
CSDN上的程式設計問題解答:
自己動手實驗,辨別解答是否有效。
(3)其他推薦的參考書和參考資料:
國內專業作者寫作的專業技術書籍(豆瓣評分7分以上的)。
大廠(Google、Facebook、Microsoft、Amazon、阿裡、騰訊、百度、頭條等)資深工程師的技術公號、專欄、博客等。
著名圖書系列:如O’Reilly的動物封面的系列圖書(請注意最新版本和時效性)。
國內翻譯的著名技術圖書(譯本在豆瓣評分7分以上的)。
(4)儘量避免的參考書和參考資料:
• 已經過時的圖書或參考資料。
• 作者或譯者人數比章節數還多的專業圖書。
• 百度百科上的數學或電腦科學相關資料。
什麼什麼?你這篇問答居然沒有推薦一本具體的圖書?是,沒錯。如果你覺得即便有了上面的線索,自己還是找不到好書好資料,那也許你還是適合“休閒模式”⟹請跳轉至【問題100】
同時也有1部Youtube影片,追蹤數超過8萬的網紅與芬尼學英語 Finnie's Language Arts,也在其Youtube影片中提到,?【成人英語再起步】網上課程 ► http://bit.ly/2We1n2Q YouTube 觀眾十二月特備優惠:購買【成人英語再起步網上課程】,用信用卡結賬時,可用優惠碼「YOUTUBEDEC20」,以 $1,299 優惠價購買第一期(原價 $1,499);更可以以 $2,499 優惠價購買第一期...
「google翻譯語音輸出」的推薦目錄:
- 關於google翻譯語音輸出 在 李開復 Kai-Fu Lee Facebook 的最讚貼文
- 關於google翻譯語音輸出 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
- 關於google翻譯語音輸出 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
- 關於google翻譯語音輸出 在 與芬尼學英語 Finnie's Language Arts Youtube 的最讚貼文
- 關於google翻譯語音輸出 在 [新聞] 狹路相逢勇者勝– Google會用其Transfor - 看板Tech_Job 的評價
- 關於google翻譯語音輸出 在 JavaScript (9) – Google 的語音合成API 之使用(作者:陳鍾誠) 的評價
- 關於google翻譯語音輸出 在 google翻譯語音輸出的問題包括PTT、Dcard、Mobile01 的評價
- 關於google翻譯語音輸出 在 google翻譯語音輸出的問題包括PTT、Dcard、Mobile01 的評價
- 關於google翻譯語音輸出 在 google翻譯語音輸出的問題包括PTT、Dcard、Mobile01 的評價
- 關於google翻譯語音輸出 在 google翻譯聲音設定-在PTT/MOBILE01上汽車保養配件評價分析 的評價
- 關於google翻譯語音輸出 在 google翻譯聲音設定-在PTT/MOBILE01上汽車保養配件評價分析 的評價
- 關於google翻譯語音輸出 在 google translate廣東話語音輸出的推薦與評價,PTT、DCARD 的評價
- 關於google翻譯語音輸出 在 google translate廣東話語音輸出的推薦與評價,PTT、DCARD 的評價
- 關於google翻譯語音輸出 在 新版Google翻譯無法英文發音? 的評價
google翻譯語音輸出 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
Google開源可即時產生精確文字的AI模型LaserTagger
LaserTagger的預測速度,是常用文字處理方法Seq2seq的100倍,可用在許多需要即時回應的場景
文/李建興 | 2020-02-03發表
Google研究人員開發了一種人工智慧文字編輯模型,可以預測編輯操作序列,把來源文字轉換成為目標文字,Google表示,LaserTagger是一種精確不易出錯的文字產生方法,且比過去的方法更易於訓練,改進後的模型架構執行速度也更快。
Seq2seq(Sequence-to-sequence)是一種用來處理語言的機器學習方法,可以應用在段落融合、文字摘要和語法錯誤糾正等文字編輯工作。Google提到,Seq2seq模型的發明,改變了機器翻譯的領域,因為其改進的模型結構,並以非監督式預訓練使用大量未標註文字的特性,讓神經網路方法輸出的品質得以大幅提升。
不過,Seq2seq仍然有不少需要克服的缺點,最主要有三點,該方法會生成輸入所不支援的文字,也就是產生幻覺(Hallucination),而且需要大量的訓練資料,輸出才能達到可接受的品質,還有Seq2seq產生文字的方式為逐字產生,因此不可避免地,文字產生的速度較慢。
Google最新有關人工智慧文字處理的論文,發表最新的LaserTagger模型,改善Seq2seq的三項主要缺點,該模型的特色就像是名稱LaserTagger中的雷射一樣,速度和精確度的表現非常好,LaserTagger不會從頭開始產生文字,而是透過預測一系列編輯操作產生最終文字,而非實際預測單詞來產生輸出。
Google提到,許多文字產生的工作,其輸出與輸入有極高的重疊,例如在檢測和糾正錯誤,或是融合句子的時候,通常大部分的輸入文字都不需要更動,只需要修改一小部分。LaserTagger產生的編輯操作,例如Keep是複製單詞到輸出,而Delete是刪除單詞,Keep-AddX/Delete-AddX則是在標記的單詞前增加片語X,並且選擇性刪除標記單詞。
由於需要添加的單詞和片語,均來自於最佳化的字彙列表,該字彙列表需要符合字彙數量最小化,且能最大化訓練範例的數量,Google提到,限制字彙表就能縮小輸出的決策空間,便能避免模型隨意添加字詞,減少幻覺產生的機率,因此LaserTagger比Seq2seq基準更不容易產生幻覺。
另外,在資料效率方面,即便只使用數百或是數千個範例訓練,LaserTagger也能產生合理的結果,而Seq2seq至少需要數萬個訓練範例,才能產生與之相比的結果。LaserTagger預測速度快上不少,是Seq2seq基準的100倍,因此更適合用在即時應用上。
Google提到,之所以LaserTagger的研究很重要,是因為在大規模應用上,LaserTagger的優勢也能隨之放大,部分服務能用來透過縮短回應長度,以改進語音答案的組成,而LaserTagger較快的預測速度,可以在不明顯增加延遲的情況下,加入到更多現有的技術堆疊中,提供更多元的服務。更好的資料效率,就代表可以為更多資源稀缺的語言使用者提供服務。
資料來源:https://www.ithome.com.tw/news/135610
google翻譯語音輸出 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
1949-2019:中國硬科技終迎來黃金時代
本文來源自CV智識
……………………………………………………
┃從達特茅斯的夏天到中國科技的“春天”
上世紀 50 年代,中國剛剛從槍炮與戰爭中站立起來不久,滿目瘡痍,百廢待舉,科技尤其如此。國內專門的研究機構一度不超過 30 多個,全國科技人才一度不足 5 萬人。
同一時期,大西洋彼岸的美國也正歷經一段黃金歲月。儘管存在核滅絕、種族隔離和迫在眉睫的冷戰的威脅,但上個世紀 50 年代仍然被視為美國歷史上幸福和繁榮的時代。
1956 年夏季,新罕布什爾州漢諾威小鎮,達特茅斯學院群星閃耀,一群來自各大研究機構和科技公司的科學家們聚在一起,共同研究了兩個月,目標是“精確、全面地描述人類的學習和其他智慧,並製造機器來類比”。
這是人類近代歷史上,頂級科學家們第一次如此齊活地聚在一起,就機器智慧問題進行探討,也正因為此,達特茅斯會議後來被公認為人工智慧的起源。
與達特茅斯會議幾乎同一時期,參會的西蒙、紐厄爾和第一屆圖靈獎得主艾倫·佩利(Alan Perlis)一起創立了卡內基梅隆大學(Carnegie Mellon University,CMU)的電腦系,從此,CMU 電腦系成為電腦科學和人工智慧研究的高地。
80 年代,一批懷抱“遠大的理想、志向、抱負和對新事物的追求”的中國學生陸陸續續來到 CMU 電腦系,向人工智慧先驅們拜師問道。
這些年輕人,包括曾經活躍于谷歌的李開復,百度的陸奇,前微軟亞洲研究院院長沈向洋,現任微軟亞洲研究院院長洪小文。
而一些當時沒有選擇 CMU 的年輕人,如電腦視覺華人鼻祖黃煦濤、2000年圖靈獎得主姚期智,則在同樣散佈在東部學術高地的各個頂尖實驗室裡。
90 年代,當時只有二十出頭的中國年輕人湯曉鷗,剛剛從中科大資訊科學技術學院畢業。此後,他沒有選擇繼續留在母校,而是來到歷史悠久,學術輝煌的美國東北部繼續求學深造。
新千年之初,深度學習技術已然取得重大突破,卻還沒有迎來屬於它的高光時刻,在李開復、沈向洋、湯曉鷗等人之後,更多的年輕人開始來到東部各大高校的實驗室裡深造。
2006 年,時年 25 歲的周曦揮別呆了七年之久的中科大,進入伊利諾大學香檳分校(UIUC),成為華人電腦視覺大師黃煦濤當年在全球招收的三位學生之一。
當時的中科大已然成為國內眾所周知的語音研究高地,頭部語音AI公司科大訊飛和雲知聲創始團隊均來自中科大。
周曦想要做更有挑戰的事情,他對當時在中國發展仍然很不充分的圖像識別技術產生了極大的興趣,而美國恰好擁有當時獨一無二的圖像識別研究環境。
他很快在UIUC搭建了Cluster伺服器陣列,將語音辨識領域的演算法跟思想與圖像識別領域巧妙交叉碰撞。此後的幾年,周曦跟團隊先後戰勝 MIT、東京大學、IBM、Sony等著名研究機構,拿到六次世界智慧識別大賽冠軍。
而在 2006 年前後,與周曦一同拜入黃煦濤門下的,還有依圖的顏水成,文遠知行的韓旭和甯華中、文安智能的陶海、奇點汽車的黃浴等人。
學成之後,這批人幾乎無人留在美國,而是陸續歸來,把最前沿的尖端科技帶回中國。
┃以外企為師,走向世界
新千年之初的中國,伴隨著改革開放成長起來的 80 後、85 後年輕人,已經告別了衣不蔽體、食不飽腹的最艱難歲月。年輕人們不再需要為解決溫飽問題發愁了,整個社會的創新力與活力隨之開始釋放。
2000 年,世紀交疊,熱鬧的清華園照常迎來一批新的學生,王永瑞便是新生中的一員,此後 8 年,他一直在清華精密儀器繫念書。
畢業之後,王永瑞曾在航太科工四院待過短暫的一段時間,2013 年他加入清華旗下產業啟迪之星,從普通員工做到常務副總經理,從事硬科技創業專案投資孵化工作。從清華到啟迪,王永瑞一直是中國科技創業浪潮的見證者與參與者。
8 年間,偌大的園子內外發生的一切,王永瑞回想起來依然歷久彌新。
彼時的清華人,尚且對創新創業沒有如今天般的熱情,上課、作業,業餘時間搞搞社團,參加參加學生會的工作,學生們常是規規矩矩的,在就業的選擇上同樣如此。
深度學習技術尚未起來,演算法也還不那麼常見,機械類、材料類、晶片類學科仍然冷門,硬科技尚且沒有像今天這樣受到如日中天的追捧。
那是外企在中國最為風光無兩的時代,遍佈望京商圈的是摩托羅拉、愛立信等外企,金輝大廈還不是阿裡的地盤,360 集團也尚未在這裡築起高樓。
“在那個年代整體來講,創業的比例還是小,打工也基本上是去外企的金融公司和互聯網公司,大量的網路設備公司,像愛立信,它並不是國內的企業,還是大的外企。”王永瑞回憶起他求學時期同窗好友們的就業選擇,大量的人才都去了外企互聯網公司和金融公司。
與此同時,國內的互聯網也在萌芽,新浪、搜狐、網易等門戶網站出現,懷抱著好奇的清華人也開始做一些校園網、社群項目的創業。
隋建鋒是清華機械專業的博士生,在園子裡渡過了近十年的學習和工作生涯。雖然一直從事硬科技相關研究,他也見證了清華人在互聯網時代的摩拳擦掌、躍躍欲試。
2008 年,人人網最火的年頭。清華園內,一個叫“師兄幫幫我”的校園社交平臺風雲一時。
苦於解決個人問題的清華理工男們,為了增加接觸女生的機會,做了一個類似于校園版百合網的社交網站,後來越做越大,一時間席捲了北京幾十所高校,甚至誤打誤撞獲得了薛蠻子的天使投資。
隋建鋒親身經歷了“師兄幫幫我”風雲一時的那段日子,而做此項目的正是他的同班同學,“師兄幫師妹去解決問題,問題解決了之後師妹要請師兄吃一次飯,其實它背後的邏輯就是解決男女相處的問題,清華理工科女生偏少男生偏多,這就給大家提供了一個交流的機會。”
“最瘋狂的時候,他們發了好多的券,你註冊了就可以去免費領一個雞腿,推廣得非常火。”隋建鋒覺得,那可能是他距離互聯網創業最近的一次。
遺憾的是,短暫火了一陣之後,由於缺乏真正的商業變現模式,“師兄幫幫我”沒有再繼續運營下去。
但好在,一些年輕人正在成長,已經成長起來的人則聚到了一起,為平靜的中國科研氛圍注入新的活力。
九十年初,中國電腦產業苗頭燃起,而大洋彼岸的軟體巨頭正面臨創新與競爭壓力,微軟前任首席技術官麥爾伏德向比爾蓋茨諫言,將研究院開到中國來。
1998年,微軟中國研究院成立。37歲的語音辨識專家李開復受命成為首任院長。三年後,最初的微軟中國研究院更名為微軟亞洲研究院。
巧婦難為無米之炊,李開復組建團隊之初頻頻受阻,說服海外精英歸國並不容易,卻也不乏慕名而來的熱血青年,張亞勤的加盟成為打開僵局的契機,隨後沈向洋加入,成為團隊的第一個研究員。
1999年,研究院第一批管理團隊逐漸成形,由國內高校博士生和海歸派組成。略微發黃的合照記錄下知春路 49 號的偉大時刻,在往後的十幾年裡,這批人的光熱輻射至大半個中國科技圈。
微軟亞洲研究院,又被稱為MSRA,對於大眾而言,她是個遠不如阿裡、騰訊等互聯網巨頭響亮的名字,即使在人工智慧已然發展得如日中天的今天,她的名氣依然不敵商湯、曠視之類的 AI 獨角獸。
但大眾同樣不知道的是,沒有樹大根深的MSRA,就不會有此後一代又一代的互聯網巨頭、移動互聯網巨頭,再到如今的 AI 獨角獸。
香港科技大學電腦系與數學系教授、前騰訊AI Lab主任張潼曾這樣向筆者談及MSRA對於公司穿越發展週期、基業長青的重要意義。
“研究院有幾個功能,一個功能是它會在短期專案上支援一些產品;另外一個是本身它也會對做一些技術儲備,為開發一些產品做積累;還有一個我覺得挺重要但被忽略的一點,研究院作為公司的人才儲備,在產業迅速變革的時候,這些人才才能產生價值。”
在張潼看來,微軟歷經多輪時代浪潮之而不倒,重回全球市值第一寶座,正與其人才儲備息息相關。
“比如說微軟,”張潼告訴筆者,“它原來就是一個軟體公司,但後來在做搜索的時候,雖然沒有做到Google的程度,卻能夠很快地起來,包括現在做雲計算,它為什麼能夠成為市值最高的公司之一?就是因為技術的儲備、人才的積累,在公司轉型上,如果沒有這些人才儲備,就沒有辦法去做這些事情。”
象牙塔內,學術研究熱火朝天,人才貯備從無到有;象牙塔外,互聯網創業水大魚大、戰事紛呈,已然開啟一個新的時代。
MSRA 建院這一年前後,搜狐、京東、阿裡、騰訊、新浪、網易、百度相繼誕生,外企們應該不會想到,當時還是由一群初生牛犢的中國年輕人創立的幾家門戶網站,或是ebay、Google的“拙劣模仿者”們,在此後的十年裡順勢崛起,直至將他們“掃地出門”。
隨著中國第一波互聯網發展熱潮湧現,中國公司開始為創新事業向矽谷尋找人才、資金,甚至包括公司命名的方式。
把別人的成果直接商用當然會被人詬病,但正是這段經歷讓中國的互聯網公司積累了使用者介面設計、網站架構和後端軟體發展的初步經驗。
三十年河西,三十年河東。
百度的核心功能和極簡主義的設計風格借鑒了Google,但在此基礎上,李彥宏堅持不懈地優化網站,以迎合中國用戶的搜索習慣。淘寶以ebay為師,卻另謀在初期為商家提供免費服務的模式,最終打敗ebay。
曾比作中國版BuzzFeed的位元組跳動,通過機器學習演算法為使用者提供定制化的新聞內容。現在,BuzzFeed的市值也已和位元組跳動不在一個量級。美團的靈感來自Groupon,但其業務線卻從團購一路拓展至電影、外賣、酒店、旅遊等本地生活服務等,現在美團的估值已經10 倍於Groupon。
Google、eBay、Uber、Airbnb、LinkedIn、Amazon……一個又一個美國巨頭都想贏得中國市場,卻無一不鎩羽而歸。
外國分析師在美國公司無法佔領中國市場這個問題上糾結的時候,中國的公司正忙著打造更好的產品。
資本聞風而動,人才循錢而至。
隨之而來的是,風投資金和人才魚貫湧入互聯網行業。市場如火如荼,創業公司的數量呈幾何級數增長。
大多數創業公司的產品靈感或許來自大洋彼岸,和矽谷的競爭的確產生了中國本土的互聯網巨頭,但真正造就了一代創業者鬥士的,卻是外人難以想像的殘酷“本土大戰”。
“如果你去外面看看,你會發現這個世界上最好的市場其實就在你腳下。”這是現如今大多數出海創業者對於開闢海外市場最為深刻的感受。
中國市場競爭的殘酷,讓中國互聯網公司探索出了完善的商業模式和強大的運營能力。
一些在殘酷的“本土廝殺”中成功出局的中國企業,也在海外戰場上開啟了與全球科技巨頭的無限戰爭。
2012 年,隨著智慧手機的出現與普及,中國移動互聯網出海風口開始形成,作為出海先驅,獵豹更是將中國免費工具的模式移到了海外。
2016 年,有更多公司開始把中國模式複製到海外市場,隨著市場的變化,出海的類型開始多樣。
中國企業出海的典範位元組跳動,一方面 Copy From China,將在中國獲得成功的資訊流模式複製到海外市場;另一方面則借助資本的力量在海外展開大肆並購,最終通過技術輸出的方式實現全球擴張。
直到最近兩年,無論是遊戲、內容還是電商類產品,出海的中國公司已經逐漸讓產品達到完全當地語系化的狀態。中企出海,已然歷經從稚嫩到成熟。
┃AI時代:走入無人區
“2000 年的時候,大家更多還是想著錢,怎麼快速賺到錢。”這是王永瑞還在清華念書時,對互聯網帶來的外部環境的極速變化,最為深刻的感受。
但賺到錢的一個好處是,中國的創業者們終於有錢去做些從前囊中羞澀之時難以做到的事情了。
發展硬科技,讓中國在底層研究、前沿科技的突破上真正屹立於世界民族之林,則是大多數中國科學家與技術人心中一顆自始至終都不曾熄滅的種子。
互聯網這十年,伴隨著供應鏈的成熟、市場的培育、人才儲備越來越充足,也為發展硬科技的提供了可能。
王永瑞談到,在清華讀書的這些年裡,周圍很多同學,還是“在互聯網圈裡混。”
到 2008 年畢業時,他明顯感覺到,一些新的變化正在發生,“這個時間段逐漸開始有一些人開始往硬科技的方向去做,慢慢的也有人去做硬科技的創業。”
“硬科技和移動互聯網的區別還是比較明顯的,它區別就是說一個週期的問題,聯網可能你投入就快了,慢的話我就三個月肯定也出來東西了,如果你是做一個硬體產品,週期不會這麼短,還不算你前期的人員、知識儲備以及經驗積累。”
王永瑞談到硬科技時說:硬科技創業雖然週期長、難度大,但這不妨礙越來越多有情懷、有個性、有創造力的工程師們加入進來。
“國內在很多基礎應用工程應用的學科建設,或者說知識儲備過程中還沒有達到,或者說離世界上先進的水準還有一定差距,中國大量的工科學生還是有一種情懷在,真的想把這個 gap 給彌補上來。”
至少在清華園裡,2010 年前後,雙創提出來前幾年,學校、學生們對於將產學研結合,甚至創業的熱情開始變得高漲。
隋建鋒回憶說,那個時候還沒有人工智慧這種說法,“現在的人工智慧、智慧硬體,那個時候我們叫機電一體化,簡單理解就是用各種各樣的方式實現機器人的自動化。”
互聯網風雲十年,是清華人不斷開放、追求變化的十年,而姚班的出現則把這種求變之心放大到一個極致。
打比賽、做課題、搗鼓機器,一些工科生做著做著,就開始了“真槍實彈”的創業。這批人當中,有小馬智行的樓天城,曠視科技的印奇、唐文斌、楊沐,MOMENTA 的曹旭東,深鑒科技的姚頌、單羿,禾賽科技的李一帆……今天,他們撐起了 AI 創業大潮的半壁江山。
2004年9月的一天,正在普林斯頓大學攻讀博士學位的張勝譽像往常一樣與導師姚期智碰面交流近期研究進展。姚期智突然對他說:“我要回中國了,permanently(永遠地)。”
張勝譽後來回憶說:“當時有些訝異,但隨即感到釋然。單純從研究角度講,的確沒有一個地方比普林斯頓更舒服。他回國,應該是要去做一件大事。”
此後不久,姚期智辭去普林斯頓終身教職,正式加盟清華大學高等研究中心,成為清華全職教授,在清華園裡,開啟了人生下半場全新的探索。2005 年,姚期智主導與微軟亞洲研究院共同合作成立“電腦科學實驗班”,姚班由此而生。
姚班初成立時,“教主”樓天城還是剛剛入學“萌新”,還在安徽蕪湖一中讀高三的“怪小孩”印奇,仍然幻想著有朝一日能編織出《終結者》中的天網世界,在後來的人工智慧浪潮中叱吒風雲的姚班少年們,此刻正在園子裡積蓄能量。
八年前,印奇與唐文斌、楊沐下定決心開始人工智慧領域創業之時,人工智慧還遠未成為一個風口,或者說尚且未被完全證明為一股可以改變時代的浪潮。
創業之初,印奇就曾與唐文斌商定,二人同赴美國攻讀博士,印奇專注智慧感測器方向,學的是硬體,唐文斌則繼續研究軟體。三人決定出發之時已然想好,做AI,最終一定會走到做硬體這一步。
而在MSRA的實驗室裡,湯曉鷗依然沉溺于拿兒子照片做人臉識別研究的快樂。此時的湯教授應該還沒有想到,日後不久,他會跑出來創業。畢竟,在以基礎科學研究聞名的 MSRA,誰能實現最多的技術突破,誰就獲得最多尊重。
直到 2012 年,人工智慧以深度學習的面貌重新贏得世人關注,屬於硬科技從業者的創業黃金時代終於來了。
多年來對神經網路根深蒂固的成見讓人工智慧的許多研究人員忽略了這個已經取得出色成果的“邊緣群體”,但 2012 年傑佛瑞·辛頓的團隊在一場國際電腦視覺競賽中的勝出,讓人工神經網路和深度學習重新回到聚光燈下。
在邊緣地帶煎熬了數十年後,以深度學習的形式再次回到公眾視野中的神經網路法不僅成功地讓人工智慧回暖,也第一次把人工智慧真正地應用在現實世界中。
研究人員、未來學家、科技公司 CEO 都開始討論人工智慧的巨大潛力:識別人類語言、翻譯檔、識別圖像、預測消費者行為、辨別欺詐行為、批准貸款、幫助機器人”看”甚至開車。
隨之而來的是,越來越多的學者在這個時候離開象牙塔,一批遠在海外的人也陸續回國,他們要從中得到在學術圈外一展身手的機會,當然也嗅到了商機,還有金錢的味道。
2014 年,湯曉鷗帶著他在港中文多媒體實驗室 (mmlab) 的一眾“門徒”跑出來創業了,取中國歷史上第一代王朝商朝開國君主之名——商湯,商湯科技應運而生。
一批 AI 公司有如雨後春筍般冒出來,不管是 MSRA、清華,還是 UIUC、中科院、mmlab,一代科學家與技術人們,仿佛跟約定好了一樣接二連三地流入尚且年幼的科技創業前沿陣地。
┃AI+5G 時代:細分,落地,紮入產業
造輪子的時代過去了,AI 從發明的年代邁入實幹的年代,從專家的年代邁入資料的年代。
西方國家點燃了深度學習的火炬,但最大的受益者卻是中國。在資料和工程人才方面,中國擁有得天獨厚的優勢。
無論是國際市場,還是國內市場,5G 和人工智慧都備受關注。被冠以“互聯網預言家”的馬化騰,更是公開表示“一個 AI+5G 的全智慧時代正在到來。”
“硬科技真正的突飛猛進,或者說走到了風口浪尖,有幾方面原因,一個是整個供應鏈、市場環境確實更加成熟了,包括很多柔性製造新技術的應用,感測器的不斷小型化,包括智慧硬體底層的技術系統的開發,一些主晶片的小型化,這一系列的技術,搭建得比較成熟了。”
硬科技的發展,則是跟隨著技術、市場、供應鏈的完善水到渠成的結果,而硬科技專案越來越受大家追捧,同樣是這個時代自然而然的發展趨勢。
王永瑞明顯感受到,硬科技真正掀起熱潮,是在最近一兩年。人工智慧領域的創業尤其如此。
在經過前期的拼實力、拼融資、拼應用等一系列競爭之後,AI獨角獸們逐漸開始學著做產品,講應用,談落地。
2019 年,大家的目光不約而同地轉向了商業化落地,以及實現規模化收入上。細分、落地、紮入產業,人工智慧的競爭已然進入下半場。
“真的太瘋狂了,什麼華為、阿裡都進來了。”一位 AI 公司的朋友這樣描述今年下半年整個行業的競爭態勢。
隋建鋒談及了他今年經手的兩個印象頗為深刻的項目。
“當時我在北京接觸智慧硬體的專案叫情感記錄儀,像一個小的紐扣一樣配在身上,通過提取人的溫度、心跳來判斷出你的情緒。這項目也經歷過一段時間,最後黃掉了。”
這樣的項目,到底有沒有存在的意義?隋建鋒反問,“你的情緒你高興還是喜悅還是悲憤,你自己肯定會主觀地意識到,還需要用這種智慧硬體來衡量你是高興還是不高興嗎?”
智慧硬體所謂的智慧肯定是服務於硬體,不是為了智慧而智慧,這是隋建鋒從事硬科技專案投資孵化以來最為深刻的感受。
“來到深圳之後我又接觸到一個智慧讀錶盤的專案,它的應用物件就是水錶電錶,每個月要有人去讀這個數,這其實是一個工作量非常大的事情,然後一個團隊專門做了一個讀表儀,一把它放到水錶上,它就能夠及時把資料傳輸出來。”
“做智慧硬體一定離不開應用場景,這是我在北京和深圳感受到的一個非常大的差別,也是目前整個 AI 大的領域特別重要的一個點,一定要找到痛點。”
在更加細分垂直的領域,如醫療、教育、智慧製造、腦機交互,大風口之下,一個個小風口正在形成,一個個小獨角獸正在誕生。
最近一兩年,AI醫療賽道的森億智慧,將製藥時間從8年縮短到幾個月的AI製藥公司 InSilico Medicine,從事類腦晶片研發的靈汐科技,腦機交互產品研發的腦陸科技、優腦銀河等,明顯開始受到資本的青睞。
隋建鋒說,如今 VC 技術化,甚至 LP 技術化的趨勢正變得愈發明顯。“我們在找LP的時候,也傾向於找那些理解技術,能給硬科技創業者帶來更多資源的 LP。”
AI商業化的1.0在雲端,是基於大資料做應用。AI商業化2.0的變化趨勢是從雲端到邊緣,把人工智慧的能力帶到每個人身邊。
5G則是有效連接雲端和邊緣的高速度、高可靠性和低時延的通信管道,可以用最優化的方式實現人工智慧的資源配置。
5G和AI結合在一起一定會進入很多新場景,產生很多新機會。今年4月初, 中國完成首例 AI+5G手術,在400公里外完成“補心”手術,為智慧醫療開啟無限想像空間。
而這些都只是剛剛開始。
┃尾聲:科技人,永遠年輕
最早今年之內,AI獨角獸曠視科技就要在港交所敲響IPO的鐘聲。
曠視終於從 8 年前那個窩在創新工場共用辦公空間小角落裡敲代碼、磨產品的“幾人組”,發展成如今第一個衝刺港股的“純人工智慧公司”。
一個月前,筆者在美麗的西南山城重慶,拜訪了雲從科技總部,恰逢曠視招股書公佈當天,問及雲從研究院院長周翔友商上市一事,周翔打趣著說到,“你看曠視都已經上市了,這個行業肯定不會繼續虧下去了。”
猶記得,招股書發佈當晚,業內一時譁然。
這家年輕AI獨角獸的表現,似乎並沒有此前大家期待的那麼高,對整個行業帶來的影響,吉凶禍福,難以預測。
筆者也就此事詢問了雲從聯合創始人姚志強,他堅定地認為“行業趨勢不可逆。短期內是有泡沫的。任何事物的快速發展,不可能沒有泡沫,它是發展過程中特定階段的產物。”
“但是真正的泡沫是不代表未來,是虛幻的,是一定會帶來沉痛的,但如果泡沫代表未來,那麼短暫的泡沫對未來趨勢影響不大,只要是在大趨勢下的選擇,一定會出現一個偉大的企業。”
在曠視人眼中,印奇不苟言笑,平時總是“端著”,唐文斌則更加外向,和大家聊技術、談人生都不在話下。
印奇也曾坦陳,自己性格比較內斂,在機場碰到客戶,一度會躲著走,直到最近兩年,他開始“強迫”自己主動上去跟客戶打個招呼。印奇一直處在從一個典型理工男努力轉變為合格公司管理者的過程中。
姚志強告訴筆者,“只要是技術男認定的事兒,我們就不會想太多的結果,先卯足勁幹再說。”但“失敗和成功的教訓都指向一個,要接地氣,技術必須為其他行業提供服務,並且能夠真的解決問題。”
王永瑞與禾賽科技的李一帆是同門好友。變形金剛、機器貓、自己組裝的模型,在他的印象中,李一帆的桌面上總是擺滿了各式各樣的機器人。“工程類的東西完完全全地融入到了他的生活,你能感受到那是一種發自內心的喜愛。”
平日裡,依圖科技創始人朱瓏喜歡圍著他辦公室所在的一層樓,一圈一圈地轉,不過,他轉圈從來不是為了監視員工。有關應該如何經營這家公司,他一直在思考。
90後的馬漢東已經是AI醫療公司森億智慧的聯合創始人。員工問他,我們所做的事情到底有沒有意義?馬漢東的回答是,你們直接去醫院裡看一看,我們的設備、應用,救的都是人命。
既身坐冷板凳,又頭頂泡沫,科技創業,可謂路上道道折。但創業者們從來沒有懷疑過這其中的價值。
幾十年的發展也有力地證明,科技公司的力量正變得越來越強大,聚聚了一大批頂尖科技公司的中國力量也越來越難被取代。
中國的科技公司,歷經了從無到有,又從Copy to China到Copy from China的大時代。直至如今,一些重要領域已然躋身世界前列,這是近代以來從未曾有過的重大改變。
google翻譯語音輸出 在 與芬尼學英語 Finnie's Language Arts Youtube 的最讚貼文
?【成人英語再起步】網上課程 ► http://bit.ly/2We1n2Q
YouTube 觀眾十二月特備優惠:購買【成人英語再起步網上課程】,用信用卡結賬時,可用優惠碼「YOUTUBEDEC20」,以 $1,299 優惠價購買第一期(原價 $1,499);更可以以 $2,499 優惠價購買第一期+第二期!
? Patreon 月費學習計劃 ► https://bit.ly/3fZcjID
0:00 簡介
1:17 Tip 1: 不斷精進你對文法和讀音的認識
3:54 Tip 2: 和不同老師學習,因為每個老師的強項有不同,你也會得到不同啟發
5:45 Tip 3: 把英語學習融入生活中
8:29 Tip 4: 把學英文變成一種 lifestyle
8:48 4a: 看電影
9:33 4b: 聽英語音樂
9:55 4c: 用英語追星
12:21 4d: 不要只集中 input(輸入),忽略 output(輸出)
13:56 Tip 5: 學英文不是純粹翻譯
15:43 Bonus tip: 避免過份依賴字典
16:35 課程優惠
17:02 Instagram時事英語
17:36 下載懶人包
? 訂閱電郵通訊,收取學習資源、心得和課程最新消息 ► http://bit.ly/fla-nl
? 收聽 Learning English with Tiffany Podcast
► https://apple.co/2OwMPpK (Apple Podcasts) / https://spoti.fi/3g2KChF (Spotify) / https://bit.ly/3j0uSyd (Google Podcasts)
▶️ SUBSCRIBE 訂閱 ► http://bit.ly/flayt-sub
記住要按訂閱按鈕旁邊的小鈴鐺,那麼我們每次推出新片,你就會收到通知了!
It would mean the world to me if you could hit that bell ? beside the SUBSCRIBE button because that way, you get notified EVERY SINGLE TIME a new video goes live.
?我的相機和其它拍攝器材 ► https://kit.co/finnieslanguagearts/canon-800d-rebel-t7i-youtube-kit
✏️ 歡迎提供字幕 :) ► https://www.youtube.com/timedtext_cs_panel?tab=2&c=UCHkPJ7O9LLjEntwbsgn5TOg
??英文 channel ► http://bit.ly/tiffanysuen-youtube
?芬尼創業日記 channel ► http://bit.ly/fmkt-yt
? MeWe 學英文群組 ► https://bit.ly/fla-mewe-group
▍WATCH MORE 收看更多:
名人英語 ► http://bit.ly/2EUc8QO
時事英語 ► http://bit.ly/2RqrMok
文法懶人包 ► http://bit.ly/2UPUzI4
品牌名學英語 ► http://bit.ly/2qd3mUq
語文知識 ► http://bit.ly/2GzuW8b
今天只學一個字 ► http://bit.ly/2DRQPgE
Word Pairs 怎樣分 ► http://bit.ly/2hS1MCF
▍FOLLOW ME:
Instagram ► http://bit.ly/fla-ig
Facebook ► http://bit.ly/fla-fb
MeWe ► https://bit.ly/fla-mewe
Blog ► http://bit.ly/fla-medium
Twitter ► http://bit.ly/fla-twitter
Telegram ► https://bit.ly/fla-tg
Pinterest ► http://bit.ly/fla-pinterest
Free stuff!!! :)
► Use my iHerb Discount Code: ASC7218
► Sign up at AirBnb and get HKD$290 in travel credit: https://www.airbnb.com/c/tiffanys213
► Get a FREE first Uber ride (up to HK$50): https://www.uber.com/invite/tiffanys2213ue
► Get TWO months of free SkillShare premium: https://skl.sh/2IIHhr8
► Get HKD$100 of credit to spend across your next 4 orders at Deliveroo: https://roo.it/tiffanyccs
► Get HKD$100 off your order at NOSH: TIFH437
google翻譯語音輸出 在 JavaScript (9) – Google 的語音合成API 之使用(作者:陳鍾誠) 的推薦與評價
Google 的語音合成服務非常容易使用,因為您只要利用Google 翻譯中的TTS (Text to Speech) 功能,將文字放到以下網址中的{query} 欄位中,然後設定正確的語言 ... ... <看更多>
google翻譯語音輸出 在 google翻譯語音輸出的問題包括PTT、Dcard、Mobile01 的推薦與評價
為了解決 google翻譯語音輸出 的問題,作者梁佩瑩這樣論述:. TensorFlow是2015年年底開源的一套深度學習框架,也是目前最活躍的深度學習框架之一。 ... <看更多>
google翻譯語音輸出 在 [新聞] 狹路相逢勇者勝– Google會用其Transfor - 看板Tech_Job 的推薦與評價
狹路相逢勇者勝 – Google會用其Transformer專利控告ChatGPT?
https://bit.ly/45gV8LO
眾所周知,這一波OpenAI夯遍全球的ChatGPT,係指一種基於生成式預訓練轉換模型
(Generative Pre-trained Transformer,簡稱GPT),其字母中的「T」代表Transformer
即轉換模型之意。然而,該Transformer模型中極為重要之「自注意力」
(Self-attention),卻並非由OpenAI所原創,而是由軟體科技業的領頭羊Google研究實驗
室,所創造出來的大型語言模型之核心技術。
近年來Google一向積極建構AI相關智財,並以擁有眾多AI相關專利組合技術著稱。此
Google所創造出的Transformer模型,為這波聊天機器人在深度學習方面帶來重大突破,
該轉換模型神經網路(Transformer Neural Networks)關鍵技術,為ChatGPT-3打下強大基
礎,更醞釀出眾多生成式AI (Generative AI),得以有今日的非凡成就,故此一
Transformer模型之自注意力機制,Google可謂是原始發明人。
按Google旗下科學家2017年在神經資訊處理系統(NIPS: Neural Information
Processing Systems,後更名為NeuroIPS)會議上,發表一篇題為《Attention is All
You Need》的開創性論文。截至2023年1月,該論文已被引用超過62,000次,成為AI領域
被引用次數最多的論文之一。Google不僅創造這項技術,還獲得相關的專利,其中如極為
重要之US 10,452,978 B2專利[1](以下稱’978專利),是一件在專利佈局上涵蓋非常全
面的專利(請參本刊之前報導:Google Transformer模型專利 – ChatGPT自注意力機制之
重要推手),其最早先透過美國臨時案於2017年5月23日與2017年8月4日先行申請,然後在
2018年6月28日轉為正式案申請,並在2019年10月22日被核准授予。
這意味著,Google可以透過訴訟來維權,從而挫敗競爭對手。但,Google會用
Self-attention專利來挑戰ChatGPT嗎?值得關注。其實,根據別人論文中的技術來開發
應用,不一定就會侵犯到該技術中的專利,這還得看實際個案而定,但就Open AI之GPT中
Transformer模型的運用,的確帶有一些’978專利申請範圍內之特徵,但是否真的落入請
求項的範圍,當然還需視Claim Construction的結果而定。具體而言,Google的’978專
利包含系統項、電腦儲存媒介項與方法項,其中又以系統項涵蓋層面最廣,所以就系統項
之獨立項1所記載的重要元件,再配合專利說明書中的實施例做統整,現試圖用簡單的方
式說明’978專利中Transformer模型的技術特徵。關於系統項的獨立項1所記載的重點,
整理如下:
1. 系統包含一或多計算機,透過計算機執行指令一序列轉導神經網路(Sequence
Transduction Neural Network),該序列轉導神經網路將一輸入序列轉導為一輸出序列
[2];
2. 該序列轉導神經網路包含一編碼神經網路(其實就是編碼器),用以接收該輸入序列並產
生編碼表示法(其實就是詞嵌入(Word Embedding)[3]),以及一解碼神經網路(其實就
是解碼器),用以接收該編碼表示法並產生該輸出序列;
3. 該編碼神經網路又包含一或多個編碼器子網路(Encoder Subnetwork),用以接收該編碼表
示法並處理其對應的輸入位置做位置嵌入(Positional Embedding),而位置嵌入正是透過
編碼器自注意力子層(Encoder Self-attention Sub-layer)所接收與執行;以及
4. 透過編碼器子網路應用一自注意力機制,使多個輸入位置而產生對應的個別輸出,其中該
注意力機制又包含計算Q (Query)、K (Key)、V (Value)矩陣等三大步驟,最後將Q、K、V
矩陣計算完畢後而產生對應的個別輸出。
關於’978專利的詳細內涵,請參前揭文:「Google Transformer模型專利 – ChatGPT自
注意力機制之重要推手」。如從’978專利獨立項1所揭露的技術內容來看,真的與
Transformer模型相關的技術特徵只有3與4。換言之,若把3和4抽離,’978專利可能就和
習知的深度學習神經網路沒什麼兩樣。簡單來說,Transformer模型的特色就是,透過結
合位置嵌入與自注意力機制的運作,而能夠在冗長的輸入序列中,做出很好的語言推理與
「理解」(或是「類理解」),例如機器翻譯、人機對話,就是很好的應用場景。
過去AI發展因歷經幾波載沉載浮之影響,專利部署相對不那麼被重視,很多學術文獻的發
表往往停留在概念驗證階段,而AI平台帶來的典範轉移(paradigm shifts),也僅在少數
利基市場(niche markets)中發生,較少去實行專利貨幣化。至2014年AI迎來深度學習革
命性破口,於2015年深度神經網路包括圖像辨識、語音識別等方面開始大幅超越人類,一
些企業才開始積極建構AI智財組合。而Google在AI相關之智財權保護很積極,其在收購
DeepMind後,將許多公開發表或習知概念申請專利[4],隨意簡單檢索其於WIPO的專利至
少即有數百多件,甚至 Alphabet子公司DeepMind,也擁有強大的IP智財組合,帶動業者
紛紛起而效尤。
當時為了證明AI公司的估值合理,風險投資常會建議對一些核心技術申請專利,但10年前
由於仍受限於算力和晶片技術的影響,即便有再好的AI演算法,也難以透過當時的技術水
平,作出今日各領域令人驚豔的AI創新產品與服務,所以投資AI研發的風險仍大。因此,
Google在對待處理許多AI新創時,可能遵循類似的思路,認為拿AI專利起訴別人或許無太
大的商業意義,而業界共同努力建立AI生態系統才是王道。換言之,長期以來Google的理
念,似乎是抱持著開放其研究成果(available as open source),讓外部研究人員用
Google開源的AI相關研究與程式碼,繼續迭代開發,而相對的,這樣也有利於Google的產
品與服務,發展為屬於Google自己的技術生態圈。
然而,近幾個月來的情況似乎發生了些變化,隨者ChatGPT、DALL-E、Midjourney等具突
破性典範轉移工具席捲市場,在在挑戰Google作為AI領域的主導地位,且甚至可能會削弱
其重要之搜尋引擎的業務時,Google領導階層的態度可能略有改變,其領導階層認為,
Google在努力發布產品的同時,應將新技術保留在內部,DeepMind實驗室研究人員皆認知
:「是時候進行競爭,並將知識保留在公司內了(keep knowledge in-house)」。
Google迄未提告緣由 1 -- 專利正面之多贏戰略思惟
基本上,在科技領域中專利常被拿來捍衛自家技術,實務上向來是業界的優先策略,以鞏
固其市場上合法壟斷之優勢地位,同時也得以此對抗眾多NPE專利怪獸。但OpenAI原先聯
合創始人之一的Elon Musk,於2014年率先開放特斯拉的智財,將其所有專利組合開源
(open-sourcing)供業界使用,以防止在電動車領域中造成不公平競爭,頓時刷新科技業
界的三觀。
影響所及,AI雖已發展了一甲子,現正處於重中之重的技術領域中,但不知為何相對較克
制,大幅佈局AI相關專利,似非業界認為最優先的項目,即使像知名如OpenAI,似乎也未
就核心AI技術布局專利,如用「OpenAI」做檢索似乎難以發現其所獲准之專利(有人認為
係因OpenAI最初係非營利組織,較乏積極保護IP的商業思維)。
本質上言,各科技大咖最終都會創造出彼此可疊加互利之技術,彼此有把餅做大之
win-win雙贏默契,以致於AI相關的專利申請更多是防禦性措施考量,而非攻擊性策略。
因此,或許Google的想法是,對軟體框架開源供全世界RD一起開發,基於軟體專利訴訟本
來不好打且經濟效益不高,所以與其花時間成本挑起專利戰,不如直接open source讓所
有開發者習慣用Google的技術,使各家程式設計師自然成為Google的follower,這可能是
Google在專利與商業之間的戰略思維[5]。
準此,Google在生成式AI的關鍵理論方面,雖然處於領先地位,並且在使用自注意力的核
心神經網路技術上占優勢地位,但基於上述之「春秋大義」,因而暫不太可能對OpenAI採
取法律行動;由此也使業界儼然瀰漫一股氛圍,即AI生態系統應於整個科技領域中,讓業
界人士共同努力互相奠基發展來達成,致力使AI世界變為更美好的多贏營運。
Google迄未提告緣由 2 -- AI專利訴訟先天困境 + 業界「恐怖平衡」
退一步言,縱使不是基於以上的高調理念,那為何科技公司已申請獲准AI專利卻較少去執
行?
其實像美國這種動輒專利興訟的國家,目前在AI技術領域中的訴訟,比起其他像手機或半
導體光電領域動輒有大量官司,兵戎相見的情況相對較少。按AI語言模型本身,本就是一
種利用軟體執行演算法的產物,因難以檢視競爭對手的產品以了解其程式開發的邏輯,所
以有時很難判斷是否侵犯專利;再加上,訴訟中縱使透過證據開示取得程式碼,但基於所
謂AI黑盒子(black box)難題--不知其所以然,舉證上尚有許多不易克服之技術問題;尤
其是針對軟體或演算法方面相關專利訴訟,將會面臨專利法第101條適格標的(抽象概念
)之障礙與挑戰,經常使權利人提告後,賠了夫人又折兵--官司敗訴專利又被無效[6],
所以可能使業界不願輕易發動訴訟。
基於此,Google雖得以訴訟執行專利,但侵權指控如不夠精確,則該法律行動會產生高昂
法律成本,甚至可能導致自己的專利被無效。更何況,如Google起訴微軟侵犯專利,微軟
也可能會立即拿其他專利來反擊Google,最後可能各自不得不鳴金收兵,這使得科技巨頭
在AI各應用領域雖不斷競爭,但彼此卻又相互牽制,不輕易啟動訴訟,故有論者用「互保
毀滅」(mutually assured destruction)的「恐怖平衡」來解釋,為何Google還未使用這
些專利來對抗競爭對手的緣故,因此,Google或許暫不會就新興生成AI技術捲入法律糾紛
,因為訴訟本極具挑戰,公司目前更應專注於如何將技術成功整合到現有業務中[7]。
有鑑於此,儘管Google涵蓋AI許多領域擁有強大智財組合,並已拔得頭籌獲頒ChatGPT關
鍵之「基於注意力序列轉導」(attention-based sequence transduction)之發明專利,
但似乎尚未打算在AI領域「展示」其IP實力。然而,隨著生成式AI繼續席捲市場,且微軟
已將OpenAI工具整合到其龐大的產品生態系統中,在此種強大的競爭態勢下,「戰爭與和
平」的板塊是否將來會有所改變,亟有待觀察。
戰國群雄最終難免一戰? -- Google如日後才執行專利之潛在爭議
另一種可能是,因ChatGPT才發行不久,而收費也不過是這幾個月的事,所以Google不急
於此時提告,否則可預計損害賠償金額也不高,何況這回合Google和微軟之間的競爭,並
非像10年前Apple/Samsung/HTC間的手機大戰,不是那種非得拼出個你死我活的生存戰,
因此現在專利權人其實不急著提告,而可慢慢等將來ChatGPT銷售數年之後再說。
假設Google的專利可能涵蓋ChatGPT中的應用,則不論是一對一文義侵害全要件原則,還
是針對實質相同手段、達成實質相同功能而產生實質相同的結果所構成的均等論,依過去
美國專利訴訟中一般原告的立場,其實Google都可能挑出一些落入範圍的使用來主張[8]
,但Google此時還按兵不動,繼續保持觀望的態度等個幾年,那麼在法律上會衍生出一個
專利法的問題,即ChatGPT既已夯得震天價響而無人不知曉,因此身為專利權人的Google
顯然知道此狀況,如仍遲遲不提告,這在美國專利訴訟中,是否會有所謂「權利行使怠惰
」(Laches)的爭議產生。
Google會構成失權效?專利請求權消滅時效 v. 權利行使怠惰
依美國專利法第35 U.S.C. § 286條規定,侵權損賠可以追溯6年,在此請求權消滅時效
(Statutory Limitations)期限內,皆得向侵權者主張回溯6年之損害賠償。但另一方面與
此有關的觀念是,美國案例法(Case Laws)中,還有一種稱為「權利行使怠惰」之衡平抗
辯(Equitable Defense),此種態樣在實務上可構成被告的積極抗辯(Affirmative
Defenses),如權利人明知侵權卻在權利上睡眠,導致其嗣後不得再主張,構成法律上的
一種「失權效」。
專利法上之權利行使怠惰,長久以來為美國侵權理論中的實務課題,針對原告權利人就侵
權之存在,事實上已知悉或可得而知(actual or constructive knowledge of the
facts),卻不合理的延宕不主張權利而給予不利之對待。此權利行使怠惰抗辯之目的,係
為了防止專利權人在權利上怠惰,而讓不知情的侵權者於多年後遭受突擊,因時限拖長情
況變動對其在防禦上,產生有失公平之負擔或不利益,蓋被告如能即早面對訴訟,發現侵
權可能時,商業上應讓其有機會調整,技術上應讓其轉換或進行迴避設計(Design
Around),或讓其有機會作財務上應變,而不致在多年後突被告而措手不及。總之,為維
護法律安定與確定性,讓雞養大了再殺的思惟不可取,遂有此權利行使怠惰之抗辯產生。
美國最高法院之判例啓示
但也因此,消滅時效和權利怠惰,這二項法律概念間形成衝突,亦即縱使確實有權利怠惰
,但是否仍可於請求權消滅時效內提告?專利權人明知被侵權而遲遲不告,延宕多時譬如
到了6年時效屆滿前二個月才起訴,是否仍得適用權利怠惰?關於這兩者間之衝突,美國
在SCA Hygiene Products Aktiebolag v. First Quality Baby Products案中,專利權人
在法定6年內行使權利,但卻遭CAFC巡迴上訴法院認為,其行為構成權利怠惰而不得主張
專利,判定即使在請求權消滅時效內,仍得適用權利怠惰。
原告不服上訴後,最高法院在2016年核准聽審(grant certiorari),基於2014年
Petrella v. Metro-Goldwyn-Mayer案中,最高法院曾判定於著作權請求權消滅時效內,
Laches不得再作為抗辯,惟Petrella案因係著作權而非專利,法院對此上訴案,針對權利
怠惰於專利請求權消滅時效內得否適用?著作權與專利權間應否有差別待遇?為避免不同
案例間有所杆格,才使得最高法院准予聽審[9]。嗣於2017年最高法院駁回CAFC的判決,
認為國會既已於立法中明定6年請求權消滅時效而無其他限制,即不得任意額外再適用權
利怠惰抗辯,讓6年法定消滅時效縮短,並明確表明智財中專利與著作權應有一致之標準
。
但另一方面,最高法院也未對「專利權人讓雞養大後再殺」的思惟背書,強調如同
Petrella案所述,縱使權利行使怠惰之抗辯無法適用,但普通法中(Common Law)之「衡平
禁反言抗辯」(Equitable Estoppel Defense)仍得發揮作用,亦即仍得視個案事實,檢視
專利權人之行為有無違反禁反言,以抗衡專利權人先按兵不動,誘使侵權者繼續投資侵權
商品,多年後予以突擊衍生鉅大賠償訴訟,導致對其防禦產生有失公平或不利益等種種情
況綜合認定,故衡平禁反言原則仍得適用作為抗辯。
因此, ChatGPT只要繼續被使用,從起訴日起算專利請求權都可回溯6年,也就是說,消
滅時效的6年優於權利怠惰的不行使,專利權人在期限中任何時候起訴,都不需擔心權利
怠惰的問題。因此,Google只要其間無任何積極語言或行為可被認定為禁反言,即可好整
以暇等待市場大賣之後再來主張。
小結:山雨欲來?
總之,Google目前尚未提告,仍處於西線無戰事的階段,將來如何尚不得而知,按照過去
慣例,各大企業當然都會繼續針對生成式AI,積極開發產品與創新服務,同時也會繼續做
好專利組合,以便將來即使被告也可累積籌碼作為談判和反制之工具,美國企業間各科技
大咖的合縱連橫頻繁,此消彼長向來變化莫測!況且科技發展充滿變數,一哩之外都是迷
霧!因此,將來權利人是否提告的發展甚值關注,吾人且拭目以待。
[1] https://patents.google.com/patent/US10452978B2/en?oq=US10452978B2
[2] 轉導或稱轉換,指將一種形式或訊號轉換成另一種形式或訊號的過程。在Google的專
利中多次提到「序列轉導 (sequence transduction)」,指的就是輸入一段文字或語音序
列後,可轉換為另一種形式的表示而被輸出,即時翻譯就是典型的序列轉導行為。
[3] 所謂的詞嵌入意味將單詞予以編碼成數值型態的向量來表示。
[4] 例如Dropout是用於解決深度學習模型中過度擬合的系統和方法,Google於2013、
2016和2019年向USPTO申請並已獲准三項專利。
[5] 不過Google雖不告人,但在最近這一波生成式AI訴訟風波中,因樹大招風其與母公司
Alphabet、兄弟公司DeepMind,還是不免被別人告著作權侵害和不正競爭等,係北加州地
院之J.L., C.B., K.S., et al., v. Alphabet, Inc., et al案(Case
3:23-cv-03440-LB Filed 07/11/23).
[6] 美國幾件與AI相關專家系統、機器學習、語音與圖像辨識等演算法的專利訴訟個案,
如Vehicle Intelligence and Safety LLC v. Mercedes-Benz USA, LLC, Daimler AG 專
家系統案(Fed. Cir.2015), 78 F. Supp. 3d 884 (N.D. Ill. 2015); Blue Spike LLC
v. Google, Inc. 訊號辨識系統案(No. 14-cv-01650-YGR; No. 16-1054 (Fed. Cir.
2016)); Purepredictive v. H20.AI, Inc 機器學習案(No. 17-cv-03049, N.D. Cal.,
Aug. 29, 2017); Word to Info v. Apple Siri語音識別/自然語言處理案(Case
2:17-cv-00592-JRG Document 1, 2017).以上好幾件都通不過101適格標的之檢驗。
[7] 康乃爾大學法學教授Matthew D'Amore表示:在此領域申請專利需要克服很多障礙,
或許比智能手機時代還要困難…..,短期內暫時不會出現重大的法律衝突,因大型科技公
司都正忙於在此領域投入大量資金,且都知道各自都遵循相同的專利策略。
[8] 有趣的是,如向ChatGPT下指令詢問,它「客氣」的回應(甩鍋?):雖然GPT使用
Self-attention,但目前還不清楚Google的專利為何,也不知是否涵蓋GPT架構中
Self-attention的使用。
[9] 美國最高法院對上訴案大部分並不會受理,通常只挑具有重大法律問題或意義的案件
才核准聽審。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1691633542.A.902.html
... <看更多>