鄧力后來說:在深度學習剛剛被提出時,全世界只有兩家公司真的相信了?!捌渲幸患沂枪雀?,另一家就是科大訊飛?!?/section>谷歌后來花費了4400萬美元收購了多倫多大學的一家初創公司 DNNResearch。這家公司在當時不僅沒有任何產品,也壓根沒有生產產品的計劃。它只有三位員工Geoffrey Hinton與他的學生Alex Krizhevsky、llya Sutskever。順便說一句,llya Sutskever后來離開谷歌,成為Open AI的聯合創始人和首席科學家,并參與主導了ChatGPT的研發。
左一為鄧力,右一為Geoffrey Hinton
在2022年底的那個關鍵一周,測試ChatGPT的重任落在劉權身上。
劉權是魏思和劉聰的師弟,他2012年進入中科大語音實驗室,正是“深度學習”風起云涌之時。當年,實驗室十五個人,十四個人都搞語音,只有他一人自告奮勇要用深度學習的方法去搞NLP(自然語言理解)。
轉博時,實驗室老師勸他搞語音,被劉權直接拒絕了:“我說我就不做語音,我要徹底的‘NLP’?!?/p>
劉權后來加入魏思負責的“超腦計劃”,是超腦組“一號組員”,專攻常識推理,后來他在2016年Winograd Schema國際認知智能挑戰賽上拿下第一名。他的系統是唯一用深度學習做出來的系統,當年其他系統都仍然使用傳統符號邏輯推理方法。
盡管奪冠,但第一名的正確率也只有58%。這是個什么概念呢?“這個測試是二選一,也就是說,小孩隨機猜都能拿50分?!?/p>
也就是說:算法還抵不過瞎猜。這個結論令人沮喪。在那個年代,機器的推理能力尚不及兒童水平,通用人工智能仍是遙不可及的事。
劉權后來離開“常識知識推理”領域,從2017年到2022年底,他在訊飛一直從事“人機交互”,仍與NLP相關,但那是一個更貼近企業實際應用的東西,“為稻粱謀”,劉權也與通用人工智能漸行漸遠。
因此當2022年11月30日,劉權開始測試ChatGPT時,就像回到久別重逢的故鄉,看到了熟悉的人,但已是今時不同往日。
之后的那一周,劉權把科大訊飛研究院好幾個方向的骨干都拉進一個群里,都是他認為最靠譜的人。實際上,研究院整建制的團隊都在支持他。他和他的小伙伴們開始輪番上陣測試ChatGPT。
當GPT的訓練方法通過對海量數據的高質量清洗和對上億參數大模型的訓練之后,突然迸發出驚人的力量。
“當它把全世界的書、全世界的網頁、全世界的語料都讀了一遍之后,神奇的事情出現了。大模型大概率就懂得了語義——它可能讀懂了語言在隱含空間中的意思?!?/p>
一周之內,劉權寫下整整一百頁PPT。在這個PPT最后,劉權建議“借鑒ChatGPT思路,在重要認知智能任務中開始研究,并研制一個中等大規模預訓練模型”。(注:后來這一建議在立項時被擴展到“1+N”,即一個“可對標ChatGPT的大模型”加N個“行業大模型”)
短短兩句話,意味著要以億為單位,“燒錢”投入GPT技術。

科大訊飛AI研究院副院長劉權

2022年12月7日,科大訊飛A4樓五樓北側,訊飛研究院院長胡國平那間不到二十個平方米的辦公室擠滿了人,研究院最生猛的年輕人們都在。大家圍住一臺電腦,電腦連著一個投影,投影上是劉權熬夜寫成的《Open AI ChatGPT 調研分析報告》。ChatGPT最大的反對派是魏思,他認為ChatGPT是“一本正經地胡說八道”,這源自于他對GPT-1到GPT-3的觀察?!拔艺f你別聽他吹牛。Open AI特別喜歡PR(公關),GPT-1到GPT-3都吹得跟啥一樣,其實效果并不好?!?/section>支持派的代表人物則是劉聰。劉聰是結果導向,他在舉了很多例子后說:“這一次有可能是顛覆性的?!?/section>魏思反問:你不能光看結果,有些結果是人為做出來的。你有沒有自己去試?劉權沒有評價兩位師兄的發言。他調試好了他的一百頁PPT,開始一頁一頁的分析。會議結束后的中午,魏思沒去吃飯,他找劉權要了一個賬號,開始親手測試ChatGPT。魏思用的是教育和醫療任務去測ChatGPT,ChatGPT是大模型,不可能針對這些“小任務”做過訓練。但結果出乎魏思的意料,ChatGPT的表現與訊飛專門針對這些任務訓練過的“小模型”相比,差距并不大?!斑@就相當厲害了?!?/section>一個下午過去,魏思的觀點一百八十度翻轉,一躍成為支持派。魏思當天晚上就給劉慶峰寫郵件。他不容置疑地說:我們必須上(大模型),不上肯定落后。劉慶峰立刻要了一個賬號體驗,體驗完之后,劉慶峰把ChatGPT定義為“通用人工智能的曙光”。他判斷,大模型將對整個人類的生產和生活方式帶來巨大的顛覆,產生全新的機會?!靶乱惠喌睦顺币獊砹恕?。“很多系統是在各個專用領域做到了超過我們人類的水平,尤其是在各大感知領域,但今天在通用人工智能的曙光下,星星之火開始出現?!眲c峰說。一是,科大訊飛要把資源壓上去,重現Open AI的智慧涌現。二是,大模型要做“1+N”,“1”就是指通用認知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。三是,建立一套實實在在、腳踏實地、科學的、系統的評測體系。要用評測體系給出判斷,技術到底到了什么程度了、下一個發展應該往哪邊走。 整個研究院都為之沸騰??拼笥嶏w的大模型被命名為“星火”。劉慶峰對這個詞感觸很深。這和訊飛創業初期的“要么率先燎原,要么率先熄滅”的意象異曲同工?!靶切侵?,可以燎原”出自《毛澤東選集》,在關鍵時點,點出了中國革命重大轉折來臨的歷史邏輯。
討論
2023年5月6日,合肥奧體中心的主場館內,劉慶峰董事長帶著星火大模型跑步入場。
在此后的兩個小時內,劉慶峰和劉聰在臺上一起操控“星火”完成各式任務。那大概是科大訊飛歷史上氣氛最熱烈的發布會了,能容納1500人的會展中心主場館座無虛席,就連過道上也擠滿了人,他們在一陣陣驚呼聲中站著聽完2個多小時的發布會,而線上累計觀看人次超過3345萬,幾乎每隔幾分鐘,現場就爆發出熱烈掌聲。發布會后的下一個交易日,科大訊飛股票漲停,一周內滬深兩市成交量排名第一。魏思后來復盤時說:盡管GPT-3出來的時候沒有引起足夠重視,但那不是決定性的。「研究就是這樣,每個人都有自己認同的方向,有的人堅信,他就賭對了,所以他就成了。我們做的方向可能不一樣,但是沒關系。原創研究的不確定性是很大的,你可能做十個能成一個就不錯了,你不能賭這個東西??拼笥嶏w是家企業,對企業來說重要的并不僅僅是你賭對方向的能力,而是你迅速判斷哪個方向有用,并快速把它落地的能力?!?/section>你還要足夠勇敢,勇敢到在timing來臨時毫不猶豫。
當然,你還要足夠強悍和聰明。用劉聰的話說:錯一個東西,三個月就過去了。
2023年,鄧力在回顧過去十年人工智能的歷史時說:大模型正是人工智能的Goldrush(淘金熱),而上一個Goldrush就是十年前(深度學習)。4月28日召開的中共中央政治局會議指出,要重視通用人工智能發展,營造創新生態,重視防范風險。5月5日召開的二十屆中央財經委員會第一次會議則強調,要把握人工智能等新科技革命浪潮,適應人與自然和諧共生的要求。在10月25日,科大訊飛發布星火大模型3.0之后一天。安徽省發布《通用人工智能創新發展三年行動計劃》,提出搶占通用人工智能發展制高點,加速構建產業創新發展生態體系。人工智能的一個新的時代可能就要來了。劉慶峰說:“通用人工智能將是一個偉大的歷史進程,所以核心技術的進步也將是一步一個腳印、踏踏實實持續進化的過程;同時,就像過去十年一樣,我們依然不能放松對源頭技術的關注?!?/section>那些決定勝負的關鍵核心技術突破往往不是大力出奇跡,也不是集中一萬個工程師辦大事,而是由若干個充滿個性、野心勃勃的人在一個適宜創新的環境中碰撞出來的。在ChatGPT的賭局之后,魏思表示要請2022年12月7日見證過那個賭局的人們“撮”一頓。但在那之后,“星火”令所有人都抽不出時間了。 
安徽商報丨元新聞記者丨潘艷剛 周梅 梁巍

