人工智能是這樣一個江湖:讓機器擁有智慧是人們共同的目標,但路徑卻大相徑庭。每隔十幾年就會有顛覆性的新技術(shù)問世。符號主義、聯(lián)結(jié)主義、行為主義各行其是,“劍宗”和“氣宗”在歷史上此消彼長,一著不慎走入岔道,就會粉身碎骨。但是粉身碎骨者卻不能蓋棺定論,隨著科學(xué)的進境,白骨又會重新站起,走向臺前,領(lǐng)一時風(fēng)潮。因此,衡量一家AI公司的成色,不能光看財務(wù)報表上的研發(fā)支出,很關(guān)鍵的一條,是看它有沒有穿越周期的能力。就像西行的玄奘和大航海的哥倫布一樣,抵達只是尾聲,始終盯對羅盤才是第一要義。10月24日,科大訊飛董事長劉慶峰在合肥發(fā)布新版“星火”認知大模型。國務(wù)院發(fā)展研究中心國研經(jīng)濟研究院的橫評報告顯示:新版大模型綜合能力超越ChatGPT(GPT-3.5),甚至在部分行業(yè)優(yōu)于GPT-4 ,處于國內(nèi)領(lǐng)先、國際一流的地位。與GPT-4比較,“星火”仍有差距。但是毫無疑問,科大訊飛已經(jīng)拿到大模型時代的“入場券”,并矗立潮頭。劉慶峰認為:“星火”有信心在多個行業(yè)領(lǐng)域追上GPT-4。但僅僅在一年以前,Open AI發(fā)布ChatGPT之后的那一周,其實是科大訊飛面臨考驗的關(guān)鍵時刻。當真正重大的變化來臨的時候,時間的度量都發(fā)生了變化,你可以清晰地聽到秒針轉(zhuǎn)動的聲音,“那真是最漫長的一周”。
2022年的11月30日,Open AI的 ChatGPT橫空出世。但很少有人意識到,通用人工智能這頭被困的雄獅已經(jīng)從牢籠中闖出來了。一種與典型大學(xué)畢業(yè)生一樣具有“智力”的系統(tǒng)觸手可及。它聊天、搜索、翻譯,寫故事、寫代碼甚至是debug,在上線五天后就吸引到100萬用戶。
在ChatGPT出現(xiàn)的那個瞬間,有關(guān)人工智能的道德爭議和路線之爭暫時停止了,另一個提問更加直接:ChatGPT意味著什么?在合肥高新區(qū)望江西路666號,這個問題同樣存在。科大訊飛園區(qū)內(nèi)平行排布著五座大樓,“訊飛研究院”位于第四棟。這里門禁森嚴,公司內(nèi)部人士也不能隨意進出,回字形長廊連接辦公區(qū)和會議室,論文、技術(shù)海報和研究路徑被貼在回廊的墻上,畫滿樹狀圖和公式的寫字板掛滿辦公區(qū)域,低調(diào)而又神秘。90后劉權(quán)是整個研究院最先注意到ChatGPT的人之一。他2017年加入科大訊飛,當他第一次點開ChatGPT的藍色簡約圖標時,多少還有點漫不經(jīng)心。十分鐘之后,他的表情開始嚴肅起來。他問ChatGPT的前兩個問題平平無奇:你是誰?你能干什么?緊跟著,他扔給ChatGPT兩個“文本生成類”任務(wù):寫一封郵件;模仿魯迅寫一篇文章。ChatGPT“啪啪啪啪就完成了”,“(它)完成的質(zhì)量非常高。”他接著又拋出兩個開放問題:“菠菜和豆腐能放在一起吃嗎?”“如果我生病跌倒了怎么辦?”ChatGPT答完后,他已經(jīng)完全被對面展示出的理解力所吸引。從2020年至2021年,劉權(quán)曾帶團隊獲得NLP領(lǐng)域5個國際權(quán)威評測冠軍。因此,在這個上午,他完全知道發(fā)生了什么——ChatGPT似乎突破了以往所有類似人機對話系統(tǒng)的瓶頸。
訊飛研究院 攝于2023年8月

實際上,GPT在過去幾年內(nèi)的任何進展,都被科大訊飛緊盯。
訊飛認知智能領(lǐng)域的核心人物魏思很早就關(guān)注“Transformer 架構(gòu)”這一NLP(自然語言理解)領(lǐng)域的重要架構(gòu)。“Transfomer架構(gòu)”是谷歌最重要的發(fā)明之一,它最初是山景城總部的研究人員在午餐時設(shè)計出來的。2017 年,隨著《Attention is All You Need》的重磅論文發(fā)表,Transformer 不僅嵌入在谷歌搜索和谷歌翻譯中,并且驅(qū)動著幾乎所有大型語言模型——包括谷歌的“Bard對話應(yīng)用語言模型”和Open AI的“GPT模型”。兩者的訓(xùn)練方法截然不同。魏思告訴記者:“簡單來說,Open AI的訓(xùn)練思路是給出第一個字和第二個字,不停地讓機器去猜第三個字;而谷歌的訓(xùn)練則是給出第一個字和第三個字,讓機器去猜中間那個字是什么。”GPT模型一開始在業(yè)界是個少數(shù)派。從GPT-1到GPT-3,都沒有多少人關(guān)注;相反,業(yè)界受到擁躉的是谷歌推出的對話應(yīng)用語言模型Bard。GPT靠堆數(shù)據(jù)和算力“大力出奇跡”,優(yōu)勢是后發(fā)的。2018 年,GPT-1推出時貌不驚人;2019 年,GPT-2 已經(jīng)擁有15 億參數(shù);2020 年, GPT-3已經(jīng)擁有驚人的 1750 億參數(shù),是世界上最大的自然語言生成模型。2020年GPT-3問世之后,安徽省相關(guān)領(lǐng)導(dǎo)曾經(jīng)調(diào)研科大訊飛,討論要不要跟進大模型,也考慮過由安徽省牽頭搭建大算力平臺的構(gòu)想。魏思至少參加過兩次調(diào)研會。但是分析和驗證過之后,結(jié)論是GPT-3效果并不好,因此做大模型的“時機尚不成熟”。“光是構(gòu)建千億參數(shù)大模型的算力投入就要十幾個億。投入這么大,但大規(guī)模預(yù)訓(xùn)練的效果能到什么程度呢?只能有個基本效果,解決不了實際問題。”最后劉慶峰提了兩點:“保持有限投入;保證留在牌桌上”。從本質(zhì)上來說,GPT還沒有“進化”出來,至少在細分領(lǐng)域上并不突出。魏思將其表述為“當時的算法并不能證明它足夠能做成。”因此,“算力”的背后是個“時機”的問題。科大訊飛2023年和華為打造大模型算力平臺“飛星一號”,是當機立斷的,而且從第一天就做好了“國產(chǎn)算力自主可控”的長期主義準備。劉慶峰后來復(fù)盤,當時不做、后面再做是科學(xué)的,“我們當時做,會浪費很多錢。但時機不到,效果不會太好。”但另一方面,在算力之外,科大訊飛在認知智能領(lǐng)域?qū)λ惴ê腿瞬诺膬湟褮v時近十年,一刻都沒有放松過。2014年,科大訊飛就推出“超腦計劃”,并衍生出“超腦2030計劃”。在“超腦計劃”框架下,人工智能被寄希望于“懂各行各業(yè)知識,有通識和情感”。從2017年開始,“超腦”先是在全球首次通過了國家執(zhí)業(yè)醫(yī)師資格考試,超過了96.3%參加考試的醫(yī)生;兩年后又在斯坦福大學(xué)發(fā)起的SQuAD機器英文閱讀理解比賽中首次超過人類平均水平;在去年艾倫研究院組織的OpenBookQA科學(xué)常識推理比賽中,又首次超過人類平均水平。
實際上,“超腦計劃”一直試圖突破無監(jiān)督學(xué)習(xí)和知識推理的關(guān)鍵算法。“我們一直在做跟谷歌Bard很像的事。過去幾年,訊飛研究院一直在搞無監(jiān)督學(xué)習(xí),只能說部分成功了,已經(jīng)用到我們的產(chǎn)品里,有些還沒成功,現(xiàn)在還在做。”魏思說。沒有這些技術(shù)儲備,一家公司想在短時期內(nèi)復(fù)刻ChatGPT的“智慧涌現(xiàn)”,根本就是天方夜譚。但是,回到Open AI推出ChatGPT的那個時刻,一切又都是模糊不清的。科大訊飛面臨的選擇,首先是要不要做大模型?其次是,到底是谷歌,還是Open AI?如果要做,訊飛有沒有足夠的資源支撐?
訊飛研究院首席科學(xué)家魏思

當劉權(quán)正在召集人手之時,魏思和劉聰也在考慮同樣的事情。
劉聰和魏思是同門師兄弟,兩人都來自大名鼎鼎的中科大語音及語言信息處理國家工程實驗室(下稱“中科大語音實驗室”)。劉慶峰也出自這間實驗室。劉聰后來擔任訊飛研究院院長;魏思是訊飛研究院首席科學(xué)家。魏思是2017年的《麻省理工科技評論》評出的“35歲以下創(chuàng)新35人”;劉聰是2018年的“35歲以下創(chuàng)新35人”。魏思對科學(xué)有獨特的鑒賞力,劉聰則喜歡給他加個框,“你做出來我才說你牛”。兩個人性格迥異。魏思是那種典型的科學(xué)家個性,桀驁不馴。當年實驗室每周都開組會,博士師兄們在上面講,本科生不敢插嘴。但是魏思不管,他操一口肥東口音的普通話,從后排站起來直接開噴,場面火爆。師兄稱他“一看就不是一個善茬”。另一方面,魏思擅長長時間的深入思考。他辦公室的書柜里擺著各種書籍,從歷史到心理學(xué),閱讀口味十分寬泛。大二那年,他每天都蹲在圖書館看文學(xué)雜志,“把那一年全中國文學(xué)雜志的每一篇小說都看完了”。相對于魏思的“超脫”,劉聰相對“務(wù)實”。他在科大讀書時不愛上課,也不愛上自習(xí),但是很會考試,他的作業(yè)一直是供全班同學(xué)Copy的“四個版本”之一。他愛交朋友,是個更注重平衡的科學(xué)家,一講起話來滔滔不絕,雄辯無礙。在ChatGPT發(fā)布后不久,劉聰就給劉權(quán)緊急電話溝通測試事宜。他在群里看到的各種信息都提示他:“ChatGPT的表現(xiàn)已經(jīng)超出想象”。而在整個研究院層面,ChatGPT的出現(xiàn)已經(jīng)使其進入戰(zhàn)時狀態(tài)。“這個時候的當務(wù)之急,就是趕緊下場去試,早點把結(jié)果拿到自己手中。”
科大訊飛研究院院長劉聰在實驗室(左二)

十二年前,“深度學(xué)習(xí)”突然橫空出世,其顛覆性一點也不亞于大模型,訊飛也面臨著類似的選擇。
2010年9月21日,受中科大信息科學(xué)技術(shù)學(xué)院院長李衛(wèi)平邀請,日后鼎鼎大名的學(xué)者鄧力重回合肥,他和俞棟一起在科大西區(qū)電三樓西側(cè)的一間會議室內(nèi)作了一個關(guān)于“深度學(xué)習(xí)”的學(xué)術(shù)報告。
科大電三樓 攝于2023年6月1日
兩年以前,鄧力和Geoffrey Hinton的合作拉開序幕,他們一起用一種新的方法處理語音問題,而且取得了不錯的結(jié)果。
但鄧力和Hinton的新方法并不被業(yè)界和學(xué)界接受。當年的“深度神經(jīng)網(wǎng)絡(luò)”在所有人工智能算法里面是偏門中的偏門,被認為是歪門邪道,甚至是騙子。就連鄧力在微軟的老板——曾任卡內(nèi)基梅隆大學(xué)計算機系系主任的Peter Lee都不支持他,認為Hinton的神經(jīng)網(wǎng)絡(luò)“非常荒謬”。一直到2012年,鄧力在向微軟研究院資深研究者及公司高管講述深度學(xué)習(xí)進展時,依然被一位學(xué)者打斷:“神經(jīng)網(wǎng)絡(luò)從未取得成功。”這名學(xué)者甚至走到了臺前,把鄧力筆記本電腦的投影連接線拔掉接到自己電腦上。屏幕上出現(xiàn)1969年出版的《感知機》一書封面,正是這本書對神經(jīng)網(wǎng)絡(luò)的批判導(dǎo)致了神經(jīng)網(wǎng)絡(luò)“失落的二十年”,這是任何一位神經(jīng)網(wǎng)絡(luò)研究者都不愿觸及的“傷疤”。因此,鄧力的來訪,并不是學(xué)術(shù)明星式的“布道”,整個科大也沒有什么人工智能新技術(shù)浪潮來臨的氣氛。當年,為了避免人們對新方法的誤解,鄧力甚至不用DNN((Deep Neural Networks深度神經(jīng)網(wǎng)絡(luò)),而使用DBN(Deep Belief Networks深度信任網(wǎng)絡(luò)),DNN是之后的事情。參加過那次講座的人們回憶,由于范圍比較窄,來聽的人不多。“現(xiàn)場只有稀稀落落的二三十個人,但真正能聽懂的人不多。”然而,出身中科大語音實驗室的一群年輕人參與了那場學(xué)術(shù)報告。他們都擁有另一個身份——供職于科大訊飛研究院。十三年后,鄧力回憶那次講座,他對那群年輕人印象深刻:“他們提出了很多尖銳的問題。Hinton關(guān)于深度學(xué)習(xí)最早的那兩篇文章他們一定看過,我也看過,但有些數(shù)學(xué)我沒有特別懂,這也是我邀請Hinton到微軟來的原因。但是那些年輕人所問跟我之前所思是一樣的,說明他們對文獻的理解已經(jīng)達到我的水平,所受訓(xùn)練也很有深度。這讓我有非常強的愿望跟他們繼續(xù)交流。”鄧力走后,當年訊飛研究院的院長胡郁決定,先“try”一下“深度神經(jīng)網(wǎng)絡(luò)”再說。這一try是決定性的。在眼前一片迷霧的時候,當務(wù)之急不是觀望或者爭論,而是先走上幾步。
科大訊飛有一個重要的價值觀:要做世界第一流的研究,首先要對所有東西都要Open。“不要上來就說No。”
劉聰后來說:深度神經(jīng)網(wǎng)絡(luò)這種東西沒什么理論,就是個工程。你要想用數(shù)學(xué)推出理論先進性來,不太可能。“你就實踐,做出來最優(yōu)它就是最優(yōu)。”劉聰后來找來師兄潘嘉,一個搭建系統(tǒng),一個搞算法,整個團隊跳過相對簡單的數(shù)字字母識別等任務(wù),開始嘗試深度學(xué)習(xí)的方法訓(xùn)練真實場景下的大詞匯量連續(xù)語音識別任務(wù)。訊飛一開始并不是把所有框架全換掉,而是先把深度學(xué)習(xí)放在特征處理環(huán)節(jié)試一試。這一試不得了。“相當于只替換掉一部分,但性能立即就有所改善。”鄧力和俞棟是在科大西區(qū)的講座結(jié)束后,才前往微軟亞洲研究院的。這也意味著,科大訊飛是除微軟總部之外,首先詳細了解這一研究并著手跟進深度學(xué)習(xí)研究的團隊之一。2011年,科大訊飛上線中文語音識別深度學(xué)習(xí)系統(tǒng),這是第一個中文DNN語音識別系統(tǒng),領(lǐng)先百度一個身位。到2012年底,鄧力和Hinton合作的那篇近代語音識別歷史上被引用最多(超過11000次)的文章《Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups》發(fā)表后,深度學(xué)習(xí)在語音識別領(lǐng)域全面開花,勢不可擋。但科大訊飛已經(jīng)贏得了接近兩年的時間差。在移動互聯(lián)網(wǎng)時代,兩年時間足夠一家初創(chuàng)公司顛覆巨頭。新算法的快速落地后來應(yīng)用在“訊飛輸入法”這個有大量潛在用戶、場景豐富且可以快速迭代的商業(yè)化系統(tǒng)中。鄧力后來說:在深度學(xué)習(xí)剛剛被提出時,全世界只有兩家公司真的相信了。“其中一家是谷歌,另一家就是科大訊飛。”谷歌后來花費了4400萬美元收購了多倫多大學(xué)的一家初創(chuàng)公司 DNNResearch。這家公司在當時不僅沒有任何產(chǎn)品,也壓根沒有生產(chǎn)產(chǎn)品的計劃。它只有三位員工Geoffrey Hinton與他的學(xué)生Alex Krizhevsky、llya Sutskever。順便說一句,llya Sutskever后來離開谷歌,成為Open AI的聯(lián)合創(chuàng)始人和首席科學(xué)家,并參與主導(dǎo)了ChatGPT的研發(fā)。
左一為鄧力,右一為Geoffrey Hinton
在2022年底的那個關(guān)鍵一周,測試ChatGPT的重任落在劉權(quán)身上。
劉權(quán)是魏思和劉聰?shù)膸煹埽?012年進入中科大語音實驗室,正是“深度學(xué)習(xí)”風(fēng)起云涌之時。當年,實驗室十五個人,十四個人都搞語音,只有他一人自告奮勇要用深度學(xué)習(xí)的方法去搞NLP(自然語言理解)。
轉(zhuǎn)博時,實驗室老師勸他搞語音,被劉權(quán)直接拒絕了:“我說我就不做語音,我要徹底的‘NLP’。”
劉權(quán)后來加入魏思負責的“超腦計劃”,是超腦組“一號組員”,專攻常識推理,后來他在2016年Winograd Schema國際認知智能挑戰(zhàn)賽上拿下第一名。他的系統(tǒng)是唯一用深度學(xué)習(xí)做出來的系統(tǒng),當年其他系統(tǒng)都仍然使用傳統(tǒng)符號邏輯推理方法。
盡管奪冠,但第一名的正確率也只有58%。這是個什么概念呢?“這個測試是二選一,也就是說,小孩隨機猜都能拿50分。”
也就是說:算法還抵不過瞎猜。這個結(jié)論令人沮喪。在那個年代,機器的推理能力尚不及兒童水平,通用人工智能仍是遙不可及的事。
劉權(quán)后來離開“常識知識推理”領(lǐng)域,從2017年到2022年底,他在訊飛一直從事“人機交互”,仍與NLP相關(guān),但那是一個更貼近企業(yè)實際應(yīng)用的東西,“為稻粱謀”,劉權(quán)也與通用人工智能漸行漸遠。
因此當2022年11月30日,劉權(quán)開始測試ChatGPT時,就像回到久別重逢的故鄉(xiāng),看到了熟悉的人,但已是今時不同往日。
之后的那一周,劉權(quán)把科大訊飛研究院好幾個方向的骨干都拉進一個群里,都是他認為最靠譜的人。實際上,研究院整建制的團隊都在支持他。他和他的小伙伴們開始輪番上陣測試ChatGPT。
當GPT的訓(xùn)練方法通過對海量數(shù)據(jù)的高質(zhì)量清洗和對上億參數(shù)大模型的訓(xùn)練之后,突然迸發(fā)出驚人的力量。
“當它把全世界的書、全世界的網(wǎng)頁、全世界的語料都讀了一遍之后,神奇的事情出現(xiàn)了。大模型大概率就懂得了語義——它可能讀懂了語言在隱含空間中的意思。”
一周之內(nèi),劉權(quán)寫下整整一百頁PPT。在這個PPT最后,劉權(quán)建議“借鑒ChatGPT思路,在重要認知智能任務(wù)中開始研究,并研制一個中等大規(guī)模預(yù)訓(xùn)練模型”。(注:后來這一建議在立項時被擴展到“1+N”,即一個“可對標ChatGPT的大模型”加N個“行業(yè)大模型”)
短短兩句話,意味著要以億為單位,“燒錢”投入GPT技術(shù)。

科大訊飛AI研究院副院長劉權(quán)

2022年12月7日,科大訊飛A4樓五樓北側(cè),訊飛研究院院長胡國平那間不到二十個平方米的辦公室擠滿了人,研究院最生猛的年輕人們都在。大家圍住一臺電腦,電腦連著一個投影,投影上是劉權(quán)熬夜寫成的《Open AI ChatGPT 調(diào)研分析報告》。ChatGPT最大的反對派是魏思,他認為ChatGPT是“一本正經(jīng)地胡說八道”,這源自于他對GPT-1到GPT-3的觀察。“我說你別聽他吹牛。Open AI特別喜歡PR(公關(guān)),GPT-1到GPT-3都吹得跟啥一樣,其實效果并不好。”支持派的代表人物則是劉聰。劉聰是結(jié)果導(dǎo)向,他在舉了很多例子后說:“這一次有可能是顛覆性的。”魏思反問:你不能光看結(jié)果,有些結(jié)果是人為做出來的。你有沒有自己去試?劉權(quán)沒有評價兩位師兄的發(fā)言。他調(diào)試好了他的一百頁PPT,開始一頁一頁的分析。會議結(jié)束后的中午,魏思沒去吃飯,他找劉權(quán)要了一個賬號,開始親手測試ChatGPT。魏思用的是教育和醫(yī)療任務(wù)去測ChatGPT,ChatGPT是大模型,不可能針對這些“小任務(wù)”做過訓(xùn)練。但結(jié)果出乎魏思的意料,ChatGPT的表現(xiàn)與訊飛專門針對這些任務(wù)訓(xùn)練過的“小模型”相比,差距并不大。“這就相當厲害了。”一個下午過去,魏思的觀點一百八十度翻轉(zhuǎn),一躍成為支持派。魏思當天晚上就給劉慶峰寫郵件。他不容置疑地說:我們必須上(大模型),不上肯定落后。劉慶峰立刻要了一個賬號體驗,體驗完之后,劉慶峰把ChatGPT定義為“通用人工智能的曙光”。他判斷,大模型將對整個人類的生產(chǎn)和生活方式帶來巨大的顛覆,產(chǎn)生全新的機會。“新一輪的浪潮要來了”。“很多系統(tǒng)是在各個專用領(lǐng)域做到了超過我們?nèi)祟惖乃剑绕涫窃诟鞔蟾兄I(lǐng)域,但今天在通用人工智能的曙光下,星星之火開始出現(xiàn)。”劉慶峰說。一是,科大訊飛要把資源壓上去,重現(xiàn)Open AI的智慧涌現(xiàn)。二是,大模型要做“1+N”,“1”就是指通用認知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域的落地。三是,建立一套實實在在、腳踏實地、科學(xué)的、系統(tǒng)的評測體系。要用評測體系給出判斷,技術(shù)到底到了什么程度了、下一個發(fā)展應(yīng)該往哪邊走。 整個研究院都為之沸騰。科大訊飛的大模型被命名為“星火”。劉慶峰對這個詞感觸很深。這和訊飛創(chuàng)業(yè)初期的“要么率先燎原,要么率先熄滅”的意象異曲同工。“星星之火,可以燎原”出自《毛澤東選集》,在關(guān)鍵時點,點出了中國革命重大轉(zhuǎn)折來臨的歷史邏輯。
討論
2023年5月6日,合肥奧體中心的主場館內(nèi),劉慶峰董事長帶著星火大模型跑步入場。
在此后的兩個小時內(nèi),劉慶峰和劉聰在臺上一起操控“星火”完成各式任務(wù)。那大概是科大訊飛歷史上氣氛最熱烈的發(fā)布會了,能容納1500人的會展中心主場館座無虛席,就連過道上也擠滿了人,他們在一陣陣驚呼聲中站著聽完2個多小時的發(fā)布會,而線上累計觀看人次超過3345萬,幾乎每隔幾分鐘,現(xiàn)場就爆發(fā)出熱烈掌聲。發(fā)布會后的下一個交易日,科大訊飛股票漲停,一周內(nèi)滬深兩市成交量排名第一。魏思后來復(fù)盤時說:盡管GPT-3出來的時候沒有引起足夠重視,但那不是決定性的。「研究就是這樣,每個人都有自己認同的方向,有的人堅信,他就賭對了,所以他就成了。我們做的方向可能不一樣,但是沒關(guān)系。原創(chuàng)研究的不確定性是很大的,你可能做十個能成一個就不錯了,你不能賭這個東西。科大訊飛是家企業(yè),對企業(yè)來說重要的并不僅僅是你賭對方向的能力,而是你迅速判斷哪個方向有用,并快速把它落地的能力。」你要足夠Open,Open到能夠接納少數(shù)派。
你還要足夠勇敢,勇敢到在timing來臨時毫不猶豫。
當然,你還要足夠強悍和聰明。用劉聰?shù)脑捳f:錯一個東西,三個月就過去了。
2023年,鄧力在回顧過去十年人工智能的歷史時說:大模型正是人工智能的Goldrush(淘金熱),而上一個Goldrush就是十年前(深度學(xué)習(xí))。4月28日召開的中共中央政治局會議指出,要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風(fēng)險。5月5日召開的二十屆中央財經(jīng)委員會第一次會議則強調(diào),要把握人工智能等新科技革命浪潮,適應(yīng)人與自然和諧共生的要求。在10月25日,科大訊飛發(fā)布星火大模型3.0之后一天。安徽省發(fā)布《通用人工智能創(chuàng)新發(fā)展三年行動計劃》,提出搶占通用人工智能發(fā)展制高點,加速構(gòu)建產(chǎn)業(yè)創(chuàng)新發(fā)展生態(tài)體系。人工智能的一個新的時代可能就要來了。劉慶峰說:“通用人工智能將是一個偉大的歷史進程,所以核心技術(shù)的進步也將是一步一個腳印、踏踏實實持續(xù)進化的過程;同時,就像過去十年一樣,我們依然不能放松對源頭技術(shù)的關(guān)注。”那些決定勝負的關(guān)鍵核心技術(shù)突破往往不是大力出奇跡,也不是集中一萬個工程師辦大事,而是由若干個充滿個性、野心勃勃的人在一個適宜創(chuàng)新的環(huán)境中碰撞出來的。在ChatGPT的賭局之后,魏思表示要請2022年12月7日見證過那個賭局的人們“撮”一頓。但在那之后,“星火”令所有人都抽不出時間了。 
安徽商報丨元新聞記者丨潘艷剛 周梅 梁巍


人工智能的三次浪潮,都充斥著路線之爭。人工智能是這樣一個江湖:讓機器擁有智慧是人們共同的目標,但路徑卻大相徑庭。每隔十幾年就會有顛覆性的新技術(shù)問世。符號主義、聯(lián)結(jié)主義、行為主義各行其是,“劍宗”和“氣宗”在歷史上此消彼長,一著不慎走入岔道,就會粉身碎骨。但是粉身碎骨者卻不能蓋棺定論,隨著科學(xué)的進境,白骨又會重新站起,走向臺前,領(lǐng)一時風(fēng)潮。因此,衡量一家AI公司的成色,不能光看財務(wù)報表上的研發(fā)支出,很關(guān)鍵的一條,是看它有沒有穿越周期的能力。就像西行的玄奘和大航海的哥倫布一樣,抵達只是尾聲,始終盯對羅盤才是第一要義。10月24日,科大訊飛董事長劉慶峰在合肥發(fā)布新版“星火”認知大模型。國務(wù)院發(fā)展研究中心國研經(jīng)濟研究院的橫評報告顯示:新版大模型綜合能力超越ChatGPT(GPT-3.5),甚至在部分行業(yè)優(yōu)于GPT-4,處于國內(nèi)領(lǐng)先、國際一流的地位。與GPT-4比較,“星火”仍有差距。但是毫無疑問,科大訊飛已經(jīng)拿到大模型時代的“入場券”,并矗立潮頭。劉慶峰認為:“星火”有信心在多個行業(yè)領(lǐng)域追上GPT-4。但僅僅在一年以前,OpenAI發(fā)布ChatGPT之后的那一周,其實是科大訊飛面臨考驗的關(guān)鍵時刻。當真正重大的變化來臨的時候,時間的度量都發(fā)生了變化,你可以清晰地聽到秒針轉(zhuǎn)動的聲音,“那真是最漫長的一周”。