10月24日,第六屆世界聲博會主論壇上,科大訊飛重磅發(fā)布星火認知大模型V3.0。根據科大訊飛現場給出的數據,相較上一版本,星火認知大模型新版本的七大能力均有一定程度的提升。根據《通用認知大模型評測體系》,基于真實用戶數據,新版本的文本生成能力上升3%;語言理解能力上升6%;知識問答能力上升7%;邏輯推理能力上升8%;數學能力提高3%;代碼能力提高9%;多模態(tài)能力提升7%。值得注意的是,新版本進一步升級了數學自動提煉規(guī)律、小樣本學習、代碼項目級理解能力、多模態(tài)指令跟隨與細節(jié)表達等能力,進一步提升星火的落地應用能力。國務院發(fā)展研究中心國研經濟研究院測評報告顯示,星火大模型V3.0綜合能力超越ChatGPT,國內領先,達到國際一流水平。
兩個半小時內星火干了啥?
第六屆世界聲博會主論壇上,科大訊飛重磅發(fā)布星火認知大模型新版本。科大訊飛稱:星火認知大模型V3.0版本全面對標ChatGPT。“其中文能力客觀評測超越ChatGPT,英文能力對標ChatGPT48項任務結果相當。”
在昨天的主論壇上,穿插在科大訊飛董事長劉慶峰的演講之中,科大訊飛研究院院長劉聰操縱星火認知大模型在兩個半小時內完成多項任務。
一、為孩子們即興創(chuàng)作主題為“小兔子登月,并遇到月球探測機器人”的繪本,并現場朗誦繪本。
二、圍繞認知大模型,解放生產力寫了一篇發(fā)言稿。
三、以孔子的身份,圍繞認知大模型,解放生產力寫了一篇發(fā)言稿。
四、現場學習科大訊飛研究院院長劉聰的語言風格,以劉聰的名義,圍繞認知大模型,解放生產力寫了一篇發(fā)言稿。
五、現場學習劉聰和女兒萱萱的聊天記錄,以劉聰的名義,給女兒寫了一封道歉信。
六、和星火大模型虛擬出的“哪吒”一起討論了哪吒和孫悟空的戰(zhàn)力對比。類似人設星火大模型已經擁有三千個。
七、以劉備的身份,和星火大模型虛擬出的“諸葛亮”一起討論了三國爭霸的局勢和對策。
八、翻譯了軍事科學院系統工程學院李德毅的一篇論文綜述《人工智能基礎問題:機器能思維嗎?》。
九、給劉聰同學一篇論文潤色,修改了其英文表達。
十、就“量子計算”生成一段文獻綜述。
十一、手把手教劉聰做一篇關于畢加索的英語閱讀理解,重點講解該篇閱讀理解該如何起標題。
十二、給一位最近總是發(fā)燒的兒童看病,通過讀醫(yī)學檢測報告生成重點及健康提醒。
十三、人機共創(chuàng),30分鐘共創(chuàng)生成一篇通用稿件。
皖版大模型已有1200萬用戶
安徽商報融媒體記者獲悉,當前訊飛星火已有1200萬用戶。
“大模型正日益成為解放生產力工具。”科大訊飛創(chuàng)始人、董事長劉慶峰表示。
與此同時,隨著大模型持續(xù)突破,訊飛AI開發(fā)者生態(tài)持續(xù)領先。自5月6日星火發(fā)布以來,訊飛開放平臺新增143.4萬開發(fā)者團隊,同比增幅331%,匯聚553萬AI生態(tài)開發(fā)者團隊。其中新增大模型開發(fā)者17.8萬,訊飛正與10萬+企業(yè)客戶用星火創(chuàng)新應用新體驗。大模型也顯著降低了開發(fā)者門檻,在訊飛星火上,已有1.5萬助手開發(fā)者,開發(fā)超2.9萬個助手應用。
盡管國務院發(fā)展研究中心國研經濟研究院測評報告顯示,星火大模型V3.0綜合能力超越ChatGPT,國內領先,達到國際一流水平。但是劉慶峰也在主論壇提出,國產大模型必須正視和GPT-4的差距。“國產大模型在復雜知識推理、小樣本快速學習、超長文本處理、跨模態(tài)統一理解上距GPT-4還有差距。”他表示,唯有秉持科學精神,才能真正實現超越。“大模型時代的大幕才剛剛揭開”。
值得注意的是,科大訊飛已經聯合華為開發(fā)基于昇騰生態(tài)的“飛星一號”大模型算力平臺。劉慶峰透露,對標GPT-4的更大參數規(guī)模的星火大模型正式啟動訓練,2024年上半年將實現對標GPT-4。(安徽商報融媒體記者 梁巍)