10月24日,在第七屆世界聲博會(huì)暨2024年科大訊飛全球1024開(kāi)發(fā)者節(jié)上,科大訊飛宣布訊飛星火4.0Turbo全新升級(jí)??拼笥嶏w稱:星火4.0Turbo文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)、代碼、多模態(tài)七大能力全面超過(guò)GPT-4 Turbo,數(shù)學(xué)能力、代碼能力超過(guò)GPT-4o,星火4.0Turbo效率提升50%。值得注意的是,在數(shù)學(xué)能力上,訊飛星火已完成超長(zhǎng)思維鏈、樹搜索和自我反思評(píng)價(jià)等算法驗(yàn)證,預(yù)計(jì)今年底可實(shí)現(xiàn)“類o1”(高難度數(shù)學(xué)能力顯著提升)。
星火4.0 Turbo發(fā)布,數(shù)學(xué)能力、代碼能力超過(guò)GPT-4o
訊飛星火大模型4.0 Turbo正式發(fā)布,在數(shù)學(xué)能力、代碼能力上超過(guò)了GPT-4o。由艾倫人工智能研究所、OpenAI等國(guó)內(nèi)外權(quán)威單位發(fā)布,涵蓋理解和推理、綜合考試、數(shù)學(xué)和科學(xué)、代碼等不同任務(wù)類型的14項(xiàng)主流測(cè)試集中,訊飛星火4.0-Turbo在其中9項(xiàng)測(cè)試集中實(shí)現(xiàn)超越,星火4.0 Turbo效率相對(duì)提升50%。
根據(jù)行業(yè)實(shí)用數(shù)學(xué)任務(wù)構(gòu)建的測(cè)試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計(jì)算、財(cái)務(wù)、金融、度量等多個(gè)維度的任務(wù)中均超過(guò)GPT-4o水平,已完成超長(zhǎng)思維鏈、樹搜索和自我反思評(píng)價(jià)等算法驗(yàn)證,預(yù)計(jì)今年底可實(shí)現(xiàn)類“o1”的高難度數(shù)學(xué)能力顯著提升。
根據(jù)代碼生成HumanEval測(cè)試集上的效果對(duì)比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務(wù)上和GPT-4o的差距微弱,在C++能力上超過(guò)GPT-4o。
在真實(shí)應(yīng)用場(chǎng)景,基于認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室構(gòu)建的iFLYCode-Eval-2.0代碼實(shí)用場(chǎng)景測(cè)試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯(cuò)、單元測(cè)試等任務(wù)上都超過(guò)了GPT-4o。同時(shí)推出星火代碼7B版本,滿足代碼生成、代碼補(bǔ)全等極速響應(yīng)型任務(wù)。
與華為合作,打造“飛星二號(hào)”大規(guī)模智算平臺(tái)
近兩年來(lái),以ChatGPT為代表的生成式AI掀起新一輪產(chǎn)業(yè)浪潮,科大訊飛基于已有的技術(shù)積淀和成建制的研發(fā)團(tuán)隊(duì),迅速跟進(jìn)大模型研發(fā)。2023年5月6日,公司首發(fā)星火認(rèn)知大模型,此前已更新至4.0版本。
2023年上半年,科大訊飛與華為組建聯(lián)合特戰(zhàn)隊(duì),就大模型底座能力進(jìn)行高強(qiáng)度的攻關(guān)訓(xùn)練,并在半年內(nèi)實(shí)現(xiàn)星火大模型訓(xùn)練和推理效率翻番。
2023年10月24日,二者聯(lián)合打造的基于昇騰生態(tài)的自主可控大模型算力底座“飛星一號(hào)”正式發(fā)布。據(jù)悉,這是首個(gè)支持萬(wàn)億參數(shù)大模型訓(xùn)練的萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)。
基于“飛星一號(hào)”,科大訊飛在2024年已對(duì)星火大模型進(jìn)行了兩次迭代,分別在2024年1月30日、6月27日相繼發(fā)布了V3.5、V4.0,其中訊飛星火V4.0全面對(duì)標(biāo)GPT-4 Turbo,并實(shí)現(xiàn)在文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力等方面的整體超越。
記者從發(fā)布會(huì)獲悉,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)有限公司三方聯(lián)合打造的國(guó)產(chǎn)超大規(guī)模智算平臺(tái)“飛星二號(hào)”正式啟動(dòng)。
據(jù)悉,“飛星二號(hào)”將帶來(lái)新模型新算法的持續(xù)適配和智算集群規(guī)模的再次躍遷,持續(xù)探索無(wú)人區(qū)、引領(lǐng)國(guó)產(chǎn)大模型底座的發(fā)展、給世界提供第二選擇。“只有在真正自主可控的平臺(tái)上,才有真正的中國(guó)人工智能大未來(lái)?!笨拼笥嶏w董事長(zhǎng)劉慶峰表示。
(安徽商報(bào)融媒體記者 梁巍)