4月26日,訊飛星火大模型V3.5(以下簡稱“訊飛星火”)春季上新。面向用戶高效準確知識獲取的痛點,科大訊飛發布業界首個長文本、長圖文、長語音大模型,總體已經達到GPT-4 Turbo 4月最新長文本版本的97%水平。
多個垂直領域
長文本水平超越GPT-4 Turbo
為什么要做長文本、長圖文、長語音的大模型?
科大訊飛相關人士稱:用戶使用的最高峰不是周末,而是工作日的上午9:30和下午3:30。這意味著,大部分用戶用訊飛星火來解決和工作相關的剛需問題。而高效的知識獲取是用戶和開發者都高度關注的問題。
“在知識獲取和學習的過程中,廣大用戶能拿到的資料往往不僅是現成的長文本,還有隨手可見的報刊書籍內容、各種研討會的PPT內容,老師黑板上的板書、同學的筆記,以及各種會議錄音、訪談,各種網上的發布會、培訓教育視頻等。”
為此,科大訊飛推出首個支持長文本、長圖文、長語音的大模型,來解決用戶真實場景中多源信息的獲取需求。
本次訊飛星火長文本功能全新升級后,具備長文檔信息抽取、長文檔知識問答、長文檔歸納總結、長文檔文本生成等能力,總體已經達到GPT-4 Turbo 4月最新長文本版本的97%水平。
與此同時,在銀行、保險、汽車、電力等多個垂直領域的知識問答任務上,訊飛星火長文本總體水平已經超過GPT-4 Turbo。
科大訊飛CEO劉慶峰稱,科大訊飛進行了重要的模型剪枝和蒸餾,從而推出業界性能最優的130億參數的大模型,“在效果損失僅3%以內的情況下,使得星火在文檔上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。”
此外,科大訊飛也在26日首次推出星火圖文識別大模型。根據國際公開的權威英文測試集來看,訊飛星火的圖文識別效果超過微軟和谷歌。
同時,面對廣泛的音視頻信息高效獲取需求,科大訊飛也推出長語音功能,將國際領先的語音識別和翻譯技術結合起來,可以實現會議錄音、學習視頻等的一鍵研讀,實現音視頻場景的高效知識獲取。
復刻林志玲聲音
現在只要她一句話
萬物互聯時代下需要更真實的AI語音交互。年初訊飛星火V3.5發布會上,科大訊飛推出了超擬人對話功能,AI的聲音更自然更真實,擬人度達到了83%。無論是語音可懂度、流暢度還是表現力,效果均超過OpenAI、微軟。
值得注意的是,科大訊飛此次發布“多情感超擬人合成”,進一步提升了情緒表達的可感知度,對高興、抱歉、安慰、撒嬌、困惑等情緒表達的可感知度達到85%以上,AI語音更加生動、真實。
此前,昊鉑HT 2024 款車型行業率先搭載科大訊飛超擬人合成技術,已在4月25日正式全球上市。
同時,科大訊飛還推出“一句話聲音復刻”功能,一句話就可以定制你的AI助手聲音。
“比如模仿小朋友的聲音,每天給爺爺奶奶讀書讀報;在出差的時候,模仿我們的聲音給孩子講故事。”劉慶峰表示:“這個功能可以讓世界變得更有溫度。”
此前,科大訊飛在個性化語音合成一直處于業界領先,目前已進階至一句話聲音復刻。當年訊飛AI模仿林志玲的聲音需要去臺灣錄一個星期的聲音,到后來模仿郭德綱需要一天的聲音,再往后需要5分鐘的錄音,現在一句話就可以模仿。
智能無人“評標師”
已在央企上崗
目前,皖版大模型正在各個場景的落地。
在招投標場景,科大訊飛和國家能源物資公司在企業采購場景合作了智能無人評審系統,已經在國資委網站上被作為典型案例推薦。據介紹,在國家能源集團已評審5.7萬余單,評審準確率達97%。
日常生活中,消費者在買賣商品、裝修房屋或者是購買汽車保險時經常會遇到各種各樣的合同,看不懂存在風險怎么辦?皖版大模型推出星火合同助手,它可以對我們的合同進行風險審核、合同比對,摘要總結以及合同生成,迅速識別潛在風險漏洞,成為你口袋里的“法務助手”。
此外,星火科研助手目前已在中國科學院、三亞崖州灣科技城、北京郵電大學、哈爾濱工業大學等機構高校鋪開應用。多模態能力升級下,訊飛星火科研助手也進一步提升了論文問答、綜述生成、實驗解讀等的效果,使得解析的學術資料更加豐富,進一步賦能高校和科研院所的科研工作。
(安徽商報融媒體記者 梁巍)