上個月,香港立法會來了一位“AI同事”,被大家親切地稱為“AI字幕君”。
7月16日,香港立法會正式推出智慧謄錄系統“智識聽”AI實時字幕功能。公眾可以通過立法會網站的網上廣播等平臺收看帶有實時字幕的立法會大會會議直播。這標志著香港立法公開透明化邁出關鍵一步,也為粵港澳大灣區數字政務建設樹立了新標桿。
香港立法會主席梁君彥在社交平臺為其點贊,稱其是“人機結合的科創成果”,他還表示要將其推薦給英聯邦國家。
元新聞獲悉, “AI字幕君”出自安徽,由科大訊飛旗下“訊飛聽見”團隊打造。該項目在港落地,前后歷時三年。
“AI字幕君”三年入港,背后是科大訊飛的出海戰略。香港,正在成為內地大廠都要搶占的一個橋頭堡。這個高度開放、消費多元、連接中外的市場,正在被寄予了出海練兵、品牌滲透的重任。
01/
“AI字幕君”,三年入港
“AI字幕君”入港,歷經三個階段。
“智識聽”1.0版本始于2022年,一開始功能很簡單,就是“錄音轉文字”。
香港立法會是中華人民共和國香港特別行政區的立法機關,同時,立法會會議的過程會逐字記錄,一般被稱為議事錄,在立法會結束后向公眾發放。
“立法會開會頻繁,一天通常開會 8 到 10 個小時。”訊飛聽見項目經理張坤說。
每次開完會后,香港立法會的工作人員會手動將錄音導入系統,完成轉寫,由秘書處工作人員修改,再按特定格式輸出為謄錄稿;與此同時,系統還大量自動處理歷史錄音,“將錄音轉成文字”。
張坤說,以前立法會 10 個小時的錄音轉寫需要五六個小時,但1.0上線后,“ 14 天產出的謄錄版,7 天就能完成,效率大大提升。”
2021年,科大訊飛與全國人大信息中心簽署戰略合作協議;兩年后,全國人大“智慧簡報”系統正式上線。也是從2021年開始,訊飛聽見服務開始全面覆蓋全國人大、政協各駐地。香港立法會在看到相關成果后,開始尋求引入實時會議專業系統。
2023 年,2.0版本開始建設;2024 年上半年,智慧謄錄系統二期上線。
“2.0版本中,轉寫是實時的。所有立法會會議能實時將議員的講話內容轉化為文字,這也是首次在實時會議中引入中英粵語混讀識別引擎。”張坤說。
二期上線同時,香港立法會宣布建設智慧謄錄系統三期(“智識聽3.0”),特點是“配備實時字幕和后置字幕”——這也就是7月16日香港立法會推出的智慧謄錄系統“智識聽”AI實時字幕功能。
香港立法會網上廣播系統
02/
融入香港,首用三語混讀引擎
從1.0到3.0,皖產 AI系統一直克服在本地化難題。
香港立法會會議使用香港本地化、口語化的粵語詞匯,這些詞匯需要轉化為書面語,也涉及翻譯問題;而會議中法律相關專業術語較多,不同于香港人使用的日常語言。
另一方面,立法會中約有 10% 議員講英語,粵語、普通話、英語同時出現;部分從內地到香港的議員,為融入環境講粵語,連本地人都聽不懂。
為此,香港立法會專門提供了包含 2 億字的中英對照語句表,提升文本翻譯和文檔翻譯效果;秘書處還準備了2億5000萬字議事錄、400小時會議錄音音頻以及20萬組關鍵詞。
“香港立法會項目也是首個使用‘中英粵三語混讀引擎’的項目,立法會提供的大量真實會議語料標注訓練,經過數據和算法的優化和不斷的訓練,立法會會議實時字幕的準確率達96%。”張坤稱。
今年,科大訊飛還將底層引擎從 CPU 版本換成了 GPU 版本,大模型也升級為星火 X1 版本,底層能力得到大幅提升。
梁君彥在向媒體解釋“實時字幕”功能時說:“智識聽”在立法會會議期間會記錄與會者發言,將粵語轉化為書面語,AI會根據上文下理和語言學特征智慧斷句。幕后秘書處會在字幕自動生成后,在10秒鐘之內把關、修改,做到“人機合一”,字幕隨后加到直播畫面中,過程不足20秒。
“這種人機結合的科創成果,有賴于科大訊飛團隊努力不懈研發實時字幕、對接立法會應用場景,以及立法會秘書處各部門的全力投入,共同孕育出這套AI系統,讓它茁壯成長。”
香港立法會會議 實時字幕顯示
03/
伏筆三年,開始搶灘香港
伏筆埋了三年,香港立法會成為訊飛出海戰略的關鍵一手。
梁君彥后來在接受媒體采訪時表示,要將“智識聽”推薦給英聯邦國家:
「科技是時代的高鐵,你如果上不去,就會被社會的發展拋下。這幾年,內地在人工智能領域的發展日新月異,香港也不能掉隊,要積極與內地科技企業合作,推動立法會智慧化轉型。」
在“智識聽”1.0版本上線的2022年底,《香港創新科技發展藍圖》對外發布,為未來5至10年香港創科發展制訂清晰發展路徑和系統的戰略規劃,明確了香港創科發展的四大方向,包括“完善創科生態圈,推進香港‘新型工業化’”“壯大創科人才庫,增強發展動能”“推動數字經濟發展,建設智慧香港”和“積極融入國家發展大局,做好連通內地與世界的橋梁”。
從2024年開始,科大訊飛啟動國際化戰略升級。劉慶峰說,科大訊飛要堅定不移地為世界提供“第二選擇”。
而訊飛出海的“橋頭堡”就選定在香港。
2024年11月,訊飛醫療入選香港特區政府引進重點企業辦公室的“重點企業伙伴”,并于12月成為港交所主板上市的“醫療大模型第一股”;同年7月,科大訊飛宣布在香港投資4億港元設立國際總部,并建立國際研發中心。
科大訊飛香港國際總部的設立與訊飛醫療的分拆上市形成了戰略協同。
科大訊飛(國際)有限公司開幕儀式
香港是一個很復雜的市場,但人多、錢多、人口密度大。以香港為基地,訊飛正積極響應國家人工智能全球戰略,展開頂層布局,和歐洲、中東、東盟等國家開展緊密合作;而服務粵港澳大灣區“三語互通”需求的多語種會議系統可能正是破局先鋒。
今年6月,科大訊飛香港公司開幕。科大訊飛面向中、粵、英多語種混合的港澳市場同時發布了基于訊飛星火大模型底座能力研發的醫療、教育、會議、辦公等多領域人工智能產品。
發布會的核心亮點,正是訊飛聽見多語種會議系統的正式發布。迄今為止,該系統在香港貿發局、香港聯通等單位均有應用。用科大訊飛副總裁王瑋的話說“已打通三關”。
今年,科大訊飛在海外市場再次突破。一年來,海外開發者數從38.6萬增加到50.9萬,同比增長31.9%;海外AI營銷業務營收,從去年1-5月份的900萬增加到今年1-5月份的2.3億,同比增長25倍;海外C端硬件的營收增加3倍。更值得一提的是,科大訊飛自主研發的星火X1已支持130+語種。
訊飛星火AI大模型展項亮相大阪世博會中國館
04/
科大訊飛,已成高規格會議標配
7月26日,諾貝爾獎與圖靈獎雙料得主杰弗里·辛頓現身2025世界人工智能大會(WAIC)。杰弗里·辛頓演講完后,中國外交部原副部長傅瑩告訴他:“杰弗里,今天你的演講我聽得非常清楚,屏幕上有實時中文翻譯字幕,AI一直在翻譯你的話。”她接著還告訴杰弗里·辛頓:
「AI在聆聽你。(AI is listening to you!)」
傅瑩口中的“語音同傳”,和梁君彥口中的“智識聽”出自同門。科大訊飛是2025WAIC唯一翻譯合作伙伴。杰弗里·辛頓的演講內容橫跨AI發展史、認知科學、科技倫理、人類未來、量子計算隱喻等復雜領域,但杰弗里·辛頓演講的中文字幕體驗卻極為流暢,幾乎達到無感程度。
科大訊飛相關人士告訴元新聞,訊飛聽見已經服務全國人大四年,服務全國政協七年。其中:
在2025年的十四屆全國人大三次會議上,提供了160套智慧簡報系統,服務34個代表團,完成1290小時會議記錄和轉寫1875萬字,識別率96.2%;
在全國政協十四屆三次會議上,提供了60套智慧簡報系統,支撐372場分組會議,覆蓋58個界別。
2022年,訊飛多語種技術還助力北京冬奧會和殘奧會,使之成為人類歷史上首個信息溝通無障礙奧運會;科大訊飛還是2023布達佩斯世界田徑錦標賽語音技術及多語種翻譯合作伙伴和2024年巴黎奧運會“中國之家”人工智能技術獨家供應商。
“在整個高端會議領域,訊飛已經掌握了絕對的話語權。”一位業內人士稱,“嚴肅會議、規格會議、高權威會議用科大訊飛已成為一種共識。”
元新聞了解到,由于前三個版本識別和翻譯效果良好,香港立法會正在建設4.0版本,該版本將建設“英語字幕和多語種字幕系統”;與此同時,香港立法會還擬沿用成熟技術開發“智慧辦公系統AI 助手”和基于訊飛星火大模型的“知識問答和智能摘要”功能。
“4.0版本預計將在今年8 月啟動建設多語種實時分布系統,方便香港不同文化的市民看到更豐富的語言字幕。”
(安徽商報 元新聞記者 梁巍 “出海”系列報道⑤)