“假如我們現在不是用國產平臺,而是用已經成型的英偉達的平臺,我們今天發布的星火3.0的效果可能還會更好,但這一步我們非走不可。”在聯合華為發布“飛星一號”大模型算力平臺后,科大訊飛董事長劉慶峰接受《財富》采訪時表示。
10月24日,科大訊飛承辦的第六屆世界聲博會暨2023科大訊飛全球1024開發者節在安徽省合肥市舉辦。科大訊飛發布了訊飛星火認知大模型3.0版本,據稱該模型綜合能力已經超越國內同行,在文本生成、語言理解、知識回答、邏輯推理、數學能力等七大能力上均持續提升。劉慶峰在會上表示,訊飛星火3.0通用模型將全面對標ChatGPT,中文能力已超越ChatGPT,英文能力與之相當。
“飛星一號”則是科大訊飛基于華為昇騰生態開發的大模型算力平臺。雖然科大訊飛方面沒有公布更新版大模型的具體參數,但劉慶峰透露,這是首個真正在國產算力平臺上訓練出來的大模型,訊飛和華為“聯合特戰隊”半年內就將星火大模型訓練和推理效率翻番,而“飛星一號”平臺的發布意味著訊飛正式啟動對標GPT-4更大參數規模的星火大模型訓練。
“‘飛星一號’這個平臺發布的背后,最大的壓力是我們在做這件事情的過程中自己的心態,因為本來用英偉達可能一個月就能干成的事情,但我們與華為攜手克服各種不確定性,可能三個月才能干完。所以當時最大的困難就是我們在快速奔跑的過程中,別人用的最豪華的武器,而我們要一邊打仗,一邊磨練武器,或者說一邊要賺錢一邊要比別人投入更多,這很考驗我們的心態,但這對我們未來長期戰略是非常重要的。”他在接受采訪時坦言道。
科大訊飛10月19日發布的財報顯示,前三季度實現營業收入126億元,同比小幅下滑0.27%;歸屬凈利潤9936萬元,同比下滑76%。其中,第三季度凈利潤僅為2579萬元,同比下滑82%。其解釋稱利潤下滑主要原因系公司積極搶抓通用人工智能的歷史新機遇,在通用人工智能認知大模型等方面堅定投入。前三季度科大訊飛開發支出逾10億元,同比增長約44%。
另外,在此前發布的半年報中,科大訊飛凈利潤出現了73.54%的下滑,其解釋原因為公司應對美國極限施壓,加大了在核心技術自主可控和產業鏈可控等方面的投入。
盡管訊飛星火3.0已取得一定突破,但劉慶峰表示,國產大模型必須正視和GPT-4的差距。“國產大模型在復雜知識推理、小樣本快速學習、超長文本處理、跨模態統一理解上距GPT4還有差距。唯有實事求是的科學精神,才能真正實現超越。”
他預計對標GPT-4的目標有望于2024年上半年實現,屆時星火4.0大模型將會發布。
“我也不希望大家覺得我們老在蹭華為的熱點,但華為確實有很多值得我們學習的。訊飛是典型的高校科技成果,可以說是學生創業,我們在核心技術上夢想很多,商業化能力還是很弱的,所以要向他們多學習。無論是盈利能力還是管理能力,我們跟華為的差距都還挺大的。當然我們可能一樣都有夢想。”在談及科大訊飛是否是“微縮版華為”時,劉慶峰表示。(財富中文網)