中國超300個大模型,僅有4成完成備案
2024-05-19 13:00
文本設置
小號
默認
大號
Plus(0條)
截至今年4月底,國內共計推出了305個大模型。而截至5月16日,只有約140個大模型完成生成式人工智能服務備案,占發布總量的45.9%。這一嚴峻現實的背后除了有技術層面的難度,還有訓練和推理過程中高昂算力成本的制約;即便是跨過這一關,大模型企業如何實現商業化,依然著面臨不小的難度。 | 相關閱讀(每日經濟新聞)
51
六和璧
現在國產大模型“百家爭鳴”的熱鬧氛圍讓我想起了團購網站“千團大戰”的時候,互聯網贏家通吃的現實催促著所有人全力沖刺。
國內很多公司開發的大模型都在拿GPT3.5或者4對標,宣稱在某些方面“不落下風”,有的號稱在參數更少的情況下性能相當,有的甚至宣稱“全面領先”。這些模型是如何實現這些所謂的領先呢?
簡而言之,這多半是過擬合現象導致的。所謂過擬合,是機器學習和統計建模中的一個常見問題,簡單來說,就是在測試中表現出色,而在實際應用中卻不盡如人意。
因此,在評估大模型能力時,我們不應過分關注這些測試集的得分。實際上,過度擬合在生活中的例子比比皆是,如大學排名的刷分、自媒體的刷流量等。真正優秀的模型應當是在公開市場競爭中,人們愿意為其支付額外費用的模型。其他任何補充說明都是多余的。
大浪淘沙,接下來的大模型“淘汰賽”正在進行中,“鹿死誰手”,還得看核心本事。