阿里云發(fā)布通義千問(wèn)2.5
裕棠
今年4月,清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗(yàn)室發(fā)布了2024年3月版《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》,報(bào)告認(rèn)為,在中文推理、中文語(yǔ)言等評(píng)測(cè)上,文心一言遙遙領(lǐng)先,和其他模型拉開明顯差距,中文理解上,文心一言4.0領(lǐng)先優(yōu)勢(shì)明顯,領(lǐng)先第二名GLM-4 0.41分,GPT-4系列模型表現(xiàn)較差,排在中下游,并且和第一名文心一言4.0分差超過(guò)1分。
如今通義千問(wèn)也是在“中文語(yǔ)境下”趕超GPT-4。但我想說(shuō)的是,對(duì)于中文,國(guó)內(nèi)的公司強(qiáng)一點(diǎn)也是正常的,但還是要看到差距的是,GPT-4幾乎覆蓋了所有的語(yǔ)言,因此是全球的大模型,其應(yīng)用還是要更加廣泛一些,國(guó)內(nèi)的互聯(lián)網(wǎng)公司大可把眼光放長(zhǎng)遠(yuǎn)和寬泛一些,不要老是想著只在“中文”上超越國(guó)際競(jìng)爭(zhēng)對(duì)手。
懿德資本
文心一言不敢恭維、李彥宏強(qiáng)調(diào)說(shuō)某些方面超過(guò)G PT4了、比如詩(shī)詞方面。我評(píng)論說(shuō)現(xiàn)在年輕人誰(shuí)好做實(shí)習(xí)、那還不如說(shuō)文言文方面更勝一籌呢,結(jié)果我的評(píng)論就被屏蔽了。不是鼓吹國(guó)外的東西、都是付費(fèi)版本、文心一言就是個(gè)小學(xué)生、回答問(wèn)題不會(huì)變通、一板一眼的回答。而GPT4目前最低也算高中生、回答問(wèn)題的邏輯性、拓展性都還可以的。