OpenAI推出GPT-4

2023-03-15 08:01

文本設(shè)置

小號(hào)

默認(rèn)

大號(hào)

Plus(0條)

3月15日消息，Open-AI剛剛公布大型語(yǔ)言模型的最新版本——GPT-4，該版本已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練，并且在模型文件中有更多的權(quán)重，這使得它的運(yùn)行成本更高。OpenAI表示，新模型將產(chǎn)生更少的錯(cuò)誤答案，更少地偏離談話軌道，更少地談?wù)摻稍掝}，甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。例如，GPT-4在模擬律師考試的成績(jī)?cè)诳忌信琶?0%左右，在SAT閱讀考試中排名前7%左右，在SAT數(shù)學(xué)考試中排名前11%左右。 | 相關(guān)閱讀（財(cái)聯(lián)社）

肖颯

“科技+金融”深度法律服務(wù)者

不得不重視的法律問(wèn)題

颯姐團(tuán)隊(duì)之前也寫過(guò)大量GPT模型合規(guī)的內(nèi)容，在這里做一個(gè)總結(jié)。

1、生產(chǎn)出來(lái)的“作品”著作權(quán)到底是誰(shuí)的？

根據(jù)我國(guó)《著作權(quán)法》第11條規(guī)定，作品歸屬于自然人、法人、非法人組織。換言之，在我國(guó)，只有自然人、法人可以成為著作權(quán)的主體，ChatGPT首先不是我國(guó)法律意義上的適格主體，因此不能成為真正意義以上的作者。另外，AI或ChatGPT產(chǎn)出的文本，是否是我國(guó)著作法意義上的“作品”也存在爭(zhēng)議。但必須提及的是，2019年12月我國(guó)出現(xiàn)了首例認(rèn)定人工智能產(chǎn)出文本為“作品”的判例（深圳南山區(qū)法院），但在全國(guó)范圍內(nèi)多數(shù)法院包括北京知識(shí)產(chǎn)權(quán)法院還是堅(jiān)持嚴(yán)格解釋法條，而非認(rèn)定機(jī)器AI成為作者。

2、利用ChatGPT生成的內(nèi)容是否需要與活人寫的內(nèi)容區(qū)別開(kāi)？如何應(yīng)對(duì)ChatGPT制造的“假新聞”和“謠言”？

首先，根據(jù)《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》，深度合成的信息內(nèi)容須添加顯著標(biāo)識(shí)，防止公眾混淆誤認(rèn)，AIGC內(nèi)容與真人內(nèi)容是需要做好區(qū)分的。針對(duì)假新聞和謠言等問(wèn)題，2023年1月10日正式實(shí)施的《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》，要求深度合成提供者和使用者，不得制作、復(fù)制、發(fā)布、傳播虛假新聞消息，轉(zhuǎn)載給予深度合成服務(wù)制作發(fā)布的新聞消息的，應(yīng)當(dāng)依法轉(zhuǎn)載互聯(lián)網(wǎng)新聞信息源單位發(fā)布的新聞信息。

颯姐團(tuán)隊(duì)提示：服務(wù)提供者應(yīng)當(dāng)加強(qiáng)深度合成內(nèi)容管理，采取技術(shù)或者人工方式對(duì)輸入數(shù)據(jù)和合成結(jié)果進(jìn)行審核，建立健全用于識(shí)別違法和不良信息的特征庫(kù)，應(yīng)當(dāng)建立健全辟謠機(jī)制。

3、如果用于AI訓(xùn)練的數(shù)據(jù)如果來(lái)源不合法，是否有法律風(fēng)險(xiǎn)？

我們必須明確一個(gè)前提：用于AI訓(xùn)練的數(shù)據(jù)必須是合法取得的。在個(gè)人信息采集方面，必須經(jīng)被采集人的知情同意，不能非法采集數(shù)據(jù)，需要遵循“個(gè)保法”規(guī)定和配套標(biāo)準(zhǔn)。在其他數(shù)據(jù)方面，需要取得權(quán)利人的同意或授權(quán)，例如將他人具有著作權(quán)的作品用于數(shù)據(jù)訓(xùn)練，需要在事前取得其授權(quán)，除非是已經(jīng)經(jīng)過(guò)著作權(quán)保護(hù)期或由于其他原因（CC授權(quán)等）而進(jìn)入公共領(lǐng)域的作品，否則不能直接使用。同時(shí)，服務(wù)提供者和技術(shù)支持者應(yīng)當(dāng)加強(qiáng)訓(xùn)練數(shù)據(jù)管理，采取必要措施保障訓(xùn)練數(shù)據(jù)安全，防止數(shù)據(jù)泄露。

隱隱

根據(jù)OpenAI公布的信息，GPT4相比上一代有了飛躍性的提升，擁有強(qiáng)化版的推理能力，能夠生成與編輯創(chuàng)新型與技術(shù)性的文字內(nèi)容，并且在圖像處理執(zhí)行任務(wù)上幾乎一步到位，一瞬間替百度們有點(diǎn)絕望了，在可用數(shù)據(jù)的數(shù)量和質(zhì)量尚且欠缺的情況下，不知道怎么跟人家打。

關(guān)于比人類表現(xiàn)得更好的這一點(diǎn)，可能不少人會(huì)質(zhì)疑，chatGPT只是依靠過(guò)往信息的獲取整合輸出，它并沒(méi)有創(chuàng)造性的思辨能力，但個(gè)人認(rèn)為，某些時(shí)候，人類忽略了自身看似感性的認(rèn)知、創(chuàng)造的表達(dá)也建立在過(guò)往經(jīng)歷和信息的獲取，盡管不同的人有其特異性，但從群體的視角，有時(shí)候卻呈現(xiàn)高度的趨同。從OpenAI“更少地談?wù)摻稍掝}”的表態(tài)中，也說(shuō)明這一智能工具的邊界，正在被背后的開(kāi)發(fā)者小心翼翼地釋放。未來(lái)或許會(huì)產(chǎn)生更多難以令人分辨的不實(shí)信息，以及加速重復(fù)性工作崗位的替代。

陳守華

掛牌上市顧問(wèn)，品牌策劃人。

GPT-5也會(huì)在不久的將來(lái)推出，人工智能已經(jīng)進(jìn)入指數(shù)級(jí)發(fā)展階段。

格隆匯

投資研究

NB！對(duì)不起，實(shí)在沒(méi)忍住說(shuō)出這兩個(gè)字。

ChatGPT（GPT-3.5）引爆科技圈后，所有人都在討論，AI下一步會(huì)往哪個(gè)方向發(fā)展。

上一次有這種感覺(jué)，還是初代iPhone發(fā)布的時(shí)候。

我們并沒(méi)有等太久。

隔夜，OpenAI正式推出新品GPT-4，再次點(diǎn)燃了大家的想象力。

老板Sam Altman直接開(kāi)門見(jiàn)山地介紹：

這是我們迄今為止功能最強(qiáng)大的模型！

有多強(qiáng)？

就像不少人感嘆的：如果GPT-3.5尚屬意料之中，GPT-4則讓我自愧不如。

這一波，真是科幻照進(jìn)現(xiàn)實(shí)了。

01

偉大變革的前奏

怎么證明一個(gè)人比另一個(gè)人水平高？

現(xiàn)實(shí)社會(huì)中，主要手段是考試、拿證。

所以，想讓大部分人直觀地感受到，新AI模型比舊的牛逼，同樣是考試。

OpenAI用GPT-4參加了多項(xiàng)美國(guó)通用考試，成績(jī)很驚艷：

在SAT數(shù)學(xué)和閱讀考試中，GPT-4比GPT-3.5高150分；

它還能通過(guò)律師模擬考試，得分排在應(yīng)試者前10%，而震撼全球的GPT-3.5只能排在倒數(shù)10%……

隨后，在YouTube上進(jìn)行的Live Demo中，OpenAI展示了GPT-4的真正實(shí)力：總結(jié)文章、寫代碼、報(bào)稅、寫詩(shī)……GPT-3.5做不到的，GPT-4輕松拿下。

而且，還不僅僅是這樣。

根據(jù)OpenAI官網(wǎng)描述，相較于GPT3.5，GPT-4最大的進(jìn)化在于：“多模態(tài)”和長(zhǎng)內(nèi)容生成。

其中的關(guān)鍵，就是多模態(tài)這個(gè)詞，顧名思義，就是不同類型數(shù)據(jù)的融合。

目前GPT-4最大的突破，就是擁有了“讀圖能力”。

用戶可以直接用圖片提問(wèn)，它能夠在讀懂圖片內(nèi)容的基礎(chǔ)上，給出有邏輯的回答。

有個(gè)形象的例子。

下面這個(gè)人用筆在本子上畫了個(gè)網(wǎng)站的草圖，然后用手機(jī)拍下來(lái)，發(fā)送給GPT-4。

10秒鐘后，它不僅識(shí)別出圖片的含義，還生成了要建立這個(gè)網(wǎng)站的代碼。

“您好，您的網(wǎng)站建好了。”

這個(gè)事件中，最核心的點(diǎn)并不在于編程、計(jì)算和分析能力，而是它能準(zhǔn)確理解圖片的含義，并給出解答，甚至是圖片解答。

這就比GPT-3.5高出一個(gè)世代了。

兩者的表現(xiàn)力根本不是一個(gè)級(jí)別的。我們可以理解為，在純文字的年代，照相機(jī)的出現(xiàn)，對(duì)信息交流產(chǎn)生了多大的促進(jìn)作用。

這就是AI進(jìn)化史上類似的事件。

甚至，這也只是表象。更讓我震驚加一點(diǎn)恐懼的，是GPT-4具備的的初步邏輯思維能力。

正如OpenAI在今天的博文中所說(shuō)：

我們創(chuàng)建了GPT-4，這是 OpenAI 努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。雖然在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類，但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平。

在OpenAI提供的一個(gè)示例中，GPT-4準(zhǔn)確地回答了幾個(gè)網(wǎng)絡(luò)meme為什么搞笑的問(wèn)題，雖然解釋得并不好笑。

GPT-4還學(xué)會(huì)簡(jiǎn)單的邏輯推理了。比如你問(wèn)，圖片里的繩子剪斷會(huì)發(fā)生什么。它答，氣球會(huì)飛走。

它甚至可以講出一些質(zhì)量不咋地、模式化的冷笑話。雖然并不好笑，但至少，它已經(jīng)開(kāi)始理解“幽默”這一人類特質(zhì)。

這兩件小事看起來(lái)挺弱智的，卻是AI向人類思維慢慢進(jìn)化的標(biāo)志。

就像古猿人第一次學(xué)會(huì)直立行走，石器時(shí)代的原始人第一次思考人與自然的關(guān)系。

微觀角度看，這沒(méi)什么大不了的。但拉長(zhǎng)時(shí)間線，以后人的眼光看，這也許正是偉大變革的前奏曲。

就像我們研究原始人走路一樣。

當(dāng)然，GPT-4依然有局限性。

首先，它的知識(shí)范疇也存在時(shí)間限制，截止于 2021 年 9 月。

其次，AI畢竟是AI，OpenAI也表示目前GPT-4并不完美，它在很多場(chǎng)景下的能力都不如人類。

據(jù)稱，該模型仍然存在“幻覺(jué)”或編造事實(shí)的問(wèn)題，并且在事實(shí)方面也不一定總是可靠的，“它傾向于堅(jiān)持認(rèn)為它是正確的，即使它錯(cuò)了”。

OpenAI表示，GPT-4正在努力解決其局限性，例如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示。

但盡管如此，沒(méi)人能否認(rèn)，GPT非常有潛力。

世界上任何事，最難的永遠(yuǎn)不是做不到，而是想不到。

只要有個(gè)雛形，哪怕很low、很簡(jiǎn)陋，距離做好就不會(huì)很遠(yuǎn)了。

OpenAI做出ChatGPT，最大的意義是是向大家證明，這種應(yīng)用是存在的，這種技術(shù)是可行的。這件事，不是干不成的。

就好像多年前，大家都在空談概念的時(shí)候，只有特斯拉先做出了成品。

02

成功絕非偶然

一個(gè)恐怖的事實(shí)：GPT-4早在去年8月就訓(xùn)練完成了。

之所以現(xiàn)在才面市，是OpenAI需要花6個(gè)月時(shí)間，讓它變得更安全。

這就不得不讓人浮想聯(lián)翩。

會(huì)不會(huì)已經(jīng)有GPT-5、GPT-6了，它們到底是什么樣子？是否已經(jīng)成長(zhǎng)為無(wú)法掌控的巨獸？

OpenAI的內(nèi)部技術(shù)，到底領(lǐng)先外界多少年？

巨大的壓力給到全世界。

自ChatGPT發(fā)布以來(lái)，國(guó)內(nèi)外眾多科技公司對(duì)AIGC技術(shù)的追捧已達(dá)到空前絕后的熱度了。

Chat GPT剛剛發(fā)布，百度便立即官宣了大模型新項(xiàng)目“文心一言”（ERNIE Bot），將在明天和大家見(jiàn)面。

在此后很短的一段時(shí)間內(nèi)，阿里、京東、騰訊、字節(jié)跳動(dòng)、360等多家互聯(lián)網(wǎng)及IT企業(yè)紛紛表示對(duì)AIGC技術(shù)發(fā)展的關(guān)注和跟進(jìn)，并同步提出了一些相關(guān)計(jì)劃。

種種跡象表明，從科技巨頭到行業(yè)龍頭，中國(guó)企業(yè)已紛紛進(jìn)入AIGC賽道競(jìng)逐。

但是，這塊蛋糕，并不好吃。

GPT-4是人工智能生成內(nèi)容——AIGC技術(shù)最新進(jìn)展的代表。

所謂AIGC，是繼專業(yè)生成內(nèi)容（PGC）、職業(yè)生成內(nèi)容（OGC）、用戶生成內(nèi)容（UGC）后，互聯(lián)網(wǎng)內(nèi)容生成的第四個(gè)階段——神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)。

這的確是人類科技史上翻天覆地的革命。

GPT-3.5和GPT-4，之所以能生成文字、代碼、語(yǔ)音、圖片、視頻，完成語(yǔ)言翻譯、文案撰寫、腳本編程，是因?yàn)镺penAI對(duì)數(shù)據(jù)、算力、算法等關(guān)鍵要素進(jìn)行了幾個(gè)世代的升級(jí)。

先說(shuō)數(shù)據(jù)。

僅GPT-3.5的訓(xùn)練參數(shù)，就達(dá)到1750億個(gè)以上。

想要把如此海量的數(shù)據(jù)被反復(fù)投喂給AI模型，單次訓(xùn)練成本就高達(dá)460萬(wàn)美元。

如果不是先有馬斯克、后有微軟的支持，OpenAI是不可能耗費(fèi)得起的。

再說(shuō)算力。

2012-2018年，全球AI算力需求增長(zhǎng)約為30萬(wàn)倍，這個(gè)數(shù)字已經(jīng)很恐怖了。

但從2018年起，隨著Google Duplex、Open AI Five以及新華社全球第一個(gè)“AI合成主播”上崗，人工智能技術(shù)開(kāi)始加速落地。尤其是今年，稱得上是爆發(fā)之年。

按照現(xiàn)在的進(jìn)度，根據(jù)預(yù)測(cè)，AI所需算力每100天將翻一倍。

也就是說(shuō)，到2030年，AI所需算力是現(xiàn)在的3200萬(wàn)倍。（2的25次方）

顯然，如果不在軟件服務(wù)、硬件支撐、芯片技術(shù)等方面協(xié)同創(chuàng)新，我們的算力水平不可能實(shí)現(xiàn)指數(shù)級(jí)別的增長(zhǎng)。

GPT-4的訓(xùn)練是在微軟云上進(jìn)行的。而在全球云計(jì)算市場(chǎng)，微軟云排名第二，再加上芯片技術(shù)的高速發(fā)展，這些都為ChatGPT的橫空出世奠定了堅(jiān)實(shí)的算力基礎(chǔ)。

最后說(shuō)算法。

相比傳統(tǒng)的AI算法，GPT的優(yōu)勢(shì)在于，通過(guò)海量參數(shù)，進(jìn)一步提升模型的精確度。

初代GPT模型的參數(shù)是1.17億個(gè)；GPT-2事15億個(gè)，增加了10倍；GPT-3達(dá)到1750億，是GPT-2的 100 倍；而GPT-4的真實(shí)參數(shù)在1750億-2800億之間，并沒(méi)有比GPT-3高出太多，其重點(diǎn)在數(shù)據(jù)處理優(yōu)化上。

這種大模型算法的實(shí)現(xiàn)，必須有高效率的算法框架來(lái)支撐，因?yàn)閰?shù)量上去之后，需要把模型和數(shù)據(jù)分散放到多個(gè)GPU卡上，卡之間如何通信、調(diào)度，如何進(jìn)行高效的反向傳播，都需要大量高水平技術(shù)人才來(lái)推進(jìn)和實(shí)施。

GPT之所以獨(dú)特，就是在目前世界上最強(qiáng)大的LLM（大語(yǔ)言模型）為基礎(chǔ)的同時(shí)，引入了基于人類反饋的強(qiáng)化學(xué)習(xí)方法，從而提高了對(duì)話的質(zhì)量，而升級(jí)到多模態(tài)預(yù)訓(xùn)練大模型GPT-4版本后，其對(duì)話質(zhì)量變得更加強(qiáng)大、完美。（具體可閱讀《ChatGPT的兩宗罪》）

同時(shí)也能看到，GPT-4之所以比GPT3.5強(qiáng)得有限，可能就是算法的效率達(dá)到瓶頸了。

GPT-5，可能沒(méi)有我們想象的那么快到來(lái)。

綜上，可以看出，ChatGPT是靠強(qiáng)大算力和高成本，用大規(guī)模的數(shù)據(jù)“喂”出來(lái)的AI模型，它的出圈看似是偶然的，但其成功卻絕非偶然。

其他公司想要復(fù)制一款ChatGPT，絕非隨便設(shè)計(jì)個(gè)對(duì)話模型就完事。

事實(shí)上，國(guó)內(nèi)AI領(lǐng)域真正缺乏的是技術(shù)積累，包括數(shù)據(jù)的清洗和標(biāo)注、模型的結(jié)構(gòu)設(shè)計(jì)，以及怎么訓(xùn)練、推理等，這些技術(shù)很多都需要經(jīng)驗(yàn)和積累，需要大量的科研人才和普通技術(shù)人員一步一個(gè)腳印走出來(lái)。

這方面，目前大公司更有優(yōu)勢(shì)。

比如百度，之所以能盡快推出“文心一言”，就是因?yàn)槠涫甓鄟?lái)累計(jì)投入了超過(guò)1000億元的技術(shù)研發(fā)經(jīng)費(fèi)。

而小公司，不僅承擔(dān)不起高昂的成本，也沒(méi)有前期的技術(shù)研發(fā)沉淀。跟風(fēng)入局，雖然在股市里有一時(shí)的風(fēng)光，利用時(shí)間差賺一些塊錢。

但長(zhǎng)遠(yuǎn)來(lái)看，終究會(huì)被市場(chǎng)淘汰。

當(dāng)然，并不是說(shuō)小公司完全沒(méi)有機(jī)會(huì)，若能真正腳踏實(shí)地做好AIGC相關(guān)的一個(gè)細(xì)分板塊，依然有機(jī)會(huì)跑出來(lái)。

愿國(guó)內(nèi)科技公司在追趕世界前沿科技的同時(shí)，少一些嬌嬈炒作，少一些急功近利，多一些創(chuàng)新實(shí)干，多一些厚積薄發(fā)。

03

尾聲

今天有個(gè)熱搜挺有意思的。

說(shuō)是《校花的貼身高手》水了一萬(wàn)多章，十多年還沒(méi)完結(jié)，被讀者舉報(bào)了。

看得人一臉懵逼，這不是剛上高中時(shí)躲被窩里看的么。作者魚人二代，當(dāng)年還挺火的，《極品修真強(qiáng)少》、《很純很曖昧》都是青春期難忘的回憶。

印象中，這部小說(shuō)早就被翻拍成電視劇，下意識(shí)便以為完本了。

其實(shí)想想也正常，追了一萬(wàn)多章的書，校花都成阿姨了，男主還是個(gè)雛兒，讀者當(dāng)然生氣……

還有另一種說(shuō)法。

平臺(tái)和簽約作者有協(xié)議，只要小說(shuō)不斷更，每個(gè)月就有幾萬(wàn)元固定收入。所以本該完本的小說(shuō)，作者又找了個(gè)代筆，磨磨唧唧水了近十年。

這波啊，是反向薅資本家羊毛，堪稱吾輩楷模。

平臺(tái)被薅得受不了了，于是自己找人偷偷舉報(bào)。

聯(lián)想一下。

當(dāng)ChatGPT、“文心一言”在國(guó)內(nèi)普及后，如果過(guò)氣的老牌作者人手一個(gè)，天天水字?jǐn)?shù)，能白嫖多少稿費(fèi)？

想想就流口水啊。

對(duì)已經(jīng)功成名就的部分網(wǎng)文作者而言，AI的普及，大概率是件好事。

但對(duì)其他人，不一定如此了。

根據(jù)上文，總的來(lái)說(shuō)，GPT-4 的已經(jīng)證明了，它有能力在很多領(lǐng)域，呈現(xiàn)出超越人類的表現(xiàn)。

甚至有傳言稱，GPT-4通過(guò)了“圖靈測(cè)試”，在邏輯能力上與絕大部分人類已經(jīng)無(wú)異。

現(xiàn)在唯一的門檻，就是成本問(wèn)題了。

一旦算力、算法、數(shù)據(jù)得到突破性進(jìn)展，成本降下來(lái)了，就真的會(huì)對(duì)一些產(chǎn)業(yè)形成沖擊。

說(shuō)不定吃著火鍋唱著歌，突然就被 AI 把命給革了。

當(dāng)然，我還是那個(gè)觀點(diǎn)：快點(diǎn)學(xué)，快點(diǎn)用。

AI畢竟是工具，是被人奴役的對(duì)象。

即使將來(lái)淘汰一部分人，也是先淘汰那些不會(huì)使用先進(jìn)工具的人。

我愛(ài)這個(gè)魔幻的世界。（全文完）

蘭香

長(zhǎng)期跟蹤研究金融和新產(chǎn)業(yè)

預(yù)測(cè)一下：知識(shí)傳播類的頭部，也包括各類型的教師，用自己的數(shù)字人+ ChatGPT 不斷迭代構(gòu)建的自我知識(shí)庫(kù)，同時(shí)給幾十萬(wàn)人上課的場(chǎng)景會(huì)是多么震撼？亦或?qū)W生們直接用各種訓(xùn)練好的AI工具自我學(xué)習(xí)，學(xué)習(xí)模式將會(huì)有什么改變？最簡(jiǎn)單的學(xué)習(xí)路徑不就是一問(wèn)一答嗎？
再進(jìn)一步，感覺(jué)所有不需要跑腿功能的個(gè)人助理和純耍嘴皮子的片兒湯會(huì)議愛(ài)好者都得下崗……
?當(dāng)然，等波士頓動(dòng)力和科大訊飛加入戰(zhàn)團(tuán)后，可能除了資本家之外，幾乎所有人都得下崗……
?再當(dāng)然，可能最后人類也都得下崗……

評(píng)論

撰寫或查看更多評(píng)論

請(qǐng)打開(kāi)財(cái)富Plus APP

前往打開(kāi)

熱讀文章

精品国产_亚洲人成在线高清,国产精品成人久久久久,国语自产偷拍精品视频偷拍

關(guān)注我們

OpenAI推出GPT-4

肖颯

隱隱

陳守華

格隆匯

蘭香

撰寫或查看更多評(píng)論