ChatGPT引發(fā)人工智能狂潮
微軟準備在OpenAI及其開創(chuàng)性的機器人上投資數(shù)十億美元。為什么薩姆·奧爾特曼正在打造的未來讓人們感到既興奮又可怕?
圖片來源:FROM A PHOTOGRAPH BY DAVID PAUL MORRIS—BLOOMBERG/GETTY IMAGES? 插圖來源:HSIAO-RON CHENG
在一代人的時間里,總是會出現(xiàn)一些產(chǎn)品,將從工程部門昏暗的地下室中,青少年書呆子氣味難聞的臥室里,或者孤僻的有某種嗜好的人家中誕生的技術(shù),變成人人都會使用的工具。網(wǎng)絡瀏覽器誕生于1990年,但直到1994年,網(wǎng)景通信公司(Netscape Communications Corporation)開發(fā)的Netscape Navigator瀏覽器問世,大多數(shù)人才開始探索互聯(lián)網(wǎng)。2001年iPod誕生之前流行的MP3播放器,并未掀起數(shù)字音樂革命。同樣,2007年,在蘋果公司(Apple)的iPhone手機橫空出世之前,智能手機就已經(jīng)問世,但卻并沒有針對智能手機開發(fā)的應用程序。
2022年11月30日,人工智能領域可能也迎來了與Netscape Navigator瀏覽器的問世同樣重要的關鍵時刻。
位于美國加利福尼亞州舊金山的人工智能公司OpenAI的首席執(zhí)行官薩姆·奧爾特曼(Sam Altman)宣告了這個時刻的來臨。OpenAI成立于2015年,得到了埃隆·馬斯克(Elon Musk)、彼得·蒂爾(Peter Thiel)和其他PayPal幫成員以及領英(LinkedIn)的聯(lián)合創(chuàng)始人里德·霍夫曼(Reid Hoffman)等一眾硅谷大佬的投資。2022年11月30日,公司成立約七年后,奧爾特曼在推特(Twitter)上發(fā)文稱:“今天我們發(fā)布了ChatGPT。歡迎點擊這里與它聊天。”任何人都能夠通過推文中的鏈接注冊一個賬號,開始與OpenAI的新聊天機器人免費聊天。
這引起了各界人士的興趣。人們不止是與它交流天氣狀況。它根據(jù)軟件公司首席執(zhí)行官和工程師阿姆賈德·馬薩德(Amjad Masad)的要求,檢查了程序代碼的漏洞。美食博主和網(wǎng)紅吉娜·霍穆爾卡(Gina Homolka)要求它編寫一份健康的巧克力片曲奇餅干食譜。Scale AI公司的工程師賴利·古德賽德(Riley Goodside)要求它撰寫一集《宋飛正傳》(Seinfeld)的劇本。市場營銷人員、一家在線人工智能美術(shù)館的經(jīng)營者蓋伊·帕森斯(Guy Parsons)要求它為其撰寫提示語,然后輸入到另外一款人工智能系統(tǒng)Midjourney后轉(zhuǎn)換成圖像。斯坦福大學醫(yī)學院(Stanford University School of Medicine)的皮膚病學家、從事人工智能醫(yī)學應用研究的羅克薩娜·達內(nèi)什尤(Roxana Daneshjou)向它提出了醫(yī)學問題。許多學生利用它來完成家庭作業(yè)。這一切都發(fā)生在該聊天機器人發(fā)布后的24小時之內(nèi)。
以前也曾經(jīng)有過其他種類的聊天機器人,但沒有一款可以與ChatGPT相提并論。ChatGPT能夠進行天馬行空的長對話,可以回答問題,還能夠根據(jù)人們的要求撰寫各種書面材料,例如商業(yè)計劃書、廣告宣傳材料、詩歌、笑話、計算機代碼和電影劇本等。當然,它并不完美:它所提供的結(jié)果往往不夠準確;它無法引用信息來源;而且它幾乎完全不知道2021年以后發(fā)生的事情。雖然它提供的結(jié)果通常足夠流暢,在高中甚至大學課堂上可以過關,但根本無法像人類專家們的表述那樣做到字斟句酌。另一方面,通常在對用戶知之甚少的情況下,ChatGPT生成內(nèi)容只要大約一秒鐘時間,而且它生成的許多內(nèi)容并沒有想象的那么糟糕。在ChatGPT發(fā)布后的五天內(nèi),該聊天機器人的用戶就超過了100萬人,而Facebook用了10個月的時間才達到這個里程碑。
過去十年,人工智能技術(shù)在商業(yè)領域逐步擴大應用,悄然改進了我們?nèi)粘J褂玫脑S多軟件,但卻并沒有令非技術(shù)用戶感到興奮。ChatGPT的橫空出世改變了這一點。突然之間,人人都開始談論人工智能將會如何顛覆他們的工作、公司、學校和生活。
ChatGPT是一股相關人工智能技術(shù)浪潮的一部分,這種技術(shù)被統(tǒng)稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術(shù)生成模型。OpenAI位于科技行業(yè)“下一個大事件”的前沿,它具備了一家傳奇新創(chuàng)企業(yè)的特征,包括全明星級別的團隊和投資者的熱捧,該公司的估值據(jù)稱已經(jīng)達到290億美元。
該公司最近的突然躥紅引發(fā)了嫉妒、猜疑和恐慌。谷歌(Google)利潤豐厚的搜索帝國可能受到影響。據(jù)媒體報道,為了應對ChatGPT,谷歌內(nèi)部已經(jīng)拉響了“紅色警報”。但OpenAI能夠成為超強科技公司俱樂部的成員,卻出乎人們的意料。在幾年之前,它甚至還不是一家公司,而是一家致力于學術(shù)研究的小型非營利性實驗室。公司至今依舊秉持著崇高的創(chuàng)立原則,比如保護人類文明,防范不受限制的人工智能所帶來的威脅等。與此同時,OpenAI經(jīng)歷了一次內(nèi)部轉(zhuǎn)型,導致原始團隊分裂,公司也將重心從純科研項目逐步轉(zhuǎn)移到商業(yè)項目。(有批評者認為,發(fā)布ChatGPT本身是一種危險行為,并且表明OpenAI的經(jīng)營模式發(fā)生了巨大的轉(zhuǎn)變。)
OpenAI與微軟(Microsoft)擴大合作的消息在今年1月下旬公布,微軟將向該公司投資高達100億美元,作為回報,未來幾年,該軟件業(yè)巨頭將獲得OpenAI的大部分利潤。該筆交易可能會令外界更加確信,一份曾經(jīng)理想主義的事業(yè)現(xiàn)在只關心謀利。盡管如此,《財富》雜志掌握的文件揭示了尚未盈利的OpenAI目前的經(jīng)營狀況。
37歲的聯(lián)合創(chuàng)始人及首席執(zhí)行官奧爾特曼充分體現(xiàn)了OpenAI謎一樣的特性。作為一位資深科技創(chuàng)業(yè)者,奧爾特曼更為人們所熟知的是他出色的商業(yè)才能,而不是其工程技術(shù)成就。他是OpenAI的估值暴漲的推手,也是給該技術(shù)潑冷水的主力。他曾經(jīng)公開表示,ChatGPT距離真正可靠仍然有很大的差距。與此同時,他認為該技術(shù)是實現(xiàn)公司使命的重要一步。這家公司有一個堂吉訶德式的使命,即開發(fā)一種計算機超級智能,又稱通用人工智能(AGI)。奧爾特曼在2022年7月說:“通用人工智能是人類生存必不可少的。我們面臨的問題極其嚴峻,如果沒有更好的工具,就將無法解決。”
對一家營利性的企業(yè)而言,這種指導理念不同尋常,尤其是有些計算機科學家認為奧爾特曼的執(zhí)念純屬幻想。加州大學伯克利分校(University of California at Berkeley)的計算機科學家本·雷希特(Ben Recht)表示:“通用人工智能是一種愚蠢的設想。在我看來,它是虛無縹緲的。”
但通過發(fā)布ChatGPT,奧爾特曼卻將OpenAI及其宏大的人工智能使命,變得令整個科技界都為之著迷。問題的關鍵在于,他與微軟的合作能否解決ChatGPT的缺點,利用其先發(fā)優(yōu)勢來改變整個科技行業(yè)。谷歌和其他科技業(yè)巨頭紛紛在加大力氣開發(fā)各自的人工智能平臺;未來,更完善的軟件可能讓ChatGPT看起來如同兒戲。OpenAI總有一天可能會發(fā)現(xiàn),雖然它的技術(shù)突破開啟了未來的大門,但這個未來卻與它無關,如同網(wǎng)景公司在瀏覽器領域曇花一現(xiàn)的統(tǒng)治地位一樣。
今年1月中旬一個星期四的晚上,奧爾特曼在舊金山罕見地公開露面。他上身穿灰色針織衫,下身穿藍色牛仔褲,腳蹬一雙時髦的亮色扎染運動鞋,走進一個擠滿投資者、技術(shù)人員和記者的房間。所有人都想收集與ChatGPT或近期融資有關的信息。當一家專注于風險投資的媒體公司StrictlyVC的創(chuàng)始人康妮·洛伊佐斯(Connie Loizos)詢問他對于公司引起媒體轟動的看法時,奧爾特曼回答道:“我不看新聞,實際上我不太關注媒體的報道。”
活動在賽富時大廈(Salesforce Tower)的46層召開,房間內(nèi)座無虛席。在采訪開始前召開的金融科技專題討論會上,一位發(fā)言嘉賓甚至告訴聽眾,她知道所有人“都在等待薩姆·奧爾特曼”。
然而,盡管引起了各界關注,還有有關微軟投資的傳聞在四處傳播,但奧爾特曼卻似乎有意在給這種熱烈的氛圍降溫。他對聽眾表示:“這些技術(shù)有一點比較奇怪,那就是雖然它們的表現(xiàn)令人印象深刻,卻并不可靠。所以你在使用第一版演示版的時候,會產(chǎn)生一種非常深刻的反應:‘哇,真是不可思議,我已經(jīng)迫不及待了。’但在用過100次之后,你就會發(fā)現(xiàn)它的缺點。”
這種謹慎似乎代表了OpenAI總部的官方態(tài)度。該公司的總部位于美國舊金山教會區(qū)(Mission District)的一家舊行李箱工廠內(nèi)。事實上,如果說ChatGPT是人工智能領域里的“Netscape Navigator瀏覽器”時刻,那它差點就要提前夭折,因為OpenAI在幾個月前幾乎要叫停這個項目。
ChatGPT的聊天界面支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設想是將這個界面作為完善其“大語言模型”(LLM)的一種方式。大多數(shù)的生成式人工智能系統(tǒng)的核心都有一個大語言模型。大語言模型是將非常龐大的神經(jīng)網(wǎng)絡應用于大量人為創(chuàng)建文本所生成的。神經(jīng)網(wǎng)絡是大致基于人腦內(nèi)部神經(jīng)連接的一種人工智能。模型從這個數(shù)據(jù)庫中學習一個復雜的統(tǒng)計學概率圖,代表了任何一組單詞在特定語境下相鄰出現(xiàn)的統(tǒng)計學概率。這樣一來,大語言模型就可以執(zhí)行大量的自然語言處理任務,例如翻譯、總結(jié)或?qū)懽鞯取?/p>
OpenAI已經(jīng)創(chuàng)建了全世界最強大的大語言模型之一。該模型名為GPT-3,由超過1,750億個的統(tǒng)計性聯(lián)系組成,在約三分之二的互聯(lián)網(wǎng)、整個維基百科(Wikipedia)和兩個大型圖書數(shù)據(jù)集中進行訓練。但OpenAI發(fā)現(xiàn),GPT-3很難準確提供用戶想要的結(jié)果。一個團隊提議使用“強化學習”系統(tǒng)來完善該模型。“強化學習”是從試錯中學習,以取得最大化回報的人工智能系統(tǒng)。該團隊認為,一款聊天機器人或許是不錯的候選方法之一,因為以人類對話的形式持續(xù)提供反饋,使人工智能軟件很容易知道其做得好的地方和需要改進的情況。因此,在2022年年初,該團隊開始開發(fā)這款聊天機器人,也就是后來的ChatGPT。
在開發(fā)完成后,OpenAI邀請貝塔測試人員對其進行了測試。但據(jù)OpenAI的聯(lián)合創(chuàng)始人及現(xiàn)任總裁格雷格·布羅克曼(Greg Brockman)表示,測試人員的反饋卻令OpenAI失望;人們不知道應該與聊天機器人交流哪些內(nèi)容。OpenAI一度改變了策略,嘗試開發(fā)專業(yè)聊天機器人,希望為特定領域的專業(yè)人員提供協(xié)助。但這個項目也遇到了問題,部分原因是OpenAI缺少訓練專業(yè)聊天機器人的合適數(shù)據(jù)。布羅克曼表示,OpenAI決定孤注一擲,對外發(fā)布ChatGPT,交給用戶使用,任其自由發(fā)展。布羅克曼說:“我承認,我當時的立場是,不知道它是否會成功。”
OpenAI的高管表示,這款聊天機器人的突然爆紅,令公司措手不及。其首席技術(shù)官米拉·穆拉蒂(Mira Murati)稱:“這令我們非常驚訝。”在舊金山舉辦的風險投資活動上,奧爾特曼表示他“的預期可能要低一個量級——它所引起的熱度低一個量級。”
ChatGPT并不是OpenAI唯一一款引發(fā)熱度的產(chǎn)品。雖然該公司僅有約300名員工,團隊規(guī)模較小,卻拓展了人工智能的應用范圍,使其不只是簡單的分析數(shù)據(jù),而是能夠創(chuàng)建數(shù)據(jù)。OpenAI的另外一款產(chǎn)品DALL-E 2支持用戶通過輸入幾個單詞,生成他們所想象的任何物品的仿真圖片。現(xiàn)在跟風者已經(jīng)出現(xiàn),包括Midjourney和開源軟件公司Stability AI。(這些圖片生成模型都有缺點,最突出的是它們傾向于放大他們的訓練數(shù)據(jù)中的偏見,可能生成存在種族歧視和性別歧視的圖片。)OpenAI通過微調(diào)其計算機代碼的GPT大語言模型,還創(chuàng)建了Codex系統(tǒng)。該系統(tǒng)可以根據(jù)程序員以直白的語言輸入的代碼功能預期,為程序員編寫代碼。
OpenAI還有更多的創(chuàng)新正在蓄勢待發(fā)。OpenAI在名為GPT-4的貝塔測試版本中采用了更加強大的大語言模型,預計該版本將于今年發(fā)布,甚至很快就將發(fā)布。奧爾特曼也表示,公司正在研發(fā)一款能夠根據(jù)文本描述生成視頻的系統(tǒng)。此外,在今年1月中旬,OpenAI稱,其計劃發(fā)布ChatGPT的商業(yè)版。付費用戶可以通過一個界面使用聊天機器人,更容易將其整合到自己的產(chǎn)品和服務當中。
或許有冷眼旁觀者認為,ChatGPT的發(fā)布時機與OpenAI正在進行的一輪大規(guī)模融資有關。(OpenAI表示該產(chǎn)品發(fā)布的時機純屬巧合。)可以確定的是,ChatGPT的出現(xiàn)攪動了一個鯊群出沒的水域。它在風投界掀起了一場狂熱的追逐,風投公司希望利用OpenAI的高管、員工和創(chuàng)始人非公開出售股權(quán)的機會,獲得該公司的股份。
與此同時,微軟將在該公司追加投資高達100億美元的消息剛剛對外公布。微軟在2016年開始與OpenAI合作,三年前與該公司建立了戰(zhàn)略合作伙伴關系,并宣布投資10億美元。據(jù)熟悉此次投資的知情人士透露,該公司的股份被大量超額認購,盡管微軟通過一種不同尋常的投資結(jié)構(gòu)獲得了巨大的財務優(yōu)勢。
《財富》雜志掌握的文件顯示,在新投資完成并且OpenAI的首批投資者收回初始資本后,微軟將有權(quán)獲得OpenAI的75%的利潤,直至其收回130億美元投資,其中包括直到《財富》雜志在今年1月爆料之后,OpenAI才披露的20億美元投資。之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。與此同時,其他的風險投資者和OpenAI的員工將有權(quán)獲得該公司49%的利潤,直至利潤達到1,500億美元為止。在利潤達到上述上限之后,微軟和投資者的股份將重新歸還給OpenAI的非營利基金。實際上,OpenAI的做法是將公司出租給微軟,租期取決于OpenAI的盈利速度。
但要收回投資和實現(xiàn)利潤上限目標,可能需要相當長的一段時間。《財富》雜志掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴重虧損狀態(tài)。文件顯示,該公司2022年的收入預計不足3,000萬美元。但計算和數(shù)據(jù)支出預計達到4.1645億美元,人工支出8,931萬美元,其他非特定營業(yè)費用為3,875萬美元。其在2022年的凈虧損總計為5.445億美元,不含員工股票期權(quán)。而ChatGPT的發(fā)布可能快速增加該公司的虧損。奧爾特曼在推特上回復埃隆·馬斯克的問題稱,用戶與ChatGPT的每次互動,將占用OpenAI“個位數(shù)百分比”的計算成本,隨著這款聊天機器人的走紅,其每月的支出可能高達數(shù)百萬美元。
OpenAI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。文件顯示,該公司預測2023年收入2億美元,2024年收入預計超過10億美元。但OpenAI并未預測其支出的增長情況以及何時能夠扭虧為盈。該公司拒絕就這些數(shù)據(jù)發(fā)表評論,但它們指向了一個顯而易見的事實:OpenAI和微軟都認為,曾經(jīng)的非營利性實驗室現(xiàn)在已經(jīng)具有能夠用來出售謀利的產(chǎn)品。
微軟已經(jīng)開始收獲雙方合作協(xié)議的成果。微軟在其Azure Cloud平臺中推出了一系列OpenAI品牌的工具和服務,支持Azure的客戶使用OpenAI的技術(shù),包括GPT和DALL-E工具。比如,汽車交易平臺CarMax已經(jīng)推出了可以在這些Azure工具上運行的新服務。
微軟的人工智能平臺(AI Platform)的企業(yè)副總裁埃里克·博伊德(Eric Boyd)表示,滿足訓練和運行OpenAI的大語言平臺的需求,推動了創(chuàng)新,將使所有Azure客戶受益。例如,微軟為人工智能創(chuàng)建了其認為全球最強大的超級計算集群,并開發(fā)了多種軟件創(chuàng)新,使在這些機器上訓練和運行大型人工智能模型變得更加容易。微軟正在將OpenAI的技術(shù)逐漸整合到其許多軟件當中。微軟在其搜索引擎必應(Bing)中推出了一款圖片創(chuàng)作工具以及一款新型Designer圖片設計工具,這兩款工具均由DALL-E驅(qū)動;在其Power Apps軟件中推出了一款支持GPT-3的工具,并根據(jù)OpenAI的Codex模型開發(fā)了一款代碼建議工具GitHub Copilot。
晨星(Morningstar)專注于科技股研究的高級股票研究分析師丹·羅曼諾夫(Dan Romanoff)表示,與OpenAI的合作關系即使不會馬上對Azure的收入產(chǎn)生影響,也依舊是一次良好的品牌定位和營銷。他說:“OpenAI備受關注。微軟能夠采用OpenAI開發(fā)的人工智能解決方案,將其應用到Azure,并命名為Azure AI,可以保持其競爭力。”微軟的云服務的競爭對手谷歌、亞馬遜網(wǎng)絡服務(AWS)、IBM、甲骨文(Oracle)、賽富時(Salesforce)等,都有各自的“認知”服務,但能夠與開發(fā)出ChatGPT的公司合作必然是利大于弊。
對微軟而言,更大的回報可能是在搜索領域。科技媒體The Information最近報道稱,微軟計劃將ChatGPT整合到必應,使其可以為用戶反饋簡潔明了的回答,并且讓用戶能夠通過與聊天機器人對話來進行深入探究,而不是逐一查看一列鏈接。谷歌目前在搜索市場占據(jù)主導地位,其全球市場份額超過90%。必應雖然名列第二位,卻與谷歌相去甚遠,市場份額僅有約3%。在2022年的前九個月,谷歌搜索業(yè)務的收入為1,200億美元,約占谷歌總收入的60%。ChatGPT或許為微軟動搖谷歌的霸主地位提供了唯一一次真正的機會。(微軟拒絕就The Information的報道發(fā)表評論。)
按照微軟的標準,這些積極的回報非常劃算。微軟在OpenAI的總投資額為130億美元,確實是一個天文數(shù)字,但這筆投資僅占其過去12個月850億美元稅前利潤的15%,卻可以獲得一項顛覆性技術(shù)的近期控制權(quán),是一筆成本相對較低的交易。但OpenAI和奧爾特曼卻可能要付出不同的代價:微軟的優(yōu)先任務可能對OpenAI自己的優(yōu)先任務產(chǎn)生排擠效應,使OpenAI更宏大的使命面臨風險,并且降低助力公司成功的科學家們對其的歸屬感。
2015年7月的一個晚上,時任知名新創(chuàng)企業(yè)孵化器Y Combinator負責人的奧爾特曼,在門洛帕克瑰麗酒店(Rosewood Sand Hill)舉行私人晚宴,這家具有牧場風格的豪華酒店地處硅谷的風投業(yè)中心門洛帕克(Menlo Park)。出席晚宴的包括埃隆·馬斯克,還有當時26歲的麻省理工學院(MIT)肄業(yè)生布羅克曼。布羅克曼時任支付處理新創(chuàng)企業(yè)Stripe的首席技術(shù)官。賓客中有多位經(jīng)驗豐富的人工智能研究人員,也有人對機器學習幾乎不甚了解。但所有人都相信通用人工智能是可行的,而且他們都非常擔心。
谷歌剛剛收購了一家公司:位于英國倫敦的神經(jīng)網(wǎng)絡新創(chuàng)企業(yè)DeepMind。在奧爾特曼、馬斯克和其他的科技界內(nèi)部人士眼中,這是有極高勝算最先開發(fā)出通用人工智能的一家公司。如果DeepMind成功,谷歌可能就會在這項無所不能的技術(shù)領域里一家獨大。在門洛帕克瑰麗酒店舉辦晚宴的目的是討論成立一家實驗室與其競爭,以避免這種情況發(fā)生。
新實驗室旨在成為一家與DeepMind和谷歌截然不同的機構(gòu)。這家實驗室將是非營利性質(zhì),并明確提出以將先進人工智能的效益民主化為使命。該實驗室承諾公開所有研究,將所有技術(shù)開源,并在公司的名稱OpenAI中充分體現(xiàn)了對透明度的承諾。該實驗室有多位知名捐款人,其中不僅有馬斯克,還有他在PayPal的同事蒂爾和霍夫曼;奧爾特曼和布羅克曼;Y Combinator的聯(lián)合創(chuàng)始人杰西卡·利文斯頓(Jessica Livingston);奧爾特曼成立的YC Research基金;印度的IT外包公司印孚瑟斯(Infosys);以及亞馬遜網(wǎng)絡服務(Amazon Web Services)。所有創(chuàng)始捐款人承諾在這家理想主義的新公司共同投資10億美元(但稅務記錄顯示,雖然這一承諾被媒體廣泛報道,但該非營利組織僅收到了承諾捐款金額的一小部分)。
但事實很快證明,訓練龐大的神經(jīng)網(wǎng)絡成本高昂,計算成本高達數(shù)千萬美元。人工智能研究人員的人工成本同樣昂貴:稅務記錄顯示,出生于俄羅斯的科學家伊利亞·薩茨科爾(Ilya Sutskever)離開谷歌后,加入OpenAI擔任首席科學家,在前幾年的年薪高達190萬美元。幾年后,奧爾特曼和OpenAI的其他人得出的結(jié)論是,如果想要與谷歌、Meta以及其他的科技巨頭競爭,該實驗室就不能繼續(xù)以非營利的方式運營。奧爾特曼在2019年對《連線》雜志(Wired)表示:“為了成功地完成我們的使命,我們需要海量的資金,數(shù)額遠遠超出我最初的設想。”
成立一家營利性分支機構(gòu),讓OpenAI可以吸收風險資本。但OpenAI創(chuàng)建了一種非同尋常的融資結(jié)構(gòu),按照投資者的初始投資,以特定倍數(shù)規(guī)定投資者的回報上限。而由硅谷精英組成的OpenAI非營利性董事會,將保留對OpenAI的知識產(chǎn)權(quán)的控制權(quán)(參見邊欄)。有一位硅谷精英沒有繼續(xù)在董事會任職,他就是馬斯克:2018年,馬斯克離開OpenAI董事會,理由是他需要經(jīng)營太空探索技術(shù)公司(SpaceX),還有更加重要的特斯拉(Tesla)。
當時,微軟的首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)迫切希望證明,在人工智能領域落后于競爭對手的微軟,也能夠在人工智能技術(shù)的尖端領域扮演一定的角色。微軟曾經(jīng)嘗試聘請一位重量級的人工智能科學家,但未能成功。微軟還建立了規(guī)模龐大、成本高昂的專用芯片集群,以推進其在語言模型開發(fā)領域的進展。這正是OpenAI迫切需要的超級計算力,當時該公司曾經(jīng)斥巨資進行收購。OpenAI擅長的是實現(xiàn)各種炫酷的人工智能演示,而這正是希望證明微軟在人工智能方面具有實力的納德拉所期待的。奧爾特曼主動聯(lián)系到納德拉商談合作,他曾經(jīng)多次飛往西雅圖展示OpenAI的人工智能模型。納德拉最終簽署了合作協(xié)議,并在2019年7月對外公布,使微軟成為OpenAI技術(shù)商業(yè)化的“首選合作伙伴”,并在該人工智能新創(chuàng)企業(yè)初始投資10億美元。
雖然奧爾特曼從最開始就參與了OpenAI的創(chuàng)立,但他直到2019年5月OpenAI轉(zhuǎn)型為營利性企業(yè)后不久才擔任該公司的首席執(zhí)行官。但該公司從一家研究實驗室變成價值數(shù)十億美元的現(xiàn)象級企業(yè)的過程,充分顯示出奧爾特曼獨特的融資能力,以及以產(chǎn)品為導向的經(jīng)營理念,也凸顯出這些商業(yè)本能與他對實現(xiàn)科學驅(qū)動的宏大想法的承諾之間的矛盾。
作為OpenAI的領導人,從某種程度上來說,奧爾特曼就是硅谷的典型代表:年輕的白人男性;堅定專注;精通極客技術(shù);熱衷于效率和生產(chǎn)率最大化;致力于“改變世界”的工作狂。[在2016年《紐約客》雜志(New Yorker)的一篇文章中,奧爾特曼表示自己并沒有阿斯伯格綜合征(Asperger's syndrome),但他可以理解為什么人們會認為他是阿斯伯格綜合征的患者。]
奧爾特曼從斯坦福大學的計算機科學專業(yè)肄業(yè),參與創(chuàng)建了一家社交媒體公司Loopt,該公司的應用程序能夠告知用戶好友所在的位置。該公司在2005年,成為Y Combinator的首批新創(chuàng)企業(yè);雖然這家公司未能成功,但奧爾特曼出售該公司所得的收入,幫助他進入了風投界。他創(chuàng)建了一家小型風險投資公司Hydrazine Capital,募資約2,100萬美元,其中包括蒂爾的資金。后來Y Combinator的聯(lián)合創(chuàng)始人保羅·格雷厄姆(Paul Graham)和利文斯頓聘請他接替格雷厄姆,負責運營YC。
奧爾特曼是一位創(chuàng)業(yè)者,而不是科學家或人工智能研究人員,他被人們所津津樂道的是極其擅長進行風投融資。他堅信偉大的事業(yè)源于遠大的志向和堅定不移的自信,他曾經(jīng)表示,希望通過開發(fā)所謂的深度科技領域,比如核聚變和量子計算等,創(chuàng)造數(shù)萬億美元的經(jīng)濟價值。這些領域雖然成功的機會渺茫,但卻可能帶來巨大的回報。奧爾特曼在Loopt的同事、資深科技投資者和新創(chuàng)企業(yè)顧問馬克·雅各布斯坦(Mark Jacobstein)說:“薩姆相信,他在自己從事的領域中是最棒的。我確信,他曾經(jīng)認為自己是辦公室里最強的乒乓球高手,直到事實證明他是錯誤的。”
據(jù)OpenAI的多位現(xiàn)任和前內(nèi)部人士爆料,隨著奧爾特曼掌管公司,這家新創(chuàng)企業(yè)開始轉(zhuǎn)移業(yè)務重心。曾經(jīng)廣泛的研發(fā)議題被精簡,主要專注于自然語言處理領域。薩茨科爾和奧爾特曼辯稱這種轉(zhuǎn)變的目的是在目前似乎最有可能實現(xiàn)通用人工智能的研發(fā)領域,最大程度增加投入。但有前員工表示,在公司獲得微軟的初始投資之后,重點開展大語言模型研究的內(nèi)部壓力顯著增加,部分原因是這些模型能夠迅速投入商業(yè)應用。
有員工抱怨,OpenAI創(chuàng)立的目的是不受企業(yè)影響,但它卻很快就變成了科技界巨頭的工具。一位前員工表示:“公司所關注的重點更多地傾向于我們?nèi)绾伍_發(fā)產(chǎn)品,而不是努力回答最有趣的問題。”與本文的許多受訪者一樣,由于保密協(xié)議的約束,并且為了避免得罪與OpenAI有關的大人物,這名員工要求匿名。
OpenAI也變得不再像以前那么開放。該公司已經(jīng)開始以擔心其技術(shù)可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。但據(jù)該公司的前員工表示,商業(yè)邏輯也是這些舉措背后的原因之一。OpenAI僅通過API提供其先進模型,保護了自己的知識產(chǎn)權(quán)和收入流。OpenAI的另外一名前員工指出:“[奧爾特曼]和[布羅克曼]對‘人工智能安全’說過不少空話,但這些言論通常都只是商業(yè)考量的遮羞布,對實際的、合理的人工智能安全問題卻視而不見。”例如,這位前員工提到OpenAI曾經(jīng)因為擔心被濫用而決定限制DALL-E 2的訪問權(quán)限,但在Midjourney和Stability AI推出競爭產(chǎn)品后,公司快速推翻了這一決定。(OpenAI表示,經(jīng)過慎重的貝塔測試,其對安全系統(tǒng)充滿了信心,之后才允許DALL-E 2的更大范圍應用。)據(jù)多位前員工爆料,公司在策略和文化上的轉(zhuǎn)變,是導致十多名OpenAI的研究人員和其他員工在2021年決定離開公司并成立研究實驗室Anthropic的原因之一。其中有多人曾經(jīng)從事人工智能安全方面的研究。
OpenAI表示,相比其他的人工智能實驗室,其會繼續(xù)公布更多的研究成果。公司還為重心向產(chǎn)品轉(zhuǎn)移的做法進行辯護。首席技術(shù)官穆拉蒂說道:“你不能只在實驗室里開發(fā)通用人工智能。”她主張,發(fā)布產(chǎn)品是了解人們希望如何使用和濫用技術(shù)的唯一途徑。她表示,直到發(fā)現(xiàn)人們使用GPT-3進行編程,OpenAI才知道GPT-3最受歡迎的應用是編寫軟件代碼。同樣,OpenAI最擔心的問題是人們利用GPT-3生成虛假的政治信息,但事實證明這只是杞人憂天。她表示,相反,最常見的惡意使用GPT-3的行為是大量制作垃圾廣告郵件。最后,穆拉蒂稱,OpenAI希望通過公開其技術(shù),“最大程度降低真正強大的技術(shù)可能對社會產(chǎn)生的沖擊。”她指出,如果不讓人們預先了解未來可能出現(xiàn)的情形,先進人工智能所引發(fā)的社會混亂可能就會更加嚴重。
薩茨科爾也認為OpenAI與微軟的合作創(chuàng)造了一種全新的“預期,即我們需要利用我們的技術(shù)開發(fā)一種有用的產(chǎn)品”,但他堅持認為OpenAI文化的核心并未改變。他說道,可以使用微軟的數(shù)據(jù)中心,對OpenAI的發(fā)展至關重要。布羅克曼也表示,與微軟的合作使OpenAI能夠創(chuàng)造收入,同時不必過多關注商業(yè)運營,否則公司可能不得不在商業(yè)運營方面投入更多的精力。他說:“招聘數(shù)千名銷售人員,可能會改變這家公司,而與一家已經(jīng)擁有銷售團隊的公司成為合作伙伴,實際上是非常好的策略。”
薩茨科爾直截了當?shù)胤裾J了OpenAI不再重視安全性的說法。“我想說的是,事實恰恰相反。”薩茨科爾稱,在員工離職并成立Anthropic之前,人工智能安全“被委派給一個團隊負責”,但現(xiàn)在它變成了所有團隊的責任。“安全性標準不斷提高,我們也在開展越來越多的安全性方面的工作。”
然而,批評者指出,OpenAI以產(chǎn)品為導向開發(fā)先進人工智能的做法是不負責任的,這相當于向人們發(fā)放上膛的槍支,理由是這是確定人們是否真的會相互射擊的最佳途徑。
紐約大學(New York University)的認知科學專業(yè)榮譽退休教授加里·馬庫斯(Gary Marcus),對以深度學習為中心的人工智能開發(fā)策略持懷疑態(tài)度。他認為,生成式人工智能“將對社會結(jié)構(gòu)產(chǎn)生切實的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統(tǒng)將生成虛假信息的成本降低到接近于零,可能會掀起虛假信息泛濫的狂潮。馬庫斯表示,我們甚至已經(jīng)看到了第一批受害者。程序員發(fā)布和回答編程問題的網(wǎng)站Stack Overflow已經(jīng)不得不禁止用戶提交由ChatGPT生成的回答,因為這種貌似合理實則錯誤的回答已經(jīng)令該網(wǎng)站疲于應付。科技資訊網(wǎng)站CNET開始使用ChatGPT生成資訊文章,但后來發(fā)現(xiàn),由于許多文章存在事實性錯誤,不得不對它們進行更正。
對有些人而言,真正的風險是ChatGPT能夠編寫準確的代碼。網(wǎng)絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨(Maya Horowitz)表示,她的團隊可以用ChatGPT設計每一個階段的網(wǎng)絡攻擊,包括杜撰一封令人信服的釣魚郵件、編寫惡意代碼,以及逃避常見的網(wǎng)絡安全檢查等。她警告稱,ChatGPT基本能夠讓不懂編程的人成為網(wǎng)絡罪犯,“我擔心未來會發(fā)生越來越多網(wǎng)絡攻擊”。OpenAI的穆拉蒂表示,公司也有同樣的擔憂,因此正在研究如何“調(diào)整”其人工智能模型,使它們不會編寫惡意軟件,但這絕非易事。
有無數(shù)批評者和教育工作者痛斥,學生很容易使用ChatGPT作弊。紐約市、巴爾的摩和洛杉磯的校區(qū)均禁止學校管理的網(wǎng)絡訪問聊天機器人,澳大利亞的一些高校表示,將轉(zhuǎn)為通過有專人監(jiān)考的書面考試來評估學生。(OpenAI正在開發(fā)更便于檢測人工智能生成文本的方法,包括可能在ChatGPT生成的文本上添加數(shù)字“水印”。)
2022年,ChatGPT最初的開發(fā)方式還引發(fā)了人們對道德方面的擔憂。《時代》周刊(Time)調(diào)查發(fā)現(xiàn),在開發(fā)過程中,OpenAI聘請了一家數(shù)據(jù)標記公司,這家公司雇傭肯尼亞的低薪員工識別包含不良語言、色情圖片和暴力內(nèi)容的段落。報道稱,一些員工因此出現(xiàn)了精神健康問題。OpenAI在一份聲明中對《時代》周刊表示,數(shù)據(jù)標記工作“是最大程度減少訓練數(shù)據(jù)中的暴力和色情內(nèi)容以及開發(fā)可以檢測有害內(nèi)容的工具的必要步驟”。
免費提供Chat-GPT使OpenAI能夠獲取大量的反饋,從而幫助其完善未來的版本。但OpenAI未來能否維持其在語言人工智能領域的主導地位,仍然是一個未知數(shù)。位于英國倫敦的人工智能公司Faculty的創(chuàng)始人及首席執(zhí)行官馬克·沃納(Marc Warner)說:“歷史上,對于這種高度通用的算法,我們所看到的是,它們并沒有達到足夠可靠的程度,可以保證一家公司獨占全部回報。”比如,面部識別和圖像識別技術(shù)最早的開發(fā)者是谷歌和英偉達(Nvidia)等科技巨頭,但現(xiàn)在它們已經(jīng)無處不在。
法院和監(jiān)管部門也可能對生成式人工智能所依賴的數(shù)據(jù)飛輪橫插一腳。向美國加利福尼亞州的聯(lián)邦法院提起的一起金額高達90億美元的集體訴訟,可能對該領域產(chǎn)生深遠影響。該案的原告指控微軟和OpenAI使用程序員的代碼訓練GitHub的編程助手Copilot,沒有承認程序員的功勞或者對程序員予以補償,違反了開源許可條款。微軟和OpenAI均拒絕就該起訴訟發(fā)表意見。
人工智能專家表示,如果法院判決原告勝訴,可能就會阻礙生成式人工智能的繁榮:大多數(shù)的生成式人工智能模型都是使用從互聯(lián)網(wǎng)上搜刮的材料進行訓練,并沒有取得許可或支付報酬。作為該案原告代理人的律師事務所,最近還提起了一起類似的訴訟,指控Stability AI和Midjourney未經(jīng)許可,在訓練數(shù)據(jù)中使用了有版權(quán)保護的美術(shù)作品。蓋蒂圖片社(Getty Images)也對Stability AI提起了版權(quán)侵權(quán)訴訟。另外一個問題是,立法者可能通過法律,授予創(chuàng)作者禁止將其創(chuàng)作的內(nèi)容用于人工智能訓練的權(quán)利,例如歐盟(European Union)的一些立法者正在考慮這樣做。
與此同時,OpenAI的競爭對手并沒有坐以待斃。據(jù)《紐約時報》(New York Times)報道,失去搜索領域主導地位的可能性,已經(jīng)促使谷歌的高管發(fā)布了“紅色警報”。報道稱,谷歌的首席執(zhí)行官桑達爾·皮查伊(Sundar Pichai)已經(jīng)多次召開會議,重新制定公司的人工智能策略,計劃發(fā)布20款支持人工智能的新產(chǎn)品,并將在今年發(fā)布搜索聊天界面的演示版本。谷歌擁有一款強大的聊天機器人LaMDA,但由于擔心一旦該產(chǎn)品被濫用可能影響公司信譽,因此一直未對外發(fā)布。據(jù)《紐約時報》引用谷歌的內(nèi)部報告和匿名知情人士的話稱,現(xiàn)在,公司計劃以ChatGPT為標桿,“重新評估”其風險承受能力。《紐約時報》報道稱,谷歌還在開發(fā)一款文本轉(zhuǎn)圖片的生成系統(tǒng),與OpenAI的DALL-E等產(chǎn)品競爭。
當然,目前尚不確定聊天機器人是否代表了搜索行業(yè)的未來。ChatGPT經(jīng)常會杜撰信息,這種現(xiàn)象被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或者簡單地提供鏈接。現(xiàn)有版本無法訪問互聯(lián)網(wǎng),因此無法提供最新的信息。馬庫斯等人認為,幻覺和偏見是大語言模型存在的根本問題,需要徹底重新思考它們的設計。他表示:“這些系統(tǒng)可以預測句子中單詞的順序,類似于開發(fā)工具Steroids上的代碼自動補全。但它們實際上并沒有任何機制,能夠跟蹤其表述的內(nèi)容的真實性,或者驗證這些內(nèi)容是否符合它們的訓練數(shù)據(jù)。”
其他人預測,這些問題將在一年內(nèi)得到解決,其中包括OpenAI的投資人霍夫曼和維諾德·科斯拉(Vinod Khosla)。穆拉蒂則更加慎重。她說:“我們到目前為止一直遵循的研究方向,目的是解決模型的事實準確性和可靠性等問題。我們正在繼續(xù)朝著這些方向努力。”
事實上,OpenAI已經(jīng)公布了對另外一個版本GPT的研究。該版本名為WebGPT,能夠通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關來源的注釋。WebGPT依舊不完美:它會接受用戶問題假設的前提,然后查找確證信息,即使這個前提是錯誤的。比如,在被問到盼望某件事情發(fā)生是否能夠令其真實發(fā)生時,WebGPT的回答是:“你確實可以通過思考的力量,使愿望成真。”
奧爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。在美國舊金山舉辦的風險投資活動上,當被問到人工智能的最佳狀況時,他夸張地說道:“我認為最好的情況好到令人難以想象……好到談論它的人會令人覺得這人是個瘋子。”他突然又將話題轉(zhuǎn)回到OpenAI核心的反烏托邦主題:“我認為最糟糕的情況是,我們所有人都死去。”
*****
OpenAI投資者名人錄
在OpenAI的早期投資者和非營利性基金會的董事會中,有許多科技行業(yè)的精英。OpenAI的組織章程賦予董事會對其知識產(chǎn)權(quán)的最終控制權(quán)。公司的重要投資者包括:
?
目前在董事會里的成員
里德·霍夫曼
作為PayPal和領英的聯(lián)合創(chuàng)始人的里德·霍夫曼現(xiàn)任風險投資公司Greylock Partners的合伙人。他是OpenAI的創(chuàng)始捐款人之一,他的慈善基金會還在早期投資了OpenAI的營利性業(yè)務。
?
塔莎·麥考利(Tasha McCauley)
虛擬現(xiàn)實創(chuàng)業(yè)者麥考利是有效利他主義(Effective Altruism)的支持者。這種哲學運動所關注的問題之一是超級智能化人工智能的危害。
?
亞當·德安杰洛(Adam D'Angelo)
德安杰洛是Facebook初期的高管之一,曾經(jīng)在21世紀00年代晚期Facebook繁榮時期擔任首席技術(shù)官,后來與他人共同創(chuàng)立了在線問答服務Quora。
?
希文·齊利斯(Shivon Zilis)
齊利斯是埃隆·馬斯克的腦機接口公司Neuralink(曾經(jīng)與OpenAI在同一棟辦公樓)的項目總監(jiān)。有爆料稱馬斯克是齊利斯的一對雙胞胎的生父。
?
維諾德·科斯拉
太陽微系統(tǒng)公司(Sun Microsystems)的聯(lián)合創(chuàng)始人科斯拉,是OpenAI營利性部門的另外一位早期投資者。他認為,人工智能將徹底改變?nèi)祟悓I(yè)技能在許多職業(yè)中的價值,包括醫(yī)療。
?
埃隆·馬斯克
太空探索技術(shù)公司和特斯拉的首席執(zhí)行官馬斯克是OpenAI最大的早期捐款人之一。他在2018年離開公司董事會。他曾經(jīng)表示,隨著特斯拉開始開發(fā)自己的先進人工智能,他在該公司面臨利益沖突。
*****
強大的風投機構(gòu)
2021年,OpenAI在一次要約收購中出售現(xiàn)有股份,估值約為140億美元,并吸引了三家重量級的風險投資公司。
?
老虎環(huán)球基金(Tiger Global)
專注于科技投資的對沖基金老虎環(huán)球,由傳奇投資者朱利安·羅伯遜(Julian Robertson)的門徒蔡斯·科爾曼(Chase Coleman)創(chuàng)立。它是規(guī)模較大的人工智能風險投資機構(gòu)之一。
?
紅杉資本(Sequoia Capital)
紅杉資本是硅谷最受尊敬的風險投資公司之一。2022年9月,該公司發(fā)布報告稱生成式人工智能可以“創(chuàng)造數(shù)萬億美元的經(jīng)濟價值”。
?
安德森·霍洛維茨(Andreessen Horowitz)
安德森·霍洛維茨又名a16z,其領導者包括網(wǎng)景(Netscape)的聯(lián)合創(chuàng)始人馬克·安德森(Marc Andreessen)。該公司因為對愛彼迎(Airbnb)和Slack的早期投資而名聲大噪。該公司還大力投資加密貨幣相關新創(chuàng)企業(yè)。
*****
目前利用“生成式”人工智能的七家新創(chuàng)企業(yè)和實驗室
ChatGPT已經(jīng)成為“生成式人工智能”熱潮的典型代表,但它只是這股熱潮的領先產(chǎn)品之一,以這項技術(shù)為基礎有望誕生大量顛覆性的產(chǎn)品和服務。有許多在科技巨頭外圍的新創(chuàng)企業(yè)獲得了風險投資,比如OpenAI等,希望利用這項技術(shù)。例如以下公司:
Cohere AI
該公司的創(chuàng)始人是谷歌(Google)的前員工。該公司致力于幫助其他公司更容易使用大語言模型;其競爭對手是OpenAI的GPT產(chǎn)品。Cohere于2022年在B輪融資中融得1.25億美元。該公司還與谷歌維持著密切的合作關系。谷歌在其數(shù)據(jù)中心的專業(yè)人工智能計算機芯片為Cohere提供了免費培訓時間。
?
Stability AI
該公司因為Stable Diffusion而成名。這款開源文本轉(zhuǎn)圖像生成模型的競爭對手是Midjourney和OpenAI的DALL-E 2。該公司在種子輪融資中融得1.01億美元,是史上規(guī)模最大的首輪融資之一,當時這家成立不足一年的公司的估值超過10億美元。該公司最近達成的一項合作,為其通過亞馬遜(Amazon)的AWS云服務部署Stable Diffusion創(chuàng)造了更加便利的條件。
?
Jasper
位于美國得克薩斯州奧斯汀的新創(chuàng)企業(yè)Jasper使用OpenAI的技術(shù),為市場營銷部門提供文案編寫軟件。該公司在2022年融資1.25億美元,估值超過15億美元。據(jù)媒體報道,其創(chuàng)始人對OpenAI免費提供ChatGPT非常不滿,因為這款工具可能蠶食Jasper公司的業(yè)務。
?
Tome
Tome孵化自Greylock Partners,并從該風投機構(gòu)和風險投資公司Coatue融得3,230萬美元。該公司旨在幫助用戶創(chuàng)作各種敘事文稿,包括童書、企業(yè)推銷文本等內(nèi)容。基于OpenAI的GPT和DALL-E的一項新功能,支持用戶根據(jù)簡單的文本提示生成包含圖解的敘事文稿。
?
Prisma Labs
Prisma Labs開發(fā)的熱門應用程序Lensa使用Stable Diffusion,支持用戶自拍,并將自拍照片轉(zhuǎn)換為酷炫的數(shù)字頭像。
?
Midjourney
該人工智能研究實驗室的創(chuàng)始人戴維·霍爾茲(David Holz),曾經(jīng)參與創(chuàng)建了手勢控制公司Leap Motion。該實驗室的熱門文本轉(zhuǎn)圖像模型以免費增值的模式提供,其競爭對手是OpenAI的DALL-E和Stable Diffusion。
?
ProFluent Bio
ProFluent Bio是一家位于美國加利福尼亞州舊金山的小型新創(chuàng)企業(yè),采用了驅(qū)動ChatGPT的底層語言模擬技術(shù),可以根據(jù)對蛋白質(zhì)的功能的文本描述生成全新的蛋白質(zhì)。該技術(shù)可能在藥物發(fā)現(xiàn)和設計方面掀起革命,有望為農(nóng)業(yè)和制造業(yè)開發(fā)新型催化劑。
譯者:Biz