編者語:ChatGPT的橫空出世,在人工智能領域掀起了重要變革,這一智能工具因其解放人類生產力的潛力,從使用者到投資者,引起了各界的廣泛關注。1月30日,有消息稱,百度將于3月在中國推出類似ChatGPT的人工智能聊天機器人程序。隨著微軟、百度等巨頭加碼,AIGC(人工智能自動生成內容)領域或將成為2023年最值得關注的、全球最熱門賽道。盡管ChatGPT乃至整個行業距離真正成熟的商業化仍有差距,從ChatGPT的幕后故事中,我們仍然得以一窺它會如何影響科技、商業以及人類社會的發展進程。
在一代人的時間里,總是會出現一些產品,將從工程部門昏暗的地下室里,青少年書呆子氣味難聞的臥室里,或者孤僻的有某種嗜好的人家中誕生的技術,變成人人都會用的工具。網絡瀏覽器誕生于1990年,但直到1994年網景導航者(Netscape Navigator)問世,大多數人才開始探索互聯網。2001年iPod誕生之前流行的MP3播放器,并未掀起數字音樂革命。同樣,2007年,蘋果(Apple)iPhone手機橫空出世之前,智能手機已經問世,但卻并沒有針對智能手機開發的應用。
2022年11月30日,人工智能領域可能也迎來了與網景導航者的問世同樣重要的關鍵時刻。
舊金山人工智能公司OpenAI的首席執行官山姆·阿爾特曼宣告了這個時刻的來臨。OpenAI成立于2015年,得到了埃隆·馬斯克、彼得·泰爾和其他PayPal幫成員以及LinkedIn聯合創始人雷德·霍夫曼等一眾硅谷大佬的投資。11月30日,公司成立約7年后,阿爾特曼發推文稱:“今天我們發布了ChatGPT。歡迎點擊這里與它聊天。”任何人可以通過推文中的鏈接注冊一個賬號,開始與OpenAI的新聊天機器人免費聊天。
這引起了各界人士的興趣。人們不止與它交流天氣狀況。它根據軟件公司CEO和工程師阿姆賈德·馬薩德的要求,檢查了程序代碼的漏洞。美食博主和網紅吉娜·霍摩爾卡要求它編寫一份健康的巧克力片曲奇餅干食譜。Scale AI公司的工程師賴利·古德賽德要求它撰寫一集《宋飛傳》(Seinfeld)的劇本。市場營銷人員、一家在線人工智能美術館的經營者蓋伊·帕森斯要求它為其撰寫提示語,然后輸入到另外一款人工智能系統Midjourney后轉換成圖像。斯坦福大學醫學院(Stanford University School of Medicine)的皮膚病學家、從事人工智能醫學應用研究的羅克珊娜·丹妮休向它提出了醫學問題。許多學生利用它完成家庭作業。這一切都發生在該聊天機器人發布后24小時內。
以前也曾有其他聊天機器人,但沒有一款能與ChatGPT相提并論。ChatGPT能進行天馬行空的長對話,可以回答問題,還能根據人們的要求撰寫各種書面材料,例如商業計劃書、廣告宣傳材料、詩歌、笑話、計算機代碼和電影劇本等。當然,它并不完美:它提供的結果往往不夠準確;它無法引用信息來源;而且它幾乎完全不知道2021年以后發生的事情。雖然它提供的結果通常足夠流暢,在高中甚至大學課堂上可以過關,但根本無法像人類專家們的表述那樣做到字斟句酌。另一方面,通常在對用戶知之甚少的情況下,ChatGPT生成內容只要大約一秒鐘時間,而且它生成的許多內容并沒有想象的那么糟糕。ChatGPT發布五天內,該聊天機器人的用戶就超過了100萬人,而Facebook用了10個月時間才達到這個里程碑。
過去十年,人工智能技術在商業領域逐步擴大應用,悄然改進了我們日常使用的許多軟件,但卻并沒有令非技術用戶感到興奮。ChatGPT的橫空出世改變了這一點。突然之間,人人都開始談論人工智能將會如何顛覆他們的工作、公司、學校和生活。
ChatGPT是一股相關人工智能技術浪潮的一部分,這種技術被統稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術生成模型。OpenAI位于科技行業“下一個大事件”的前沿,它具備了一家傳奇初創公司的特征,包括全明星級別的團隊和投資者的熱捧,該公司的估值據稱已經達到290億美元。
該公司最近的突然躥紅引發了嫉妒、猜疑和恐慌。谷歌(Google)利潤豐厚的搜索帝國可能受到影響。據媒體報道,為了應對ChatGPT,谷歌內部已經拉響了“紅色警報”。但OpenAI能成為超強科技公司俱樂部的成員,出乎人們的意料。幾年前,它甚至還不是一家公司,而是一家致力于學術研究的小型非營利性實驗室。公司至今依舊秉持著崇高的創立原則,例如保護人類文明,防范不受限制的人工智能所帶來的威脅等。與此同時,OpenAI經歷了一次內部轉型,導致原始團隊分裂,公司也將重心從純科研項目逐步轉移到商業項目。(有批評者認為,發布ChatGPT本身是一種危險行為,并且表明OpenAI的經營模式發生了巨大轉變。)
OpenAI與微軟(Microsoft)擴大合作的消息于近日公布,微軟將向該公司投資高達100億美元,作為回報,未來幾年,該軟件業巨頭將獲得OpenAI的大部分利潤。該筆交易可能會令外界更加確信,一份曾經理想主義的事業現在只關心謀利。盡管如此,《財富》雜志掌握的文件揭示了尚未盈利的OpenAI目前的經營狀況。
37歲的聯合創始人兼CEO阿爾特曼充分體現了OpenAI謎一樣的特性。作為一位資深科技創業者,阿爾特曼更為人們所熟知的是他出色的商業才能,而不是其工程技術成就。他是OpenAI估值暴漲的推手,也是給該技術潑冷水的主力。他曾公開表示ChatGPT距離真正可靠仍有很大差距。與此同時,他認為該技術是實現公司使命的重要一步。該公司有一個堂吉訶德式的使命,即開發一種計算機超級智能,又稱通用人工智能(AGI)。阿爾特曼在7月份表示:“通用人工智能是人類生存必不可少的。我們面臨的問題極其嚴峻,如果沒有更好的工具將無法解決。”
對于一家營利性的企業而言,這種指導理念不同尋常,尤其是有些計算機科學家認為阿爾特曼的執念純屬幻想。加州大學伯克利分校(University of California at Berkeley)計算機科學家本·雷希特表示:“通用人工智能是一種愚蠢的設想。在我看來,它是虛無縹緲的。”
但通過發布ChatGPT,阿爾特曼卻將OpenAI及其宏大的人工智能使命,變得令整個科技界為之著迷。問題的關鍵在于,他與微軟的合作能否解決ChatGPT的缺點,利用其先發優勢改變整個科技行業。谷歌和其他科技業巨頭紛紛在加大力氣開發各自的人工智能平臺;未來,更完善的軟件可能使ChatGPT看起來如同兒戲。OpenAI總有一天可能會發現,雖然它的技術突破開啟了未來的大門,但這個未來卻與它無關,如同網景在瀏覽器領域曇花一現的統治地位一樣。
1月中旬一個星期四的晚上,阿爾特曼在舊金山罕見地公開露面。他上身穿灰色針織衫,下身穿藍色牛仔褲,腳蹬一雙時髦的亮色扎染運動鞋,走進一個擠滿投資者、技術人員和記者的房間。所有人都想收集與ChatGPT或近期融資有關的信息。當StrictlyVC(一家專注于風險投資的媒體公司)的創始人康妮·洛伊佐斯詢問他對于公司引起媒體轟動的看法時,阿爾特曼回答稱:“我不看新聞,實際上我不太關注媒體的報道。”
活動在賽富時大廈(Salesforce Tower)的46層召開,房間內座無虛席。在采訪開始前召開的金融科技專題討論會上,一位發言嘉賓甚至對聽眾表示,她知道所有人“都在等待山姆·阿爾特曼”。
然而,盡管引起了各界關注,還有有關微軟投資的傳聞在四處傳播,但阿爾特曼卻似乎有意在給這種熱烈的氛圍降溫。他表示:“這些技術有一點比較奇怪,那就是雖然它們的表現令人印象深刻,卻并不可靠。所以你在使用第一版演示版的時候,會產生一種非常深刻的反應:‘哇,真是不可思議,我已經迫不及待了’。但在用過一百次之后,你就會發現它的缺點。”
這種謹慎似乎代表了OpenAI總部的官方態度。該公司總部位于舊金山教會區的一家舊行李箱工廠。事實上,如果說ChatGPT是人工智能領域的“網景導航者”時刻,它差點就要提前夭折,因為OpenAI在幾個月前幾乎要叫停該項目。
ChatGPT的聊天界面支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設想是將這個界面作為完善其“大語言模型”(LLM)的一種方式。大多數生成式人工智能系統核心都有一個大語言模型。大語言模型是將非常龐大的神經網絡應用于大量人為創建文本所生成的。神經網絡是大致基于人腦內部神經連接的一種人工智能。模型從這個數據庫中學習一個復雜的統計學概率圖,代表了任何一組單詞在特定語境下相鄰出現的統計學概率。這樣一來,大語言模型就可以執行大量自然語言處理任務,例如翻譯、總結或寫作等。
OpenAI已經創建了全世界最強大的大語言模型之一。該模型名為GPT-3,由1,750億個統計性聯系組成,在約三分之二互聯網、整個維基百科和兩個大型圖書數據集中進行訓練。但OpenAI發現,GPT-3很難準確提供用戶想要的結果。一個團隊提議使用“強化學習”系統完善該模型。“強化學習”是從試錯中學習以取得最大化回報的人工智能系統。該團隊認為,一款聊天機器人或許是不錯的候選方法之一,因為以人類對話的形式持續提供反饋,使人工智能軟件很容易知道其做得好的地方和需要改進的情況。因此,2022年初,該團隊開始開發這款聊天機器人,也就是后來的ChatGPT。
開發完成后,OpenAI邀請貝塔測試人員對其進行了測試。但據OpenAI聯合創始人兼現任總裁格雷戈·布洛克曼表示,測試人員的反饋卻令OpenAI失望;人們不知道該與聊天機器人交流哪些內容。OpenAI一度改變了策略,嘗試開發專業聊天機器人,希望為特定領域的專業人員提供協助。但這個項目也遇到了問題,部分原因是OpenAI缺少訓練專業聊天機器人的合適數據。布洛克曼表示,OpenAI決定孤注一擲,對外發布ChatGPT,交給用戶使用,任其自由發展。布洛克曼表示:“我承認,我當時的立場是,不知道它是否會成功。”
OpenAI的高管表示,這款聊天機器人的突然爆紅,令公司措手不及。其首席技術官米拉·穆拉蒂表示:“這令我們非常驚訝。”在舊金山召開的風險投資活動上,阿爾特曼表示他的“預期可能要低一個量級——它所引起的熱度低一個量級。”
ChatGPT并不是OpenAI唯一一款引發熱度的產品。雖然該公司僅有約300名員工,團隊規模較小,卻拓展了人工智能的應用范圍,使其不只是簡單的分析數據,而是可以創建數據。OpenAI的另外一款產品DALL-E 2支持用戶通過輸入幾個單詞,生成他們所想象的任何物品的仿真圖片。現在跟風者已經出現,包括Midjourney和開源軟件公司Stability AI。(這些圖片生成模型都有缺點,最突出的是它們傾向于放大他們的訓練數據中的偏見,可能生成存在種族歧視和性別歧視的圖片。)OpenAI通過微調其計算機代碼的GPT大語言模型,還創建了Codex系統。該系統可以根據程序員以直白的語言輸入的代碼功能預期,為程序員編寫代碼。
OpenAI還有更多創新蓄勢待發。OpenAI在貝塔測試版GPT-4中采用了更強大的大語言模型,預計該版本將于今年甚至很快發布。阿爾特曼也表示,公司正在研發一款可根據文本描述生成視頻的系統。此外,在1月中旬,OpenAI表示其計劃發布ChatGPT的商業版。付費用戶可通過一個界面使用聊天機器人,更容易將其整合到自己的產品和服務當中。
或許有冷眼旁觀者認為,ChatGPT的發布時機與OpenAI正在進行的一輪大規模融資有關。(OpenAI表示該產品發布的時機純屬巧合。)可以確定的是,ChatGPT的出現攪動了一個鯊群出沒的水域。它在風投界掀起了一場狂熱的追逐,風投公司希望利用OpenAI高管、員工和創始人非公開出售股權的機會,獲得該公司的股份。
與此同時,微軟將在該公司追加投資高達100億美元的消息剛剛對外公布。微軟在2016年開始與OpenAI合作,三年前與該公司建立了戰略合作伙伴關系,并宣布投資10億美元。據知情人士透露,該公司股份被大量超額認購,盡管微軟通過一種不同尋常的投資結構獲得了巨大的財務優勢。
《財富》雜志掌握的文件顯示,在新投資完成并且OpenAI的首批投資者收回初始資本后,微軟將有權獲得OpenAI 75%的利潤,直至其收回130億美元投資,其中包括直到《財富》雜志1月份爆料之后,OpenAI才披露的20億美元投資。之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。與此同時,其他風險投資者和OpenAI的員工將有權獲得該公司49%的利潤,直至利潤達到1,500億美元為止。在利潤達到上述上限之后,微軟和投資者的股份將重新歸還給OpenAI的非營利基金。實際上,OpenAI的做法是將公司出租給微軟,租期取決于OpenAI的盈利速度。
但要收回投資和實現利潤上限目標,可能需要一段時間。《財富》雜志掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴重虧損狀態。文件顯示,該公司去年的收入預計不足3,000萬美元。但計算和數據支出預計達到4.1645億美元,人工支出8,931萬美元,其他非特定營業費用為3,875萬美元。其在2022年的凈虧損總計為5.445億美元,不含員工股票期權。而ChatGPT的發布可能快速增加該公司的虧損。阿爾特曼在Twitter上回復埃隆·馬斯克的問題稱,用戶與ChatGPT的每次互動,將占用OpenAI“個位數百分比”的計算成本,隨著這款聊天機器人走紅,其每月的支出可能高達數百萬美元。
OpenAI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。文件顯示,該公司預測2023年收入2億美元,2024年收入預計超過10億美元。但OpenAI并未預測其支出的增長情況以及何時能夠扭虧為盈。該公司拒絕就這些數據發表評論,但它們指向了一個顯而易見的事實:OpenAI和微軟都認為,曾經的非營利性實驗室現在已經有可用來出售謀利的產品。
微軟已經開始收獲雙方合作協議的成果。微軟在其Azure Cloud平臺中推出了一系列OpenAI品牌的工具和服務,支持Azure客戶使用OpenAI的技術,包括GPT和DALL-E工具。例如,汽車交易平臺CarMax已經推出了可在這些Azure工具上運行的新服務。
微軟人工智能平臺企業副總裁埃里克·博伊德表示,滿足訓練和運行OpenAI大語言平臺的需求,推動了創新,將使所有Azure客戶受益。例如,微軟為人工智能創建了其認為全球最強大的超級計算集群,并開發了多種軟件創新,使在這些機器上訓練和運行大型人工智能模型變得更容易。微軟正在將OpenAI的技術整合到其許多軟件當中。微軟在其搜索引擎必應(Bing)中推出了一款圖片創作工具以及一款新型設計師圖片設計工具,這兩款工具均由DALL-E驅動;在其Power Apps軟件中推出了一款支持GPT-3的工具,并根據OpenAI的Codex模型開發了一款代碼建議工具GitHub Copilot。
晨星(Morningstar)專注于科技股研究的高級股票研究分析師丹·羅曼諾夫表示,與OpenAI的合作關系即使不會馬上對Azure的收入產生影響,依舊是一次良好的品牌定位和營銷。他表示:“OpenAI備受關注。微軟能夠采用OpenAI開發的人工智能解決方案,將其應用到Azure并命名為Azure AI,可以保持其競爭力。”微軟云服務的競爭對手谷歌、AWS、IBM、甲骨文(Oracle)、賽富時(Salesforce)等,都有各自的“認知”服務,但能夠與開發出ChatGPT的公司合作必然是利大于弊。
對微軟而言,更大的回報可能是在搜索領域。科技媒體The Information最近報道稱,微軟計劃將ChatGPT整合到必應,使其能夠為用戶反饋簡潔明了的回答,并且使用戶可以通過與聊天機器人對話進行深入探究,而不是逐一查看一列鏈接。谷歌目前在搜索市場占據主導地位,其全球市場份額超過90%。必應雖然名列第二,卻與谷歌相去甚遠,市場份額僅有約3%。在2022年前九個月,谷歌搜索業務的收入為1,200億美元,約占谷歌總收入的60%。ChatGPT或許為微軟動搖谷歌的霸主地位提供了唯一一次真正的機會。(微軟拒絕就The Information的報道發表評論。)
按照微軟的標準,這些積極的回報非常劃算。微軟在OpenAI的總投資額為130億美元,確實是一個天文數字,但這筆投資僅占其過去12個月850億美元稅前利潤的15%,卻能獲得一項顛覆性技術的近期控制權,是一筆成本相對較低的交易。但OpenAI和阿爾特曼卻可能要付出不同的代價:微軟的優先任務可能對OpenAI自己的優先任務產生排擠效應,使OpenAI更宏大的使命面臨風險,并且降低助力公司成功的科學家們對其的歸屬感。
2015年7月的一個晚上,時任知名初創公司孵化器Y Combinator負責人的阿爾特曼,在地處門羅帕克硅谷風投業中心的牧場風格豪華酒店羅斯伍德桑德希爾酒店(Rosewood Sand Hill)舉行私人晚宴。出席晚宴的包括埃隆·馬斯克,還有當時26歲的麻省理工學院(MIT)肄業生布洛克曼。布洛克曼時任支付處理初創公司Stripe的首席技術官。賓客中有多位經驗豐富的人工智能研究人員,也有人對機器學習幾乎不甚了解。但所有人都相信通用人工智能是可行的,而且他們都非常擔心。
谷歌剛剛收購了一家公司:位于倫敦的神經網絡初創公司DeepMind。在阿爾特曼、馬斯克和其他科技界內部人士眼中,這是有極高勝算最先開發出通用人工智能的一家公司。如果DeepMind成功,谷歌可能會在這項無所不能的技術領域一家獨大。羅斯伍德晚宴的目的是討論成立一家實驗室與其競爭,以避免這種情況發生。
新實驗室旨在成為一家與DeepMind和谷歌截然不同的機構。這家實驗室將是非營利性質,并明確提出以將先進人工智能的效益民主化為使命。該實驗室承諾公開所有研究,將所有技術開源,并在公司名稱OpenAI中充分體現了對透明度的承諾。該實驗室有多位知名捐款人,其中不僅有馬斯克,還有他在PayPal的同事泰爾和霍夫曼;阿爾特曼和布洛克曼;Y Combinator聯合創始人杰西卡·利文斯頓;阿爾特曼成立的YC Research基金;印度IT外包公司Infosys;以及Amazon Web Services。所有創始捐款人承諾在這家理想主義的新公司共同投資10億美元(但稅務記錄顯示,雖然這一承諾被媒體廣泛報道,但該非營利組織僅收到了承諾捐款金額的一小部分)。
但事實很快證明,訓練龐大的神經網絡成本高昂,計算成本高達數千萬美元。人工智能研究人員的人工成本同樣昂貴:稅務記錄顯示,出生于俄羅斯的科學家伊利亞·薩茨科爾離開谷歌后,加入OpenAI擔任首席科學家,在前幾年的年薪高達190萬美元。幾年后,阿爾特曼和OpenAI的其他人得出的結論是,要與谷歌、Meta以及其他科技巨頭競爭,該實驗室不能繼續以非營利的方式運營。阿爾特曼在2019年對《連線》(Wired)雜志表示:“為了成功完成我們的使命,我們需要海量資金,數額遠超出我最初的設想。”
成立一家營利性分支機構,使OpenAI能夠吸收風險資本。但OpenAI創建了一種非同尋常的融資結構,按照投資者的初始投資,以特定倍數規定投資者的回報上限。而由硅谷精英組成的OpenAI非營利性董事會,將保留OpenAI知識產權的控制權(見側邊欄)。有一位硅谷精英沒有繼續在董事會任職,他就是馬斯克:2018年,馬斯克離開OpenAI董事會,理由是他需要經營SpaceX,還有更重要的特斯拉(Tesla)。
當時,微軟CEO薩蒂亞·納德拉迫切希望證明,在人工智能領域落后于競爭對手的微軟,也能在人工智能技術的尖端領域扮演一定的角色。微軟曾經嘗試聘請一位重量級的人工智能科學家,但未能成功。微軟還建立了規模龐大、成本高昂的專用芯片集群,以推進其在語言模型開發領域的進展。這正是OpenAI迫切需要的超級計算力,當時該公司曾斥巨資進行收購。OpenAI擅長的是實現各種炫酷的人工智能演示,而這正是希望證明微軟人工智能實力的納德拉所期待的。阿爾特曼主動聯系到納德拉商談合作,他曾多次飛往西雅圖展示OpenAI的人工智能模型。納德拉最終簽署了合作協議,并在2019年7月對外公布,使微軟成為OpenAI技術商業化的“首選合作伙伴”,并在該人工智能初創公司初始投資10億美元。
雖然阿爾特曼從最開始就參與了OpenAI的創立,但他直到2019年5月OpenAI轉型為營利性企業后不久才擔任該公司CEO。但該公司從一家研究實驗室變成價值數十億美元的現象級企業的過程,充分顯示出阿爾特曼獨特的融資能力,以及以產品為導向的經營理念,也凸顯出這些商業本能與他對實現科學驅動的宏大想法的承諾之間的矛盾。
作為OpenAI的領導人,從某種程度上來說,阿爾特曼就是硅谷的典型代表:年輕的白人男性;堅定專注;精通極客技術;熱衷于效率和生產率最大化;致力于“改變世界”的工作狂。﹝在2016年《紐約客》(New Yorker)的一篇文章中,他表示自己并沒有阿斯伯格綜合征,但他能理解為什么人們會認為他是阿斯伯格綜合征患者。﹞
阿爾特曼從斯坦福大學計算機科學專業肄業,參與創建了一家社交媒體公司Loopt,該公司的應用可以告知用戶好友所在的位置。該公司在2005年,成為Y Combinator的首批初創公司;雖然這家公司未能成功,但阿爾特曼出售該公司所得的收入,幫助他進入了風投界。他創建了一家小型風險投資公司Hydrazine Capital,募資約2,100萬美元,其中包括泰爾的資金。后來Y Combinator的聯合創始人保羅·格雷厄姆和利文斯頓聘請他接替格雷厄姆,負責運營YC。
阿爾特曼是一位創業者,而不是科學家或人工智能研究人員,他為人所津津樂道的是極其擅長進行風投融資。他堅信偉大的事業源于遠大的志向和堅定不移的自信,他曾表示,希望通過開發所謂的深度科技領域,如核裂變和量子計算等,創造數萬億美元的經濟價值。這些領域雖然成功的機會渺茫,但有可能帶來巨大回報。阿爾特曼在Loopt的同事、資深科技投資者和初創公司顧問馬克·雅各布斯坦表示:“山姆相信,他在自己從事的領域是最棒的。我確信,他曾認為自己是辦公室里最強的乒乓球高手,直到事實證明他是錯誤的。”
據OpenAI的多位現任和前內部人士爆料,隨著阿爾特曼掌管公司,公司開始轉移業務重心。曾經廣泛的研發議題被精簡,主要專注于自然語言處理領域。薩茨科爾和阿爾特曼辯稱這種轉變的目的是在目前似乎最有可能實現通用人工智能的研發領域,最大程度增加投入。但有前員工表示,在公司獲得微軟的初始投資后,重點開展大語言模型研究的內部壓力顯著增加,部分原因是這些模型可以迅速投入商業應用。
有員工抱怨,OpenAI創立的目的是不受企業影響,但它很快就變成了科技界巨頭的工具。一位前員工表示:“公司所關注的重點更多地傾向于我們如何開發產品,而不是努力回答最有趣的問題。”與本文的許多受訪者一樣,由于保密協議的約束,并且為了避免得罪與OpenAI有關的大人物,這名員工要求匿名。
OpenAI也變得不再像以前那么開放。該公司已經開始以擔心其技術可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。但據該公司的前員工表示,商業邏輯也是這些舉措背后的原因之一。OpenAI僅通過API提供其先進模型,保護了自己的知識產權和收入流。OpenAI的另外一名前員工表示:“[阿爾特曼]和[布洛克曼]對‘人工智能安全’說過不少空話,但這些言論通常都只是商業考量的遮羞布,對實際的、合理的人工智能安全問題卻視而不見。”例如,這位前員工提到OpenAI曾因為擔心被濫用而決定限制DALL-E 2的訪問權限,但在Midjourney和Stability AI推出競爭產品后,公司快速推翻了這一決定。(OpenAI表示,經過慎重的貝塔測試,其對安全系統充滿了信心,之后才允許DALL-E 2的更大范圍應用。)據多位前員工爆料,公司在策略和文化上的轉變,是導致十多名OpenAI研究人員和其他員工在2021年決定離開公司并成立研究實驗室Anthropic的原因之一。其中有多人曾從事人工智能安全研究。
OpenAI表示相比其他人工智能實驗室,其會繼續公布更多研究成果。公司還為重心向產品轉移的做法進行辯護。首席技術官穆拉蒂說道:“你不能只在實驗室里開發通用人工智能。”她主張,發布產品是了解人們希望如何使用和濫用技術的唯一途徑。她表示,直到發現人們使用GPT-3進行編程,OpenAI才知道GPT-3最受歡迎的應用是編寫軟件代碼。同樣,OpenAI最擔心的問題是人們利用GPT-3生成虛假的政治信息,但事實證明這只是杞人憂天。她表示,相反,最常見的惡意使用GPT-3的行為是制作垃圾廣告郵件。最后,穆拉蒂表示,OpenAI希望通過公開其技術,“最大程度降低真正強大的技術可能對社會產生的沖擊。”她表示,如果不讓人們預先了解未來可能出現的情形,先進人工智能所引發的社會混亂可能更嚴重。
薩茨科爾也認為OpenAI與微軟的合作創造了一種全新的“預期,即我們需要利用我們的技術開發一種有用的產品”,但他堅持認為OpenAI文化的核心并未改變。他說道,可以使用微軟的數據中心,對于OpenAI的發展至關重要。布洛克曼也表示,與微軟的合作使OpenAI能夠創造收入,同時不必過多關注商業運營,否則公司可能不得不在商業運營方面投入更多精力。他說道:“招聘數千名銷售人員,可能會改變這家公司,而與一家已經擁有銷售團隊的公司成為合作伙伴,實際上是非常好的策略。”
薩茨科爾直截了當地否認了OpenAI不再重視安全性的說法。“我想說的是,事實恰恰相反。”薩茨科爾稱,在員工離職并成立Anthropic之前,人工智能安全“被委派給一個團隊負責”,但現在它變成了所有團隊的責任。 “安全性標準不斷提高,我們也在開展越來越多安全性方面的工作。”
然而,批評者表示,OpenAI以產品為導向開發先進人工智能的做法是不負責任的,這相當于向人們發放上膛的槍支,理由是這是確定人們是否真的會相互射擊的最佳途徑。
紐約大學(New York University)認知科學專業榮譽退休教授加里·馬庫斯,對以深度學習為中心的人工智能開發策略持懷疑態度。他認為,生成式人工智能“將對社會結構產生切實的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統將生成虛假信息的成本降低到接近于零,可能會掀起虛假信息泛濫的狂潮。馬庫斯表示,我們甚至已經看到了第一批受害者。程序員發布和回答編程問題的網站Stack Overflow已經不得不禁止用戶提交ChatGPT生成的回答,因為這種貌似合理實則錯誤的回答已經令該網站疲于應付。科技資訊網站CNET開始使用ChatGPT生成資訊文章,但后來發現,由于許多文章存在事實性錯誤,不得不對它們進行更正。
對有些人而言,真正的風險是ChatGPT能夠編寫準確的代碼。網絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨表示,她的團隊可以用ChatGPT設計每一個階段的網絡攻擊,包括杜撰一封令人信服的釣魚郵件,編寫惡意代碼,以及逃避常見的網絡安全檢查等。她警告稱,ChatGPT基本可以讓不懂編程的人成為網絡罪犯,“我擔心未來會發生越來越多網絡攻擊”。OpenAI的穆拉蒂表示,公司也有同樣的擔憂,因此正在研究如何“調整”其人工智能模型,使它們不會編寫惡意軟件,但這絕非易事。
有無數批評者和教育工作者痛斥,學生很容易使用ChatGPT作弊。紐約、巴爾的摩和洛杉磯的校區均禁止學校管理的網絡訪問聊天機器人,澳大利亞的一些高校表示,將轉為通過有專人監考的書面考試評估學生。(OpenAI正在開發更便于檢測人工智能生成文本的方法,包括可能在ChatGPT生成的文本上添加數字“水印”。)
2022年,ChatGPT最初的開發方式還引發了人們對道德方面的擔憂。《時代》(Time)雜志調查發現,在開發過程中,OpenAI聘請了一家數據標記公司,這家公司雇傭肯尼亞的低薪員工識別包含不良語言、色情圖片和暴力內容的段落。報道稱,一些員工因此出現了精神健康問題。OpenAI在一份聲明中對《時代》雜志表示,數據標記工作“是最大程度減少訓練數據中的暴力和色情內容以及開發可檢測有害內容的工具的必要步驟”。
免費提供ChatGPT使OpenAI能夠獲取大量反饋,從而幫助其完善未來的版本。但OpenAI未來能否維持其在語言人工智能領域的主導地位,仍是個未知數。倫敦人工智能公司Faculty的創始人兼CEO馬克·華納表示:“歷史上,對于這種高度通用的算法,我們所看到的是,它們并沒有達到足夠可靠的程度,能夠保證一家公司獨占全部回報。”例如,面部識別和圖像識別技術最早的開發者是谷歌和英偉達(Nvidia)等科技巨頭,但現在它們已經無處不在。
法院和監管部門也可能對生成式人工智能所依賴的數據飛輪橫插一腳。向加州聯邦法院提起的一起金額高達90億美元的集體訴訟,可能對該領域產生深遠影響。該案原告指控微軟和OpenAI使用程序員的代碼訓練GitHub的編程助手Copilot,沒有承認程序員的功勞或者對程序員予以補償,違反了開源許可條款。微軟和OpenAI均拒絕就該起訴訟發表意見。
人工智能專家表示,如果法院判決原告勝訴,可能會阻礙生成式人工智能的繁榮:大多數生成式人工智能模型都是使用從互聯網上搜刮的材料進行訓練,并沒有取得許可或支付報酬。作為該案原告代理人的律師事務所,最近還提起了一起類似訴訟,指控Stability AI和Midjourney未經許可,在訓練數據中使用了有版權保護的美術作品。蓋蒂圖片社(Getty Images)也對Stability AI提起了版權侵權訴訟。另外一個問題是,立法者可能通過法律,授予創作者禁止將其創作的內容用于人工智能訓練的權利,例如歐盟的立法者正在考慮這樣做。
與此同時,OpenAI的競爭對手并沒有坐以待斃。據《紐約時報》(New York Times)報道,失去搜索領域主導地位的可能性,已經促使谷歌高管發布了“紅色警報”。報道稱,谷歌CEO桑達爾·皮查伊已經多次召開會議,重新制定公司的人工智能策略,計劃發布20款支持人工智能的新產品,并將在今年發布搜索聊天界面的演示版本。谷歌擁有一款強大的聊天機器人LaMDA,但由于擔心一旦該產品被濫用可能影響公司信譽,因此一直未對外發布。據《時代》雜志引用谷歌的內部報告和匿名知情人士的話稱,現在,公司計劃以ChatGPT為標桿“重新評估”其風險承受能力。該雜志報道稱,谷歌還在開發一款文本轉圖片的生成系統,與OpenAI的DALL-E等產品競爭。
當然,目前尚不確定聊天機器人是否代表了搜索行業的未來。ChatGPT經常會杜撰信息,這種現象被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或簡單地提供鏈接。現有版本無法訪問互聯網,因此無法提供最新信息。馬庫斯等人認為,幻覺和偏見是大語言模型存在的根本問題,需要徹底重新思考它們的設計。他表示:“這些系統可以預測句子中單詞的順序,類似于開發工具Steroids上的代碼自動補全。但它們實際上并沒有任何機制,能夠跟蹤其表述的內容的真實性,或者驗證這些內容是否符合它們的訓練數據。”
其他人預測,這些問題將在一年內得到解決,其中包括OpenAI的投資人霍夫曼和維諾德·科斯拉。穆拉蒂則更加慎重。她說道:“我們到目前為止一直遵循的研究方向,目的是解決模型的事實準確性和可靠性等問題。我們正在繼續朝著這些方向努力。”
事實上,OpenAI已經公布了對另外一個版本GPT的研究。該版本名為WebGPT,可以通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關來源的注釋。WebGPT依舊不完美:它會接受用戶問題假設的前提,然后查找確證信息,即使這個前提是錯誤的。例如,在被問到盼望某件事情發生是否能令其真實發生時,WebGPT的回答是:“你確實可以通過思考的力量,使愿望成真。”
阿爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。在舊金山舉辦的風險投資活動上,當被問到人工智能的最佳狀況時,他夸張地說道:“我認為最好的情況好到令人難以想象……好到談論它的人會令人覺得這人是個瘋子。”他突然又將話題轉回到OpenAI核心的反烏托邦主題:“我認為最糟糕的情況是,我們所有人都死去。”
*****
OpenAI投資者名人錄
OpenAI的早期投資者和非營利性基金會的董事會中有許多科技行業的精英。OpenAI的組織章程賦予董事會對其知識產權的最終控制權。公司的重要投資者包括:
里德·霍夫曼
作為PayPal和LinkedIn聯合創始人的里德·霍夫曼現任風險投資公司Greylock Partners的合伙人。他是OpenAI的創始捐款人之一,他的慈善基金會還在早期投資了OpenAI的營利性業務。
塔莎·麥考利
虛擬現實創業者麥考利是有效利他主義的支持者。這種哲學運動所關注的問題之一是超級智能化人工智能的危害。
亞當·德安杰洛
德安杰洛是Facebook初期的高管之一,曾在2000年代晚期Facebook繁榮時期擔任首席技術官,后來與他人共同創立了在線問答服務Quora。
希文·齊利斯
齊利斯是埃隆·馬斯克腦機接口公司Neuralink(曾經與OpenAI在同一棟辦公樓)的項目總監。有爆料稱馬斯克是齊利斯一對雙胞胎的生父。
維諾德·科斯拉
太陽微系統公司(Sun Microsystems)聯合創始人科斯拉,是OpenAI營利性部門的另外一位早期投資者。他認為,人工智能將徹底改變人類專業技能在許多職業中的價值,包括醫療。
埃隆·馬斯克
SpaceX和特斯拉(Tesla)CEO馬斯克是OpenAI最大的早期捐款人之一。他在2018年離開公司董事會。他曾表示隨著特斯拉開始開發自己的先進人工智能,他在該公司面臨利益沖突。
強大的風投機構
2021年,OpenAI在一次要約收購中出售現有股份,估值約為140億美元,并吸引了三家重量級的風險投資公司。
老虎環球基金(Tiger Global )
專注于科技投資的對沖基金老虎環球,由傳奇投資者朱利安·羅伯森的門徒切斯·科爾曼創立。它是規模較大的人工智能風險投資機構之一。
紅杉資本(Sequoia Capital)
紅杉資本是硅谷最受尊敬的風險投資公司之一。9月,該公司發布報告稱生成式人工智能可以“創造數萬億美元的經濟價值”。
安德森·霍洛維茨(Andreessen Horowitz)
安德森·霍洛維茨又名a16z,其領導者包括網景(Netscape)聯合創始人馬克·愛德森。該公司因為對Airbnb和Slack的早期投資而名聲大噪。該公司還大力投資加密貨幣相關初創公司。
米哈爾·列弗拉姆和杰西卡·馬修斯的補充報道。
本文發表于2023年2月/3月刊《財富》雜志,標題為《ChatGPT引發人工智能熱潮》(ChatGPT creates an A.I. frenzy)。
翻譯:劉進龍
審校:汪皓
編者語:ChatGPT的橫空出世,在人工智能領域掀起了重要變革,這一智能工具因其解放人類生產力的潛力,從使用者到投資者,引起了各界的廣泛關注。1月30日,有消息稱,百度將于3月在中國推出類似ChatGPT的人工智能聊天機器人程序。隨著微軟、百度等巨頭加碼,AIGC(人工智能自動生成內容)領域或將成為2023年最值得關注的、全球最熱門賽道。盡管ChatGPT乃至整個行業距離真正成熟的商業化仍有差距,從ChatGPT的幕后故事中,我們仍然得以一窺它會如何影響科技、商業以及人類社會的發展進程。
在一代人的時間里,總是會出現一些產品,將從工程部門昏暗的地下室里,青少年書呆子氣味難聞的臥室里,或者孤僻的有某種嗜好的人家中誕生的技術,變成人人都會用的工具。網絡瀏覽器誕生于1990年,但直到1994年網景導航者(Netscape Navigator)問世,大多數人才開始探索互聯網。2001年iPod誕生之前流行的MP3播放器,并未掀起數字音樂革命。同樣,2007年,蘋果(Apple)iPhone手機橫空出世之前,智能手機已經問世,但卻并沒有針對智能手機開發的應用。
2022年11月30日,人工智能領域可能也迎來了與網景導航者的問世同樣重要的關鍵時刻。
舊金山人工智能公司OpenAI的首席執行官山姆·阿爾特曼宣告了這個時刻的來臨。OpenAI成立于2015年,得到了埃隆·馬斯克、彼得·泰爾和其他PayPal幫成員以及LinkedIn聯合創始人雷德·霍夫曼等一眾硅谷大佬的投資。11月30日,公司成立約7年后,阿爾特曼發推文稱:“今天我們發布了ChatGPT。歡迎點擊這里與它聊天。”任何人可以通過推文中的鏈接注冊一個賬號,開始與OpenAI的新聊天機器人免費聊天。
這引起了各界人士的興趣。人們不止與它交流天氣狀況。它根據軟件公司CEO和工程師阿姆賈德·馬薩德的要求,檢查了程序代碼的漏洞。美食博主和網紅吉娜·霍摩爾卡要求它編寫一份健康的巧克力片曲奇餅干食譜。Scale AI公司的工程師賴利·古德賽德要求它撰寫一集《宋飛傳》(Seinfeld)的劇本。市場營銷人員、一家在線人工智能美術館的經營者蓋伊·帕森斯要求它為其撰寫提示語,然后輸入到另外一款人工智能系統Midjourney后轉換成圖像。斯坦福大學醫學院(Stanford University School of Medicine)的皮膚病學家、從事人工智能醫學應用研究的羅克珊娜·丹妮休向它提出了醫學問題。許多學生利用它完成家庭作業。這一切都發生在該聊天機器人發布后24小時內。
以前也曾有其他聊天機器人,但沒有一款能與ChatGPT相提并論。ChatGPT能進行天馬行空的長對話,可以回答問題,還能根據人們的要求撰寫各種書面材料,例如商業計劃書、廣告宣傳材料、詩歌、笑話、計算機代碼和電影劇本等。當然,它并不完美:它提供的結果往往不夠準確;它無法引用信息來源;而且它幾乎完全不知道2021年以后發生的事情。雖然它提供的結果通常足夠流暢,在高中甚至大學課堂上可以過關,但根本無法像人類專家們的表述那樣做到字斟句酌。另一方面,通常在對用戶知之甚少的情況下,ChatGPT生成內容只要大約一秒鐘時間,而且它生成的許多內容并沒有想象的那么糟糕。ChatGPT發布五天內,該聊天機器人的用戶就超過了100萬人,而Facebook用了10個月時間才達到這個里程碑。
過去十年,人工智能技術在商業領域逐步擴大應用,悄然改進了我們日常使用的許多軟件,但卻并沒有令非技術用戶感到興奮。ChatGPT的橫空出世改變了這一點。突然之間,人人都開始談論人工智能將會如何顛覆他們的工作、公司、學校和生活。
ChatGPT是一股相關人工智能技術浪潮的一部分,這種技術被統稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術生成模型。OpenAI位于科技行業“下一個大事件”的前沿,它具備了一家傳奇初創公司的特征,包括全明星級別的團隊和投資者的熱捧,該公司的估值據稱已經達到290億美元。
該公司最近的突然躥紅引發了嫉妒、猜疑和恐慌。谷歌(Google)利潤豐厚的搜索帝國可能受到影響。據媒體報道,為了應對ChatGPT,谷歌內部已經拉響了“紅色警報”。但OpenAI能成為超強科技公司俱樂部的成員,出乎人們的意料。幾年前,它甚至還不是一家公司,而是一家致力于學術研究的小型非營利性實驗室。公司至今依舊秉持著崇高的創立原則,例如保護人類文明,防范不受限制的人工智能所帶來的威脅等。與此同時,OpenAI經歷了一次內部轉型,導致原始團隊分裂,公司也將重心從純科研項目逐步轉移到商業項目。(有批評者認為,發布ChatGPT本身是一種危險行為,并且表明OpenAI的經營模式發生了巨大轉變。)
OpenAI與微軟(Microsoft)擴大合作的消息于近日公布,微軟將向該公司投資高達100億美元,作為回報,未來幾年,該軟件業巨頭將獲得OpenAI的大部分利潤。該筆交易可能會令外界更加確信,一份曾經理想主義的事業現在只關心謀利。盡管如此,《財富》雜志掌握的文件揭示了尚未盈利的OpenAI目前的經營狀況。
37歲的聯合創始人兼CEO阿爾特曼充分體現了OpenAI謎一樣的特性。作為一位資深科技創業者,阿爾特曼更為人們所熟知的是他出色的商業才能,而不是其工程技術成就。他是OpenAI估值暴漲的推手,也是給該技術潑冷水的主力。他曾公開表示ChatGPT距離真正可靠仍有很大差距。與此同時,他認為該技術是實現公司使命的重要一步。該公司有一個堂吉訶德式的使命,即開發一種計算機超級智能,又稱通用人工智能(AGI)。阿爾特曼在7月份表示:“通用人工智能是人類生存必不可少的。我們面臨的問題極其嚴峻,如果沒有更好的工具將無法解決。”
對于一家營利性的企業而言,這種指導理念不同尋常,尤其是有些計算機科學家認為阿爾特曼的執念純屬幻想。加州大學伯克利分校(University of California at Berkeley)計算機科學家本·雷希特表示:“通用人工智能是一種愚蠢的設想。在我看來,它是虛無縹緲的。”
但通過發布ChatGPT,阿爾特曼卻將OpenAI及其宏大的人工智能使命,變得令整個科技界為之著迷。問題的關鍵在于,他與微軟的合作能否解決ChatGPT的缺點,利用其先發優勢改變整個科技行業。谷歌和其他科技業巨頭紛紛在加大力氣開發各自的人工智能平臺;未來,更完善的軟件可能使ChatGPT看起來如同兒戲。OpenAI總有一天可能會發現,雖然它的技術突破開啟了未來的大門,但這個未來卻與它無關,如同網景在瀏覽器領域曇花一現的統治地位一樣。
1月中旬一個星期四的晚上,阿爾特曼在舊金山罕見地公開露面。他上身穿灰色針織衫,下身穿藍色牛仔褲,腳蹬一雙時髦的亮色扎染運動鞋,走進一個擠滿投資者、技術人員和記者的房間。所有人都想收集與ChatGPT或近期融資有關的信息。當StrictlyVC(一家專注于風險投資的媒體公司)的創始人康妮·洛伊佐斯詢問他對于公司引起媒體轟動的看法時,阿爾特曼回答稱:“我不看新聞,實際上我不太關注媒體的報道。”
活動在賽富時大廈(Salesforce Tower)的46層召開,房間內座無虛席。在采訪開始前召開的金融科技專題討論會上,一位發言嘉賓甚至對聽眾表示,她知道所有人“都在等待山姆·阿爾特曼”。
然而,盡管引起了各界關注,還有有關微軟投資的傳聞在四處傳播,但阿爾特曼卻似乎有意在給這種熱烈的氛圍降溫。他表示:“這些技術有一點比較奇怪,那就是雖然它們的表現令人印象深刻,卻并不可靠。所以你在使用第一版演示版的時候,會產生一種非常深刻的反應:‘哇,真是不可思議,我已經迫不及待了’。但在用過一百次之后,你就會發現它的缺點。”
這種謹慎似乎代表了OpenAI總部的官方態度。該公司總部位于舊金山教會區的一家舊行李箱工廠。事實上,如果說ChatGPT是人工智能領域的“網景導航者”時刻,它差點就要提前夭折,因為OpenAI在幾個月前幾乎要叫停該項目。
ChatGPT的聊天界面支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設想是將這個界面作為完善其“大語言模型”(LLM)的一種方式。大多數生成式人工智能系統核心都有一個大語言模型。大語言模型是將非常龐大的神經網絡應用于大量人為創建文本所生成的。神經網絡是大致基于人腦內部神經連接的一種人工智能。模型從這個數據庫中學習一個復雜的統計學概率圖,代表了任何一組單詞在特定語境下相鄰出現的統計學概率。這樣一來,大語言模型就可以執行大量自然語言處理任務,例如翻譯、總結或寫作等。
OpenAI已經創建了全世界最強大的大語言模型之一。該模型名為GPT-3,由1,750億個統計性聯系組成,在約三分之二互聯網、整個維基百科和兩個大型圖書數據集中進行訓練。但OpenAI發現,GPT-3很難準確提供用戶想要的結果。一個團隊提議使用“強化學習”系統完善該模型。“強化學習”是從試錯中學習以取得最大化回報的人工智能系統。該團隊認為,一款聊天機器人或許是不錯的候選方法之一,因為以人類對話的形式持續提供反饋,使人工智能軟件很容易知道其做得好的地方和需要改進的情況。因此,2022年初,該團隊開始開發這款聊天機器人,也就是后來的ChatGPT。
開發完成后,OpenAI邀請貝塔測試人員對其進行了測試。但據OpenAI聯合創始人兼現任總裁格雷戈·布洛克曼表示,測試人員的反饋卻令OpenAI失望;人們不知道該與聊天機器人交流哪些內容。OpenAI一度改變了策略,嘗試開發專業聊天機器人,希望為特定領域的專業人員提供協助。但這個項目也遇到了問題,部分原因是OpenAI缺少訓練專業聊天機器人的合適數據。布洛克曼表示,OpenAI決定孤注一擲,對外發布ChatGPT,交給用戶使用,任其自由發展。布洛克曼表示:“我承認,我當時的立場是,不知道它是否會成功。”
OpenAI的高管表示,這款聊天機器人的突然爆紅,令公司措手不及。其首席技術官米拉·穆拉蒂表示:“這令我們非常驚訝。”在舊金山召開的風險投資活動上,阿爾特曼表示他的“預期可能要低一個量級——它所引起的熱度低一個量級。”
ChatGPT并不是OpenAI唯一一款引發熱度的產品。雖然該公司僅有約300名員工,團隊規模較小,卻拓展了人工智能的應用范圍,使其不只是簡單的分析數據,而是可以創建數據。OpenAI的另外一款產品DALL-E 2支持用戶通過輸入幾個單詞,生成他們所想象的任何物品的仿真圖片。現在跟風者已經出現,包括Midjourney和開源軟件公司Stability AI。(這些圖片生成模型都有缺點,最突出的是它們傾向于放大他們的訓練數據中的偏見,可能生成存在種族歧視和性別歧視的圖片。)OpenAI通過微調其計算機代碼的GPT大語言模型,還創建了Codex系統。該系統可以根據程序員以直白的語言輸入的代碼功能預期,為程序員編寫代碼。
OpenAI還有更多創新蓄勢待發。OpenAI在貝塔測試版GPT-4中采用了更強大的大語言模型,預計該版本將于今年甚至很快發布。阿爾特曼也表示,公司正在研發一款可根據文本描述生成視頻的系統。此外,在1月中旬,OpenAI表示其計劃發布ChatGPT的商業版。付費用戶可通過一個界面使用聊天機器人,更容易將其整合到自己的產品和服務當中。
或許有冷眼旁觀者認為,ChatGPT的發布時機與OpenAI正在進行的一輪大規模融資有關。(OpenAI表示該產品發布的時機純屬巧合。)可以確定的是,ChatGPT的出現攪動了一個鯊群出沒的水域。它在風投界掀起了一場狂熱的追逐,風投公司希望利用OpenAI高管、員工和創始人非公開出售股權的機會,獲得該公司的股份。
與此同時,微軟將在該公司追加投資高達100億美元的消息剛剛對外公布。微軟在2016年開始與OpenAI合作,三年前與該公司建立了戰略合作伙伴關系,并宣布投資10億美元。據知情人士透露,該公司股份被大量超額認購,盡管微軟通過一種不同尋常的投資結構獲得了巨大的財務優勢。
《財富》雜志掌握的文件顯示,在新投資完成并且OpenAI的首批投資者收回初始資本后,微軟將有權獲得OpenAI 75%的利潤,直至其收回130億美元投資,其中包括直到《財富》雜志1月份爆料之后,OpenAI才披露的20億美元投資。之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。與此同時,其他風險投資者和OpenAI的員工將有權獲得該公司49%的利潤,直至利潤達到1,500億美元為止。在利潤達到上述上限之后,微軟和投資者的股份將重新歸還給OpenAI的非營利基金。實際上,OpenAI的做法是將公司出租給微軟,租期取決于OpenAI的盈利速度。
但要收回投資和實現利潤上限目標,可能需要一段時間。《財富》雜志掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴重虧損狀態。文件顯示,該公司去年的收入預計不足3,000萬美元。但計算和數據支出預計達到4.1645億美元,人工支出8,931萬美元,其他非特定營業費用為3,875萬美元。其在2022年的凈虧損總計為5.445億美元,不含員工股票期權。而ChatGPT的發布可能快速增加該公司的虧損。阿爾特曼在Twitter上回復埃隆·馬斯克的問題稱,用戶與ChatGPT的每次互動,將占用OpenAI“個位數百分比”的計算成本,隨著這款聊天機器人走紅,其每月的支出可能高達數百萬美元。
OpenAI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。文件顯示,該公司預測2023年收入2億美元,2024年收入預計超過10億美元。但OpenAI并未預測其支出的增長情況以及何時能夠扭虧為盈。該公司拒絕就這些數據發表評論,但它們指向了一個顯而易見的事實:OpenAI和微軟都認為,曾經的非營利性實驗室現在已經有可用來出售謀利的產品。
微軟已經開始收獲雙方合作協議的成果。微軟在其Azure Cloud平臺中推出了一系列OpenAI品牌的工具和服務,支持Azure客戶使用OpenAI的技術,包括GPT和DALL-E工具。例如,汽車交易平臺CarMax已經推出了可在這些Azure工具上運行的新服務。
微軟人工智能平臺企業副總裁埃里克·博伊德表示,滿足訓練和運行OpenAI大語言平臺的需求,推動了創新,將使所有Azure客戶受益。例如,微軟為人工智能創建了其認為全球最強大的超級計算集群,并開發了多種軟件創新,使在這些機器上訓練和運行大型人工智能模型變得更容易。微軟正在將OpenAI的技術整合到其許多軟件當中。微軟在其搜索引擎必應(Bing)中推出了一款圖片創作工具以及一款新型設計師圖片設計工具,這兩款工具均由DALL-E驅動;在其Power Apps軟件中推出了一款支持GPT-3的工具,并根據OpenAI的Codex模型開發了一款代碼建議工具GitHub Copilot。
晨星(Morningstar)專注于科技股研究的高級股票研究分析師丹·羅曼諾夫表示,與OpenAI的合作關系即使不會馬上對Azure的收入產生影響,依舊是一次良好的品牌定位和營銷。他表示:“OpenAI備受關注。微軟能夠采用OpenAI開發的人工智能解決方案,將其應用到Azure并命名為Azure AI,可以保持其競爭力。”微軟云服務的競爭對手谷歌、AWS、IBM、甲骨文(Oracle)、賽富時(Salesforce)等,都有各自的“認知”服務,但能夠與開發出ChatGPT的公司合作必然是利大于弊。
對微軟而言,更大的回報可能是在搜索領域。科技媒體The Information最近報道稱,微軟計劃將ChatGPT整合到必應,使其能夠為用戶反饋簡潔明了的回答,并且使用戶可以通過與聊天機器人對話進行深入探究,而不是逐一查看一列鏈接。谷歌目前在搜索市場占據主導地位,其全球市場份額超過90%。必應雖然名列第二,卻與谷歌相去甚遠,市場份額僅有約3%。在2022年前九個月,谷歌搜索業務的收入為1,200億美元,約占谷歌總收入的60%。ChatGPT或許為微軟動搖谷歌的霸主地位提供了唯一一次真正的機會。(微軟拒絕就The Information的報道發表評論。)
按照微軟的標準,這些積極的回報非常劃算。微軟在OpenAI的總投資額為130億美元,確實是一個天文數字,但這筆投資僅占其過去12個月850億美元稅前利潤的15%,卻能獲得一項顛覆性技術的近期控制權,是一筆成本相對較低的交易。但OpenAI和阿爾特曼卻可能要付出不同的代價:微軟的優先任務可能對OpenAI自己的優先任務產生排擠效應,使OpenAI更宏大的使命面臨風險,并且降低助力公司成功的科學家們對其的歸屬感。
2015年7月的一個晚上,時任知名初創公司孵化器Y Combinator負責人的阿爾特曼,在地處門羅帕克硅谷風投業中心的牧場風格豪華酒店羅斯伍德桑德希爾酒店(Rosewood Sand Hill)舉行私人晚宴。出席晚宴的包括埃隆·馬斯克,還有當時26歲的麻省理工學院(MIT)肄業生布洛克曼。布洛克曼時任支付處理初創公司Stripe的首席技術官。賓客中有多位經驗豐富的人工智能研究人員,也有人對機器學習幾乎不甚了解。但所有人都相信通用人工智能是可行的,而且他們都非常擔心。
谷歌剛剛收購了一家公司:位于倫敦的神經網絡初創公司DeepMind。在阿爾特曼、馬斯克和其他科技界內部人士眼中,這是有極高勝算最先開發出通用人工智能的一家公司。如果DeepMind成功,谷歌可能會在這項無所不能的技術領域一家獨大。羅斯伍德晚宴的目的是討論成立一家實驗室與其競爭,以避免這種情況發生。
新實驗室旨在成為一家與DeepMind和谷歌截然不同的機構。這家實驗室將是非營利性質,并明確提出以將先進人工智能的效益民主化為使命。該實驗室承諾公開所有研究,將所有技術開源,并在公司名稱OpenAI中充分體現了對透明度的承諾。該實驗室有多位知名捐款人,其中不僅有馬斯克,還有他在PayPal的同事泰爾和霍夫曼;阿爾特曼和布洛克曼;Y Combinator聯合創始人杰西卡·利文斯頓;阿爾特曼成立的YC Research基金;印度IT外包公司Infosys;以及Amazon Web Services。所有創始捐款人承諾在這家理想主義的新公司共同投資10億美元(但稅務記錄顯示,雖然這一承諾被媒體廣泛報道,但該非營利組織僅收到了承諾捐款金額的一小部分)。
但事實很快證明,訓練龐大的神經網絡成本高昂,計算成本高達數千萬美元。人工智能研究人員的人工成本同樣昂貴:稅務記錄顯示,出生于俄羅斯的科學家伊利亞·薩茨科爾離開谷歌后,加入OpenAI擔任首席科學家,在前幾年的年薪高達190萬美元。幾年后,阿爾特曼和OpenAI的其他人得出的結論是,要與谷歌、Meta以及其他科技巨頭競爭,該實驗室不能繼續以非營利的方式運營。阿爾特曼在2019年對《連線》(Wired)雜志表示:“為了成功完成我們的使命,我們需要海量資金,數額遠超出我最初的設想。”
成立一家營利性分支機構,使OpenAI能夠吸收風險資本。但OpenAI創建了一種非同尋常的融資結構,按照投資者的初始投資,以特定倍數規定投資者的回報上限。而由硅谷精英組成的OpenAI非營利性董事會,將保留OpenAI知識產權的控制權(見側邊欄)。有一位硅谷精英沒有繼續在董事會任職,他就是馬斯克:2018年,馬斯克離開OpenAI董事會,理由是他需要經營SpaceX,還有更重要的特斯拉(Tesla)。
當時,微軟CEO薩蒂亞·納德拉迫切希望證明,在人工智能領域落后于競爭對手的微軟,也能在人工智能技術的尖端領域扮演一定的角色。微軟曾經嘗試聘請一位重量級的人工智能科學家,但未能成功。微軟還建立了規模龐大、成本高昂的專用芯片集群,以推進其在語言模型開發領域的進展。這正是OpenAI迫切需要的超級計算力,當時該公司曾斥巨資進行收購。OpenAI擅長的是實現各種炫酷的人工智能演示,而這正是希望證明微軟人工智能實力的納德拉所期待的。阿爾特曼主動聯系到納德拉商談合作,他曾多次飛往西雅圖展示OpenAI的人工智能模型。納德拉最終簽署了合作協議,并在2019年7月對外公布,使微軟成為OpenAI技術商業化的“首選合作伙伴”,并在該人工智能初創公司初始投資10億美元。
雖然阿爾特曼從最開始就參與了OpenAI的創立,但他直到2019年5月OpenAI轉型為營利性企業后不久才擔任該公司CEO。但該公司從一家研究實驗室變成價值數十億美元的現象級企業的過程,充分顯示出阿爾特曼獨特的融資能力,以及以產品為導向的經營理念,也凸顯出這些商業本能與他對實現科學驅動的宏大想法的承諾之間的矛盾。
作為OpenAI的領導人,從某種程度上來說,阿爾特曼就是硅谷的典型代表:年輕的白人男性;堅定專注;精通極客技術;熱衷于效率和生產率最大化;致力于“改變世界”的工作狂。﹝在2016年《紐約客》(New Yorker)的一篇文章中,他表示自己并沒有阿斯伯格綜合征,但他能理解為什么人們會認為他是阿斯伯格綜合征患者。﹞
阿爾特曼從斯坦福大學計算機科學專業肄業,參與創建了一家社交媒體公司Loopt,該公司的應用可以告知用戶好友所在的位置。該公司在2005年,成為Y Combinator的首批初創公司;雖然這家公司未能成功,但阿爾特曼出售該公司所得的收入,幫助他進入了風投界。他創建了一家小型風險投資公司Hydrazine Capital,募資約2,100萬美元,其中包括泰爾的資金。后來Y Combinator的聯合創始人保羅·格雷厄姆和利文斯頓聘請他接替格雷厄姆,負責運營YC。
阿爾特曼是一位創業者,而不是科學家或人工智能研究人員,他為人所津津樂道的是極其擅長進行風投融資。他堅信偉大的事業源于遠大的志向和堅定不移的自信,他曾表示,希望通過開發所謂的深度科技領域,如核裂變和量子計算等,創造數萬億美元的經濟價值。這些領域雖然成功的機會渺茫,但有可能帶來巨大回報。阿爾特曼在Loopt的同事、資深科技投資者和初創公司顧問馬克·雅各布斯坦表示:“山姆相信,他在自己從事的領域是最棒的。我確信,他曾認為自己是辦公室里最強的乒乓球高手,直到事實證明他是錯誤的。”
據OpenAI的多位現任和前內部人士爆料,隨著阿爾特曼掌管公司,公司開始轉移業務重心。曾經廣泛的研發議題被精簡,主要專注于自然語言處理領域。薩茨科爾和阿爾特曼辯稱這種轉變的目的是在目前似乎最有可能實現通用人工智能的研發領域,最大程度增加投入。但有前員工表示,在公司獲得微軟的初始投資后,重點開展大語言模型研究的內部壓力顯著增加,部分原因是這些模型可以迅速投入商業應用。
有員工抱怨,OpenAI創立的目的是不受企業影響,但它很快就變成了科技界巨頭的工具。一位前員工表示:“公司所關注的重點更多地傾向于我們如何開發產品,而不是努力回答最有趣的問題。”與本文的許多受訪者一樣,由于保密協議的約束,并且為了避免得罪與OpenAI有關的大人物,這名員工要求匿名。
OpenAI也變得不再像以前那么開放。該公司已經開始以擔心其技術可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。但據該公司的前員工表示,商業邏輯也是這些舉措背后的原因之一。OpenAI僅通過API提供其先進模型,保護了自己的知識產權和收入流。OpenAI的另外一名前員工表示:“[阿爾特曼]和[布洛克曼]對‘人工智能安全’說過不少空話,但這些言論通常都只是商業考量的遮羞布,對實際的、合理的人工智能安全問題卻視而不見。”例如,這位前員工提到OpenAI曾因為擔心被濫用而決定限制DALL-E 2的訪問權限,但在Midjourney和Stability AI推出競爭產品后,公司快速推翻了這一決定。(OpenAI表示,經過慎重的貝塔測試,其對安全系統充滿了信心,之后才允許DALL-E 2的更大范圍應用。)據多位前員工爆料,公司在策略和文化上的轉變,是導致十多名OpenAI研究人員和其他員工在2021年決定離開公司并成立研究實驗室Anthropic的原因之一。其中有多人曾從事人工智能安全研究。
OpenAI表示相比其他人工智能實驗室,其會繼續公布更多研究成果。公司還為重心向產品轉移的做法進行辯護。首席技術官穆拉蒂說道:“你不能只在實驗室里開發通用人工智能。”她主張,發布產品是了解人們希望如何使用和濫用技術的唯一途徑。她表示,直到發現人們使用GPT-3進行編程,OpenAI才知道GPT-3最受歡迎的應用是編寫軟件代碼。同樣,OpenAI最擔心的問題是人們利用GPT-3生成虛假的政治信息,但事實證明這只是杞人憂天。她表示,相反,最常見的惡意使用GPT-3的行為是制作垃圾廣告郵件。最后,穆拉蒂表示,OpenAI希望通過公開其技術,“最大程度降低真正強大的技術可能對社會產生的沖擊。”她表示,如果不讓人們預先了解未來可能出現的情形,先進人工智能所引發的社會混亂可能更嚴重。
薩茨科爾也認為OpenAI與微軟的合作創造了一種全新的“預期,即我們需要利用我們的技術開發一種有用的產品”,但他堅持認為OpenAI文化的核心并未改變。他說道,可以使用微軟的數據中心,對于OpenAI的發展至關重要。布洛克曼也表示,與微軟的合作使OpenAI能夠創造收入,同時不必過多關注商業運營,否則公司可能不得不在商業運營方面投入更多精力。他說道:“招聘數千名銷售人員,可能會改變這家公司,而與一家已經擁有銷售團隊的公司成為合作伙伴,實際上是非常好的策略。”
薩茨科爾直截了當地否認了OpenAI不再重視安全性的說法。“我想說的是,事實恰恰相反。”薩茨科爾稱,在員工離職并成立Anthropic之前,人工智能安全“被委派給一個團隊負責”,但現在它變成了所有團隊的責任。 “安全性標準不斷提高,我們也在開展越來越多安全性方面的工作。”
然而,批評者表示,OpenAI以產品為導向開發先進人工智能的做法是不負責任的,這相當于向人們發放上膛的槍支,理由是這是確定人們是否真的會相互射擊的最佳途徑。
紐約大學(New York University)認知科學專業榮譽退休教授加里·馬庫斯,對以深度學習為中心的人工智能開發策略持懷疑態度。他認為,生成式人工智能“將對社會結構產生切實的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統將生成虛假信息的成本降低到接近于零,可能會掀起虛假信息泛濫的狂潮。馬庫斯表示,我們甚至已經看到了第一批受害者。程序員發布和回答編程問題的網站Stack Overflow已經不得不禁止用戶提交ChatGPT生成的回答,因為這種貌似合理實則錯誤的回答已經令該網站疲于應付。科技資訊網站CNET開始使用ChatGPT生成資訊文章,但后來發現,由于許多文章存在事實性錯誤,不得不對它們進行更正。
對有些人而言,真正的風險是ChatGPT能夠編寫準確的代碼。網絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨表示,她的團隊可以用ChatGPT設計每一個階段的網絡攻擊,包括杜撰一封令人信服的釣魚郵件,編寫惡意代碼,以及逃避常見的網絡安全檢查等。她警告稱,ChatGPT基本可以讓不懂編程的人成為網絡罪犯,“我擔心未來會發生越來越多網絡攻擊”。OpenAI的穆拉蒂表示,公司也有同樣的擔憂,因此正在研究如何“調整”其人工智能模型,使它們不會編寫惡意軟件,但這絕非易事。
有無數批評者和教育工作者痛斥,學生很容易使用ChatGPT作弊。紐約、巴爾的摩和洛杉磯的校區均禁止學校管理的網絡訪問聊天機器人,澳大利亞的一些高校表示,將轉為通過有專人監考的書面考試評估學生。(OpenAI正在開發更便于檢測人工智能生成文本的方法,包括可能在ChatGPT生成的文本上添加數字“水印”。)
2022年,ChatGPT最初的開發方式還引發了人們對道德方面的擔憂。《時代》(Time)雜志調查發現,在開發過程中,OpenAI聘請了一家數據標記公司,這家公司雇傭肯尼亞的低薪員工識別包含不良語言、色情圖片和暴力內容的段落。報道稱,一些員工因此出現了精神健康問題。OpenAI在一份聲明中對《時代》雜志表示,數據標記工作“是最大程度減少訓練數據中的暴力和色情內容以及開發可檢測有害內容的工具的必要步驟”。
免費提供ChatGPT使OpenAI能夠獲取大量反饋,從而幫助其完善未來的版本。但OpenAI未來能否維持其在語言人工智能領域的主導地位,仍是個未知數。倫敦人工智能公司Faculty的創始人兼CEO馬克·華納表示:“歷史上,對于這種高度通用的算法,我們所看到的是,它們并沒有達到足夠可靠的程度,能夠保證一家公司獨占全部回報。”例如,面部識別和圖像識別技術最早的開發者是谷歌和英偉達(Nvidia)等科技巨頭,但現在它們已經無處不在。
法院和監管部門也可能對生成式人工智能所依賴的數據飛輪橫插一腳。向加州聯邦法院提起的一起金額高達90億美元的集體訴訟,可能對該領域產生深遠影響。該案原告指控微軟和OpenAI使用程序員的代碼訓練GitHub的編程助手Copilot,沒有承認程序員的功勞或者對程序員予以補償,違反了開源許可條款。微軟和OpenAI均拒絕就該起訴訟發表意見。
人工智能專家表示,如果法院判決原告勝訴,可能會阻礙生成式人工智能的繁榮:大多數生成式人工智能模型都是使用從互聯網上搜刮的材料進行訓練,并沒有取得許可或支付報酬。作為該案原告代理人的律師事務所,最近還提起了一起類似訴訟,指控Stability AI和Midjourney未經許可,在訓練數據中使用了有版權保護的美術作品。蓋蒂圖片社(Getty Images)也對Stability AI提起了版權侵權訴訟。另外一個問題是,立法者可能通過法律,授予創作者禁止將其創作的內容用于人工智能訓練的權利,例如歐盟的立法者正在考慮這樣做。
與此同時,OpenAI的競爭對手并沒有坐以待斃。據《紐約時報》(New York Times)報道,失去搜索領域主導地位的可能性,已經促使谷歌高管發布了“紅色警報”。報道稱,谷歌CEO桑達爾·皮查伊已經多次召開會議,重新制定公司的人工智能策略,計劃發布20款支持人工智能的新產品,并將在今年發布搜索聊天界面的演示版本。谷歌擁有一款強大的聊天機器人LaMDA,但由于擔心一旦該產品被濫用可能影響公司信譽,因此一直未對外發布。據《時代》雜志引用谷歌的內部報告和匿名知情人士的話稱,現在,公司計劃以ChatGPT為標桿“重新評估”其風險承受能力。該雜志報道稱,谷歌還在開發一款文本轉圖片的生成系統,與OpenAI的DALL-E等產品競爭。
當然,目前尚不確定聊天機器人是否代表了搜索行業的未來。ChatGPT經常會杜撰信息,這種現象被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或簡單地提供鏈接。現有版本無法訪問互聯網,因此無法提供最新信息。馬庫斯等人認為,幻覺和偏見是大語言模型存在的根本問題,需要徹底重新思考它們的設計。他表示:“這些系統可以預測句子中單詞的順序,類似于開發工具Steroids上的代碼自動補全。但它們實際上并沒有任何機制,能夠跟蹤其表述的內容的真實性,或者驗證這些內容是否符合它們的訓練數據。”
其他人預測,這些問題將在一年內得到解決,其中包括OpenAI的投資人霍夫曼和維諾德·科斯拉。穆拉蒂則更加慎重。她說道:“我們到目前為止一直遵循的研究方向,目的是解決模型的事實準確性和可靠性等問題。我們正在繼續朝著這些方向努力。”
事實上,OpenAI已經公布了對另外一個版本GPT的研究。該版本名為WebGPT,可以通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關來源的注釋。WebGPT依舊不完美:它會接受用戶問題假設的前提,然后查找確證信息,即使這個前提是錯誤的。例如,在被問到盼望某件事情發生是否能令其真實發生時,WebGPT的回答是:“你確實可以通過思考的力量,使愿望成真。”
阿爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。在舊金山舉辦的風險投資活動上,當被問到人工智能的最佳狀況時,他夸張地說道:“我認為最好的情況好到令人難以想象……好到談論它的人會令人覺得這人是個瘋子。”他突然又將話題轉回到OpenAI核心的反烏托邦主題:“我認為最糟糕的情況是,我們所有人都死去。”(財富中文網)
翻譯:劉進龍
審校:汪皓
A few times in a generation, a product comes along that catapults a technology from the fluorescent gloom of engineering department basements, the fetid teenage bedrooms of nerds, and the lonely man caves of hobbyists—into something that your great-aunt Edna knows how to use. There were web browsers as early as 1990. But it wasn’t until Netscape Navigator came along in 1994 that most people discovered the internet. There were MP3 players before the iPod debuted in 2001, but they didn’t spark the digital music revolution. There were smartphones before Apple dropped the iPhone in 2007 too—but before the iPhone, there wasn’t an app for that.
On Nov. 30, 2022, artificial intelligence had what might turn out to be its Netscape Navigator moment.
The moment was ushered in by Sam Altman, the chief executive officer of OpenAI, a San Francisco–based A.I. company that was founded in 2015 with financial backing from a clutch of Silicon Valley heavy hitters—including Elon Musk, Peter Thiel, and fellow PayPal alum and LinkedIn cofounder Reid Hoffman. On Nov. 30, some seven years after the company’s launch, Altman tweeted: “today we launched ChatGPT. try talking with it here,” followed by a link that would let anyone sign up for an account to begin conversing with OpenAI’s new chatbot for free.
And anyone—and everyone—has. And not just to chat about the weather. Amjad Masad, a software CEO and engineer, asked it to debug his code—and it did. Gina Homolka, a food blogger and influencer, got it to write a recipe for healthy chocolate-chip cookies. Riley Goodside, an engineer at Scale AI, asked it to write the script for a Seinfeld episode. Guy Parsons, a marketer who also runs an online gallery dedicated to A.I. art, got it to write prompts for him to feed into another A.I. system, Midjourney, that creates images from text descriptions. Roxana Daneshjou, a dermatologist at Stanford University School of Medicine who also researches A.I. applications in medicine, asked it medical questions. Lots of students used it to do their homework. And that was just in the first 24 hours following the chatbot’s release.
There have been chatbots before. But not like this. ChatGPT can hold long, fluid dialogues, answer questions, and compose almost any kind of written material a person requests, including business plans, advertising campaigns, poems, jokes, computer code, and movie screenplays. It’s far from perfect: The results are not always accurate; it can’t cite the sources of its information; it has almost no knowledge of anything that happened after 2021. And what it delivers—while often smooth enough to pass muster in a high school class or even a college course—is rarely as polished as what a human expert could produce. On the other hand, ChatGPT produces this content in about a second—often with little to no specific knowledge on the user’s part—and a lot of what it spits out isn’t half bad. Within five days of its release, more than 1 million people had played with ChatGPT, a milestone Facebook took 10 months to hit.
Artificial intelligence technology has, over the past decade, made steady inroads into business and quietly improved a lot of the software we use every day without engendering much excitement among non-technologists. ChatGPT changed that. Suddenly everyone is talking about how A.I. might upend their jobs, companies, schools, and lives.
ChatGPT is part of a wave of related A.I. technologies collectively known as “generative A.I.”—one that also includes buzzy art generators like Midjourney and Lensa. And OpenAI’s position at the forefront of the tech industry’s next big thing has the hallmarks of a startup epic, including an all-star cast of characters and an investor frenzy that has crowned it with a reported valuation of $29 billion.
But even as its recent surge provokes envy, wonder, and fear—Google, whose lucrative search empire could be vulnerable, reportedly declared an internal “code red” in response to ChatGPT—OpenAI is an unlikely member of the club of tech superpowers. Until a few years ago, it wasn’t a company at all but a small nonprofit lab dedicated to academic research. Lofty founding principles such as protecting humanity from the dangers of unrestrained A.I. remain. At the same time, OpenAI has gone through an internal transformation that divided its original staff and brought an increased focus on commercial projects over pure science. (Some critics argue that releasing ChatGPT into the wild was itself dangerous—and a sign of how profoundly OpenAI’s approach has shifted.)
An expanded partnership with Microsoft, announced this week, that includes as much as $10 billion in new capital could result in the software giant capturing the lion’s share of OpenAI’s profits for years to come. That deal is likely to deepen the perception that the once idealistic endeavor is now primarily concerned with making money. That said, documents seen by Fortune reveal just how unprofitable OpenAI’s business is currently.
Altman, the 37-year-old cofounder and CEO, embodies OpenAI’s puzzling nature. A serial tech entrepreneur known more for business savvy than for feats of engineering, Altman is both the architect of OpenAI’s soaring valuation and its buzzkiller-in-chief—speaking out publicly about how far ChatGPT is from being truly reliable. At the same time, he sees the technology as a step forward in his broader, quixotic corporate mission to develop a computer superintelligence known as artificial general intelligence, or AGI. “AGI is probably necessary for humanity to survive,” Altman tweeted in July. “our problems seem too big [for] us to solve without better tools.”
It’s an unusual guiding philosophy for a moneymaking enterprise, especially considering that some computer scientists dismiss Altman’s obsession as the stuff of fantasy. “AGI is just silly,” says Ben Recht, a computer scientist at the University of California at Berkeley. “I mean, it’s not a thing.”
And yet, with ChatGPT, Altman has turned OpenAI—and the broader A.I. mission—into the thing captivating the tech world. The question is whether the partnership he has forged with Microsoft can fix ChatGPT’s flaws and capitalize on its early lead to transform the tech industry. Google and other titans are hard at work on their own A.I. platforms; and future, more polished software could make ChatGPT look like child’s play. OpenAI may someday find that, much like Netscape’s short-lived browser reign, its breakthrough has opened a door to a future it isn’t part of.
On a Thursday evening in mid-January in San Francisco, Altman makes a rare public appearance. Dressed in a gray sweater, blue jeans, and a pair of groovy, brightly colored tie-dyed sneakers, the CEO walks into a roomful of investors, techies, and journalists, all gathered to glean any dish about ChatGPT or the imminent funding round. When his interviewer, Connie Loizos, the founder of StrictlyVC, a media company focused on venture capital, asks him about the media furor, Altman replies, “I don’t read the news, and I don’t really do stuff like this much.”
The event, on the 46th floor of the Salesforce Tower, is standing room only. One of the speakers during a fintech panel that takes place before the interview even tells the crowd that she knows they’re “all waiting for Sam Altman.”
But despite the buzz, and the circulating rumors of the Microsoft investment, Altman seems to go out of his way to dampen the excitement. “One of the strange things about these technologies is that they are impressive but not robust,” he tells the crowd. “So you use them in the first demo; you kind of have this very impressive, ‘Wow, this is incredible and ready to go’ [reaction]. But you see it a hundred times, and you see the weaknesses.”
That kind of caution seems to be the official mode at OpenAI’s headquarters, situated in an old luggage factory in San Francisco’s Mission District. And indeed, if ChatGPT is A.I.’s Netscape Navigator moment, it is one that very nearly never happened—because OpenAI almost killed the project months ago.
The chat interface that allows users to converse with the A.I. in plain English (and many other languages) was initially conceived by OpenAI as a way to improve its “large language models,” or LLMs. Most generative A.I. systems have an LLM at their core. They are created by taking very large neural networks—an A.I. based very loosely on connections in the human brain—and applying them to vast amounts of human-created text. From this library, the model learns a complex map of the statistical likelihood that any group of words will appear next to one another in any given context. This allows LLMs to perform a vast array of natural language processing tasks—from translation to summarization to writing.
OpenAI had already created one of the world’s most powerful LLMs. Called GPT-3, it takes in more than 175 billion statistical connections and is trained on about two-thirds of the internet, all of Wikipedia, and two large data sets of books. But OpenAI found it could be tricky to get GPT-3 to produce exactly what a user wanted. One team had the idea of using reinforcement learning—in which an A.I. system learns from trial and error to maximize a reward—to perfect the model. The team thought that a chatbot might be a great candidate for this method since constant feedback, in the form of human dialogue, would make it easy for the A.I. software to know when it had done a good job and where it needed to improve. So in early 2022, the team started building what would become ChatGPT.
When it was ready, OpenAI let beta testers play with ChatGPT. But they didn’t embrace it in the way OpenAI had hoped, according to Greg Brockman, an OpenAI cofounder and its current president; it wasn’t clear to people what they were supposed to talk to the chatbot about. For a while, OpenAI switched gears and tried to build expert chatbots that could help professionals in specific domains. But that effort ran into problems too—in part because OpenAI lacked the right data to train expert bots. Almost as a Hail Mary, Brockman says, OpenAI decided to pull ChatGPT off the bench and put it in the wild for the public to use. “I’ll admit that I was on the side of, like, I don’t know if this is going to work,” Brockman says.
The chatbot’s instant virality caught OpenAI off guard, its execs insist. “This was definitely surprising,” Mira Murati, OpenAI’s chief technology officer, says. At the San Francisco VC event, Altman said, he “would have expected maybe one order of magnitude less of everything—one order of magnitude less of hype.”
OpenAI CTO Mira Murati on ‘The Daily Show with Trevor Noah’ on Oct. 25, 2022.
ChatGPT isn’t OpenAI’s only hype generator. Its relatively small staff of around 300 has pushed the boundaries of what A.I. can do when it comes to creating, not simply analyzing, data. DALL-E 2, another OpenAI creation, allows users to create photorealistic images of anything they can imagine by typing just a few words. The system has now been emulated by others, including Midjourney and an open-source competitor called Stability AI. (All of these image generators have drawbacks, most notably their tendency to amplify biases in the data on which they were trained, producing images that can be racist and sexist.) By fine-tuning its GPT LLM on computer code, OpenAI also created Codex, a system that can write code for programmers, who only have to specify in plain language what they want the code to do.
More innovations wait in the wings. OpenAI has an even more powerful LLM in beta testing called GPT-4 that it is expected to release this year, perhaps even imminently. Altman has also said the company is working on a system that can generate video from text descriptions. Meanwhile, in mid-January, OpenAI signaled its intention to release a commercial version of ChatGPT, announcing a wait-list for would-be customers to sign up for paid access to the bot through an interface that would allow them to more easily integrate it into their own products and services.
A cynic might suggest that the fact OpenAI was in the middle of raising a large venture capital round might have something to do with the timing of ChatGPT’s release. (OpenAI says the timing is coincidental.) What’s certain is that ChatGPT chummed shark-filled waters. It set off a feeding frenzy among VC firms hoping to snap up shares in the private sale of equity currently being held by OpenAI’s executives, employees, and founders.
That tender offer is happening alongside the just-announced new investment from Microsoft, which will infuse up to $10 billion in new capital into the company. Microsoft, which started working with OpenAI in 2016, formed a strategic partnership with the startup and announced a $1 billion investment in the company three years ago. According to sources familiar with the new tender offer, it is heavily oversubscribed—despite an unusual structure that gives Microsoft a big financial advantage.
According to documents seen by Fortune, on completion of its new investment and after OpenAI’s first investors earn back their initial capital, Microsoft will be entitled to 75% of OpenAI’s profits until it earns back the $13 billion it has invested—a figure that includes an earlier $2 billion investment in OpenAI that had not been previously disclosed until Fortune reported it in January. Microsoft’s share will then step down to 49%, until the software giant earns a profit of $92 billion. Meanwhile, the other venture investors and OpenAI’s employees also will be entitled to 49% of OpenAI’s profits until they earn some $150 billion. If these caps are hit, Microsoft’s and investors’ shares will revert to OpenAI’s nonprofit foundation. In essence, OpenAI is lending the company to Microsoft—for how long depends on how quickly OpenAI can make money.
But earning back its investment, let alone hitting those caps, might take quite a while. The documents seen by Fortune reveal that OpenAI has had relatively modest revenues to date and is heavily loss-making. Last year, the company was projected to bring in just under $30 million in revenue, according to the documents. But it was projecting expenses of $416.45 million on computing and data, $89.31 million on staff, and $38.75 million in unspecified other operating expenses. In total, its net loss in 2022 excluding employee stock options was projected at $544.5 million. And with ChatGPT, those losses may be soaring: Altman said on Twitter, in response to a question from Elon Musk, that it was costing OpenAI “single-digit cents” in computing costs per interaction users have with ChatGPT—a tab that likely reached many millions of dollars per month as the bot became popular.
OpenAI is projecting that, with ChatGPT serving as a siren song to lure customers, its revenue will ramp up rapidly. It is forecasting $200 million in revenue for 2023 and expects revenues to top $1 billion in 2024, according to the documents. They do not project how OpenAI’s expenses might grow and when it could turn a profit. The companies declined to comment on these figures, but they point to an obvious reality: Both OpenAI and Microsoft think that the former nonprofit lab now has something it can sell.
Microsoft is already reaping the rewards of the partnership. It has launched an OpenAI-branded suite of tools and services in its Azure Cloud that will allow Azure customers access to OpenAI’s tech, including GPT and DALL-E tools. Auto marketplace CarMax, for example, has already launched new services that run on these Azure tools.
Eric Boyd, Microsoft’s corporate vice president of AI Platform, says that meeting the demands of training and running OpenAI’s LLMs has driven innovations that benefit all Azure customers. For instance, Microsoft has built supercomputing clusters for A.I. that it believes are the most powerful in the world, and created several software innovations to make it easier to train and run large A.I. models on these machines. Microsoft is gradually infusing OpenAI’s tech into much of its software. It has released an image creator within Bing, its search engine, and a new Designer graphic design tool, both powered by DALL-E; a GPT-3-enabled tool within its Power Apps software, and a code suggestion tool, GitHub Copilot, based on OpenAI’s Codex model.
Even if it doesn’t immediately move the needle on Azure revenue, the OpenAI relationship is good brand positioning and marketing, says Dan Romanoff, a senior equity research analyst who covers technology stocks for Morningstar. “It’s high-profile,” he says. “The ability to take an A.I. solution developed by OpenAI, put it on Azure, call it Azure AI: It keeps them competitive.” Microsoft’s Cloud rivals—Google, AWS, IBM, Oracle, Salesforce, and others—all have their own “cognitive” services, but being associated with the folks who created ChatGPT can’t hurt.
The bigger prize for Microsoft might be in search. Tech publication The Information recently reported that Microsoft plans to integrate ChatGPT into Bing, possibly allowing it to return simple, succinct answers to queries—and letting people delve deeper through dialogue with that chatbot—rather than a list of links. Google currently dominates the market for search, with a greater than 90% market share worldwide. Bing ranks a second so distant it might as well be in a different galaxy, with about a 3% share. In the first nine months of 2022, search was worth $120 billion in revenue for Google; overall, it accounts for about 60% of the money Google generates. ChatGPT may offer Microsoft the only real chance it’s ever had to knock Google off that pedestal. (Microsoft declined to comment on The Information report.)
And by Microsoft’s standards, these upsides come cheap. Its total investment of $13 billion is a hefty sum, but it’s only 15% of the $85 billion in pretax profits it booked over the past 12 months—a relative bargain for near-term control of a paradigm-shifting technology. For their part, OpenAI and Altman risk paying a different price: the possibility that Microsoft’s priorities crowd out their own, putting their broader mission at risk and alienating the scientists who fueled its successes.
One July evening in 2015, Altman, who was then the head of the prestigious startup incubator Y Combinator, hosted a private dinner at the Rosewood Sand Hill, a luxurious ranch-style hotel located in the heart of the Valley’s venture capital industry in Menlo Park. Elon Musk was there. So was Brockman, then a 26-year-old MIT dropout who had served as chief technology officer at payment-processing startup Stripe. Some of the attendees were experienced A.I. researchers. Some had hardly any machine learning chops. But all of them were convinced AGI was possible. And they were worried.
Google had just acquired what to Altman, Musk, and other tech insiders looked like the odds-on favorite to develop AGI first: London-based neural networking startup DeepMind. If DeepMind succeeded, Google might monopolize the omnipotent technology. The Rosewood dinner’s purpose was to discuss forming a rival lab to ensure that wouldn’t happen.
The new lab aimed to be everything DeepMind and Google were not. It would be run as a nonprofit, explicitly dedicated to democratizing the benefits from advanced A.I. It promised to publish its research and open-source all of its technology, a commitment to transparency enshrined in its very name: OpenAI. The lab garnered an impressive roster of donors: not only Musk, but his fellow PayPal colleagues Thiel and Hoffman; Altman and Brockman; Y Combinator cofounder Jessica Livingston; YC Research, a foundation that Altman had established; Indian IT outsourcing firm Infosys; and Amazon Web Services. Together, the founding donors pledged to give $1 billion to the idealistic new venture (although according to tax records, the nonprofit only received a fraction of the headline-grabbing pledge).
But training the giant neural networks quickly proved to be expensive—with computing costs reaching tens of millions of dollars. A.I. researchers don’t come cheap either: Ilya Sutskever, a Russian-born scientist who came to OpenAI to be its lead scientist after working at Google, was paid an annual salary of $1.9 million in his first few years at the lab, according to tax records. After a few years, Altman and others at OpenAI concluded that to compete with Google, Meta, and other tech giants, the lab could not continue as a nonprofit. “The amount of money we needed to be successful in the mission is much more gigantic than I originally thought,” Altman told Wired magazine in 2019.
Setting up a for-profit arm allowed OpenAI to raise venture capital. But OpenAI created an unusual structure that capped investors’ returns at a multiple of their initial investment. And OpenAI’s nonprofit board, which is stacked with Silicon Valley A-listers, would retain control of OpenAI’s intellectual property (see sidebar). One A-lister who didn’t stick around was Musk: In 2018, he left the board, citing the demands of running SpaceX and, more important, Tesla.
Around this time, Microsoft CEO Satya Nadella was desperate to prove that his company, perceived as trailing its rivals in A.I., could play at the technology’s bleeding edge. The company had tried and failed to hire a big-name A.I. scientist. It was also building a huge, expensive cluster of specialized chips to advance its own efforts on language models. It was just the sort of supercomputing power OpenAI needed—and which it was spending huge sums to purchase at the time. For its part, OpenAI excelled at pulling off the sort of splashy A.I. demos that Nadella desired to showcase Microsoft’s A.I. acumen. Altman approached Nadella about a deal, flying to Seattle several times to show him OpenAI’s A.I. models. Nadella ultimately signed a pact, announced in July 2019, to make Microsoft OpenAI’s “preferred partner” for commercializing its technology, alongside an initial $1 billion investment in the A.I. startup.
While Altman was involved in OpenAI from its inception, he did not become CEO until May 2019, shortly after it converted into a for-profit enterprise. But its trajectory from research lab to multibillion-dollar phenomenon reflects Altman’s unique fundraising prowess and product-oriented focus—as well as the tension between those commercial instincts and his commitment to big, science-driven ideas.
The OpenAI leader is in some ways a Silicon Valley caricature: youthful, male, and pale; unblinkingly intense; fluent in Geek; obsessed with maximizing efficiency and productivity; a workaholic devoted to “changing the world.” (In a 2016 New Yorker profile, he said he did not have Asperger’s syndrome but could understand why someone would think he did.)
Altman dropped out of a computer science degree program at Stanford University to cofound Loopt, a social media company whose app told you where your friends were. The company got into Y Combinator’s first batch of startups in 2005; Loopt failed to take off, but the money Altman earned when it was sold helped launch him into the VC universe. He started his own small VC firm called Hydrazine Capital that raised about $21 million, including money from Thiel. Then Paul Graham and Livingston, the Y Combinator cofounders, brought him in as Graham’s successor running YC itself.
Altman is an entrepreneur, not a scientist or an A.I. researcher, and he is known for being unusually adept at raising venture capital money. Convinced that great things come from the coupling of massive ambition and unflinching self-belief, he has said he aspires to create trillions of dollars of economic value via so-called deep-tech plays, in fields like nuclear fusion and quantum computing, where the odds are long but the payoffs potentially huge. “Sam believed he was the best at everything he took on,” says Mark Jacobstein, a veteran tech investor and startup adviser who worked with Altman at Loopt. “I am pretty sure he believed he was the best ping-pong player in the office until he was proven wrong.”
According to several current and former OpenAI insiders, the startup’s priorities began to shift as Altman took the reins. A once broad research agenda shrank to focus mostly on natural language processing. Sutskever and Altman have defended this shift as maximizing effort on the research areas that currently appear to offer the most promising path toward AGI. But some former employees say internal pressure to focus on LLMs grew substantially after Microsoft’s initial investment, in part because those models had immediate commercial applications.
Having been founded to be free of corporate influence, some complained, OpenAI was quickly becoming a tool for a gigantic technology company. “The focus was more, how can we create products, instead of trying to answer the most interesting questions,” one former employee said. Like many interviewed for this story, the employee requested anonymity because of nondisclosure agreements and to avoid alienating powerful figures associated with OpenAI.
OpenAI was also becoming a lot less open. It had already begun pulling back from the pledge to publish all its research and open-source its code, citing concerns that its technology could be misused. But according to former employees, commercial logic also played a role. By making its advanced models available only through APIs, OpenAI protected its intellectual property and revenue streams. “There was a lot of lip service paid to ‘A.I. safety’ by [Altman] and [Brockman] but that often seemed like just a fig leaf for business concerns, while actual, legitimate A.I. safety concerns were brushed aside,” another former OpenAI employee says. As an example, the former employee cited the way OpenAI quickly reversed a decision to limit access to DALL-E 2 because of fears of misuse as soon as Midjourney and Stability AI debuted rival products. (OpenAI says it allowed broader use of DALL-E 2 only after careful beta testing gave it confidence in its safety systems.) According to some former employees, these strategic and cultural shifts played a role in the decision of a dozen OpenAI researchers and other staff—many of whom worked on A.I. safety—to break with the company in 2021 and form their own research lab called Anthropic.
OpenAI says it continues to publish far more of its research than other A.I. labs. And it defends its shift to a product focus. “You cannot build AGI by just staying in the lab,” says Murati, the chief technology officer. Shipping products, she says, is the only way to discover how people want to use—and misuse—technology. OpenAI had no idea that one of the most popular applications of GPT-3 would be writing software code until they saw people coding with it, she says. Likewise, OpenAI’s biggest fear was that people would use GPT-3 to generate political disinformation. But that fear proved unfounded; instead, she says, the most prevalent malicious use was people churning out advertising spam. Finally, Murati says that OpenAI wants to put its technology out in the world to “minimize the shock impact on society that really powerful technology can have.” Societal disruption from advanced A.I. will be worse, she argues, if people aren’t given a teaser of what the future might hold.
Sutskever allows that OpenAI’s relationship with Microsoft created a new “expectation that we do need to make some kind of a useful product out of our technology,” but he insists the core of OpenAI’s culture hasn’t changed. Access to Microsoft data centers, he says, has been critical to OpenAI’s progress. Brockman also argues the partnership has allowed OpenAI to generate revenue while remaining less commercially focused than it would otherwise have to be. “Hiring thousands of salespeople is something that might actually change what this company is, and it is actually pretty amazing to have a partner who has already done that,” he says.
Sutskever categorically denies implications that OpenAI has de-emphasized safety: “I’d say the opposite is true.” Before the Anthropic split, A.I. safety was “localized to one team,” but it’s now the responsibility of every team, Sutskever says. “The standards for safety keep increasing. The amount of safety work we are doing keeps increasing.”
Critics, however, say OpenAI’s product-oriented approach to advanced A.I. is irresponsible, the equivalent of giving people loaded guns on the grounds that it is the best way to determine if they will actually shoot one another.
Gary Marcus, a New York University professor emeritus of cognitive science and a skeptic of deep learning–centric approaches to A.I., argues that generative A.I. poses “a real and imminent threat to the fabric of society.” By lowering the cost of producing bogus information to nearly zero, systems like GPT-3 and ChatGPT are likely to unleash a tidal wave of misinformation, he says. Marcus says we’ve even seen the first victims. Stack Overflow, a site where coders pose and answer programming questions, has already had to ban users from submitting answers crafted by ChatGPT, because the site was overwhelmed by answers that seemed plausible but were wrong. Tech news site CNET, meanwhile, began using ChatGPT to generate news articles, only to find that many later had to be corrected owing to factual inaccuracies.
For others, it’s ChatGPT writing accurate code that’s the real risk. Maya Horowitz, vice president of research at cybersecurity firm Check Point, says her team was able to get ChatGPT to compose every phase of a cyberattack, from crafting a convincing phishing email to writing malicious code to evading common cybersecurity checks. ChatGPT could essentially enable people with zero coding skills to become cybercriminals, she warns: “My fear is that there will be more and more attacks.” OpenAI’s Murati says that the company shares this concern and is researching ways to “align” its A.I. models so they won’t write malware—but there is no easy fix.
Countless critics and educators have decried the ease with which students can use ChatGPT to cheat. School districts in New York City, Baltimore, and Los Angeles all blocked school-administered networks from accessing the chatbot, and some universities in Australia said they would revert to using only proctored, paper-based exams to assess students. (OpenAI is working on methods to make A.I.-generated text easier to detect, including possibly adding a digital “watermark” to ChatGPT’s output.)
There are also ethical concerns about the way ChatGPT was originally assembled in 2022. As part of that process, OpenAI hired a data-labeling company that used low-wage workers in Kenya to identify passages involving toxic language and graphic sexual and violent content, a Time investigation found. Some of those workers reported mental health issues as a result. OpenAI told Time in a statement such data labeling was “a necessary step in minimizing the amount of violent and sexual content included in training data and creating tools that can detect harmful content.”
Making ChatGPT freely available has allowed OpenAI to gather a treasure trove of feedback to help improve future versions. But it’s far from certain OpenAI will maintain its dominance in language A.I. “Historically, what we have tended to see with these very general-purpose algorithms is that they are not sufficiently defensible to allow just one particular company to capture all the general returns,” says Marc Warner, founder and CEO of London-based A.I. company Faculty. Face- and image-recognition technology, for example, was first developed at tech giants such as Google and Nvidia but is now ubiquitous.
Courts and regulators could also thrust a giant stick into the data flywheels on which generative A.I. depends. A $9 billion class action lawsuit filed in federal court in California potentially has profound implications for the field. The case’s plaintiffs accuse Microsoft and OpenAI of failing to credit or compensate coders for using their code to train GitHub’s coding assistant Copilot, in violation of open license terms. Microsoft and OpenAI have declined to comment on the suit.
A.I. experts say that if the court sides with the plaintiffs, it could derail the generative A.I. boom: Most generative models are trained from material scraped from the internet without permission or compensation. The same law firm representing those plaintiffs recently filed a similar lawsuit against Stability AI and Midjourney, for using copyrighted art in their training data without permission. Photo agency Getty Images has filed its own copyright infringement lawsuit against Stability AI too. Another problem could come if lawmakers pass rules giving creators a right to opt out of having their content used in A.I. training, as some European Union lawmakers are considering.
OpenAI’s competitors, meanwhile, are not standing still. The prospect of losing its dominance in search has motivated execs at Google to declare a “red alert,” according to the New York Times. Sundar Pichai, Google’s CEO, has held meetings to redefine the company’s A.I. strategy and plans to release 20 new A.I.-enabled products as well as demonstrate a chat interface for search within the year, the newspaper reported. Google has its own powerful chatbot, called LaMDA, but has been hesitant to release it because of concerns about reputational damage if it winds up being misused. Now, the company plans to “recalibrate” its appetite for risk in light of ChatGPT, the Times reported, citing an internal company presentation and unnamed insiders. Google is also working on a text-to-image generation system to compete with OpenAI’s DALL-E and others, the newspaper reported.
Of course, it’s not clear that chatbots will be the future of search. ChatGPT frequently invents information—a phenomenon A.I. researchers call “hallucination.” It can’t reliably cite its sources or easily surface links. The current version has no access to the internet, and so it cannot provide up-to-date information. Some, such as Marcus, believe hallucination and bias are fundamental problems with LLMs that require a radical rethink of their design. “These systems predict sequences of words in sentences, like autocomplete on steroids,” he says. “But they don’t actually have mechanisms in place to track the truth of what they say, or even to validate whether what they say is consistent with their own training data.”
Others, including OpenAI investors Hoffman and Vinod Khosla, predict these problems will be solved within a year. Murati is more circumspect. “There are research directions that we have been following so far to kind of address the factual accuracy and to address the reliability of the model and so on. And we are continuing to pursue them,” she says.
In fact, OpenAI has already published research about a different version of GPT, called WebGPT, that had the ability to answer questions by querying a search engine and then summarizing the information it found, including footnotes to relevant sources. Still, WebGPT wasn’t perfect: It tended to accept the premise of a user’s question and look for confirmatory information, even when the premise was false. For example, when asked whether wishing for something could make it happen, WebGPT replied, “It is true that you can make a wish true by the power of thought.”
On the rare occasions that Altman lets himself rhapsodize about A.I. in public, he can sound like a wishful thinker himself. Asked at the San Francisco VC event about the best case for A.I., he gushes, “I think the best case is so good that it’s hard to imagine … I think the good case is just so unbelievably good that you sound like a crazy person talking about it.” He then abruptly returns to the dystopian themes at OpenAI’s roots: “I think the worst case is lights-out for all of us.”