最近一周,全球AI領域迎來了交鋒時刻。
當地時間5月13日,OpenAI通過直播發布了GPT-4系列新模型GPT-4o,以及ChatGPT的桌面版本。未親臨直播現場的OpenAI首席執行官山姆·奧特曼在X上發帖稱:“我們的新模型:GPT-4o,是我們目前最好的模型,它智能且快速,還是原生多模態模型。”
OpenAI首席技術官米拉·穆拉蒂介紹道,GPT-4o將面向包括免費用戶在內的所有用戶,它較上一代產品更快,改進了文本、視頻和語音功能,提高50種不同語言ChatGPT的服務質量。GPT-4o還將通過OpenAI的API提供支持,開發者可以使用新模型構建應用程序。
直播時,穆拉蒂與兩位技術人員對GPT-4o進行了現場測試。新模型減少了人機對話的遲滯感,在過程中,人們可以隨時打斷GPT-4o的輸出,情緒傳達實現進步,再結合視頻功能,讓機器更像一個能看能聽的真實存在的人。
如果說之前的GPT是基于數據,在理性分析層面給人以技術跨越的震撼,那么這次GPT-4o呈現出與人類相似的感性層面的補充,讓人感嘆科幻電影情節已經發生。
OpenAI在這次迭代中,沒有滿足外界對GPT-4.5或GPT-5的期待,但“o”相較數字,更直接地表達了一種進化。據OpenAI官網介紹,這里的“o”代表“omni”,意為“全能”,源自拉丁語。而在英語中,它常被用作詞根,可以聯想到“全知全能”和“無處不在”。
值得注意的是,GPT-4o發布時間點卡在了谷歌I/O開發者大會的前一天。而在往后的一個月中,微軟Build年度開發者大會和蘋果WWDC也即將先后召開。
當地時間5月14日,谷歌在I/O開發者大會中公布AI新進展,在前一天OpenAI的鋪墊下,市場自然會以更高的眼光審視這家老牌巨頭的新產品。
OpenAI確實通過這次布景簡單且短暫的直播成功向谷歌施壓——開發者現場的實時對話展示,讓人不禁聯想到谷歌大模型Gemini此前發布的展示視頻被指剪輯、夸大宣傳。該模型在實際應用中,并未達到其宣傳中的效果。對此,谷歌承認道,演示視頻經過編輯,為簡潔起見,延遲已減少,Gemini輸出也已縮短。2024年的I/O開發者大會成為谷歌的關鍵挽尊機會。
其實,谷歌首席執行官桑達爾·皮查伊早在七八年前就在I/O開發者大會上表態,要從“移動優先”轉為“AI優先”,但在提前看清方向的條件下,谷歌并沒有延續領先優勢。在上一代互聯網時代習慣處在領先地位的谷歌,經歷過去一年圍繞AI的挑戰后,似乎變成了追趕者。它需要向外界釋放有關最新技術的積極信號。
這次I/O開發者大會上,谷歌亮出了能與GPT-4o相抗衡的Project Astra,該項目展示了多模態理解和實時對話能力。通過演示能夠看出,Astra的延遲較GPT-4o更長,且情感多樣性還有待提高。
同時,谷歌還推出了對標Sora的視頻生成模型Veo。今年2月,與Gemini 1.5 Pro被幾乎同時推出的Sora搶盡風頭。
在搜索引擎方面,谷歌主動實現自我革命,在搜索功能中推出AI概覽(AI Overviews),歸納總結搜索結果。谷歌稱,搜索將具備多步驟推理能力,并支持視頻形式的解決方案搜索。與此同時,谷歌將擁有100萬tokens長的上下文窗口的Gemini 1.5 Pro擴展至200萬tokens級別,這意味著大模型能夠處理更多信息,擁有更全面的理解能力。
由于ChatGPT自2022年末走入大眾視野后,就對搜索領域形成了直接威脅,因此市場曾推測,OpenAI會在這次發布會上推出基于ChatGPT的搜索引擎。但該公司目前并未宣布邁出這一步。
OpenAI和谷歌的研發競賽陷入膠著,這對包括蘋果和亞馬遜在內的公司形成了威脅。它們需要跟上日益加快的步伐,至少不能落后太多,否則Siri和Alexa都會陷入尷尬。由于蘋果的AI研發進度并不明朗,已經有傳言稱其正在與OpenAI談判,以求在短期內獲得技術許可,將最先進的AI技術應用于蘋果產品。
AI競爭已經從基建向應用與生態搭建蔓延。
谷歌在企業應用和消費者應用方面的積累,為其建立AI生態圈提供了天然優勢。 或許OpenAI注意到了這一點。今年1月,OpenAI推出個性化AI應用商店GPT Store,用戶可以通過其發現和構建GPT。目前GPT Store主要針對付費版本開放。這一功能被認為可能成為下一個Apple Store。從去年年底宣布,到今年年初問世,歷時兩個月,期間經歷了奧特曼被意外罷免再復職的風波。
截至目前,GPT Store還只是一個渠道,距離大眾通過OpenAI潛力所構想的生態建立還有很大差距。但隨著GPT-4o的技術迭代,對于AI應用的想象得以進一步豐富,不能排除OpenAI正在為生態搭建架構的可能。
在OpenAI此次發布會的最后,穆拉蒂說道:“今天我們專注于免費用戶、新模式,和新產品,但我們也非常關心下一個前沿領域。很快,我們將向大家更新下一個大事件的進展。”
這不得不使人猜測,OpenAI對于實際進展有所保留。在激烈競爭之下,保留底牌或許已經成為各大巨頭的習慣。OpenAI的“下一個大事件”的官宣時間,或許在后續微軟和蘋果的發布會之后,或許會找另外一個時間節點。畢竟奧特曼一直擅長在正確的時間釋放正確的信息。OpenAI此前的技術曝光節奏都取得了不錯的效果。(財富中文網)