因驚艷效果引發文生視頻賽道熱潮的Sora終于面向大眾推出。
當地時間12月9日,在為期12天的技術分享活動中,OpenAI宣布,正式向付費用戶開放旗下AI視頻生成模型Sora。相比今年2月首次發布的版本,OpenAI推出了生成速度更快的模型版本Sora Turbo。
消息公布后,大量想要搶先體驗的用戶涌入致使Sora網站一度崩潰,OpenAI CEO山姆·奧特曼回應稱,由于需求超出預期,將不得不間歇性地關閉新用戶注冊,生成速度也會在一段時間內變慢。
盡管期待已久的用戶并未減退對這款產品熱情,但Sora的國際對手們并未放緩自己的步伐:科技巨頭們調高了AI視頻生成模型的優先級,還有更多的創業公司涌入這一賽道。
3月底,字節跳動旗下剪映團隊研發的AI創作平臺“即夢AI”開放內測,并在半年后發布了兩款視頻生成模型Seaweed和Pixeldance,Seaweed已面向平臺用戶正式開放。6月,快手可靈AI視頻生成大模型上線,截至11月20日累計服務超500萬用戶。商湯、愛詩科技、Pika Labs等公司均擁有視頻生成模型產品。
等待推出的過程中,Sora自身也遭遇了后院起火。今年10月,Sora團隊的研發負責人蒂姆·布魯克斯宣布從OpenAI離職,轉投谷歌DeepMind。在Reddit的線上問答中,OpenAI首席產品官凱文·維爾將Sora遲遲無法正式發布歸因于需要完善模型、安全因素以及計算能力有待擴展。
如今的Sora,無論對用戶、OpenAI乃至整個行業來說,仍然處于相對早期的階段,山姆·奧特曼將其稱作“視頻版GPT-1”。
如奧特曼所說,使用Sora與他人共同創作能夠為用戶帶來全新的、有趣的體驗,但Sora和它的對手們擁有一些相似的問題:高昂的計算成本、有限的視頻生成長度、不穩定的生成質量,以及如何實現商業可持續性。
對于OpenAI而言,選擇將Sora納入ChatGPT付費用戶的套餐“打包”售賣,有一定的引流效果。ChatGPT Plus套餐每月收費20美元,每月最多可以生成50個480p分辨率視頻;最新推出的ChatGPT Pro每月收費200美元,除了每月可生成500個視頻,支持1080p、20s等功能,Pro會員還包含了更智能的o1作為核心賣點。
由于Sora目前并未單獨收費,OpenAI將Sora的功能與現有產品綁定,或可增加ChatGPT訂閱服務的吸引力。如果Sora能夠吸引更多用戶訂閱每月200美元的Pro套餐,即使新增10萬Pro用戶,每年也可額外帶來2.4億美元的收入。
快手可靈、字節即夢也推出了圖片及視頻生成的按月或包年訂閱服務。在ChatGPT未進入的中國市場,快手和字節旗下抖音依靠短視頻平臺的流量和眾多創作者,擁有天然優勢,能夠迅速捕捉用戶的需求、建立應用場景。但與Sora和谷歌、英偉達投資的Runway相比,全球市場影響力有待提升。
AI視頻可以用于低成本、快速地制作視頻廣告,因此對企業用戶具有強大的吸引力。
比如,可口可樂公司最近推出3支全新的圣誕廣告,其中一支“Secret Santa”使用了快手可靈生成了部分畫面。制作方Silverside AI表示,相比傳統高達數百萬美元的制作費用,使用AI工具的成本大大降低,制作速度也是傳統方式的5倍。
許多人工智能公司都在考慮基于AI視頻的商業變現模式,將其應用于電商、教育培訓、品牌推廣、社交媒體等領域。但AI公司和廣告主們都紛紛看好的這項技術,消費者們目前尚不買單。不少觀看了可口可樂那支由AI生成的廣告的消費者認為,畫面和邏輯上的空洞以及無法擺脫AI感覺的人物形象,使廣告的整體效果“非常糟糕”。
或許正是因為明白人類的靈感對于AI創作的重要性,OpenAI、Runway、快手等公司都在致力于與藝術家們結成同盟。
12月6日,中國首個AIGC導演共創計劃正式上線。該計劃由快手可靈AI聯合賈樟柯等9位知名導演共同發起,9部短片全部使用可靈AI進行視頻生成。其中,賈樟柯在劇情短片《麥收》中讓機器人擔任影片主角,利用可靈AI訓練出專屬的人臉模型,解決了人物臉部特征難以保持一致性的難題。
不過,在藝術創作領域,人類已經開始面對如何處理與AI之間微妙的競合關系的問題。這種微妙關系引發了OpenAI又一“后院失火”案例。在Sora正式發布前的11月,Sora模型的API試用接口被一組藝術家測試人員在AI開源社區泄露。
此前,OpenAI向數百名藝術家開放了Sora的早期使用權以測試該模型,但部分藝術家認為,OpenAI“白嫖”了他們的無償勞動,并借此提升公司形象。“我們不是AI企業霸主的免費測試人員、公關傀儡、訓練數據。”測試人員在公開信中稱。
OpenAI的Sora產品負責人羅漢·薩海在9日產品發布的直播中表示:“我們顯然承擔著巨大的責任。”他補充說,公司必須防止該技術被非法使用,“但我們同樣希望實現創造性表達和保護之間的平衡。”
另一個使AI視頻生成工具無法擺脫“早期”印象的事實是,各家模型由于在理解提示詞、捕獲關鍵詞、畫面想象力等方面存在差異,產出的結果無法為更多的普通創作者所用。
從多家測評網站對不同平臺的測試結果來看,Sora引以為傲的“大片級”質感,現階段仍更適合企業級用戶或專業創作者,通過大量修改和迭代完成。
當Sora們真正面向大眾內容創作者敞開大門時,或許證明其背后的科技公司有能力為視頻生成模型找到一條可持續的變現路徑,更理想的結果是——“視頻版GPT-4”的誕生。(財富中文網)