- +1
深觀察|從再現(xiàn)到行動:Sora退場背后的AI技術(shù)路線轉(zhuǎn)向
當(dāng)?shù)貢r間3月24日,OpenAI宣布將逐步關(guān)閉其視頻生成工具Sora,并將研發(fā)重心轉(zhuǎn)向“能夠與物理世界互動的人工智能與機器人系統(tǒng)”。
這一消息引發(fā)了全球媒體和行業(yè)人士的熱議。在我看來,Sora退場看似產(chǎn)品層面的調(diào)整,實則折射出一個更深層的變化:生成式AI正在從“再現(xiàn)世界”(representation)的AIGC轉(zhuǎn)向“介入世界”(intervention)的具身智能/空間智能/物理智能。

2024 年 2 月,Sora的文生視頻功能一鳴驚人。
一、OpenAI的“元宇宙社交”落空和深度偽造危機
OpenAI 在 2024 年 2 月發(fā)布了Sora, 2025年9月30日發(fā)布了Sora2(模型 + 社交化 App 同時推出)。 初代Sora的本質(zhì)是內(nèi)容生產(chǎn)工具:用戶通過提示詞生成視頻,用于創(chuàng)作、展示或?qū)С觯溥壿嬋酝A粼凇霸佻F(xiàn)”(representation)層面,即用戶把想象轉(zhuǎn)化為可視化內(nèi)容。而Sora2則明顯呈現(xiàn)出平臺化和社交化特征。它引入信息流分發(fā)、公開發(fā)布、二次創(chuàng)作(remix)以及身份嵌入(如 cameo)等機制,使視頻不再只是被觀看的對象,而成為可以被參與、改寫和傳播的“社會行動單元”。用戶既是創(chuàng)作者、分享者甚至“演員”。
通過Sora2,OpenAI意圖實現(xiàn)“視頻化元宇宙社交”——一個以生成式視頻為基礎(chǔ)的新一代社交平臺。但這一方向,從一開始就面臨結(jié)構(gòu)性阻力。
首先是用戶層面的“反社交媒體情緒”。從傳播學(xué)角度看,過去十余年,媒介不斷加深對人的“中介化”(mediation)介入:從文字到圖片,再到短視頻與算法推薦流,用戶的注意力越來越被平臺組織與塑形。當(dāng)這一過程達(dá)到某種閾值后,用戶必然反彈,例如今天,隨著用戶對算法分發(fā)的疲勞感增強和對“表演性自我”的倦怠上升,各種小范圍和低曝光的交流方式已經(jīng)開始回潮。
在這一社會情緒下,OpenAI推出“更重、更沉浸、更具壓力”的Sora2視頻社交乃不但沒有順用戶需求而為,反而有“逆潮流而動”的意味,因為用戶尚未消化短視頻帶來的認(rèn)知負(fù)擔(dān),不太可能主動擁抱更高維度的沉浸式社交。
如果說用戶疲勞是“需求側(cè)問題”,那么人工智能背景下深度偽造(deepfake)帶來的信任危機則對Sora2的傳播形成了“制度性約束”。
長期以來,視頻被視為高可信度媒介,但生成式AI的出現(xiàn),正在迅速侵蝕這一基礎(chǔ):視頻可以被低成本偽造,真實與虛構(gòu)難以區(qū)分,內(nèi)容驗證成本大幅上升。
這實際上觸及了社會運行的一個底層機制:信任。當(dāng)一種媒介不再能提供“真實性背書”時,廣告主、平臺、用戶都將為之承擔(dān)更高的不確定性與風(fēng)險,這必然造成該媒介的商業(yè)價值下降。
二、壓縮人工智能平臺運營成本和規(guī)避法律風(fēng)險
相比文生文本與文生圖像,文生視頻在算力上的消耗呈現(xiàn)出明顯的“維度躍遷”。文本生成主要停留在詞元(token)級別的離散計算,圖像生成則是單幀的空間建模,而視頻生成不僅要處理空間信息,還需在時間軸上維持跨幀一致性與物理連續(xù)性。這意味著,諸如Sora這樣的系統(tǒng),本質(zhì)上是一種“持續(xù)推理系統(tǒng)”(continuous inference system),其計算是一個極耗費算力的動態(tài)累積的過程。
由此帶來的直接后果是成本的急劇提升——文生視頻的單位成本遠(yuǎn)高于文生文和文生圖像,且目前還很難通過優(yōu)化下降。這也決定了Sora無法復(fù)制ChatGPT式的規(guī)模化路徑。
而且在用戶方面,文生視頻并非高頻剛需,其持續(xù)付費意愿有限,而平臺大規(guī)模免費提供服務(wù)又成本巨大。如果采取廣告模式,又因合成內(nèi)容的真實性與信任問題而受到約束。因此,Sora之所以“燒錢”,并非單純是OpenAI的商業(yè)策略失誤,而是由技術(shù)范式內(nèi)在規(guī)定造成的結(jié)果。
以Sora為代表的生成式視頻工具還面臨著越來越嚴(yán)重的法律風(fēng)險。例如,用戶可以輕易生成與既有IP高度類似的內(nèi)容,比如模仿漫威或迪斯尼旗下的角色、視覺風(fēng)格乃至敘事方式,也更容易觸發(fā)法律糾紛。系統(tǒng)還能生成他人的外貌、聲音甚至行為,并以此形成高度逼真的合成視頻。這樣的視頻一旦被惡意傳播,不僅侵犯個體肖像權(quán)利,還可能引發(fā)更廣泛的信任危機,而責(zé)任歸屬卻難以清晰界定。
在這些風(fēng)險之下,平臺必須承擔(dān)更高的合規(guī)成本、采取更復(fù)雜的審核機制以及面臨巨大的應(yīng)訴和敗訴風(fēng)險,這嚴(yán)重削弱了Sora的商業(yè)化可能。
三、人工智能發(fā)展的技術(shù)轉(zhuǎn)向:從“再現(xiàn)”到“行動”
以上因素可以解釋Sora“為什么難”,但不足以解釋一個更關(guān)鍵的問題,即OpenAi為什么選擇現(xiàn)在關(guān)閉Sora?答案在于人工智能整體的技術(shù)發(fā)展路線的轉(zhuǎn)向。
在一篇發(fā)表于2024年初的論文中,我指出,人工智能被稱為“下一個新媒體”(the next new media)。它的發(fā)展呈現(xiàn)出兩條日益清晰的路線:(1)離身溝通型AI(“延展的心靈”):人類對媒介技術(shù)的應(yīng)用過程,從模擬媒介、數(shù)字媒介、社交媒體到大語言模型人工智能,是一個日益虛擬化/去物質(zhì)化/離身化的過程。該過程正引導(dǎo)我們脫離碳基身體,最終建構(gòu)出一個與現(xiàn)實世界共存和交互的虛擬世界,即元宇宙(人、物和環(huán)境的數(shù)字孿生)。這一趨勢尤其體現(xiàn)在近兩年來文生文字(text to text)、文生音頻(text-to-speech)、文生圖(text-to-picture)和文生視頻(text-to-video)等人工智能技術(shù)的增加和完善上。(2)具身溝通型AI(“心靈的延展”):即人工智能延展出硅基身體以與現(xiàn)實環(huán)境實時互動和不斷學(xué)習(xí)。這最初體現(xiàn)為各種可穿戴式設(shè)備、智能音箱、自動駕駛、寵物機器人,直到基于文生動作(text-to-acts)的人形機器人。這兩個發(fā)展路線呈雙螺旋相互促進(jìn)的關(guān)系。
或者,簡要而言,人工智能目前存在兩種發(fā)展路徑。
其一:再現(xiàn)(Representation),包括文本(ChatGPT)、圖像(DALL·E)和視頻(Sora)等應(yīng)用,其核心能力是:模擬世界、生成內(nèi)容。
其二:行動(Intervention / Embodied AI),包括機器人系統(tǒng)、自動駕駛和智能體,其核心能力是:進(jìn)入世界、改變世界。
OpenAI 此次明確表示轉(zhuǎn)向“與物理世界互動的AI”,意味著其判斷已經(jīng)發(fā)生變化:路徑一的邊際價值正在下降,而路徑二才是下一階段的戰(zhàn)略高地。從這個角度看,Sora的退出并非失敗,而是OpenAI的一次“資源重配”。借用馬歇爾·麥克盧漢 的經(jīng)典判斷而言,媒介不僅是信息載體,更是“人類感知與行動的延伸”:視頻生成強化的是“感知延伸”(讓人看到更多);機器人強化的是“行動延伸”(讓機器替人做事)。
這兩者的社會意義有所不同:前者改變的是體驗,后者改變的是生產(chǎn)與現(xiàn)實結(jié)構(gòu)。因此,從視頻生成轉(zhuǎn)向機器人,本質(zhì)上是一種“從文化工業(yè)走向基礎(chǔ)設(shè)施”的躍遷。
四、Sora只是被階段性擱置
盡管如此,我們也不宜將Sora視為一條被徹底放棄的路線。更準(zhǔn)確的判斷是:它只是被“階段性擱置”。如果未來算力成本顯著下降、對深度偽造能形成成熟的監(jiān)管與水印體系,以及視頻生成在教育、影視工業(yè)等領(lǐng)域形成剛需,那么,類似Sora的技術(shù)很可能重新回歸。但屆時,它的形態(tài)大概率不會是“社交媒體平臺”,而更可能嵌入到專業(yè)生產(chǎn)體系中,成為一種工具,而非一個入口。
OpenAI宣布將逐步關(guān)閉Sora,標(biāo)志著其AI發(fā)展戰(zhàn)略已從路徑一轉(zhuǎn)向路徑二——具身智能。然而,我們不應(yīng)將此簡單解讀為產(chǎn)品失敗或用戶不買賬,而應(yīng)置于更長時間尺度的技術(shù)演化中審視。從“讓機器像人一樣表達(dá)”到“讓機器像人一樣行動”,這一轉(zhuǎn)向恰恰呼應(yīng)了馬克思在《費爾巴哈提綱》中提出的觀點:“哲學(xué)家只是用不同方式解釋世界,真正關(guān)鍵的是去改變世界”。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




