- +1
從“串聯(lián)”到“并聯(lián)”,o1的一小步,AI覺(jué)醒的一大步?

引言:OpenAI比拼算力的下半場(chǎng),AI覺(jué)醒新征程?
當(dāng)人們談及人工智能,ChatGPT等看似無(wú)所不能的AI助手便會(huì)率先躍入腦海。它們的登場(chǎng),如同一束強(qiáng)光,穿透數(shù)據(jù)的重重迷霧,讓我們得以窺見(jiàn)未來(lái)的一角。正如著名科幻作家阿瑟?克拉克所言:“任何足夠先進(jìn)的技術(shù)都無(wú)法與魔法區(qū)分?!痹谖覀兣cAI的對(duì)話日漸成為日常習(xí)慣之時(shí),AI的下一步已然悄然鋪開(kāi)。此時(shí),OpenAI的o1模型強(qiáng)勢(shì)登場(chǎng),邁出關(guān)鍵一步。這一跨越,絕非僅僅是技術(shù)層面的飛躍,更有可能掀起一場(chǎng)影響深遠(yuǎn)的AI覺(jué)醒風(fēng)暴,為人工智能的發(fā)展開(kāi)辟嶄新的道路。
一、o1的一小步,AI覺(jué)醒的一大步
OpenAI的o1模型一經(jīng)登場(chǎng),便在AI世界掀起了驚濤駭浪。它仿佛是一把神奇的鑰匙,開(kāi)啟了人工智能邁向新高度的大門(mén)。這一模型的出現(xiàn),恰似一顆耀眼的星辰照亮了AI領(lǐng)域的蒼穹,標(biāo)志著人工智能在推理和復(fù)雜問(wèn)題解決方面邁出了至關(guān)重要的一大步。
o1模型是OpenAI研發(fā)團(tuán)隊(duì)歷經(jīng)漫長(zhǎng)歲月的精心雕琢與不懈探索的結(jié)晶。它創(chuàng)新性地采用了全新的訓(xùn)練方法,將強(qiáng)化學(xué)習(xí)與“思路鏈”巧妙融合,使得模型在回答問(wèn)題之前能夠如同人類(lèi)一般進(jìn)行深入思考。這種獨(dú)特的訓(xùn)練方式,賦予了o1模型在處理復(fù)雜問(wèn)題時(shí)令人驚嘆的能力。無(wú)論是在國(guó)際數(shù)學(xué)奧林匹克資格考試中,還是在編程能力測(cè)試?yán)铮琽1都展現(xiàn)出了超越以往的卓越表現(xiàn),讓人們對(duì)人工智能的未來(lái)充滿了無(wú)限遐想。
此外,o1模型的發(fā)布在學(xué)術(shù)界和產(chǎn)業(yè)界引發(fā)了廣泛的關(guān)注與熱議。眾多專家學(xué)者紛紛投入對(duì)o1模型性能和應(yīng)用前景的深入研究與探討,他們一致認(rèn)為,o1模型的誕生將為人工智能在各個(gè)領(lǐng)域的應(yīng)用帶來(lái)嶄新的機(jī)遇和巨大的挑戰(zhàn)。產(chǎn)業(yè)界也敏銳地察覺(jué)到了o1模型的商業(yè)價(jià)值,紛紛期待著更多企業(yè)和機(jī)構(gòu)能夠投入到o1模型的應(yīng)用開(kāi)發(fā)中,共同開(kāi)創(chuàng)人工智能的新時(shí)代。
二、AI進(jìn)化新階段:從串聯(lián)到并聯(lián)的跨越
(一)從L1到L5的進(jìn)化之路
OpenAI的CEOSamAltman曾將AI技術(shù)的發(fā)展劃分為五個(gè)階段:L1(聊天機(jī)器人)、L2(推理者)、L3(智能體)、L4(創(chuàng)新者)和L5(完整組織)。在當(dāng)前階段,大多數(shù)AI仍徘徊在L1和L2階段,主要承擔(dān)著對(duì)話和簡(jiǎn)單推理任務(wù)。而o1的出現(xiàn),猶如一座堅(jiān)實(shí)的橋梁,讓我們看到了邁向L3智能體時(shí)代的希望。
L3階段意味著AI將從單純的“工具”轉(zhuǎn)變?yōu)槟軌蜃灾餍袆?dòng)的“智能體”,可以代替人類(lèi)完成更為復(fù)雜的任務(wù)。o1通過(guò)突破性的推理鏈技術(shù),實(shí)現(xiàn)了從線性、單線程的AI思維向多線程的并聯(lián)推理的華麗轉(zhuǎn)變。這一轉(zhuǎn)變,恰似愛(ài)因斯坦所言:“任何問(wèn)題都不能在它產(chǎn)生時(shí)的同一思維水平上得到解決。”o1的推理能力正是對(duì)這一名言的生動(dòng)詮釋,為AI的發(fā)展找到了新的方向和動(dòng)力。
(二)強(qiáng)大的推理能力:并聯(lián)思維的威力
o1自推出以來(lái),在數(shù)學(xué)、編程和科學(xué)等領(lǐng)域展現(xiàn)出了令人震撼的實(shí)力。根據(jù)OpenAI的報(bào)告,o1在解決數(shù)學(xué)和編程問(wèn)題上的能力相比GPT-4有了顯著提升,提高了5倍以上,完整版o1更是實(shí)現(xiàn)了8倍的飛躍。
在國(guó)際數(shù)學(xué)奧林匹克(IMO)資格考試中,GPT-4僅解決了13%的問(wèn)題,而o1的推理模型得分高達(dá)83%。在編程領(lǐng)域,o1在Codeforces編程比賽中超越了89%的人類(lèi)選手。此外,在物理、生物和化學(xué)問(wèn)題的基準(zhǔn)測(cè)試中,o1也表現(xiàn)出了接近甚至超越人類(lèi)博士水平的準(zhǔn)確度。
例如,OpenAI發(fā)布的研究和博客文章中顯示,o1不僅可解決高級(jí)數(shù)學(xué)和編碼問(wèn)題,還能解密復(fù)雜的密碼,以及解答來(lái)自專家學(xué)者們關(guān)于遺傳學(xué)、經(jīng)濟(jì)學(xué)和量子物理學(xué)的復(fù)雜問(wèn)題。大量圖表表明,在內(nèi)部評(píng)估中,o1在編碼、數(shù)學(xué)和各個(gè)科學(xué)領(lǐng)域的問(wèn)題上已經(jīng)超越了公司最先進(jìn)的語(yǔ)言模型GPT-4o,甚至可能超越了人類(lèi)。這一切都得益于o1所采用的并聯(lián)推理思維,讓其能夠更加高效地處理復(fù)雜問(wèn)題,展現(xiàn)出了人工智能的巨大潛力。
三、技術(shù)核心揭秘:并聯(lián)推理的奧秘
(一)思維鏈技術(shù):并聯(lián)思維的紐帶
思維鏈技術(shù)起源于兩年前NeurIPS等權(quán)威會(huì)議上發(fā)表的一些經(jīng)典論文,學(xué)者們意識(shí)到大語(yǔ)言模型通過(guò)鏈?zhǔn)剿季S過(guò)程,能夠處理更復(fù)雜的推理任務(wù)。
在o1中,思維鏈技術(shù)發(fā)揮了關(guān)鍵作用。它如同一條堅(jiān)韌的紐帶,將復(fù)雜問(wèn)題分解為多個(gè)簡(jiǎn)單任務(wù)進(jìn)行求解。具體來(lái)說(shuō),o1采用了類(lèi)似人類(lèi)思維的邏輯鏈條,使得模型的“直覺(jué)”更準(zhǔn)確,推理更加深入。例如,在解決一個(gè)復(fù)雜的數(shù)學(xué)問(wèn)題時(shí),o1會(huì)先將問(wèn)題拆分成多個(gè)步驟,每一步都經(jīng)過(guò)深思熟慮的思考,最終匯聚為完整的答案。
正如德國(guó)哲學(xué)家尼采所說(shuō):“許多人浪費(fèi)了整整一生去等待符合他們心愿的機(jī)會(huì)?!倍鴒1的思維鏈技術(shù)正是主動(dòng)創(chuàng)造機(jī)會(huì),通過(guò)深入思考和分解問(wèn)題,為解決復(fù)雜任務(wù)提供了新的途徑。這種并聯(lián)思維的方式,讓o1能夠更加高效地處理復(fù)雜問(wèn)題,展現(xiàn)出了強(qiáng)大的推理能力。
(二)自學(xué)推理與強(qiáng)化學(xué)習(xí)結(jié)合:并聯(lián)思維的進(jìn)化
o1的自學(xué)推理方法借鑒了斯坦福大學(xué)的STaR方法。通過(guò)提供模型解題示例,然后讓模型自行解決更多問(wèn)題,進(jìn)而反哺其數(shù)據(jù)集,不斷增強(qiáng)模型的自我學(xué)習(xí)能力。
這種自學(xué)推理與強(qiáng)化學(xué)習(xí)的結(jié)合,極大地提升了o1的推理能力。強(qiáng)化學(xué)習(xí)使o1能夠在不斷的試錯(cuò)中學(xué)習(xí),優(yōu)化自身的策略。例如,在處理編程問(wèn)題時(shí),o1會(huì)通過(guò)嘗試不同的代碼結(jié)構(gòu)和算法,找到最優(yōu)的解決方案。
結(jié)合強(qiáng)化學(xué)習(xí),o1的推理能力進(jìn)一步提升。正如美國(guó)最有影響的現(xiàn)代經(jīng)濟(jì)學(xué)家約·凱恩斯認(rèn)為:“習(xí)慣養(yǎng)成性格,性格決定命運(yùn)。”o1通過(guò)不斷的自我學(xué)習(xí)和強(qiáng)化,養(yǎng)成了強(qiáng)大的推理能力,為其在AI領(lǐng)域的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。這種并聯(lián)思維的進(jìn)化,讓o1能夠不斷適應(yīng)新的問(wèn)題和挑戰(zhàn),展現(xiàn)出了人工智能的強(qiáng)大適應(yīng)性和智能化。
四、質(zhì)疑與挑戰(zhàn):并聯(lián)之路的坎坷
(一)成本與商業(yè)可行性:并聯(lián)思維的代價(jià)
盡管o1在技術(shù)上取得了重大突破,但高昂的成本卻成為其實(shí)際應(yīng)用中的一大難題。o1的算力消耗顯著高于之前的GPT-4,根據(jù)現(xiàn)有測(cè)試,o1的單次推理通常需要數(shù)分鐘到數(shù)十分鐘,算力成本也高出數(shù)倍。例如,在處理復(fù)雜的商業(yè)數(shù)據(jù)分析任務(wù)時(shí),企業(yè)可能需要投入大量的資金來(lái)運(yùn)行o1,這對(duì)于許多中小型企業(yè)來(lái)說(shuō)是難以承受的負(fù)擔(dān)。
這種高昂的算力消耗直接影響了o1的商業(yè)化可行性。正如美國(guó)經(jīng)濟(jì)學(xué)家保羅?薩繆爾森所說(shuō):“市場(chǎng)經(jīng)濟(jì)最終的主宰是消費(fèi)者和技術(shù)。”在o1面臨的算力瓶頸面前,如何降低成本,滿足消費(fèi)者需求,成為了OpenAI亟待解決的問(wèn)題。這也是并聯(lián)思維在實(shí)際應(yīng)用中所面臨的挑戰(zhàn)之一,需要不斷探索新的技術(shù)和方法,以降低成本,提高商業(yè)可行性。
(二)技術(shù)壁壘與競(jìng)爭(zhēng):并聯(lián)思維的挑戰(zhàn)
o1在理論上并沒(méi)有高得令人望而生畏的技術(shù)壁壘,這引發(fā)了人們對(duì)其未來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì)的擔(dān)憂。AI社區(qū)中有不少人認(rèn)為,其他公司可能迅速跟上o1的水平。技術(shù)的快速擴(kuò)散讓人不禁思考,o1帶來(lái)的優(yōu)勢(shì)能否持久。
例如,谷歌DeepMind團(tuán)隊(duì)的論文提前揭示了與o1相似的原理,這表明其他公司在技術(shù)研發(fā)方面具有追趕的能力。雖然OpenAI在算法和數(shù)據(jù)方面有一定的積累,但隨著技術(shù)的不斷進(jìn)步,其他公司也可能通過(guò)創(chuàng)新和優(yōu)化,推出具有競(jìng)爭(zhēng)力的產(chǎn)品。
在這種情況下,OpenAI需要不斷創(chuàng)新,以保持其在AI領(lǐng)域的領(lǐng)先地位。這不僅需要投入大量的研發(fā)資源,還需要具備敏銳的市場(chǎng)洞察力和快速的反應(yīng)能力。并聯(lián)思維的發(fā)展需要不斷面對(duì)技術(shù)壁壘和競(jìng)爭(zhēng)的挑戰(zhàn),只有不斷創(chuàng)新和突破,才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。
(三)黑箱化問(wèn)題:并聯(lián)思維的隱患
o1在推理過(guò)程中的“黑箱化”問(wèn)題也令外界擔(dān)憂。盡管OpenAI展示了模型的思維鏈過(guò)程,卻并未完全開(kāi)放細(xì)節(jié)。這種保護(hù)措施固然能防止競(jìng)爭(zhēng)對(duì)手抄襲,但也引發(fā)了對(duì)透明度和安全性的擔(dān)憂。
人們擔(dān)心,由于不清楚o1的內(nèi)部運(yùn)作機(jī)制,可能會(huì)導(dǎo)致不可預(yù)測(cè)的結(jié)果。例如,在醫(yī)療領(lǐng)域,如果o1給出的診斷結(jié)果缺乏透明度,醫(yī)生和患者可能難以完全信任它。此外,黑箱化也可能帶來(lái)安全風(fēng)險(xiǎn),例如被惡意利用或出現(xiàn)錯(cuò)誤時(shí)難以排查問(wèn)題。
為了解決這個(gè)問(wèn)題,OpenAI需要在保護(hù)知識(shí)產(chǎn)權(quán)和提高透明度之間找到平衡。一方面,可以通過(guò)開(kāi)放部分源代碼或提供更多的解釋性文檔,讓用戶更好地理解o1的工作原理;另一方面,也可以加強(qiáng)安全措施,防止模型被惡意攻擊。并聯(lián)思維的發(fā)展需要解決黑箱化問(wèn)題,提高透明度和安全性,才能贏得用戶的信任和支持。
五、未來(lái)發(fā)展趨勢(shì):并聯(lián)思維的未來(lái)
(一)能力稀疏化:并聯(lián)思維的新方向
o1的出現(xiàn)預(yù)示著一種新的AI發(fā)展趨勢(shì)——能力稀疏化。未來(lái)的人工智能,可能不再是單一的大模型具備所有能力,而是由多個(gè)專精于不同領(lǐng)域的模塊化能力組合而成。這種稀疏化模型的思路在o1-mini中得到了體現(xiàn)。作為o1的簡(jiǎn)化版,o1-mini以低成本展現(xiàn)了強(qiáng)大的多步推理能力,尤其在編程等場(chǎng)景中表現(xiàn)出色。
稀疏化大模型是人工智能發(fā)展的新方向,它通過(guò)只使用部分參數(shù)進(jìn)行計(jì)算,實(shí)現(xiàn)計(jì)算效率和性能的提升。例如,OpenAI在開(kāi)發(fā)稀疏性大模型Arrakis時(shí),雖然最終表現(xiàn)不佳,但積累了寶貴的經(jīng)驗(yàn)。Arrakis以《沙丘》系列中一顆沙漠星球命名,象征著模型設(shè)計(jì)中使用的稀疏性。它利用稀疏性技術(shù),只激活模型用于給定任務(wù)、樣本或標(biāo)記的某些部分,從而顯著增加模型容量和能力,而不需成比例增加計(jì)算量。
此外,像墨芯人工智能這樣的企業(yè)也在引領(lǐng)稀疏化計(jì)算。墨芯入選機(jī)器之心年度AI技術(shù)趨勢(shì)報(bào)告,其首創(chuàng)32倍稀疏率張量運(yùn)算核心,獨(dú)創(chuàng)基于雙稀疏技術(shù)研發(fā)的AI計(jì)算卡,相較于行業(yè)其他產(chǎn)品,能提供超高性能、極低TCO。墨芯的稀疏化計(jì)算卡能助力公有云和私有云服務(wù)商,將TCO降低10倍以上,將同等運(yùn)算量的耗電量降至1/10。
能力稀疏化是并聯(lián)思維在未來(lái)的發(fā)展方向之一,它將為人工智能的發(fā)展帶來(lái)更多的可能性和創(chuàng)新空間。
(二)智能體的崛起:并聯(lián)思維的新高度
目前看來(lái),o1不僅在AI推理領(lǐng)域邁出了關(guān)鍵性的一步,還預(yù)示著人工智能可能加速邁向下一個(gè)階段——智能體(Agent)。根據(jù)SamAltman的說(shuō)法,L3智能體的出現(xiàn)將顛覆行業(yè),AI將不僅能夠進(jìn)行推理,還能在復(fù)雜環(huán)境中自主行動(dòng)、完成任務(wù)。
Altman的觀點(diǎn)為AI的發(fā)展帶來(lái)了新的視角:“L2最令人興奮的事情之一是它能夠相對(duì)快速地實(shí)現(xiàn)L3。”這意味著AI技術(shù)的進(jìn)化速度將極快,未來(lái)AI將主動(dòng)提出問(wèn)題、尋找答案,甚至進(jìn)行創(chuàng)新和實(shí)驗(yàn)。這將改變?nèi)祟?lèi)與AI互動(dòng)的根本方式。
例如,未來(lái)微軟Office全家桶得到最強(qiáng)o1模型的加持,推理性能更高,響應(yīng)更快。CopilotPages把上網(wǎng)搜索、內(nèi)容策劃和團(tuán)隊(duì)寫(xiě)作全部搞定,Copilot辦公全家桶升級(jí)后,AI生成Python代碼,秒處理Excel數(shù)據(jù),一句提示就能把想法變成PPT。這表明AI正在逐漸成為能夠自主協(xié)作、執(zhí)行任務(wù)的智能體,為人們的工作和生活帶來(lái)極大的便利。
智能體的崛起是并聯(lián)思維在未來(lái)的新高度,它將為人工智能的發(fā)展帶來(lái)更加廣闊的前景和深遠(yuǎn)的影響。
誠(chéng)然,OpenAI的o1模型在人工智能領(lǐng)域邁出了從串聯(lián)到并聯(lián)的關(guān)鍵一步,這一小步卻可能引發(fā)AI覺(jué)醒的一大步。盡管在發(fā)展過(guò)程中面臨著諸多質(zhì)疑和挑戰(zhàn),但o1模型所代表的并聯(lián)思維和技術(shù)創(chuàng)新,為人工智能的未來(lái)發(fā)展指明了方向。在未來(lái),我們有理由相信,隨著技術(shù)的不斷進(jìn)步和創(chuàng)新,人工智能將在并聯(lián)思維的引領(lǐng)下,實(shí)現(xiàn)更加輝煌的發(fā)展,為人類(lèi)社會(huì)帶來(lái)更多的驚喜和福祉。?
OpenAI o1代表了當(dāng)前AI推理能力的頂尖水平,未來(lái)它將會(huì)為科研、金融、醫(yī)療等垂直行業(yè)提供了全新解決方案,也為智能體的崛起鋪平了道路。在未來(lái)的AI技術(shù)競(jìng)賽中,推理能力的提升無(wú)疑將成為決定成敗的關(guān)鍵。
o1,這僅僅是開(kāi)始。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




