下載客戶端

登錄

從“串聯(lián)”到“并聯(lián)”，o1的一小步，AI覺(jué)醒的一大步？

2024-09-21 10:46

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

聽(tīng)全文

引言：OpenAI比拼算力的下半場(chǎng)，AI覺(jué)醒新征程？

當(dāng)人們談及人工智能，ChatGPT等看似無(wú)所不能的AI助手便會(huì)率先躍入腦海。它們的登場(chǎng)，如同一束強(qiáng)光，穿透數(shù)據(jù)的重重迷霧，讓我們得以窺見(jiàn)未來(lái)的一角。正如著名科幻作家阿瑟?克拉克所言：“任何足夠先進(jìn)的技術(shù)都無(wú)法與魔法區(qū)分?！痹谖覀兣cAI的對(duì)話日漸成為日常習(xí)慣之時(shí)，AI的下一步已然悄然鋪開(kāi)。此時(shí)，OpenAI的o1模型強(qiáng)勢(shì)登場(chǎng)，邁出關(guān)鍵一步。這一跨越，絕非僅僅是技術(shù)層面的飛躍，更有可能掀起一場(chǎng)影響深遠(yuǎn)的AI覺(jué)醒風(fēng)暴，為人工智能的發(fā)展開(kāi)辟嶄新的道路。

一、o1的一小步，AI覺(jué)醒的一大步

OpenAI的o1模型一經(jīng)登場(chǎng)，便在AI世界掀起了驚濤駭浪。它仿佛是一把神奇的鑰匙，開(kāi)啟了人工智能邁向新高度的大門(mén)。這一模型的出現(xiàn)，恰似一顆耀眼的星辰照亮了AI領(lǐng)域的蒼穹，標(biāo)志著人工智能在推理和復(fù)雜問(wèn)題解決方面邁出了至關(guān)重要的一大步。

o1模型是OpenAI研發(fā)團(tuán)隊(duì)歷經(jīng)漫長(zhǎng)歲月的精心雕琢與不懈探索的結(jié)晶。它創(chuàng)新性地采用了全新的訓(xùn)練方法，將強(qiáng)化學(xué)習(xí)與“思路鏈”巧妙融合，使得模型在回答問(wèn)題之前能夠如同人類(lèi)一般進(jìn)行深入思考。這種獨(dú)特的訓(xùn)練方式，賦予了o1模型在處理復(fù)雜問(wèn)題時(shí)令人驚嘆的能力。無(wú)論是在國(guó)際數(shù)學(xué)奧林匹克資格考試中，還是在編程能力測(cè)試?yán)铮琽1都展現(xiàn)出了超越以往的卓越表現(xiàn)，讓人們對(duì)人工智能的未來(lái)充滿了無(wú)限遐想。

此外，o1模型的發(fā)布在學(xué)術(shù)界和產(chǎn)業(yè)界引發(fā)了廣泛的關(guān)注與熱議。眾多專家學(xué)者紛紛投入對(duì)o1模型性能和應(yīng)用前景的深入研究與探討，他們一致認(rèn)為，o1模型的誕生將為人工智能在各個(gè)領(lǐng)域的應(yīng)用帶來(lái)嶄新的機(jī)遇和巨大的挑戰(zhàn)。產(chǎn)業(yè)界也敏銳地察覺(jué)到了o1模型的商業(yè)價(jià)值，紛紛期待著更多企業(yè)和機(jī)構(gòu)能夠投入到o1模型的應(yīng)用開(kāi)發(fā)中，共同開(kāi)創(chuàng)人工智能的新時(shí)代。

二、AI進(jìn)化新階段：從串聯(lián)到并聯(lián)的跨越

（一）從L1到L5的進(jìn)化之路

OpenAI的CEOSamAltman曾將AI技術(shù)的發(fā)展劃分為五個(gè)階段：L1（聊天機(jī)器人）、L2（推理者）、L3（智能體）、L4（創(chuàng)新者）和L5（完整組織）。在當(dāng)前階段，大多數(shù)AI仍徘徊在L1和L2階段，主要承擔(dān)著對(duì)話和簡(jiǎn)單推理任務(wù)。而o1的出現(xiàn)，猶如一座堅(jiān)實(shí)的橋梁，讓我們看到了邁向L3智能體時(shí)代的希望。

L3階段意味著AI將從單純的“工具”轉(zhuǎn)變?yōu)槟軌蜃灾餍袆?dòng)的“智能體”，可以代替人類(lèi)完成更為復(fù)雜的任務(wù)。o1通過(guò)突破性的推理鏈技術(shù)，實(shí)現(xiàn)了從線性、單線程的AI思維向多線程的并聯(lián)推理的華麗轉(zhuǎn)變。這一轉(zhuǎn)變，恰似愛(ài)因斯坦所言：“任何問(wèn)題都不能在它產(chǎn)生時(shí)的同一思維水平上得到解決。”o1的推理能力正是對(duì)這一名言的生動(dòng)詮釋，為AI的發(fā)展找到了新的方向和動(dòng)力。

（二）強(qiáng)大的推理能力：并聯(lián)思維的威力

o1自推出以來(lái)，在數(shù)學(xué)、編程和科學(xué)等領(lǐng)域展現(xiàn)出了令人震撼的實(shí)力。根據(jù)OpenAI的報(bào)告，o1在解決數(shù)學(xué)和編程問(wèn)題上的能力相比GPT-4有了顯著提升，提高了5倍以上，完整版o1更是實(shí)現(xiàn)了8倍的飛躍。

在國(guó)際數(shù)學(xué)奧林匹克（IMO）資格考試中，GPT-4僅解決了13%的問(wèn)題，而o1的推理模型得分高達(dá)83%。在編程領(lǐng)域，o1在Codeforces編程比賽中超越了89%的人類(lèi)選手。此外，在物理、生物和化學(xué)問(wèn)題的基準(zhǔn)測(cè)試中，o1也表現(xiàn)出了接近甚至超越人類(lèi)博士水平的準(zhǔn)確度。

例如，OpenAI發(fā)布的研究和博客文章中顯示，o1不僅可解決高級(jí)數(shù)學(xué)和編碼問(wèn)題，還能解密復(fù)雜的密碼，以及解答來(lái)自專家學(xué)者們關(guān)于遺傳學(xué)、經(jīng)濟(jì)學(xué)和量子物理學(xué)的復(fù)雜問(wèn)題。大量圖表表明，在內(nèi)部評(píng)估中，o1在編碼、數(shù)學(xué)和各個(gè)科學(xué)領(lǐng)域的問(wèn)題上已經(jīng)超越了公司最先進(jìn)的語(yǔ)言模型GPT-4o，甚至可能超越了人類(lèi)。這一切都得益于o1所采用的并聯(lián)推理思維，讓其能夠更加高效地處理復(fù)雜問(wèn)題，展現(xiàn)出了人工智能的巨大潛力。

三、技術(shù)核心揭秘：并聯(lián)推理的奧秘

（一）思維鏈技術(shù)：并聯(lián)思維的紐帶

思維鏈技術(shù)起源于兩年前NeurIPS等權(quán)威會(huì)議上發(fā)表的一些經(jīng)典論文，學(xué)者們意識(shí)到大語(yǔ)言模型通過(guò)鏈?zhǔn)剿季S過(guò)程，能夠處理更復(fù)雜的推理任務(wù)。

在o1中，思維鏈技術(shù)發(fā)揮了關(guān)鍵作用。它如同一條堅(jiān)韌的紐帶，將復(fù)雜問(wèn)題分解為多個(gè)簡(jiǎn)單任務(wù)進(jìn)行求解。具體來(lái)說(shuō)，o1采用了類(lèi)似人類(lèi)思維的邏輯鏈條，使得模型的“直覺(jué)”更準(zhǔn)確，推理更加深入。例如，在解決一個(gè)復(fù)雜的數(shù)學(xué)問(wèn)題時(shí)，o1會(huì)先將問(wèn)題拆分成多個(gè)步驟，每一步都經(jīng)過(guò)深思熟慮的思考，最終匯聚為完整的答案。

正如德國(guó)哲學(xué)家尼采所說(shuō)：“許多人浪費(fèi)了整整一生去等待符合他們心愿的機(jī)會(huì)?！倍鴒1的思維鏈技術(shù)正是主動(dòng)創(chuàng)造機(jī)會(huì)，通過(guò)深入思考和分解問(wèn)題，為解決復(fù)雜任務(wù)提供了新的途徑。這種并聯(lián)思維的方式，讓o1能夠更加高效地處理復(fù)雜問(wèn)題，展現(xiàn)出了強(qiáng)大的推理能力。

（二）自學(xué)推理與強(qiáng)化學(xué)習(xí)結(jié)合：并聯(lián)思維的進(jìn)化

o1的自學(xué)推理方法借鑒了斯坦福大學(xué)的STaR方法。通過(guò)提供模型解題示例，然后讓模型自行解決更多問(wèn)題，進(jìn)而反哺其數(shù)據(jù)集，不斷增強(qiáng)模型的自我學(xué)習(xí)能力。

這種自學(xué)推理與強(qiáng)化學(xué)習(xí)的結(jié)合，極大地提升了o1的推理能力。強(qiáng)化學(xué)習(xí)使o1能夠在不斷的試錯(cuò)中學(xué)習(xí)，優(yōu)化自身的策略。例如，在處理編程問(wèn)題時(shí)，o1會(huì)通過(guò)嘗試不同的代碼結(jié)構(gòu)和算法，找到最優(yōu)的解決方案。

結(jié)合強(qiáng)化學(xué)習(xí)，o1的推理能力進(jìn)一步提升。正如美國(guó)最有影響的現(xiàn)代經(jīng)濟(jì)學(xué)家約·凱恩斯認(rèn)為：“習(xí)慣養(yǎng)成性格，性格決定命運(yùn)。”o1通過(guò)不斷的自我學(xué)習(xí)和強(qiáng)化，養(yǎng)成了強(qiáng)大的推理能力，為其在AI領(lǐng)域的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。這種并聯(lián)思維的進(jìn)化，讓o1能夠不斷適應(yīng)新的問(wèn)題和挑戰(zhàn)，展現(xiàn)出了人工智能的強(qiáng)大適應(yīng)性和智能化。

四、質(zhì)疑與挑戰(zhàn)：并聯(lián)之路的坎坷

（一）成本與商業(yè)可行性：并聯(lián)思維的代價(jià)

盡管o1在技術(shù)上取得了重大突破，但高昂的成本卻成為其實(shí)際應(yīng)用中的一大難題。o1的算力消耗顯著高于之前的GPT-4，根據(jù)現(xiàn)有測(cè)試，o1的單次推理通常需要數(shù)分鐘到數(shù)十分鐘，算力成本也高出數(shù)倍。例如，在處理復(fù)雜的商業(yè)數(shù)據(jù)分析任務(wù)時(shí)，企業(yè)可能需要投入大量的資金來(lái)運(yùn)行o1，這對(duì)于許多中小型企業(yè)來(lái)說(shuō)是難以承受的負(fù)擔(dān)。

這種高昂的算力消耗直接影響了o1的商業(yè)化可行性。正如美國(guó)經(jīng)濟(jì)學(xué)家保羅?薩繆爾森所說(shuō)：“市場(chǎng)經(jīng)濟(jì)最終的主宰是消費(fèi)者和技術(shù)。”在o1面臨的算力瓶頸面前，如何降低成本，滿足消費(fèi)者需求，成為了OpenAI亟待解決的問(wèn)題。這也是并聯(lián)思維在實(shí)際應(yīng)用中所面臨的挑戰(zhàn)之一，需要不斷探索新的技術(shù)和方法，以降低成本，提高商業(yè)可行性。

（二）技術(shù)壁壘與競(jìng)爭(zhēng)：并聯(lián)思維的挑戰(zhàn)

o1在理論上并沒(méi)有高得令人望而生畏的技術(shù)壁壘，這引發(fā)了人們對(duì)其未來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì)的擔(dān)憂。AI社區(qū)中有不少人認(rèn)為，其他公司可能迅速跟上o1的水平。技術(shù)的快速擴(kuò)散讓人不禁思考，o1帶來(lái)的優(yōu)勢(shì)能否持久。

例如，谷歌DeepMind團(tuán)隊(duì)的論文提前揭示了與o1相似的原理，這表明其他公司在技術(shù)研發(fā)方面具有追趕的能力。雖然OpenAI在算法和數(shù)據(jù)方面有一定的積累，但隨著技術(shù)的不斷進(jìn)步，其他公司也可能通過(guò)創(chuàng)新和優(yōu)化，推出具有競(jìng)爭(zhēng)力的產(chǎn)品。

在這種情況下，OpenAI需要不斷創(chuàng)新，以保持其在AI領(lǐng)域的領(lǐng)先地位。這不僅需要投入大量的研發(fā)資源，還需要具備敏銳的市場(chǎng)洞察力和快速的反應(yīng)能力。并聯(lián)思維的發(fā)展需要不斷面對(duì)技術(shù)壁壘和競(jìng)爭(zhēng)的挑戰(zhàn)，只有不斷創(chuàng)新和突破，才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。

（三）黑箱化問(wèn)題：并聯(lián)思維的隱患

o1在推理過(guò)程中的“黑箱化”問(wèn)題也令外界擔(dān)憂。盡管OpenAI展示了模型的思維鏈過(guò)程，卻并未完全開(kāi)放細(xì)節(jié)。這種保護(hù)措施固然能防止競(jìng)爭(zhēng)對(duì)手抄襲，但也引發(fā)了對(duì)透明度和安全性的擔(dān)憂。

人們擔(dān)心，由于不清楚o1的內(nèi)部運(yùn)作機(jī)制，可能會(huì)導(dǎo)致不可預(yù)測(cè)的結(jié)果。例如，在醫(yī)療領(lǐng)域，如果o1給出的診斷結(jié)果缺乏透明度，醫(yī)生和患者可能難以完全信任它。此外，黑箱化也可能帶來(lái)安全風(fēng)險(xiǎn)，例如被惡意利用或出現(xiàn)錯(cuò)誤時(shí)難以排查問(wèn)題。

為了解決這個(gè)問(wèn)題，OpenAI需要在保護(hù)知識(shí)產(chǎn)權(quán)和提高透明度之間找到平衡。一方面，可以通過(guò)開(kāi)放部分源代碼或提供更多的解釋性文檔，讓用戶更好地理解o1的工作原理；另一方面，也可以加強(qiáng)安全措施，防止模型被惡意攻擊。并聯(lián)思維的發(fā)展需要解決黑箱化問(wèn)題，提高透明度和安全性，才能贏得用戶的信任和支持。

五、未來(lái)發(fā)展趨勢(shì)：并聯(lián)思維的未來(lái)

（一）能力稀疏化：并聯(lián)思維的新方向

o1的出現(xiàn)預(yù)示著一種新的AI發(fā)展趨勢(shì)——能力稀疏化。未來(lái)的人工智能，可能不再是單一的大模型具備所有能力，而是由多個(gè)專精于不同領(lǐng)域的模塊化能力組合而成。這種稀疏化模型的思路在o1-mini中得到了體現(xiàn)。作為o1的簡(jiǎn)化版，o1-mini以低成本展現(xiàn)了強(qiáng)大的多步推理能力，尤其在編程等場(chǎng)景中表現(xiàn)出色。

稀疏化大模型是人工智能發(fā)展的新方向，它通過(guò)只使用部分參數(shù)進(jìn)行計(jì)算，實(shí)現(xiàn)計(jì)算效率和性能的提升。例如，OpenAI在開(kāi)發(fā)稀疏性大模型Arrakis時(shí)，雖然最終表現(xiàn)不佳，但積累了寶貴的經(jīng)驗(yàn)。Arrakis以《沙丘》系列中一顆沙漠星球命名，象征著模型設(shè)計(jì)中使用的稀疏性。它利用稀疏性技術(shù)，只激活模型用于給定任務(wù)、樣本或標(biāo)記的某些部分，從而顯著增加模型容量和能力，而不需成比例增加計(jì)算量。

此外，像墨芯人工智能這樣的企業(yè)也在引領(lǐng)稀疏化計(jì)算。墨芯入選機(jī)器之心年度AI技術(shù)趨勢(shì)報(bào)告，其首創(chuàng)32倍稀疏率張量運(yùn)算核心，獨(dú)創(chuàng)基于雙稀疏技術(shù)研發(fā)的AI計(jì)算卡，相較于行業(yè)其他產(chǎn)品，能提供超高性能、極低TCO。墨芯的稀疏化計(jì)算卡能助力公有云和私有云服務(wù)商，將TCO降低10倍以上，將同等運(yùn)算量的耗電量降至1/10。

能力稀疏化是并聯(lián)思維在未來(lái)的發(fā)展方向之一，它將為人工智能的發(fā)展帶來(lái)更多的可能性和創(chuàng)新空間。

（二）智能體的崛起：并聯(lián)思維的新高度

目前看來(lái)，o1不僅在AI推理領(lǐng)域邁出了關(guān)鍵性的一步，還預(yù)示著人工智能可能加速邁向下一個(gè)階段——智能體（Agent）。根據(jù)SamAltman的說(shuō)法，L3智能體的出現(xiàn)將顛覆行業(yè)，AI將不僅能夠進(jìn)行推理，還能在復(fù)雜環(huán)境中自主行動(dòng)、完成任務(wù)。

Altman的觀點(diǎn)為AI的發(fā)展帶來(lái)了新的視角：“L2最令人興奮的事情之一是它能夠相對(duì)快速地實(shí)現(xiàn)L3。”這意味著AI技術(shù)的進(jìn)化速度將極快，未來(lái)AI將主動(dòng)提出問(wèn)題、尋找答案，甚至進(jìn)行創(chuàng)新和實(shí)驗(yàn)。這將改變?nèi)祟?lèi)與AI互動(dòng)的根本方式。

例如，未來(lái)微軟Office全家桶得到最強(qiáng)o1模型的加持，推理性能更高，響應(yīng)更快。CopilotPages把上網(wǎng)搜索、內(nèi)容策劃和團(tuán)隊(duì)寫(xiě)作全部搞定，Copilot辦公全家桶升級(jí)后，AI生成Python代碼，秒處理Excel數(shù)據(jù)，一句提示就能把想法變成PPT。這表明AI正在逐漸成為能夠自主協(xié)作、執(zhí)行任務(wù)的智能體，為人們的工作和生活帶來(lái)極大的便利。

智能體的崛起是并聯(lián)思維在未來(lái)的新高度，它將為人工智能的發(fā)展帶來(lái)更加廣闊的前景和深遠(yuǎn)的影響。

誠(chéng)然，OpenAI的o1模型在人工智能領(lǐng)域邁出了從串聯(lián)到并聯(lián)的關(guān)鍵一步，這一小步卻可能引發(fā)AI覺(jué)醒的一大步。盡管在發(fā)展過(guò)程中面臨著諸多質(zhì)疑和挑戰(zhàn)，但o1模型所代表的并聯(lián)思維和技術(shù)創(chuàng)新，為人工智能的未來(lái)發(fā)展指明了方向。在未來(lái)，我們有理由相信，隨著技術(shù)的不斷進(jìn)步和創(chuàng)新，人工智能將在并聯(lián)思維的引領(lǐng)下，實(shí)現(xiàn)更加輝煌的發(fā)展，為人類(lèi)社會(huì)帶來(lái)更多的驚喜和福祉。?

OpenAI o1代表了當(dāng)前AI推理能力的頂尖水平，未來(lái)它將會(huì)為科研、金融、醫(yī)療等垂直行業(yè)提供了全新解決方案，也為智能體的崛起鋪平了道路。在未來(lái)的AI技術(shù)競(jìng)賽中，推理能力的提升無(wú)疑將成為決定成敗的關(guān)鍵。

o1，這僅僅是開(kāi)始。

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#人工智能 #OpenAIo1