中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

GPT時(shí)代,一位數(shù)據(jù)產(chǎn)業(yè)創(chuàng)業(yè)者的“生存法則”

2023-04-20 16:23
來(lái)源:澎湃新聞·澎湃號(hào)·湃客
聽(tīng)全文
字號(hào)

作者:周雅

“Data is the new oil. (數(shù)據(jù)是新型石油)”,這句如今聽(tīng)起來(lái)頗有些陳詞濫調(diào)的話卻是關(guān)于“數(shù)據(jù)”廣為流傳的較早隱喻,17年前這個(gè)論調(diào)被英國(guó)數(shù)學(xué)家Clive Humby提出時(shí),大家或許還沒(méi)有意識(shí)到,數(shù)據(jù)和石油其實(shí)一樣,都是要經(jīng)過(guò)提煉、加工才能變?yōu)楦袃r(jià)值的產(chǎn)物。

而究其本質(zhì),對(duì)石油的再加工,需要一個(gè)全新的「化學(xué)工程」行業(yè),并引發(fā)了一些產(chǎn)業(yè)變革。比如上世紀(jì)初如果沒(méi)有高辛烷值汽油出現(xiàn),就沒(méi)有之后的汽車普及。今天,當(dāng)人們開(kāi)始對(duì)數(shù)據(jù)再加工,同樣需要一個(gè)全新的「數(shù)據(jù)工程」行業(yè)。

眾所周知,人工智能的三駕馬車,是算法、算力和數(shù)據(jù)。而一份來(lái)自UBS Global的報(bào)告卻顯示,現(xiàn)如今AI工程師70%-90%的時(shí)間都花費(fèi)在訓(xùn)練數(shù)據(jù)上。所以本質(zhì)上,機(jī)器學(xué)習(xí)作為AI的大腦,是一種被數(shù)據(jù)投喂長(zhǎng)大的算法技術(shù),伴隨著建模門(mén)檻的降低,數(shù)據(jù)的門(mén)檻卻越來(lái)越高,使得數(shù)據(jù)工程變成了機(jī)器學(xué)習(xí)的瓶頸。

所以,我們可以說(shuō):AI正在改變世界,而數(shù)據(jù)工程則在改變AI。

在這個(gè)過(guò)程中,一批批技術(shù)為王的訓(xùn)練數(shù)據(jù)服務(wù)商突出重圍。于是,倍賽科技和它的創(chuàng)始人兼CEO杜霖就出現(xiàn)在了我們的視野當(dāng)中。

說(shuō)起來(lái),杜霖和數(shù)據(jù)打交道將近20年。早在大二期間,他就曾創(chuàng)辦過(guò)一家數(shù)據(jù)挖掘公司,最后以400萬(wàn)美金賣掉。甚至在高中,他就自學(xué)了計(jì)算機(jī)視覺(jué)相關(guān)技術(shù),并在核心期刊發(fā)表論文。

而倍賽公司的創(chuàng)立,也源于杜霖發(fā)現(xiàn)了機(jī)器學(xué)習(xí)進(jìn)一步發(fā)展面臨的痛點(diǎn)。

創(chuàng)業(yè)雛形:數(shù)據(jù)才是那只木桶的短板

作為AI如今最輝煌的分支,機(jī)器學(xué)習(xí)曾經(jīng)多年來(lái)卻一直進(jìn)展緩慢,直到2012年的ImageNet圖像分類競(jìng)賽中,深度卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet取得了驚人的成績(jī),將錯(cuò)誤率降低了近一半,使得深度學(xué)習(xí)開(kāi)始受到廣泛關(guān)注和應(yīng)用。

除了算力的疊加、算法的優(yōu)化之外,高質(zhì)量數(shù)據(jù)集就是不可逾越的一環(huán)。舉例來(lái)說(shuō),人臉是千變?nèi)f化的,但若沒(méi)有包括不同年齡、性別、種族、角度和光照條件下的人臉圖像數(shù)據(jù)集,可能就不會(huì)有AI識(shí)別模型的性能和準(zhǔn)確率。

也是那時(shí)候,杜霖敏銳地嗅到了數(shù)據(jù)的前景,深感里面有很多事可做。于是,他火速拉了交大的兩位同學(xué)入伙,開(kāi)發(fā)了一個(gè)完整的AI應(yīng)用場(chǎng)景:一款能識(shí)別食材的冰箱,冰箱能識(shí)別出120種食材,綜合識(shí)別率達(dá)89.9%。雖然還不夠完美,但商用也是沒(méi)問(wèn)題的。

在那個(gè)年代,這款冰箱開(kāi)創(chuàng)了圖像識(shí)別冰箱的先河。杜霖回憶,“我們?cè)囍u給海爾美的等家電公司,大家都很感興趣,但是誰(shuí)也付不起費(fèi)用,因?yàn)榘纂姷睦麧?rùn)空間非常薄,這套識(shí)別系統(tǒng)軟硬件成本至少1000塊,而一臺(tái)冰箱也就賣一兩千塊錢?!薄叭绻皇翘^(guò)前衛(wèi),倍賽現(xiàn)在可能就是一家智能冰箱解決方案公司了。”

表面上看,是技術(shù)太過(guò)前衛(wèi),成本太過(guò)高昂,但經(jīng)過(guò)仔細(xì)反思復(fù)盤(pán),杜霖意識(shí)到背后有更通用的痛點(diǎn):機(jī)器學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)工程占據(jù)了絕大部分研發(fā)時(shí)間。

算下來(lái),這5個(gè)半月的時(shí)間里,他們花了3個(gè)半月做數(shù)據(jù)標(biāo)注,真正訓(xùn)練模型也就1個(gè)多月時(shí)間,其中數(shù)據(jù)標(biāo)注用了將近30人,而數(shù)據(jù)訓(xùn)練只有一位AI工程師。

杜霖從中總結(jié)出兩條頗有遠(yuǎn)見(jiàn)的觀點(diǎn):第一,所有行業(yè)都會(huì)有被機(jī)器學(xué)習(xí)滲透的那一天,因?yàn)樗娴哪芴嵝?,所以它?huì)隨著數(shù)據(jù)的豐富和建模門(mén)檻的降低,變得越來(lái)越普及。第二,正因?yàn)闄C(jī)器學(xué)習(xí)會(huì)普及,圍繞在訓(xùn)練數(shù)據(jù)的工程化一定有巨大潛力。

“解決數(shù)據(jù)問(wèn)題更重要”,杜霖說(shuō)。于是,倍賽科技公司就在這樣的背景下誕生了。

公司雖然落成了,但這也只是一個(gè)開(kāi)端。倍賽從2015年便開(kāi)始研發(fā)自己的數(shù)據(jù)標(biāo)注系統(tǒng)Origin1,直到2017年底才開(kāi)始接業(yè)務(wù)。蟄伏了三年,只為讓系統(tǒng)足夠穩(wěn)定成熟。到2018年反哺也聯(lián)袂而至,倍賽科技的營(yíng)收同比增長(zhǎng)了五六倍,達(dá)千萬(wàn)規(guī)模?!爱?dāng)時(shí)我們每天都會(huì)收到大量的需求?!倍帕卣f(shuō)。

戰(zhàn)略轉(zhuǎn)型:黎明之前的至暗時(shí)刻

創(chuàng)業(yè)路上有無(wú)數(shù)的暗礁,都源于各種第一次,第一次組隊(duì)伍,第一次找融資,第一次商業(yè)化……對(duì)于倍賽來(lái)說(shuō),潛伏最深的那塊險(xiǎn)地,是第一次技術(shù)化轉(zhuǎn)型。

轉(zhuǎn)型,對(duì)于任何一家公司包括創(chuàng)業(yè)公司而言,它的考驗(yàn)程度甚至堪比一場(chǎng)再創(chuàng)業(yè),因?yàn)槟且馕吨鴮?duì)舊事物的推翻、對(duì)新事物的創(chuàng)建,就勢(shì)必會(huì)有一個(gè)否定自己再證明自己的過(guò)程。

在倍賽的發(fā)展歷程中,杜霖曾寫(xiě)過(guò)一封全員信,說(shuō)公司最難的時(shí)候,不是賬上的錢只夠維持兩個(gè)月工資,也不是拿著的一個(gè)大客戶訂單突然就丟了,最難就是那一場(chǎng)技術(shù)平臺(tái)大轉(zhuǎn)型。

那一年,倍賽的核心產(chǎn)品Origin1已經(jīng)穩(wěn)定發(fā)展了4年,但團(tuán)隊(duì)遇到了一些反復(fù)出現(xiàn)的問(wèn)題——公司的AI項(xiàng)目經(jīng)理和公司的客戶經(jīng)常會(huì)花大量時(shí)間去磨某一個(gè)數(shù)據(jù)該怎么標(biāo)。

拿一個(gè)很簡(jiǎn)單的自動(dòng)駕駛場(chǎng)景舉例,下雨時(shí)攝像頭會(huì)變臟,這時(shí)候就要加一個(gè)標(biāo)簽“攝像頭是否潔凈”,因?yàn)樗鼤?huì)影響建模。但就是這種常見(jiàn)場(chǎng)景,卻是要求數(shù)據(jù)標(biāo)注方案迭代很多次。

諸如此類的問(wèn)題,極大影響了數(shù)據(jù)處理的效率。杜霖進(jìn)一步發(fā)現(xiàn),這些問(wèn)題已經(jīng)無(wú)法在既有產(chǎn)品上修修補(bǔ)補(bǔ)來(lái)解決了,必須做一次重構(gòu),全部推倒重來(lái)。

思索再三,杜霖及同事們最終決定對(duì)核心產(chǎn)品下手。而且,既然要改,就要改得徹底。作為一款企服的產(chǎn)品,它需要“商業(yè)化友好”,它的底層性能要強(qiáng)大完備;而作為一款國(guó)際化視野的平臺(tái),它需要“開(kāi)發(fā)者友好”,所以用戶體驗(yàn)也要跟上步伐。

用一句話總結(jié)目標(biāo):倍賽需要將公司原來(lái)的“數(shù)據(jù)標(biāo)注”產(chǎn)品Origin1,轉(zhuǎn)型為一個(gè)“訓(xùn)練數(shù)據(jù)工程化”開(kāi)源平臺(tái)Xtreme1。

這項(xiàng)重大的產(chǎn)品升級(jí),同時(shí)面向N個(gè)目標(biāo)訴求,操作起來(lái)必然是牽一發(fā)而動(dòng)全身。那陣子,這邊Origin1還在不斷商業(yè)化,那邊Xtreme1只是襁褓嬰兒。需要用老產(chǎn)品的“回報(bào)”東墻,補(bǔ)新產(chǎn)品的“開(kāi)發(fā)”西墻。

更難的是,公司上下包括杜霖自己在內(nèi),大家并不知道新產(chǎn)品能否做的出來(lái),何時(shí)才能做出來(lái),唯獨(dú)只是堅(jiān)定要持續(xù)投入。那段時(shí)間里,整個(gè)團(tuán)隊(duì)的士氣進(jìn)入了一種又迷茫又激進(jìn)的擰巴狀態(tài)。

作為公司主心骨,杜霖眼前的難處也有一籮筐,包括怎么保持新舊兩邊產(chǎn)品部門(mén)的目標(biāo)協(xié)同一致;怎么做好兩個(gè)產(chǎn)品的平穩(wěn)過(guò)渡;怎么匹配新戰(zhàn)略,向VC介紹新的商業(yè)邏輯;以及,Origin1做了4年的閉源,突然要從Xtreme1轉(zhuǎn)為開(kāi)源,雖然迎合了大趨勢(shì),但到底是福是禍?

在前后1年多的時(shí)間里,杜霖做了無(wú)數(shù)適配,來(lái)掌舵這次轉(zhuǎn)型。他在成都創(chuàng)立了研發(fā)中心,從零開(kāi)始招募第一位員工。而整個(gè)團(tuán)隊(duì),也頻繁往返北京成都兩地,進(jìn)入高強(qiáng)度工作狀態(tài)。

幸好,倍賽最終有驚無(wú)險(xiǎn)地闖過(guò)了難關(guān)。

經(jīng)過(guò)無(wú)數(shù)次測(cè)試,新一代支持多模態(tài)數(shù)據(jù)的AI訓(xùn)練數(shù)據(jù)平臺(tái)Xtreme1橫空出世,并在2021年12月30號(hào)加入Linux基金會(huì)并實(shí)現(xiàn)開(kāi)源。

回看這次轉(zhuǎn)型,杜霖也感慨萬(wàn)千,他說(shuō)“這不光是一次產(chǎn)品的升級(jí),更是一次能力的升級(jí),因?yàn)楣疽虼藢?shí)現(xiàn)了從技術(shù)投入、團(tuán)隊(duì)升級(jí)、戰(zhàn)略調(diào)整的一系列蛻變。”

他在那封全員信的最后寫(xiě)道:所謂的至暗時(shí)刻,不是午夜12點(diǎn),而是黎明沒(méi)來(lái)、深夜未走的凌晨四五點(diǎn)。

消除誤解:誰(shuí)說(shuō)數(shù)據(jù)標(biāo)注沒(méi)有含金量

業(yè)界有一種誤區(qū)認(rèn)為,數(shù)據(jù)工程的核心就是“數(shù)據(jù)標(biāo)注”,而數(shù)據(jù)標(biāo)注只是“處理多少數(shù)據(jù),就有多少人工”的藍(lán)領(lǐng)流水線。

杜霖以產(chǎn)品舉例稱,“Xtreme1成為了Linux基金會(huì)關(guān)于MLOps版圖中全球首個(gè)填補(bǔ)“Annotation&Visualization”空白的產(chǎn)品?!彼^MLOps,是指將DevOps(開(kāi)發(fā)運(yùn)營(yíng))中的最佳實(shí)踐應(yīng)用于機(jī)器學(xué)習(xí)的運(yùn)營(yíng)。

隨著數(shù)據(jù)的復(fù)雜性增加,以及新算法的不斷涌現(xiàn),機(jī)器學(xué)習(xí)模型的部署和運(yùn)營(yíng)變得越來(lái)越困難。而MLOps通過(guò)采用自動(dòng)化流程和工具,使機(jī)器學(xué)習(xí)模型的部署、監(jiān)測(cè)和維護(hù)變得更容易、高效和可靠。

Xtreme1正是圍繞Data-Centric MLOps的應(yīng)用策略展開(kāi),從而更便捷、高效地幫助客戶實(shí)現(xiàn)AI應(yīng)用交付。某種程度上,這可以理解為是一種用“人工智能”提升“人工智能開(kāi)發(fā)”的工作方法。AI helps AI。

在產(chǎn)品細(xì)節(jié)上,Xtreme1從功能層面由五大板塊構(gòu)成:Ontology Center,Annotation Suite,Dataset Curation,SOTA Models和BasicBot。比如Ontology Center這一功能,當(dāng)中關(guān)于車的屬性就有很多種,SUV、轎車、卡車、自行車等等,客戶可以基于屬性,去生成一個(gè)想要的標(biāo)準(zhǔn)方案?;蛘呓Y(jié)合業(yè)務(wù)場(chǎng)景,去定制一個(gè)方案?!拔覀?cè)赬1里開(kāi)發(fā)了一系列自動(dòng)化工具,去幫助客戶實(shí)現(xiàn)數(shù)據(jù)標(biāo)注方案?!?/p>

如今,Xtreme1已經(jīng)成為倍賽科技的拳頭產(chǎn)品,并得到招商銀行、英特爾、南方電網(wǎng)、京東、Bosch、科大訊飛、商湯等近千家頭部企業(yè)客戶的青睞。去年,倍賽科技還拿到英特爾AI百佳創(chuàng)新激勵(lì)計(jì)劃的“芯銳獎(jiǎng)”生態(tài)拓展獎(jiǎng),使用英特爾處理器 IntelXeon?Processor、Intel?OpenvINo?等技術(shù)對(duì)產(chǎn)品開(kāi)展模型訓(xùn)練。

跨物種聯(lián)手:人工智能離不開(kāi)人類老師

不過(guò),要把AI轉(zhuǎn)化為生產(chǎn)力,不僅要懂AI,更要懂場(chǎng)景。數(shù)據(jù)工程的門(mén)檻,不僅在于技術(shù)研發(fā)上,更在于各個(gè)行業(yè)的Know-How上。

杜霖說(shuō),“我們的產(chǎn)品經(jīng)歷了數(shù)萬(wàn)項(xiàng)目的打磨,當(dāng)一接手某種類型的項(xiàng)目,在系統(tǒng)層面,我們就知道它可能會(huì)涉及到哪些數(shù)據(jù)標(biāo)注的規(guī)則,這在內(nèi)部稱之為Data Driven(數(shù)據(jù)驅(qū)動(dòng)),我們會(huì)去理解客戶為什么做這個(gè)數(shù)據(jù)、想解決什么問(wèn)題。

比如同樣都是道路場(chǎng)景,自動(dòng)配送車、無(wú)人駕駛車、配送機(jī)器人這三種車輛,標(biāo)注方案卻是完全不同的。

對(duì)于自動(dòng)駕駛,需要大量補(bǔ)充類似“道路臨時(shí)施工的錐子”Corner case數(shù)據(jù);而對(duì)于酒店配送機(jī)器人,就要去找“電梯上下口特征”的數(shù)據(jù)?!安煌膱?chǎng)景有不同的數(shù)據(jù)要求,我們是理解的,因?yàn)槲覀冏隽颂喟咐??!?/p>

甚至,在杜霖看來(lái),ChatGPT之所以這么驚艷,也是有人類Know-How參與的原因。

也就是說(shuō),ChatGPT的背后功臣,除了有實(shí)現(xiàn)更大級(jí)別模型的「預(yù)訓(xùn)練」,此外把Human in the Loop(或被稱之為RLHF)這件事情做好也是關(guān)鍵。

HITL(Human in the Loop,人機(jī)協(xié)同),可以簡(jiǎn)單理解為用“人類智能”結(jié)合“機(jī)器智能”來(lái)創(chuàng)建機(jī)器學(xué)習(xí)模型。實(shí)際做法就是用“言傳身教”的方法,給機(jī)器這個(gè)“學(xué)生”配個(gè)優(yōu)秀的“人類老師”,把機(jī)器學(xué)習(xí)原本的“填鴨式教學(xué)”升級(jí)到“答疑式教學(xué)”,來(lái)迅速提升它的學(xué)習(xí)成績(jī)。

也就是,當(dāng)生成式AI創(chuàng)造出內(nèi)容后,人類根據(jù)自身Know-How來(lái)給結(jié)果打分,幫助機(jī)器對(duì)齊人類思維。

“當(dāng)下的機(jī)器學(xué)習(xí)大部分是依賴于HITP。”杜霖指出,ChatGPT通過(guò)來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)生成的InstructGPT模型,比100倍參數(shù)規(guī)模無(wú)監(jiān)督的GPT-3模型效果更好,也說(shuō)明了有監(jiān)督的數(shù)據(jù)標(biāo)注是大模型應(yīng)用成功的基礎(chǔ)。

反觀回來(lái),作為一家全棧AI數(shù)據(jù)及模型解決方案供應(yīng)商,杜霖所創(chuàng)立的倍賽科技的核心宗旨,就是用更好用的工具更好的達(dá)到Human in the Loop,把客戶的建模成本進(jìn)一步降低,建模效率進(jìn)一步提升。

杜霖把倍賽的這項(xiàng)業(yè)務(wù)總結(jié)為“Training Data Engineering(訓(xùn)練數(shù)據(jù)工程化)”,其中涉及到的環(huán)節(jié)就包括了:數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、數(shù)據(jù)集管理、模型建立、模型部署、應(yīng)用程序構(gòu)造等。

所以,無(wú)論是從哪個(gè)角度看,數(shù)據(jù)工程不僅是個(gè)技術(shù)密集型產(chǎn)業(yè),更是一個(gè)要求責(zé)任感很重的產(chǎn)業(yè)。好的數(shù)據(jù)集,就是AI的優(yōu)質(zhì)教科書(shū),賦予AI靈魂的存在。

不過(guò)在杜霖看來(lái),國(guó)內(nèi)的這個(gè)行業(yè)其實(shí)被一些新涌入者搞的有些混亂。很多同行一味實(shí)施低價(jià)策略,甚至是虧錢接活,拼體力搶單,搶到之后再去講融資的故事。“這是一個(gè)不健康的業(yè)態(tài)和模式。”

相較而言,在國(guó)際市場(chǎng)上,數(shù)據(jù)工程行業(yè)也是高度競(jìng)爭(zhēng)的,但是大家的競(jìng)標(biāo)價(jià)格基本都是八九不離十的,客戶最后研判的標(biāo)準(zhǔn)會(huì)上升到技術(shù)實(shí)力、交付能力、業(yè)務(wù)貼合度等指標(biāo),不會(huì)一味的只看價(jià)格。

最終的結(jié)果是,國(guó)際數(shù)據(jù)處理公司的估值動(dòng)輒幾十億,中國(guó)可能只有十分之一,這也讓數(shù)據(jù)工程被誤解甚至邊緣化。

也正因如此,杜霖堅(jiān)定的將把“更強(qiáng)的技術(shù)能力”和“國(guó)際化”作為公司核心方向。“倍賽一直把自己標(biāo)桿成一個(gè)世界級(jí)的產(chǎn)品,所以我一直要求產(chǎn)品經(jīng)理去看世界最好的工具,眼光還是要放高?!蹦壳?,倍賽全線產(chǎn)品都是中英文雙語(yǔ),在成都的研發(fā)部門(mén)60%以上在英文環(huán)境中工作,非研發(fā)部門(mén)90%以上實(shí)現(xiàn)英文工作環(huán)境。

他強(qiáng)調(diào)說(shuō):“整個(gè)數(shù)據(jù)行業(yè)里,未來(lái)能走出來(lái)的一定是工具能力非常強(qiáng)、且有全球化基因的公司”,因?yàn)锳I的通用屬性意味著,你的產(chǎn)品總有一天會(huì)被放到全球商業(yè)舞臺(tái)上去卷。

數(shù)據(jù)獵手:業(yè)務(wù)出海,產(chǎn)品說(shuō)話

回望整個(gè)創(chuàng)業(yè)之旅,杜霖最有成就感的過(guò)程,就是帶動(dòng)全員統(tǒng)一目標(biāo),做出有潛力的產(chǎn)品,從而實(shí)現(xiàn)從0到1、從1到100的增長(zhǎng)過(guò)程。

“我一直在試圖把自己所學(xué)的工程能力,轉(zhuǎn)化到現(xiàn)實(shí)世界去解決實(shí)際問(wèn)題。我是一個(gè)非常典型的喜歡去解決問(wèn)題的人?!倍帕叵嘈?,能解決實(shí)際問(wèn)題的產(chǎn)品就是好產(chǎn)品。

但由于技術(shù)是一個(gè)相對(duì)抽象的概念,技術(shù)的發(fā)展是個(gè)漫漫長(zhǎng)路,創(chuàng)業(yè)者如何更好地普及技術(shù)?杜霖頓了頓說(shuō)道,“我相信倍賽是以產(chǎn)品驅(qū)動(dòng)增長(zhǎng)的公司,就讓產(chǎn)品自己說(shuō)話吧?!北热缜瓣囎樱a(chǎn)品收到了不知名用戶的好評(píng),是來(lái)自瑞士理工大學(xué)的某個(gè)用戶被挪威某個(gè)大學(xué)的校友推薦用了產(chǎn)品,“這讓我很有成就感?!?/p>

談及未來(lái)發(fā)展,擺在公司面前依然有兩條路可走,是做一個(gè)小而精的垂類公司,還是做一個(gè)大而美的平臺(tái)公司?杜霖說(shuō),還是回到最初的定位,就是圍繞多模態(tài)數(shù)據(jù)做好一套訓(xùn)練數(shù)據(jù)工程化(Training Data Engineering)和訓(xùn)練數(shù)據(jù)生命周期管理(Training Data Lifecycle Management),因?yàn)檫@是未來(lái)一切可能的地基。

如何看待AI未來(lái)?杜霖說(shuō),“AI的終極方向,一定是在可控的范圍內(nèi),進(jìn)一步提升全世界的效率”,如果類比的話,AI只是一次工業(yè)革命,是對(duì)生產(chǎn)力的又一次解放,它的跨時(shí)代意義跟蒸汽機(jī)時(shí)代是一樣的。

蒸汽機(jī)剛出現(xiàn)時(shí)也很笨拙,但是某一天,大家發(fā)現(xiàn)它可以取代馬車、人力,然后被取代的人慢慢就反相變成AI的操作者,比如司機(jī)操作方向盤(pán),工人操作機(jī)械。

所以,AI所取代的工作,未來(lái)依然會(huì)有更多的人反向去操作這樣的AI,也就是我們之前所談的Human in the Loop。也正因如此,訓(xùn)練數(shù)據(jù)工程化的工作現(xiàn)在重要,隨著AI在不同行業(yè)的深入,還會(huì)變得更加重要?!叭祟愐藺I好的東西,和對(duì)的東西?!?/p>

在連續(xù)創(chuàng)業(yè)的間隙,杜霖還因?yàn)閻?ài)好,而當(dāng)過(guò)幾年的海上獵手,甚至后來(lái)還因此孵化了一家海釣漁具公司。他說(shuō)自己喜歡出最遠(yuǎn)的海,去釣很大的魚(yú),享受與未知世界斗智斗勇的感覺(jué):“我釣過(guò)最大的魚(yú)是在西沙的一條接近300多斤大鯊魚(yú),我用手搖竿搖上來(lái)的?!?/p>

不過(guò),只要了解釣魚(yú)這項(xiàng)運(yùn)動(dòng)的愛(ài)好者都清楚,其中取勝的關(guān)鍵,并不是收桿那一刻的拼體能,而是在整個(gè)過(guò)程的運(yùn)籌帷幄。

從這個(gè)角度看,海上獵手如此,數(shù)據(jù)獵手也如此。

    本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司