中文字幕国产91无码|AV成人手机在线|av成人先锋在线|911无码在线国产人人操|91蜜桃视频精品免费在线|极品美女A∨片在线看|日韩在线成人视频日韩|电影三级成人黄免费影片|超碰97国产在线|国产成人精品色情免费视频

  • +1

專訪|向量數(shù)據(jù)庫Zilliz創(chuàng)始人星爵:非共識到共識的創(chuàng)業(yè)之路

澎湃新聞記者 喻琰 實(shí)習(xí)生 王春
2024-09-29 17:40
來源:澎湃新聞
? 科創(chuàng)101 >
聽全文
字號

·“中國企業(yè)如果要在未來的幾十年里實(shí)現(xiàn)更大的發(fā)展,SaaS類企業(yè)服務(wù)的崛起是必然的。如果企業(yè)服務(wù)無法崛起,中國難以參與全球頂尖的競爭?!?/u>

·“如果外部環(huán)境變化就能讓你改變方向,那并不是真正的相信自己。改變方向只會讓你失去自我?!?/u>“即便在兩三年前我們已經(jīng)融到了1.1億美元,拿到了頂級投資人的錢,是中國基礎(chǔ)軟件領(lǐng)域融資最多的公司之一,但那時(shí)候市場上幾乎沒有人相信我們?!?017年,在數(shù)據(jù)領(lǐng)域工作了15年后,星爵觀察到了一個(gè)現(xiàn)象:大量的非結(jié)構(gòu)化數(shù)據(jù)一直未被有效地處理和利用,傳統(tǒng)數(shù)據(jù)庫如Oracle等公司通常處理的是結(jié)構(gòu)化數(shù)據(jù)。于是,他決定從硅谷回到中國創(chuàng)業(yè),成立了向量數(shù)據(jù)庫公司“Zilliz”。不過那時(shí)OpenAI也剛剛創(chuàng)立兩年,距離大模型掀起新一輪人工智能熱潮還需要再等五六年,市場上幾乎沒有人相信他們,“(創(chuàng)業(yè))前五六年,向量數(shù)據(jù)庫基本上屬于聰明人看不上也不愿意做的事?!比涨?,在接受澎湃科技采訪時(shí),星爵回憶說。

向量數(shù)據(jù)庫公司Zilliz創(chuàng)始人謝超,星爵為其花名。

直到2023年,創(chuàng)業(yè)之路迎來了一個(gè)重要的拐點(diǎn),ChatGPT將大模型推上了人工智能的主流?!昂鸵酝哪P拖啾龋竽P蛯?shù)據(jù)的依賴程度更高,它完全是由數(shù)據(jù)驅(qū)動的,數(shù)據(jù)變得更加重要?!?/p>

七年時(shí)間,向量數(shù)據(jù)庫作為AI的基礎(chǔ)設(shè)施,從幕后走到了幕前,非共識成為了共識?!斑^去一年多,很多公司都在進(jìn)入向量數(shù)據(jù)庫這個(gè)領(lǐng)域,甚至一度有兩三百家數(shù)據(jù)庫廠商將自己定位為向量數(shù)據(jù)庫公司,有些人兩三個(gè)月前還不相信的東西,突然特別相信了?!毙蔷粽f。

科技的發(fā)展速度超過了很多人的想象,但始終堅(jiān)定并非易事。從市場幽微時(shí)刻出發(fā),一路行至光明時(shí)刻,在星爵看來是一種極富英雄主義的堅(jiān)持。在Zilliz成立伊始便定了一個(gè)規(guī)矩,新成員加入時(shí)要選一個(gè)英雄的名字作為自己的花名,本名謝超的他選了漫威宇宙銀河護(hù)衛(wèi)隊(duì)中的英雄“星爵”。

大模型只是應(yīng)用場景之一

在過去多年的互聯(lián)網(wǎng)發(fā)展過程中,結(jié)構(gòu)化數(shù)據(jù)的處理占據(jù)了主流。所謂結(jié)構(gòu)化數(shù)據(jù)指的是一種使用預(yù)定義和預(yù)期格式的數(shù)據(jù),其字段、存儲、輸入、查詢、分析等相對固定,典型代表如電商場景中的交易數(shù)據(jù),其金額、購買信息等都會有嚴(yán)格的字段定義。

而非結(jié)構(gòu)化數(shù)據(jù)則恰恰相反,它的結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,很難用數(shù)據(jù)庫二維邏輯表來表示的數(shù)據(jù),常見的包括語音、視頻、圖片、文本等。大家通常認(rèn)為,這類非結(jié)構(gòu)化數(shù)據(jù)比結(jié)構(gòu)化數(shù)據(jù)量大很多,占到所有數(shù)據(jù)總量的80%,但卻很難被處理或分析。

相較于市場上已經(jīng)發(fā)展了二三十年的結(jié)構(gòu)化數(shù)據(jù)處理工具,非結(jié)構(gòu)化數(shù)據(jù)處理的工具并不完善,往往需要投入很大的算力和存儲資源,譬如要在上百部電影中找到特定畫面,檢索過程非常復(fù)雜且龐大。因?yàn)槌杀具^高,導(dǎo)致很多非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值沒有被充分挖掘。

“進(jìn)入人工智能時(shí)代后,機(jī)器可以代替人來處理這些非結(jié)構(gòu)化數(shù)據(jù),如果能夠有效利用這些數(shù)據(jù),將是一個(gè)巨大的機(jī)會?!盳illiz主打向量數(shù)據(jù)庫,一種專門為AI打造的處理非結(jié)構(gòu)化數(shù)據(jù)的存儲系統(tǒng),用于處理非結(jié)構(gòu)化數(shù)據(jù)的軟件工具。復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)一般需要通過AI模型轉(zhuǎn)化成向量,然后存儲到向量數(shù)據(jù)庫中進(jìn)行分析,才能進(jìn)一步挖掘其蘊(yùn)含的價(jià)值。

“事實(shí)上,大語言模型只是向量數(shù)據(jù)庫的一個(gè)應(yīng)用場景,并不是唯一的應(yīng)用。從2018年開始到2022年,中國的主流科技公司幾乎都在使用我們的產(chǎn)品,尤其是在互聯(lián)網(wǎng)搜索和廣告領(lǐng)域,雖然看起來沒有那么酷,但它們?nèi)允俏覀儺a(chǎn)品的重要應(yīng)用場景。”星爵說。

比如用戶在電商場景中搜索面包,如果僅以關(guān)鍵詞維度進(jìn)行搜索,那么吐司、貝果、歐包等面包的細(xì)分品類,就可能被忽略。但在語義和向量維度,它們之間具有極高的相似度,以向量為依據(jù)進(jìn)行搜索更符合現(xiàn)實(shí)場景中的用戶需求。

向量數(shù)據(jù)庫需要考慮如何將歷史海量數(shù)據(jù)做好向量化,如何構(gòu)建索引、過程中如何做存儲,如何兼顧語義查詢和精準(zhǔn)查詢。經(jīng)過五年的打磨,Zilliz旗下開源產(chǎn)品Milvus已經(jīng)成為全球最受歡迎的開源向量數(shù)據(jù)庫之一,基于Milvus的全托管向量數(shù)據(jù)庫云服務(wù)Zilliz Cloud也于2022年11月正式發(fā)布商用版本,并先后實(shí)現(xiàn)全球五大云19個(gè)節(jié)點(diǎn)的全覆蓋,成為全球首個(gè)提供海內(nèi)外多云服務(wù)的向量數(shù)據(jù)庫企業(yè)。在不久前發(fā)布的全球知名研究公司Forrester Wave? 向量數(shù)據(jù)庫報(bào)告中,Zilliz獲評領(lǐng)導(dǎo)者象限最高分,在向量維度、向量索引、性能、可擴(kuò)展性等多個(gè)角度得到專業(yè)認(rèn)可。

但在星爵看來這只是個(gè)開始,算力、算法和數(shù)據(jù)是人工智能的三大技術(shù)支柱,“如果說算力是火箭的機(jī)體,那么算法是控制系統(tǒng),數(shù)據(jù)是燃料,雖然每一輪計(jì)算機(jī)技術(shù)的革命都是從硬件開始,然后是算法的進(jìn)步,但數(shù)據(jù)才是最核心、最有價(jià)值的資源。”大模型為數(shù)據(jù)提供了一個(gè)很好的載體,同樣在大模型時(shí)代,數(shù)據(jù)也變得更加重要。

“AI在不同的發(fā)展階段有不同的表現(xiàn)方式,比如五六年前,AI的表現(xiàn)可能是傳統(tǒng)的小型卷積神經(jīng)網(wǎng)絡(luò)模型。隨后,Transformer的出現(xiàn),再加上scalinglaw等產(chǎn)業(yè)規(guī)律的存在,有了大模型。除了語言模型,也有視覺模型或其他類型的模型,并逐漸發(fā)展成為統(tǒng)一的多模態(tài)模型,既可以處理語言文字,也可以處理視頻、音頻?!?/p>

真正的“高光時(shí)刻”還未到來

大模型的走紅帶火了向量數(shù)據(jù)庫,但星爵認(rèn)為,向量數(shù)據(jù)庫真正的“高光時(shí)刻”還未到來。

當(dāng)前AI領(lǐng)域的發(fā)展還沒有到真正的爆發(fā)階段?!斑^去6到8個(gè)月中,AI領(lǐng)域正處于爬坡階段,雖然整體效能有所提升,但尚未達(dá)到理想水平。在技術(shù)層面,大模型依然面臨瓶頸,這一瓶頸可能持續(xù)三個(gè)月、三年或更長,具體時(shí)間難以預(yù)測?!?/p>

大家都在尋找理想的應(yīng)用載體,以便將AI與其他技術(shù)結(jié)合,創(chuàng)造更大的效益。星爵認(rèn)為,當(dāng)前AI的發(fā)展仍在尋找價(jià)值、創(chuàng)造新機(jī)遇,市場層面需要找到新的價(jià)值點(diǎn)。很多公司對AI的認(rèn)知不夠。“他們常常尋求幫助,卻不清楚自己想解決的問題到底是什么,有些找到我們的客戶甚至還不了解行業(yè)是如何細(xì)分的,什么樣的問題該找哪類供應(yīng)商?!?/strong>

不過,他對中國AI市場的未來發(fā)展仍然樂觀,“雖然在中國市場,我們經(jīng)歷了很多挑戰(zhàn),但我們依然不愿意放棄這個(gè)市場。在AI應(yīng)用層面,中國并不會落后,中國公司在應(yīng)用反應(yīng)速度和執(zhí)行力上具備優(yōu)勢。在上一代移動革命時(shí)期,中國公司在應(yīng)用方面表現(xiàn)出色?!毙蔷粽J(rèn)為,這一出色的表現(xiàn)仍然會延續(xù)至AI時(shí)代。

雖然SaaS服務(wù)在中國市場一直面臨營收難題,但在星爵看來,中國企業(yè)如果要在未來的幾十年里實(shí)現(xiàn)更大的發(fā)展,SaaS類企業(yè)服務(wù)的崛起是必然的?!叭绻髽I(yè)服務(wù)無法崛起,中國難以參與全球頂尖的競爭?!?/p>

“真正的高光時(shí)刻應(yīng)該是當(dāng)出現(xiàn)第一家營收超過10億美元、估值達(dá)到100億美元的公司?!倍鴦?chuàng)造這個(gè)高光時(shí)刻的公司可能會是類似Zilliz這樣的獨(dú)立創(chuàng)新公司。

偉大的機(jī)會往往都是反共識的

向量數(shù)據(jù)庫火出圈后,經(jīng)常有人問星爵,“為什么是你們跑出來了?做對了什么?”

“偉大的機(jī)會往往是反共識的”。當(dāng)大多數(shù)人都不看好一個(gè)方向時(shí),正是創(chuàng)業(yè)者堅(jiān)持信念的時(shí)刻。星爵表示,最初選擇創(chuàng)業(yè)是出于自己從事數(shù)據(jù)工作多年后的技術(shù)直覺,“我在數(shù)據(jù)領(lǐng)域工作了很長時(shí)間,知道當(dāng)下市場的需求已經(jīng)可以通過技術(shù)的手段去滿足。如果不是長期從事數(shù)據(jù)庫工作的人,可能無法說服自己相信這項(xiàng)技術(shù)已經(jīng)到了拐點(diǎn)?!?/p>

在創(chuàng)業(yè)之前,星爵已在數(shù)據(jù)領(lǐng)域工作近十五年,處理非結(jié)構(gòu)化數(shù)據(jù)一直是工作中棘手的難題。但深度學(xué)習(xí)技術(shù)的出現(xiàn)讓他意識到這是一個(gè)重要的技術(shù)變量,使得非結(jié)構(gòu)數(shù)據(jù)的處理問題變得可以解決。

“相信自己”被星爵認(rèn)為是一個(gè)創(chuàng)業(yè)者必須具備的第一要素。“很多人不敢行動,首先是害怕失敗,其次是不相信自己,相信自己是一件非常困難的事情,需要對自己的判斷和直覺有高度的信任?!痹诖竽P蛶Щ鹆讼蛄繑?shù)據(jù)庫后,很多從事傳統(tǒng)數(shù)據(jù)庫的人開始轉(zhuǎn)變思路,從不相信到相信,但在星爵看來,“如果外部環(huán)境變化就能讓你改變方向,那并不是真正的相信自己。改變方向只會讓你失去自我。”

雖然堅(jiān)信終點(diǎn)一定可以抵達(dá),但何時(shí)可以抵達(dá)并不確定。在創(chuàng)業(yè)過程中,星爵也曾遭遇融資困難熬不下去的時(shí)候,所以他覺得理想主義對于創(chuàng)業(yè)者來說也不可或缺,“如果想要更快地發(fā)展可能需要追求短期利益,但只有具備理想和長期愿景,才能更早地進(jìn)入一個(gè)市場,并堅(jiān)守這一領(lǐng)域。只有堅(jiān)持和熬過困難,才能取得成功,好的機(jī)會往往是反共識的?!盳illiz今天能夠在細(xì)分領(lǐng)域里獲得領(lǐng)先,在星爵看來,完全得益于“起步更早,吸引了更多優(yōu)秀的人才”,“如果我們進(jìn)入市場的時(shí)間晚了,就根本沒有機(jī)會了?!?/p>

    責(zé)任編輯:宦艷紅
    圖片編輯:蔣立冬
    校對:張艷
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報(bào)業(yè)有限公司