- +1
從存史到算史:方志數(shù)智化的范式重構(gòu)
國有史,地有志,家有譜。地方志作為中華民族特有的文化基因與歷史記憶載體,其價值不僅在于存史,更在于資政與教化。隨著“十五五”規(guī)劃的前瞻布局與新質(zhì)生產(chǎn)力理論的提出,數(shù)字技術(shù)對傳統(tǒng)文化的賦能已不再局限于物理介質(zhì)的遷移,而是向著知識生產(chǎn)方式的根本性變革邁進。在這一宏觀背景下,重新審視方志資源的屬性,應(yīng)當(dāng)將其界定為一種具備全域性、全時空特征的高置信度地情數(shù)據(jù)要素。然而,面對浩如煙海的方志典籍,傳統(tǒng)的人工檢索與簡單的關(guān)鍵詞匹配已無法應(yīng)對日益復(fù)雜的知識挖掘需求。生成式人工智能的崛起,為打破這一瓶頸提供了新的契機。本文以上海地方志的數(shù)智化轉(zhuǎn)型探索為例,探討如何利用前沿AI技術(shù)重構(gòu)方志資源的治理范式,推動地方志工作從被動的資源保藏向主動的知識計算轉(zhuǎn)型,從而在數(shù)字文明時代煥發(fā)出新的生命力。
一、轉(zhuǎn)型邏輯:從資源匯聚到數(shù)據(jù)要素化的時代必然
地方志的數(shù)字化轉(zhuǎn)型,本質(zhì)上是一場關(guān)于知識生產(chǎn)與消費的供給側(cè)結(jié)構(gòu)性改革。審視當(dāng)前的發(fā)展階段,既要客觀評估既有建設(shè)的基座效應(yīng),更要敏銳洞察制約價值躍升的深層矛盾,從而確立以數(shù)據(jù)要素化為核心的轉(zhuǎn)型邏輯。
現(xiàn)狀審視:物理基座的堅實與語義認知的跨越階段
一期工程的歷史性貢獻:堅實的物理底座。上海地方志經(jīng)過一期工程的持續(xù)建設(shè),已構(gòu)建完成上海數(shù)字方志一體化系統(tǒng)。這一階段的歷史性貢獻在于實現(xiàn)了方志資源的匯聚與物理可達。通過大規(guī)模的數(shù)字化掃描與基礎(chǔ)文本識別,汗牛充棟的實體志書被轉(zhuǎn)化為觸手可及的數(shù)字鏡像,徹底解決了傳統(tǒng)方志藏在深閨人未識的傳播困境。
在一期工程的建設(shè)過程中,前瞻性地搭建了四大核心平臺,構(gòu)建了完整的數(shù)字化生態(tài)系統(tǒng)。后臺管理平臺實現(xiàn)了標簽管理、方志詞庫及大事管理等基礎(chǔ)數(shù)據(jù)治理功能,其標簽體系涵蓋篇、章、節(jié)、目四級篇目結(jié)構(gòu)標簽,特別是在要素標簽層面,通過對人、事、物、時間、地點的五維界定,為后續(xù)的語義化處理奠定了堅實的分類基礎(chǔ)。方志智庫平臺不僅提供了基礎(chǔ)與高級查詢功能,還支持電子書閱覽及原始稿件查閱,初步實現(xiàn)了從物理庫存向數(shù)字倉庫的轉(zhuǎn)型,確保了地情資料有庫可查。方志智造平臺集成了框架結(jié)構(gòu)、總述、大事記及人物傳記等志書編纂輔助小工具,為修志人提供了高效的數(shù)字化協(xié)同環(huán)境。方志智服平臺則通過云游滬上方志場景等,實現(xiàn)了方志資源面向社會公眾的多維展示。這些基于物理遷移的數(shù)字化成果,是二期工程增量賦能的重要基石。
語義解構(gòu)的待墾區(qū):從有庫向有智躍升的必然挑戰(zhàn)。然而,站在機器認知和生成式AI(人工智能)的視角審視,一期工程完成的是數(shù)字化,而非智能化。目前的數(shù)字化產(chǎn)物主要以PDF或離散文本形式存在,對于大語言模型而言,它們與一堆掃描圖片并無本質(zhì)區(qū)別——字符可見,語義不可達。無論是新方志中記錄經(jīng)濟社會發(fā)展的海量統(tǒng)計表格,還是古方志中蘊含復(fù)雜關(guān)系的傳記文本,在缺乏深度語義解析的情況下,僅僅是數(shù)字字符的堆砌而非可計算的知識。
這種現(xiàn)狀導(dǎo)致大模型在面對跨文本邏輯推理的高階咨詢時,如分析近代上海工業(yè)空間布局演變或跨世紀氣候災(zāi)害統(tǒng)計,往往顯得支撐力不足。順應(yīng)國家數(shù)據(jù)要素×行動的要求,推動方志資源從非結(jié)構(gòu)化的電子文獻向結(jié)構(gòu)化的數(shù)據(jù)要素躍升,已成為打破應(yīng)用天花板、釋放新質(zhì)生產(chǎn)力的必由之路。
認知革命:生成式AI作為新質(zhì)生產(chǎn)力的介入
認知主體的重構(gòu):從人讀志向AI讀志的進階。要理解這場變革的實質(zhì),需要回到一個基本問題:誰來讀志書?傳統(tǒng)模式下,人類專家受限于閱讀速度與記憶容量,難以在短時間內(nèi)窮盡全量史料。大模型改變了這個前提。作為第一讀者,它具備全量吞吐與多模態(tài)理解能力,能夠以毫秒級的速度通讀億萬字志書,并在此基礎(chǔ)上建立跨文本的關(guān)聯(lián)索引。這種介入并非取代人類,而是通過AI的預(yù)讀與預(yù)處理,將專家從繁瑣的翻檢工作中解放出來,使其更專注于價值研判。我們建議將這一垂域大模型命名為“申知·滬志”,以求在方志中了解上海、認知上海。
價值形態(tài)的重構(gòu):從靜態(tài)文獻向動態(tài)知識圖譜的活化。在數(shù)據(jù)要素×的視角下,方志資源不再是靜止的陳列品,而是可以被GIS(地理信息系統(tǒng))系統(tǒng)調(diào)用、被BI(商業(yè)智能)工具分析的活態(tài)數(shù)據(jù)源。通過AI的深度介入,能夠?qū)⑹鲂缘奈谋巨D(zhuǎn)化為結(jié)構(gòu)化的時間軸、地理坐標與實體關(guān)系網(wǎng)。但這里有一個關(guān)鍵約束:方志領(lǐng)域?qū)糜X零容忍。不同于通用大模型可以在不確定中給出概率性回答,方志垂域大模型生成的每一條知識都必須溯源至確切的志書頁碼——無出處不生成,這是算史區(qū)別于聊天的底線。檢索增強生成(RAG)技術(shù)為此提供了工程化路徑。這種范式重構(gòu),將徹底激活沉睡的方志資源,使其成為賦能城市治理與文化傳承的高能級資產(chǎn)。
二、理論框架:構(gòu)建兼容古今異構(gòu)的數(shù)智化三維坐標
一期工程的貢獻在于完成了方志資源的物理遷移,這是數(shù)字化的必經(jīng)之路,但也僅僅是起點。生成式AI近兩年的爆發(fā),尤其是視覺語言模型與圖檢索增強生成技術(shù)的成熟,開啟了一種全新的可能:不再滿足于把志書搬進數(shù)據(jù)庫,而是將其重構(gòu)為一個可計算的三維知識空間,時間軸、地理坐標、語義網(wǎng)絡(luò)在其中交織貫通。上海方志的獨特價值恰恰在于它的復(fù)雜性:千年古籍與當(dāng)代新志并存,文言豎排與現(xiàn)代表格共處。這種古今異構(gòu)的張力,要求設(shè)計一套雙軌并行的治理范式,不是權(quán)宜之計,而是方志數(shù)智化的通用解法。
資源層:雙軌并行的多模態(tài)治理策略
古方志的版面語義理解與邏輯還原。方志數(shù)據(jù)呈現(xiàn)出顯著的二元結(jié)構(gòu)特征。一類是1949年以前的古籍善本,其特點是文言晦澀、版面復(fù)雜。傳統(tǒng)OCR在這里遇到的不是識別精度問題,而是認知框架問題,它遵循線性掃描邏輯,把雙行夾注、眉批與正文一視同仁地串成字符流,原書的版面語義在這一過程中被徹底抹平。引入視覺語言模型(Vision-Language Model, VLM),建立基于版面語義一體化的理解機制,將成為破解這一難題的關(guān)鍵路徑。VLM的優(yōu)勢在于它把頁面當(dāng)作圖像來理解,而非字符序列來掃描,系統(tǒng)可以直接識別頁面中的欄線、版心與閱讀順序,精準還原大字正文、小字夾注的層級關(guān)系,從而在實現(xiàn)數(shù)字化的同時,完整保留史料的原始風(fēng)貌與邏輯。
新方志表格數(shù)據(jù)的深度激活與考古式挖掘。另一類是1949年以后的新方志,其特點是數(shù)據(jù)密集、體例規(guī)范,其中最大的價值洼地在于數(shù)以萬計的統(tǒng)計表格,這些表格記錄了上海數(shù)十年經(jīng)濟社會的量化軌跡,卻因跨頁斷裂、多級表頭嵌套等結(jié)構(gòu)化難題,長期處于不可計算狀態(tài)。對計算機而言,一張跨頁的GDP統(tǒng)計表和一張風(fēng)景照片并無區(qū)別,都是像素矩陣。對此,構(gòu)建專門的表格智能體(Table-Agent)將是解決問題的核心方案。Table-Agent的本質(zhì)是一個視覺-邏輯混合推理器:它不僅具備視覺重構(gòu)能力以修復(fù)物理斷裂,更具備邏輯推演能力,能夠理解多級表頭的嵌套關(guān)系,自動補全單元格的屬性路徑。通過這一路徑,原本鎖死在圖片中的統(tǒng)計數(shù)據(jù)將被還原為標準的數(shù)據(jù)庫格式,支撐起歷時性的趨勢分析。
知識層:歷時性本體與語義空間的跨時空映射
在完成了資源層的雙軌治理后,方志數(shù)智化轉(zhuǎn)型面臨著最為核心的挑戰(zhàn),古今概念漂移導(dǎo)致的語義鴻溝。這個問題比表面看起來更棘手。中國地方志跨越千載,不僅是語言形態(tài)從文言向白話的演變,更是社會制度、經(jīng)濟結(jié)構(gòu)與地理形態(tài)的根本性變遷。如果知識圖譜無法建立精密的概念對齊機制,用戶問“上海百年稅收演變”,系統(tǒng)卻無法理解厘金、關(guān)稅、增值稅本質(zhì)上是同一類事物在不同時代的表現(xiàn)形態(tài),所謂的算史就淪為關(guān)鍵詞匹配的游戲。
古今概念漂移的深度解構(gòu)與典型案例實證。為了確保方志大模型能夠理解歷史演進的連續(xù)性,應(yīng)該構(gòu)建一套動態(tài)的語義映射體系。以下三組案例展示了這一問題的復(fù)雜性及其解決邏輯:
教育機構(gòu)的演化脈絡(luò)。以著名的上海龍門書院為例,其作為晚清上海最高學(xué)府,在制度上承襲了傳統(tǒng)書院的講學(xué)特質(zhì),但在十九世紀末的戊戌維新背景下,逐漸向近代學(xué)堂(如南洋公學(xué),今上海交通大學(xué)前身)轉(zhuǎn)型,并最終演變?yōu)楝F(xiàn)代意義上的學(xué)校。這三個概念,書院、學(xué)堂、學(xué)校,在功能上具有教育傳承的等價性,但在組織形態(tài)、招生機制、課程體系上存在質(zhì)的差異。知識圖譜要做的,是建立功能等價但形態(tài)演化的演化鏈,讓系統(tǒng)能夠響應(yīng)“上海高等教育百年空間位移”這樣的深層課題,而非簡單地返回包含“教育”二字的條目。
財稅制度的概念變遷。古代志書中的厘金記錄了晚清商品流通的稅收細節(jié)(厘金制度創(chuàng)設(shè)于咸豐三年即1853年,初為鎮(zhèn)壓太平天國的軍費籌措手段),這與近代的關(guān)稅以及現(xiàn)代的增值稅在稅基、稅率與征收邏輯上各不相同,但本質(zhì)上都屬于商品流轉(zhuǎn)環(huán)節(jié)的資源要素配置。通過在圖譜中建立稅制本體的上下位關(guān)系,系統(tǒng)能夠?qū)崿F(xiàn)對上海百年財稅收入的標準化換算,從而支撐起長周期的經(jīng)濟趨勢研究。
度量衡的單位映射。古代志書中常見的里(明清時期約合576米)、步、畝與現(xiàn)代的公里、平方米、公頃之間存在復(fù)雜的換算關(guān)系,且不同朝代的里長度略有差異。系統(tǒng)在處理歷史地理數(shù)據(jù)時,必須自動識別時間切片并應(yīng)用相應(yīng)的換算系數(shù)。例如,明代松江府至上??h的距離描述,與現(xiàn)代松江區(qū)至黃浦區(qū)的空間跨度,需在標準化后方可進行邏輯比對。
時空映射超級本體的構(gòu)建機制。為了應(yīng)對上述挑戰(zhàn),二期工程的核心理論框架可以包含一套時空映射超級本體。這套機制的設(shè)計哲學(xué)是柔性對齊而非剛性統(tǒng)一,不采取強行統(tǒng)一詞匯的激進策略,而是通過知識圖譜的屬性鏈接,實現(xiàn)語義的動態(tài)關(guān)聯(lián)。具體而言,將采用同義映射模式,針對名稱變化但內(nèi)涵一致的概念進行對齊,如松江府與松江區(qū)在特定語境下的行政延續(xù);建立上下位關(guān)系模式,例如將錢莊界定為金融機構(gòu)在清代的特定表現(xiàn)形態(tài),實現(xiàn)從宏觀產(chǎn)業(yè)到微觀實體的穿透;引入時間切片模式,針對同一名稱在不同時期指代不同地理實體的復(fù)雜情形進行隔離。通過這一三維坐標系的建立,上海方志中的故紙將被轉(zhuǎn)化為可供大模型精準調(diào)用的數(shù)據(jù)資產(chǎn)。
三、技術(shù)機理:基于GraphRAG的可信知識計算與算史實證
理論框架回答了“算什么”的問題,現(xiàn)在要解決“怎么算”。方志資源的特殊性在于對信史的極致追求,這意味著不能依賴通用大模型的概率生成,而要構(gòu)建一套以可信驗證為核心的計算引擎。幸運的是,2024年以來,視覺語言模型、圖檢索增強生成、表格智能體等技術(shù)的成熟,為這套引擎的落地提供了可行路徑。
從字符識別到版面語義理解:VLM驅(qū)動的端到端解析
傳統(tǒng)OCR的線性局限與版面語法的喪失。在一期工程中,OCR解決了字字皆識的問題,但也僅此而已。面對古籍復(fù)雜的版面時,傳統(tǒng)OCR遵循線性掃描邏輯,將極具語義價值的雙行夾注、眉批以及圖文繞排結(jié)構(gòu)強行割裂。打個比方:這就像把一本精心排版的書拆成單字卡片按順序排列——字都在,但書沒了。這種降維識別方式導(dǎo)致最終生成的純文本流喪失了原書的邏輯層次。
視覺語言模型的認知飛躍與實證選型。VLM的突破在于改變了認知框架:它不再把文字當(dāng)作符號序列來掃描,而是把整個頁面當(dāng)作圖像來理解。依據(jù)2025年發(fā)布的AncientDoc基準測試,新一代模型能夠在具體任務(wù)維度上完成從頁級OCR到白話翻譯,再到基于隱含信息的邏輯推理。根據(jù)該基準測評數(shù)據(jù),Qwen2.5-VL-72B等模型在處理繁簡轉(zhuǎn)換、異體字對齊任務(wù)中表現(xiàn)出卓越的魯棒性,其字符錯誤率顯著低于通用大模型。這意味著機器開始具備理解版面語法的能力,它知道大字是正文、小字是注釋,知道眉批是后人評點而非原作者所言。為了實現(xiàn)上海方志的深度適配,建議二期系統(tǒng)將基于5000個以上的標注頁面進行領(lǐng)域微調(diào),真正實現(xiàn)從文本數(shù)字化向語義版面數(shù)字化的質(zhì)變。
突破幻覺困境:GraphRAG構(gòu)建的邏輯約束機制
從向量檢索向圖結(jié)構(gòu)檢索的范式進化。通用大模型的幻覺問題在方志領(lǐng)域尤其致命。當(dāng)用戶問及徐光啟的科學(xué)成就,如果模型基于概率生成一個聽起來合理但實際不存在的著作名,這在閑聊場景可以容忍,在方志應(yīng)用中則是災(zāi)難性的。根本原因在于:通用大模型缺乏知識錨點,它的回答來自參數(shù)記憶而非確切文獻。為此,建議采用圖索引增強生成(GraphRAG)技術(shù)。這一技術(shù)由微軟研究院于2024年提出,其核心思想是把檢索的粒度從文本片段提升到知識圖譜,模型的每一次生成都必須沿著圖譜的邊走,找到確切的節(jié)點作為錨點。
雙模查詢機制下的高置信度回答。GraphRAG的精妙之處在于它支持兩種互補的查詢模式,分別應(yīng)對精確問答和宏觀綜述兩類需求。局部搜索(Local Search)基于實體鄰域的精確查詢:當(dāng)用戶詢問徐光啟的科學(xué)成就時,系統(tǒng)從節(jié)點出發(fā),沿關(guān)聯(lián)邊檢索其著作(《農(nóng)政全書》60卷、《崇禎歷書》137卷)、合作者(利瑪竇)及社交網(wǎng)絡(luò),提供事實性、高精度的信息。全局搜索(Global Search)基于社區(qū)摘要的主題綜述:對于晚清上海買辦階層的社會影響等宏觀課題,系統(tǒng)利用Leiden算法進行社區(qū)檢測,生成多層級的主題摘要。前者回答“是什么”,后者回答“怎么看”,兩者結(jié)合,才能覆蓋方志應(yīng)用的完整場景。根據(jù)南京農(nóng)業(yè)大學(xué)研究團隊的實證數(shù)據(jù),這種引入圖譜約束的機制,使模型在歷史知識問答中的F1值提升了11個百分點,有效加裝了符合史學(xué)邏輯的安全閥。
現(xiàn)代方志的結(jié)構(gòu)化還原:Table-Agent的數(shù)據(jù)挖掘
統(tǒng)計表格:新方志的核心價值洼地。如果說古方志的難點是版面語義,新方志的深水區(qū)則是統(tǒng)計表格。在經(jīng)濟志、行業(yè)志的處理中,海量統(tǒng)計表格記錄了上海數(shù)十載的產(chǎn)業(yè)興替,但多以圖片形式鎖死在系統(tǒng)中。這些表格的價值密度極高,一張產(chǎn)值表可能濃縮了某個行業(yè)十年的發(fā)展軌跡,但對計算機而言,它們與一張白紙無異。為了激活這些沉睡的數(shù)據(jù),必須引入具備數(shù)據(jù)挖掘能力的Table-Agent。
四階段閉環(huán)工作流的技術(shù)實現(xiàn)。Table-Agent的工作流是一個視覺、邏輯、語義層層遞進的認知鏈條,每一階段解決一個特定問題。視覺重構(gòu)階段解決物理斷裂問題:利用TableTransformer技術(shù),系統(tǒng)精確識別表格邊界,并通過表頭特征匹配算法判斷相鄰頁面的表格是否屬于同一邏輯長表,從而完成跨頁縫合。結(jié)構(gòu)解析階段解決邏輯理解問題:利用Chain-of-Table表格推理鏈技術(shù),模型顯式輸出表頭的嵌套關(guān)系,例如將一個單元格數(shù)值補全為上海市/2020年/GDP/第三產(chǎn)業(yè)/億元的完整屬性路徑。數(shù)據(jù)清洗階段解決識別噪聲問題:系統(tǒng)利用統(tǒng)計學(xué)規(guī)律進行數(shù)字形近糾錯(如0與O、1與l的混淆),并自動推斷單位標準化。語義融合階段解決孤島問題:結(jié)構(gòu)化后的表格數(shù)據(jù)與知識圖譜對接,每個數(shù)據(jù)值都標注有確切的來源和時空屬性。通過這一完整流水線,死數(shù)據(jù)變?yōu)榭沈?qū)動決策的高質(zhì)量燃料。
混合專家系統(tǒng):MoE架構(gòu)下的專業(yè)化協(xié)作
應(yīng)對業(yè)務(wù)復(fù)雜性的MoE架構(gòu)設(shè)計。方志業(yè)務(wù)的復(fù)雜性在于它同時需要兩種截然不同的能力:古文語義理解與現(xiàn)代數(shù)值分析。讓一個模型既精通文言文又擅長統(tǒng)計推斷,這在技術(shù)上是可行的,但效率很低,大量參數(shù)被浪費在不相關(guān)的任務(wù)上。申知·滬志底座將采用混合專家系統(tǒng)(Mixture of Experts, MoE)架構(gòu),其核心思想是術(shù)業(yè)有專攻:把模型拆分成多個專家子模塊,每個專家深耕一個垂直領(lǐng)域,由路由網(wǎng)絡(luò)根據(jù)輸入特征動態(tài)分配任務(wù)。專家子模塊被劃分為古文專家、數(shù)理專家與歸納專家:古文專家負責(zé)文白對譯,數(shù)理專家負責(zé)趨勢分析,歸納專家負責(zé)宏觀敘事。系統(tǒng)通過路由機制自動識別任務(wù)特征,檢測到豎排版面則分發(fā)至古文專家,檢測到數(shù)值序列則引導(dǎo)至數(shù)理專家。這種設(shè)計確保了在處理具體史料時的專業(yè)精度,真正實現(xiàn)了從單一模型向復(fù)合智能系統(tǒng)的進化。
專家子模塊的功能劃分與垂直領(lǐng)域深度微調(diào)。MoE的優(yōu)勢不僅在于推理效率,更在于它允許每個專家在自己的領(lǐng)域里做到極致。申知·滬志底座通過稀疏門控網(wǎng)絡(luò)(Sparse Gating)將模型內(nèi)部劃分為多個具備垂直深度的專家子腦。這種設(shè)計不僅能夠顯著降低推理成本,更重要的是它解決了傳統(tǒng)模型在處理古今異構(gòu)語料時容易出現(xiàn)的干擾與混淆。
古文理解專家不僅承擔(dān)繁簡轉(zhuǎn)化與文白對譯的基礎(chǔ)任務(wù),更被賦予深層的歷史敏感度。訓(xùn)練中將注入HisDoc1B等大規(guī)模古籍識別數(shù)據(jù)集,并結(jié)合上海方志辦提供的明清及民國時期的高精細OCR語料進行專項微調(diào)。該專家的獨特價值在于它理解語境,而非僅僅翻譯字面。對于晚清民國史料中常見的半文半白文體、異體字以及古今字,其識別與理解的準確率將顯著優(yōu)于通用模型。這意味著,當(dāng)系統(tǒng)處理《嘉定縣志》中的賦稅記述時,古文專家能自動識別出其中潛藏的社會制度背景,從而避免字面理解的謬誤。
數(shù)理統(tǒng)計專家是實現(xiàn)從存史向算史跨越的核心算子。該專家專門負責(zé)調(diào)用Table-Agent進行趨勢分析與圖表生成,訓(xùn)練中將被注入大量的經(jīng)濟史數(shù)據(jù)與統(tǒng)計學(xué)模型,具備極強的時間序列分析、統(tǒng)計檢驗及可視化生成能力。它的獨特價值在于理解統(tǒng)計口徑的演變。在處理1949年以后的新方志時,數(shù)理專家不僅能解析表格中的數(shù)值,更能判斷20世紀80年代的工農(nóng)業(yè)產(chǎn)值計算方法與當(dāng)前的GDP核算標準之間的邏輯轉(zhuǎn)換,從而為跨越半個世紀的經(jīng)濟增長分析提供嚴謹?shù)臄?shù)據(jù)支撐。
宏觀歸納專家致力于解決方志中篇幅浩大、信息分散帶來的閱讀困難。該專家負責(zé)進行跨章節(jié)、跨志書的綜述與摘要生成,其核心能力是從離散史實中提煉規(guī)律、構(gòu)建敘事。當(dāng)用戶提出類似近百年來上海城市空間的演變規(guī)律等宏觀問題時,歸納專家將協(xié)同GraphRAG的全局搜索結(jié)果,將分散在各區(qū)縣志、建設(shè)志、交通志中的信息進行邏輯縫合,生成一份具備史學(xué)深度的專業(yè)研究簡報。
動態(tài)路由機制與多專家協(xié)同推理邏輯。MoE架構(gòu)的精妙之處在于路由機制,它決定了每個查詢由哪些專家來處理、各占多大權(quán)重。當(dāng)用戶輸入一個查詢請求時,路由網(wǎng)絡(luò)將對輸入的語義特征進行多維度的向量化分析,從而決定任務(wù)在各專家之間的分配權(quán)重。如果系統(tǒng)檢測到輸入語料包含豎排版面特征、繁體字符或晦澀的文言表達,路由權(quán)重將向古文專家大幅傾斜;如果輸入中包含大量的表格結(jié)構(gòu)、數(shù)值序列或涉及具體的統(tǒng)計分析請求,系統(tǒng)則將優(yōu)先激活數(shù)理專家的參數(shù)權(quán)重。
更有趣的是多專家協(xié)同場景。例如,在分析徐家匯地區(qū)的商業(yè)演變時,路由機制將同時調(diào)用古文專家處理晚清筆記史料,數(shù)理專家處理現(xiàn)代商業(yè)普查表格,并由歸納專家最終整合這些異質(zhì)信息。這種協(xié)同不是簡單的拼接,而是在語義層面的融合,最終輸出的報告里,古今數(shù)據(jù)被置于同一分析框架下,形成連貫的歷史敘事。這種術(shù)業(yè)有專攻的參數(shù)分配策略,確保了申知·滬志底座在處理具體史料時具備專業(yè)精度,在面對宏觀敘事時具備邏輯廣度,真正實現(xiàn)從單一通用大模型向復(fù)合型專業(yè)智能系統(tǒng)的進化。
四、上海路徑:打造申知·滬志垂域智能體集群
技術(shù)機理解決的是能力問題,現(xiàn)在要回答落地問題:這套系統(tǒng)在上海應(yīng)該長什么樣?在厘清了VLM、GraphRAG、Table-Agent及MoE專家系統(tǒng)等一系列前沿技術(shù)機理后,必須結(jié)合上海特有的城市精神、政策語境與現(xiàn)實需求,探索一條具有示范意義的數(shù)智化落地路徑。二期工程不應(yīng)止步于對現(xiàn)有系統(tǒng)功能的簡單修補,而應(yīng)以打造申知·滬志為核心品牌,構(gòu)建一個集存儲、計算、應(yīng)用、交互于一體的垂域智能體集群,讓方志資源真正成為驅(qū)動城市文化軟實力與治理現(xiàn)代化的數(shù)據(jù)要素引擎。
申知·滬志底座:面向超大城市地情的混合專家大模型
將上海方志大模型命名為申知·滬志,寓意著利用生成式人工智能技術(shù)開啟沉睡在故紙堆中的歷史智慧,為超大城市的運行提供來自歷史深處的啟示。在品牌構(gòu)建過程中,申知·滬志將被定位為上海城市歷史的智能腦,它象征著方志事業(yè)從傳統(tǒng)的靜態(tài)資源保管向主動的知識價值發(fā)現(xiàn)的本質(zhì)飛躍。
這一垂域模型不是套殼的聊天機器人,而是一個深度定制的專業(yè)引擎。它基于大參數(shù)基座模型,經(jīng)過嚴格指令微調(diào)(SFT)與全量地情數(shù)據(jù)注入。全量知識注入方面,將把一期工程中已經(jīng)數(shù)字化的上海現(xiàn)存所有志書、年鑒、大事記、行業(yè)報刊及地情資料進行精細化的語料重組——這不是簡單的文本灌入,而是通過VLM語義還原與Table-Agent表格提取,把破碎的數(shù)據(jù)重構(gòu)為機器可理解的知識單元。編纂規(guī)范的指令對齊方面,將利用監(jiān)督式微調(diào)技術(shù),使大模型深度理解上海方志辦制定的一套嚴謹?shù)氖?、記、志、傳、圖、表、錄體例寫作規(guī)范,確保當(dāng)模型生成初稿或進行內(nèi)容審查時,能夠自動符合志書編寫的嚴肅性與專業(yè)性。信史約束的強化學(xué)習(xí)方面,將通過引入基于人類反饋的強化學(xué)習(xí)(RLHF),把有出處才生成的原則內(nèi)化為模型的行為模式,對于任何無法在原始史料中找到依據(jù)的內(nèi)容,模型被賦予拒絕生成的邏輯,從而減少直至杜絕通用大模型可能產(chǎn)生的幻覺問題。
場景實證:三大智能體賦能資政、興業(yè)、教化核心職能
底座能力要通過場景來釋放。為了響應(yīng)國家數(shù)據(jù)要素×文化行動計劃,可以把申知·滬志底座的能力模塊化、場景化,封裝為三個直接面向不同用戶群體的智能體(Agent)。這三大智能體協(xié)同作業(yè),以場景化應(yīng)用驗證數(shù)智化轉(zhuǎn)型的實際效能,讓方志工作真正走出象牙塔,進入社會生產(chǎn)的主力場。
資政智能體(Zizheng-Agent):從歷史資料查閱向城市治理輔助決策的飛躍。資政智能體主要面向城市管理者、政策研究者及政府決策部門,其核心使命是把歷史數(shù)據(jù)轉(zhuǎn)化為治理智慧。以超大城市防汛決策為例:上海作為地勢低洼、水網(wǎng)密布的濱海城市,歷史上飽受臺風(fēng)、暴雨與潮位波動的困擾。在傳統(tǒng)的決策模式下,查閱歷年水文數(shù)據(jù)是一項耗時耗力的工作。而資政智能體可以在幾秒鐘內(nèi)完成以下操作:調(diào)用《上海水利志》、《上海氣象志》以及歷年年鑒中關(guān)于災(zāi)害記錄的統(tǒng)計表格;通過Table-Agent提取百年來關(guān)于極端降水與河道水位的關(guān)聯(lián)數(shù)值;結(jié)合GraphRAG抓取歷史上受災(zāi)點位的空間分布規(guī)律;自動生成一份包含歷史極值警示、易澇點位演變趨勢以及防御建議的決策簡報。這種能力將使地方志從事后的歷史記載,提升到事前的風(fēng)險預(yù)判層面。
興業(yè)智能體(Xingye-Agent):激活老字號數(shù)據(jù)資產(chǎn),賦能商業(yè)文脈的數(shù)字化重塑。興業(yè)智能體面向市場主體,特別是上海眾多的老字號企業(yè)、文創(chuàng)產(chǎn)業(yè)及商業(yè)地產(chǎn)開發(fā)商。上海擁有豐富的商業(yè)文明遺存,老鳳祥、恒源祥、杏花樓等老字號不僅是企業(yè),更是城市記憶的載體。興業(yè)智能體致力于挖掘《上海工商志》及行業(yè)志中蘊含的商業(yè)文脈價值。通過對企業(yè)創(chuàng)始人社會網(wǎng)絡(luò)、歷代掌門人關(guān)系網(wǎng)以及品牌核心技藝傳承路徑的深度梳理,系統(tǒng)可以自動生成一張具備史學(xué)嚴謹性的品牌基因圖譜。在城市更新與地塊開發(fā)的實際應(yīng)用中,這張圖譜的價值立竿見影:當(dāng)輸入南京路某一街區(qū)時,智能體能迅速還原該地點百年前的商戶布局、經(jīng)營規(guī)模以及品牌更替歷史。這不僅為企業(yè)的品牌敘事提供了確鑿的史料背書,更為商業(yè)地產(chǎn)的業(yè)態(tài)規(guī)劃與文化軟實力賦能提供了不可替代的數(shù)據(jù)資產(chǎn),真正實現(xiàn)了讓紙上的地情變?yōu)橘~上的要素,讓故紙堆變成黃金屋。
教化智能體(Jiaohua-Agent):海派文化全民普及的沉浸式新界面。教化智能體面向廣大市民、中小學(xué)生、游客以及文化愛好者,承擔(dān)著讓歷史活起來、傳下去的社會使命。它的設(shè)計理念是把方志從專家的書桌搬到市民的掌心。依托生成式大模型自然的交互能力與多模態(tài)理解力,可以打造“我在志書中遇見你”的沉浸式文化體驗。市民只需在小程序或智能終端輸入一個地址,或是上傳一張泛黃的老照片,智能體即可利用實體鏈接與空間映射技術(shù),精準挖掘出該地點相關(guān)的歷史記憶。這里曾是哪位先賢的故居?發(fā)生過哪場改變歷史的會議?這里的建筑風(fēng)格有著怎樣的變遷?系統(tǒng)將枯燥的志書條目轉(zhuǎn)化為鮮活的情感敘事,打破方志與大眾之間的認知壁壘。這種從單向灌輸向互動探索的范式變革,將極大提升市民的文化認同感,讓方志文化在潛移默化中滋養(yǎng)心靈。
智能體協(xié)作機制與全流程數(shù)據(jù)閉環(huán)
三大智能體不是孤立的煙囪,而是共享同一個知識底座、協(xié)同響應(yīng)復(fù)雜查詢的有機整體。在知識共享層面,資政智能體提取的地理變遷數(shù)據(jù),可以直接支撐教化智能體的時空科普敘事。在任務(wù)接力層面,當(dāng)一個關(guān)于蘇州河沿岸變遷的復(fù)雜查詢發(fā)起時,興業(yè)智能體將梳理沿岸企業(yè)的產(chǎn)業(yè)更迭,資政智能體分析堤防工程的建設(shè)歷程,最后由教化智能體整合這些信息,輸出一份既有嚴謹數(shù)據(jù)支撐、又具感人敘事溫度的綜合報告。這種分工協(xié)作的機制,確保了系統(tǒng)能夠應(yīng)對全方位、多層次的社會需求,實現(xiàn)方志資源全生命周期的價值閉環(huán)。
五、戰(zhàn)略布局與實施路徑:領(lǐng)航國家文化數(shù)字化新范式
從存史到算史的范式重構(gòu),絕非單純的技術(shù)迭代,而是一場深刻的認知供給側(cè)改革。站在“十五五”規(guī)劃建議的前瞻視角下,上海地方志的數(shù)智化轉(zhuǎn)型已不僅僅是行業(yè)內(nèi)部的升級,而是新質(zhì)生產(chǎn)力在文化領(lǐng)域落地生根的生動寫照。為了確保申知·滬志這一藍圖能夠轉(zhuǎn)化為可落地、可驗收、可支付的上海實景,技術(shù)路線之外,還需要在政策、標準、組織、投入四個維度上進行系統(tǒng)布局。
政策對齊:將地方志打造為新質(zhì)生產(chǎn)力的核心要素
響應(yīng)“十五五”規(guī)劃:重塑文化知識的供給形態(tài)。隨著國家“十五五”規(guī)劃進入關(guān)鍵的布局期,文化遺產(chǎn)的數(shù)字化保護已從物理遷移轉(zhuǎn)向知識要素的深層激活。地方志作為最具備連續(xù)性、權(quán)威性的地情資源,是構(gòu)建中國自主知識體系的關(guān)鍵基石。下一步,上海方志二期工程的意義應(yīng)超越一個城市的范疇——努力成為國家文化數(shù)字化戰(zhàn)略在超大城市落地的先鋒試驗。通過大模型的認知賦能,將把方志資源從傳統(tǒng)的被動查閱轉(zhuǎn)變?yōu)橹鲃庸┙o,這正是新質(zhì)生產(chǎn)力中全要素生產(chǎn)率提升在文化領(lǐng)域的具體表現(xiàn)。申知·滬志大模型所具備的邏輯推理與知識涌現(xiàn)能力,將助力上海在“十五五”期間構(gòu)建起領(lǐng)先的數(shù)字文化資產(chǎn)高地,為城市文化軟實力的質(zhì)變提供底層算力支撐。
賦能數(shù)據(jù)要素×:釋放地情數(shù)據(jù)的乘數(shù)效應(yīng)。在國家數(shù)據(jù)要素×行動計劃的指引下,數(shù)據(jù)已成為與土地、勞動力并列的生產(chǎn)要素。地方志中蘊含的自然地理、產(chǎn)業(yè)興替與人口變遷數(shù)據(jù),是一座尚未開采的數(shù)據(jù)礦藏。我們提出的從存史向算史的躍遷,本質(zhì)上是對方志數(shù)據(jù)進行二次萃取的過程。通過Table-Agent對統(tǒng)計數(shù)據(jù)的結(jié)構(gòu)化還原,將把沉睡的字符轉(zhuǎn)化為可交易、可建模的生產(chǎn)要素。這種轉(zhuǎn)化將使得方志資源在數(shù)字經(jīng)濟、城市治理及文化產(chǎn)業(yè)中釋放出巨大的乘數(shù)效應(yīng)。上海方志不再是故紙堆,而是流淌在城市大腦中的活態(tài)血液。
治理升級:構(gòu)建標準、組織與投入的協(xié)同閉環(huán)
為了確保二期工程在務(wù)實與合規(guī)的前提下高效推進,必須通過制度創(chuàng)新破解長期以來制約方志數(shù)字化發(fā)展的瓶頸。
確立數(shù)據(jù)治理的上海標準,搶占行業(yè)全球話語權(quán)。當(dāng)前,地方志領(lǐng)域普遍面臨有數(shù)據(jù)、無標準的困境。海量語料在不同系統(tǒng)間難以互聯(lián)互通,根源在于缺乏統(tǒng)一的數(shù)據(jù)規(guī)范。上海應(yīng)制定《地方志數(shù)據(jù)要素加工與治理規(guī)范》,建立起一套可復(fù)制、可推廣的行業(yè)標桿。具體而言,應(yīng)建立古今地名GIS映射標準,要求不僅記錄地名的文字演變,更通過時空知識圖譜建立起歷史行政區(qū)劃與現(xiàn)代地理坐標的動態(tài)對應(yīng)規(guī)范,確保上海文脈在數(shù)字空間中具備精準的物理錨點;應(yīng)建立歷史統(tǒng)計表格的結(jié)構(gòu)化還原規(guī)范,針對1949年以后新方志中海量的統(tǒng)計長表,定義統(tǒng)一的元數(shù)據(jù)著錄與數(shù)據(jù)交換格式。通過這一標準,提供一套從掃描件到數(shù)據(jù)庫的標準化流水線。
組建跨界協(xié)同的數(shù)智方志聯(lián)合實驗室。算史任務(wù)跨越歷史學(xué)、計算機科學(xué)與數(shù)據(jù)科學(xué)的學(xué)科邊界,單純依靠行政體制或技術(shù)外包都無法勝任。建議組建由市方志辦牽頭,匯聚高??蒲辛α颗c頭部AI企業(yè)的聯(lián)合實驗室。這種組織形式旨在構(gòu)建一種政產(chǎn)學(xué)研用的鐵三角機制:方志辦作為行政主體,負責(zé)頂層設(shè)計與信史底色的把控;高校團隊負責(zé)VLM、GraphRAG等核心算法的科研攻堅;技術(shù)企業(yè)負責(zé)工程化落地與持續(xù)運維。通過聯(lián)合實驗室,培養(yǎng)出一批既懂志書規(guī)律、又精通AI技術(shù)的復(fù)合型人才,為“十五五”期間的持續(xù)創(chuàng)新儲備核心動能。這不僅是項目的組織保障,更是在文化人工智能領(lǐng)域的人才布局。
確立數(shù)據(jù)治理為重的資源投入機制,重塑資產(chǎn)估值邏輯。數(shù)智化時代的資產(chǎn)邏輯已發(fā)生根本性變革:服務(wù)器隨時間折舊,而高質(zhì)量語料與知識圖譜隨時間增值。在二期工程的經(jīng)費編制中,應(yīng)堅決打破重硬件、輕數(shù)據(jù)的慣性思維。建議在預(yù)算中單列數(shù)據(jù)治理與知識加工費,并明確其占比不低于總投入的40%,重點支持古籍版面語義理解、跨頁表格修復(fù)及領(lǐng)域大模型的強化學(xué)習(xí)。這種投入導(dǎo)向的轉(zhuǎn)變,實際上是將消耗性開支轉(zhuǎn)化為積累性資產(chǎn),確保財政投入能夠沉淀為具有長久生命力的國家數(shù)字化主權(quán)資產(chǎn)。
安全保障:在算法時代堅守信史底線與合規(guī)邊界
在推進數(shù)智化轉(zhuǎn)型的同時,有一條紅線不能觸及:方志的嚴肅性與權(quán)威性,必須高度重視數(shù)據(jù)安全與生成內(nèi)容的合規(guī)性。
建立數(shù)據(jù)分類分級管理體系。根據(jù)方志數(shù)據(jù)的敏感程度,應(yīng)構(gòu)建嚴密的分類分級矩陣。對于已公開的志書年鑒,應(yīng)全量開放以賦能社會;對于編纂過程中的內(nèi)部資料及涉及個人敏感信息的傳記文本,則需建立基于隱私計算機制的保護措施,確保在可用不可見的前提下進行知識挖掘。
強化AIGC(AI生成內(nèi)容)的標注與溯源機制。針對申知·滬志生成的每一項知識,系統(tǒng)必須強制性標注AI輔助生成標識,并提供動態(tài)的史料原始出處鏈接。無出處不生成——這是方志AI區(qū)別于通用聊天機器人的根本底線。這種合規(guī)性設(shè)計,既是對歷史真相的尊重,也是在人工智能時代對方志工作信史傳統(tǒng)的最有力捍衛(wèi)。通過這種機制,確保技術(shù)手段始終服務(wù)于地情研究的初心,為構(gòu)建可信的人文人工智能提供上海方案。
本文作者馬海兵系上海中僑職業(yè)技術(shù)大學(xué)教授、模馭人工智能科技(上海)有限公司首席科學(xué)家;陳暢系上海市地方志辦公室研究室(信息處)副主任(副處長)。原標題為《從存史到算史:生成式人工智能視閾下方志資源數(shù)智化轉(zhuǎn)型的范式重構(gòu)——以上海為例》,有刪減,詳見于《上海地方志》2026年第1期。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




