嶺南文化大模型工具箱“上新”!讓沉睡的文化資源“活”在當下
當古老的文化載體遇見年輕的技術手段,會碰撞出什么火花?5月22日,第21屆文博會開幕,羊城晚報報業(yè)集團精心打造的嶺南文化大模型揭開神秘面紗,吸引不少觀眾互動體驗。
記者從現(xiàn)場獲悉,作為國內首個文化領域的多模態(tài)推理大模型,嶺南文化大模型繼發(fā)布14B、32B版本及其創(chuàng)新智能體應用后,再次迎來重大突破,推出AI-Ready Data助手系列首個工具箱應用——“PDF結構化提取助手”,直擊文化資源數(shù)字化過程中的數(shù)據(jù)治理痛點。
這一工具鏈的完善,兼具文化資源“搶救式修復”和“創(chuàng)造性轉化”的雙重作用。
該應用將改變以往傳統(tǒng)典籍、年鑒報告、歷史檔案等文化資源缺少保護或被束之高閣的情況,也讓嶺南文化大模型能夠進一步“讀懂”和建立嶺南文化知識圖譜,致力于讓沉睡的文化資源真正“活”在當下、煥發(fā)新生。
面向文化和科技融合的未來,嶺南文化大模型已堅定喊出“ready”。

文化典籍和檔案都能無障礙“讀懂”
當前,我國雖然擁有極為豐富的文化資源,但普遍面臨數(shù)字化率低、應用范圍受限等問題。作為嶺南文化的重要發(fā)祥地,廣東擁有豐富的非遺資源,但文化數(shù)字化資源呈碎片化,限制了文化資源數(shù)據(jù)的流動共享、產(chǎn)業(yè)鏈的協(xié)同合作。
以古籍為例,其數(shù)字化進展十分緩慢。我國從20世紀80年代就開始嘗試古籍數(shù)字化,但受技術、資金等因素限制,海量文獻中實現(xiàn)數(shù)字化的不超過八萬種,而且許多書只是完成了初步的影像掃描,真正實現(xiàn)文本數(shù)字化的不足四萬種。
其中的重要原因是,傳統(tǒng)典籍、年鑒報告、歷史檔案等文化資源多以非結構化格式存在,其版式復雜、圖文混排、元數(shù)據(jù)缺失等特點,成為數(shù)字化道路上的“攔路虎”。
文化資源的數(shù)字化,嚴謹準確是基本要求。
嶺南文化大模型實驗室主任鄧立邦表示:“面對海量的嶺南地方志、非遺名錄和學術論文,傳統(tǒng)的人工錄入和排版耗時且易出錯,‘PDF結構化提取助手’能夠在數(shù)分鐘內完成批量文檔的標準化轉化,并結合知識庫進行事實性校驗,確保抽取內容的準確性和完整性。”
基于嶺南文化大模型的知識圖譜,還能為提取內容添加語義標簽,并結合知識庫進行事實性校驗,確保抽取內容的準確性和完整性,構建可檢索的數(shù)字資產(chǎn)庫。
深耕嶺南文化68載,羊城晚報立足文化強省建設,以“文史”“文脈”品牌為抓手,持續(xù)加大優(yōu)質文化內容供給。隨著這一工具的應用,筆尖力量將化為數(shù)字動能,讓見諸報端的文字、照片“活”起來,成為嶺南文化大模型理解和傳播嶺南文化的數(shù)字養(yǎng)料。
AI數(shù)智化工具包助推“政策包”落地
在AI驅動產(chǎn)業(yè)變革的今天,數(shù)據(jù)就緒度成為制約文化領域智能化轉型的關鍵。
Fivetran發(fā)布的一項最新研究指出,80%的AI項目失敗源于數(shù)據(jù)準備不足,而文化資源因其非結構化特性,數(shù)據(jù)治理難度更高。
嶺南文化大模型此次推出的AI-Ready Data助手系列,正是對這一痛點的精準回應。通過“PDF結構化提取助手”等工具,大模型能將散落的文化資源轉化為AI及大模型可理解的“標準語言”,為后續(xù)的智能解析、知識圖譜構建、創(chuàng)意生成等環(huán)節(jié)奠定基礎。
例如,該工具可廣泛適用于政府基層數(shù)據(jù)普查與檔案數(shù)字化整理,也可服務于科研機構的大規(guī)模文獻匯總和數(shù)據(jù)驅動分析。
這一工具鏈的意義還不止于此,能推動嶺南文化資源從“靜態(tài)保存”向“活態(tài)傳承”轉變。當結構化數(shù)據(jù)與大模型的多模態(tài)能力結合,普通人可通過自然語言與文化資源互動,讓典籍檔案的墨香古韻、鑊耳屋的磚瓦風情、粵劇水袖的飄逸靈動,在數(shù)字世界中煥發(fā)新生。
5月22日,第二十一屆文博會開幕首日,廣東重磅發(fā)布推動文化產(chǎn)業(yè)高質量發(fā)展“政策包”,提出一攬子87條政策措施,覆蓋影視、演藝市場、動漫影視、網(wǎng)絡游戲、電子競技、網(wǎng)絡視聽六大領域,全力激活廣東文化產(chǎn)業(yè)市場潛力、投資熱力。
當前,文化和科技融合潮流已勢不可擋,AI更是其中最為關鍵的因素。
作為廣東實施“人工智能+文化”行動的新基建,嶺南文化大模型此次推出的“AI-Ready Data助手”系列工具鏈應用,形成配合“政策包”落地的數(shù)智化工具包,將助力廣東文化產(chǎn)業(yè)加快與AI深度融合,推動嶺南文化傳承創(chuàng)新。
免責聲明:此文內容為本網(wǎng)站轉載企業(yè)宣傳資訊,僅代表作者個人觀點,與本網(wǎng)無關。僅供讀者參考,并請自行核實相關內容。




