“數(shù)字質(zhì)檢員”來了“辭文智能知識審校系統(tǒng)”出爐
剛剛,作為國內(nèi)首個融合權威工具書資源的智能審校解決方案的“辭文智能知識審校系統(tǒng)”正式發(fā)布,“辭文”基于《大辭?!窓嗤R庫與百度文心大模型深度融合的創(chuàng)新成果,標志著出版行業(yè)智能化轉(zhuǎn)型邁入新階段。目前,“辭文”可以在10分鐘之內(nèi)完成40萬字文本量的審校,并支持Word/WPS和PDF兩種主流文檔格式,樣品測試數(shù)據(jù)顯示,其錯誤識別準確率達到80%。

“辭文”實現(xiàn)了四大技術突破:精準的知識溯源能力,能讓用戶不僅知道“錯在哪里”,更明白“正確的應該是什么”;強大的多輪推理能力,可深入驗證文本多維度合理性,找出隱藏的邏輯謬誤;動態(tài)的知識更新機制,確保核查結(jié)果緊跟學術發(fā)展前沿;智能的交互式審校流程,既保留人工專業(yè)判斷,又發(fā)揮AI的效率優(yōu)勢。審校工作效率成倍提升,有效解決傳統(tǒng)文本審校在知識性、邏輯性方面的痛點。
上海咬文嚼字文化傳播有限公司總經(jīng)理王敏試用了該審校系統(tǒng)。他拿了一篇文章讓系統(tǒng)審校,該文介紹了元好問的人生經(jīng)歷和文學創(chuàng)作,其中有這樣一句話:“古今癡男女,誰能過情關?語妙天下的‘多情卻被無情惱’也是出自元好問之手?!?/p>
系統(tǒng)顯示::“也是”為“并非”;(原因):根據(jù)權威資料,并未提及“多情卻被無情惱”這句詩出自元好問之手,因此目標文本中的這一說法可能構(gòu)成事實性錯誤。修訂內(nèi)容將這一錯誤說法進行了更正,符合修訂要求。
“辭文”由上海辭書出版社聯(lián)合百度、鯨湯智能科技有限公司歷時兩年研發(fā),深度整合我國標志性大型綜合性辭典《大辭?!分?0多萬詞條的權威知識體系與文心大模型理解、生成、邏輯、記憶四大核心能力。百度 AI 技術生態(tài)副總經(jīng)理周奇表示,依托文心+飛槳的核心技術,百度致力于和硬件伙伴、技術伙伴、數(shù)據(jù)伙伴等共建生態(tài),架起技術和行業(yè)專業(yè)知識的橋梁,打通大模型垂直領域應用的工程化“最后一公里”。上海市出版協(xié)會理事長胡國強認為,出版機構(gòu)要不斷聚集自身的核心資源,融合先進的AI技術,拓展更多的應用場景,以科技之力激活文化資源,以跨界融合推動行業(yè)升級,推動出版業(yè)實現(xiàn)“智能+文化”的雙輪驅(qū)動。
上海世紀出版集團副總裁、上海辭書出版社社長秦志華表示,“辭文”突破以往各類文本審校工具的局限,實現(xiàn)了從“文字糾錯”到“知識審?!钡哪芰缭?,但其價值更在于守護知識傳播的準確性與嚴肅性。據(jù)悉,目前該產(chǎn)品已成功應用于人文社科、科學技術等出版領域的文本審校,他舉例,“我們在某數(shù)字閱讀平臺上選取了一篇8000字的秦始皇主題文本,經(jīng)專業(yè)編輯團隊植入25處精心設計的知識性錯誤,涵蓋歷史事件、人物關系、制度沿革等,使用辭文智能審校系統(tǒng)進行檢測,成功識別 20 處錯誤。使用4家其他審校系統(tǒng),橫向?qū)Ρ葴y試數(shù)據(jù)顯示最高檢出8處,其他3家平均僅能發(fā)現(xiàn)2-3處。辭文還發(fā)現(xiàn)一處文本中原來就存在的錯誤?!┥娇淌褮?,存字四行,每行十二字?,F(xiàn)存山東泰山碧霞?!_的是:‘泰山刻石已殘,存十字,現(xiàn)存山東泰山岱廟。’”未來,“辭文”還將拓展至新聞傳媒、教育科研等場景,致力于成為內(nèi)容生產(chǎn)領域的“數(shù)字質(zhì)檢員”。
據(jù)悉,上海辭書出版社與方正電子、啟裕科技等簽署了合作協(xié)議。
免責聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個人觀點,與本網(wǎng)無關。僅供讀者參考,并請自行核實相關內(nèi)容。




