中新網北京11月1日電 (記者 孫自法)記者11月1日從中國科學院自動化研究所(自動化所)獲悉,該所“AI+科學”研究團隊近日正式推出新一代科學文獻解析工具——磐石·科學文獻解析器,為全球科研工作者提供真正“懂科學”的智能解析引擎。
目前,磐石·科學文獻解析器1.0版已正式開源,并作為核心組件集成于中國科學院自動化所“磐石·科學基礎大模型”(ScienceOne),服務全球科研社區。下一步,研究團隊將持續拓展其對多模態科學內容的解析能力,并推動構建開放、協作的科學智能生態。
“AI+科學”研究團隊推出磐石·科學文獻解析器。中國科學院自動化所 供圖研究團隊介紹說,磐石·科學文獻解析器從底層算法出發,通過構建面向科學語義理解的多模態訓練體系與強化學習機制,在公式、文本、圖表等多元素協同解析上實現質的飛躍,為全球科研工作者提供真正“懂科學”的智能解析引擎。
在磐石·科學文獻解析器研發過程中,團隊摒棄僅依賴通用視覺語言大模型的思路,轉而構建一套專為科學文獻場景量身定制的算法訓練范式。其核心在于三大技術支柱:全場景覆蓋的科學數據構建、多模態監督微調策略,以及面向科學文獻語義的強化學習優化機制。
在數據層面,系統性采集并構建覆蓋手寫體、數字排版體與紙質掃描體三大典型科學書寫形態的訓練語料,這一“全形態、多學科、高質量”的數據基礎,為模型理解科學表達的復雜性提供了堅實支撐。
模型訓練階段采用兩階段優化策略:首先通過多模態有監督微調,使模型初步掌握文本、公式、表格、插圖等異構元素的聯合表征能力。在此基礎上,引入一種面向科學文獻語義的梯度強化學習策略優化框架,實現模型不僅“看得清”,更能“理解對”。
為更好滿足科研需求,磐石·科學文獻解析器的輸出不僅包含高精度的文本與公式識別結果,還支持多種結構化格式輸出,可無縫對接知識抽取、文獻重排版、智能問答等下游應用。
研究團隊表示,對多個科學文獻數據集開展系統評測的結果顯示,磐石·科學文獻解析器在篇章級解析、公式專項識別等任務中均展現出國際領先水平。(完)