科技日報南京1月13日電 (記者金鳳)13日,記者從南京農(nóng)業(yè)大學獲悉,該校主導研發(fā)出國內(nèi)首個面向通用農(nóng)業(yè)領(lǐng)域的開源垂直大語言模型“司農(nóng)”。
據(jù)悉,研究團隊依托南京農(nóng)業(yè)大學學科優(yōu)勢,收集了包括動物科學、農(nóng)業(yè)經(jīng)濟管理、農(nóng)業(yè)資源與環(huán)境、園藝學、智慧農(nóng)業(yè)、動物醫(yī)學、植物保護、作物育種等學科數(shù)據(jù),涵蓋了近9000冊書籍、24萬余篇學術(shù)論文和近2萬份政策、標準,構(gòu)建了體系相對完整的農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)集。
針對大語言模型在專業(yè)領(lǐng)域應(yīng)用中常見的“幻覺問題”和知識滯后性,團隊在模型訓練階段,除微調(diào)傳統(tǒng)指令外,還引入了思維鏈和上下文參考等多維訓練數(shù)據(jù),顯著提升了模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。
針對文獻知識利用效率問題,研究團隊推出多智能體檢索增強框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準調(diào)用專業(yè)知識,保障了生成內(nèi)容的準確性與時效性。
(責任編輯:蔡文斌)