圖說(shuō):白玉蘭科學(xué)大模型 來(lái)源/采訪(fǎng)對(duì)象供圖
人工智能在前沿科學(xué)領(lǐng)域已經(jīng)取得了一系列顛覆性成果,新的科學(xué)研究范式正在形成。昨日(8日)記者從上海交通大學(xué)獲悉,為推進(jìn)面向重大科學(xué)問(wèn)題的人工智能模型和算法創(chuàng)新,構(gòu)建以人工智能支撐基礎(chǔ)和前沿科學(xué)研究的新模式,上海交大研制“白玉蘭科學(xué)大模型1.0版”, 依托上海白玉蘭開(kāi)源開(kāi)放研究院正式開(kāi)源發(fā)布。
(資料圖)
“白玉蘭科學(xué)大模型1.0版”包括化學(xué)合成(BAI-Chem)、神經(jīng)流體(BAI-NeuroFluid)和科學(xué)評(píng)測(cè)基準(zhǔn)(BAI-SciEval)三個(gè)領(lǐng)域模型,分別代表以分子結(jié)構(gòu)為中心、以動(dòng)力學(xué)為中心的學(xué)科方向,及跨學(xué)科、跨模態(tài)的基礎(chǔ)模型。
化學(xué)合成(BAI-Chem)依托大模型訓(xùn)練技術(shù),利用生成式人工智能技術(shù)賦能化學(xué)合成研究,是首個(gè)具備反應(yīng)條件生成與“人在環(huán)路”反饋優(yōu)化能力的化學(xué)大模型。加速?gòu)姆肿釉O(shè)計(jì)、反應(yīng)設(shè)計(jì)、到條件生成、反應(yīng)檢驗(yàn)等化學(xué)合成全鏈條,潛在功能性分子(如藥物分子)及其合成方案設(shè)計(jì),從傳統(tǒng)方法的幾個(gè)月提速到幾十分鐘。
以抗HIV小分子設(shè)計(jì)為例,BAI-Chem能夠在2分鐘內(nèi)生成超過(guò)250,000個(gè)全新的分子;并在30分鐘內(nèi)進(jìn)一步篩選出172個(gè)潛在有效的分子,同時(shí)提供合成路線(xiàn)以及相應(yīng)的反應(yīng)條件;最終在5秒內(nèi)進(jìn)行驗(yàn)證,進(jìn)一步篩選出23個(gè)可合成的潛在分子,大幅提升分子設(shè)計(jì)迭代效率。
同時(shí),BAI-Chem平臺(tái)破除了傳統(tǒng)頁(yè)面交互的壁壘,提供化學(xué)聊天機(jī)器人和化學(xué)合成助手,支持用戶(hù)以自然語(yǔ)言的方式進(jìn)行交互,以便捷的溝通方式,能夠基于用戶(hù)給定的目標(biāo)分子一次性提供生成式合成方案和檢索式合成方案。
神經(jīng)流體(BAI-NeuroFluid)創(chuàng)建了視覺(jué)直覺(jué)學(xué)習(xí)框架,將物理啟發(fā)的生成式人工智能技術(shù)用于流體粒子模型的計(jì)算與模擬,首次實(shí)現(xiàn)了從外部視覺(jué)表觀(guān)推理內(nèi)部流體動(dòng)態(tài),并可反演粘度、密度等流體屬性,形成了“規(guī)律—仿真—觀(guān)測(cè)”空間的閉環(huán)。
同時(shí)支持跨流體屬性、跨空間尺度、跨邊界條件的大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練與推理,可以捕捉具有高泛化性的流體規(guī)律,在問(wèn)題規(guī)模、模擬速度、模型泛化性、反問(wèn)題求解精度等多個(gè)方面突破了現(xiàn)有流體數(shù)值模擬方法的計(jì)算瓶頸,十萬(wàn)粒子場(chǎng)景的模擬速度比現(xiàn)有流體仿真軟件提升一個(gè)量級(jí)。
上海交通大學(xué)人工智能研究院楊小康教授團(tuán)隊(duì)于2022年提出“神經(jīng)流體”方法(NeuroFluid),他說(shuō)道:“生成式人工智能拓展形成的仿真空間可以覆蓋傳統(tǒng)的計(jì)算機(jī)模擬方法‘仿而不真’的現(xiàn)象,允許科學(xué)家根據(jù)實(shí)際觀(guān)測(cè)數(shù)據(jù)反演仿真空間中的狀態(tài)‘后驗(yàn)信息’,通過(guò)與仿真得到的‘先驗(yàn)信息’進(jìn)行比對(duì),對(duì)已有的科學(xué)規(guī)律進(jìn)行修正,甚至通過(guò)拓展假設(shè)空間,發(fā)現(xiàn)新的科學(xué)現(xiàn)象?!?/p>
評(píng)測(cè)基準(zhǔn)(SciEval)模型的面向基礎(chǔ)科學(xué)領(lǐng)域構(gòu)建了首個(gè)包含動(dòng)態(tài)數(shù)據(jù)的評(píng)測(cè)基準(zhǔn),旨在全面評(píng)估大模型的科學(xué)知識(shí)掌握水平和輔助科研能力,涵蓋約18000道具有挑戰(zhàn)性的科學(xué)問(wèn)題,涉及化學(xué)、物理和生物三大基礎(chǔ)科學(xué)領(lǐng)域及其數(shù)十種子領(lǐng)域,以布魯姆“記憶-理解-應(yīng)用-分析-評(píng)價(jià)-創(chuàng)造”六大認(rèn)知層級(jí)為參考,從基礎(chǔ)知識(shí)、知識(shí)應(yīng)用、科學(xué)計(jì)算和科研能力四方面多層級(jí)全方位評(píng)估語(yǔ)言大模型的科學(xué)研究能力。評(píng)測(cè)方法采用了以客觀(guān)題為主、主觀(guān)題為輔的方式,旨在全面考察模型的科學(xué)思維和應(yīng)用能力。同時(shí),BAI-SciEval包含了部分基于基本科學(xué)原理動(dòng)態(tài)生成的評(píng)測(cè)數(shù)據(jù),以降低數(shù)據(jù)泄露風(fēng)險(xiǎn),保證評(píng)估結(jié)果的公正性和可信度。
新民晚報(bào)記者 易蓉
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來(lái)源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類(lèi)稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁(yè)面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過(guò)本網(wǎng)站證實(shí),不對(duì)您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。