太平洋科技要聞

首頁 > 科技要聞 > 科技> 正文

清華率先開源AI制藥智能體平臺！生物科研進(jìn)入Autopilot時代

量子位整合編輯：太平洋科技發(fā)布于：2025-03-17 16:37

AI智能體，確實到了爆發(fā)時刻。

不論是因為會炒出圈的Manus，還是后續(xù)一眾迅速跟進(jìn)的OpenManus們……都在印證之前“AI智能體元年”的論斷——背后核心印證的是基礎(chǔ)大模型能力，已經(jīng)到了足夠支撐上層建筑的時候。

無獨有偶，在更加垂直專業(yè)的生命科學(xué)領(lǐng)域，AI智能體也迎來了標(biāo)志性事件。

就在最近，一個名為OpenBioMed的智能體平臺低調(diào)亮相，率先對外開源開放。作為全球首個AI制藥領(lǐng)域的智能體開源平臺，生命科學(xué)領(lǐng)域、制藥領(lǐng)域的研發(fā)人員人人可用。

生命科學(xué)研究，開始進(jìn)入智能體驅(qū)動的新范式時代。

而驅(qū)動OpenBioMed智能體平臺的，是清華智能產(chǎn)業(yè)研究院（AIR）和清華系專注于AI制藥的高精尖創(chuàng)業(yè)公司——水木分子。

以及雖然是新團隊，但核心人物卻是AI老面孔——大牛聶再清，他是水木分子的首席科學(xué)家，也是前天貓精靈背后的首席AI科學(xué)家，一個因為AI騷擾電話不堪其擾而打造“二哈”反騷擾AI的硬核程序員。

現(xiàn)在，他希望通過為制藥研發(fā)人員打造智能體，把AI之力，AI智能體之用，帶入每一個人都是受眾、每一個人都會受益的制藥產(chǎn)業(yè)中。

清華果然是清華，俠之大者果然為國為民。

恰如清華大學(xué)智能科學(xué)講席教授、清華大學(xué)AIR院長張亞勤院士所說，經(jīng)過近四年的發(fā)展，清華大學(xué)AIR已匯聚了一批既懂科研又懂產(chǎn)業(yè)的人工智能領(lǐng)域?qū)W者：

如今，大模型與生成式AI技術(shù)正引領(lǐng)科學(xué)研究進(jìn)入一個全新的人機協(xié)作新范式。生命科學(xué)智能體的出現(xiàn)與廣泛應(yīng)用，將徹底改變科學(xué)發(fā)現(xiàn)的進(jìn)程，大幅提升科研效率。

在這一新范式下，科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述，充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗和直覺。而智能體則通過高通量的文獻(xiàn)閱讀、海量實驗數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行，成為科學(xué)家最得力的助手。這種深度的人機協(xié)作，將推動科學(xué)研究進(jìn)入一個全新的時代。

全球首個生命科學(xué)與制藥智能體開源平臺

名叫OpenBioMed，架構(gòu)如下：

最底層是AI制藥任務(wù)用到的科研數(shù)據(jù)和知識圖譜，中間則是專為生命科學(xué)和制藥打造的垂直大模型和該領(lǐng)域研發(fā)中涉及的核心任務(wù)算法，然后最上層集成了最新最強的基座大語言模型、智能體設(shè)計平臺……

最后可以實現(xiàn)面向場景的定制化應(yīng)用。

流程全自動，效率指數(shù)級提升。

OpenBioMed可以實現(xiàn)什么？實現(xiàn)藥物設(shè)計項目、生命科學(xué)研究項目的Autopilot。

舉個例子，在過去，如果要發(fā)起一項藥物設(shè)計，即便是一份報告生成，可能也需要一位老法師（制藥專家），描述需求后讓一個團隊來配合執(zhí)行。

但如果通過水木分子打造的AI智能體平臺，完全可以Autopilot——老法師發(fā)出議題：針對攜帶KRAS G12C突變的局部晚期或轉(zhuǎn)移性非小細(xì)胞肺癌（NSCLC）患者，設(shè)計新型藥物分子。

接著AI智能體就會調(diào)動大模型展開推理，然后調(diào)用工具并形成工作流。

整個流程完全實現(xiàn)了完全自動化，大模型能力之下，整合了蛋白質(zhì)結(jié)構(gòu)分析、AI分子生成、計算篩選等技術(shù)和工具調(diào)用，形成從靶點分析到候選藥物確定的閉環(huán)設(shè)計報告。

顯而易見，按照Autopilot這樣的節(jié)奏，過往數(shù)周數(shù)月甚至數(shù)年的制藥設(shè)計周期，會被顯著加快。

而且容易忽略的是，由于基座大模型的加持，Autopilot對于老法師的門檻也在降低，即便無法實現(xiàn)“人人都是老法師”，但對于制藥領(lǐng)域的資源依賴降低也大有助益。

以及智能體可以7×24小時工作——未來制藥領(lǐng)域，可能會出現(xiàn)智能體在凌晨3點自主優(yōu)化分子結(jié)構(gòu)的場景。

需要說明的是，Autopilot是水木分子在制藥AI智能體上的最新成果，但不是全部路線。

作為智能雙引擎的另一個，基于旗下ChatDD——AI制藥領(lǐng)域的DeepSeek，水木分子還推出了Copilot模式，主打人類專家的“智能助手”。

在制藥領(lǐng)域，類似設(shè)計報告一樣的工作已經(jīng)是非常成熟、標(biāo)準(zhǔn)化的任務(wù)，或者在某些特定領(lǐng)域中，智能體當(dāng)前的能力已經(jīng)足夠強大，可以達(dá)到人類專家的水平，Autopilot作為全流程自動化執(zhí)行角色，可以大大縮短研發(fā)周期。

而在需要高度專業(yè)知識和經(jīng)驗的任務(wù)中，把關(guān)者和決策者就必須是人類專家。

所以有了Copilot模式，就可以實現(xiàn)智能體與人類專家共同協(xié)作，智能體提供輔助支持，但最終決策權(quán)在人類專家手中。

具體如針對難成藥靶點3D構(gòu)象生成、藥物篩選等任務(wù)，Autopilot來執(zhí)行；AI靶點挖掘、驗證實驗方案優(yōu)化，則由Copilot來實現(xiàn)。

Autopilot和Copilot被水木分子視為生物醫(yī)藥的智能雙引擎，二者配合之下，可以顯著縮短研發(fā)周期，降低系統(tǒng)誤差，從而實現(xiàn)藥物研發(fā)成本的下降。

當(dāng)然，Autopilot和Copilot只是生命科學(xué)領(lǐng)域研發(fā)的最新進(jìn)展，是行業(yè)智能體落地應(yīng)用的表現(xiàn)。

在水木分子的設(shè)計中，完整的制藥研發(fā)新范式，由三部分構(gòu)成——

通用大模型底座+行業(yè)大模型+行業(yè)智能體。

三位一體，缺一不可。

一個時代有一個時代的制藥研發(fā)范式

大模型為核心技術(shù)的制藥研發(fā)范式，被水木分子命名為ChatDD，Chat Drug Design——對話式藥物設(shè)計。

ChatDD將專家的認(rèn)知和大模型的知識連接起來，通過人機協(xié)作對話式的方式進(jìn)行藥物研發(fā)。這一模式不僅重新定義了藥物研發(fā)，還通過藥物研發(fā)AI智能體（Copilot / Autopilot）實現(xiàn)了更高的靈活性和效率。

而在此之前，連點成線回溯，人類的制藥研發(fā)大致歷經(jīng)了三大階段：

第一代：TMDD——傳統(tǒng)手工藥物設(shè)計。

在遠(yuǎn)古時代至19世紀(jì)末，藥物設(shè)計主要依賴傳統(tǒng)手工方法（TMDD，Traditional Manual Drug Design）�？茖W(xué)家通過手工合成、提取和篩選藥物，基于大量試驗和經(jīng)驗進(jìn)行探索。然而，這種方法存在低通量、缺乏系統(tǒng)性、耗時長和成本高等局限性。

第二代：CADD——計算機輔助藥物設(shè)計。

20世紀(jì)中葉，計算機技術(shù)的興起帶來了計算機輔助藥物設(shè)計（CADD，Computer-Aided Drug Design）。CADD通過計算機技術(shù)加速藥物發(fā)現(xiàn)和設(shè)計過程，具有高通量篩選和工具屬性強的特點，但仍依賴研究人員的經(jīng)驗和直覺。

第三代：AIDD——人工智能藥物設(shè)計。

21世紀(jì)初，人工智能技術(shù)的發(fā)展推動了人工智能藥物設(shè)計（AIDD，AI Drug Design）。AIDD具有超高通量和流程化的特點，能夠從大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)中挖掘藥物發(fā)現(xiàn)和設(shè)計的規(guī)律。然而，AIDD缺乏模型與專家的交互，且對大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)的依賴成為瓶頸。

在第四代制藥范式中，科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述，充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗和直覺。

而智能體則通過高通量的文獻(xiàn)閱讀、海量實驗數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行，成為科學(xué)家最得力的助手。

按照水木分子的架構(gòu)圖譜，最底層是“知識”，上面是大模型和工具，再往上就是智能體，通過調(diào)用大模型能力，完成立項決策、臨床前藥物發(fā)現(xiàn)、藥物開發(fā)、臨床試驗以及其他企業(yè)私有任務(wù)的部署。

但即便架構(gòu)圖譜清晰，路徑明確，智能體要真正成為第四代制藥范式的主角，就需要解決最核心的行業(yè)痛點——打通兩大模態(tài)。

一個模態(tài)是文本模態(tài)，或者可以稱為自然語言模態(tài)，是通用大模型底座。

另一個模態(tài)則是生物模態(tài)，以生物數(shù)據(jù)為“語言”，是行業(yè)大模型基礎(chǔ)。

類比來說，兩個模態(tài)很像目前基礎(chǔ)大模型領(lǐng)域文本和圖像兩個模態(tài)，文生圖和圖生文如果要相互轉(zhuǎn)換，就需要“跨模態(tài)翻譯”，或者說對齊。

于是在生物數(shù)據(jù)大模型層面，水木分子打造了PharMolixFM。

它采用全原子建模的方式，把小分子、肽、蛋白質(zhì)、DNA、RNA和離子等結(jié)構(gòu)生物學(xué)研究對象的基本單元，實現(xiàn)了多尺度統(tǒng)一。

其次又把蛋白質(zhì)折疊、蛋白質(zhì)序列與結(jié)構(gòu)設(shè)計、大小分子對接、基于靶點的分子生成等多任務(wù)統(tǒng)一。

最終完成了全原子基礎(chǔ)大模型PharMolixFM。

該模型在多個關(guān)鍵任務(wù)上也實現(xiàn)了SOTA，包括分子對接任務(wù)、基于靶點結(jié)構(gòu)的藥物設(shè)計任務(wù)等，都在對應(yīng)的行業(yè)基準(zhǔn)測試數(shù)據(jù)集，創(chuàng)造了性能新紀(jì)錄。

并且為了把分子結(jié)構(gòu)翻譯為化學(xué)家可理解且機器可利用的文本，水木分子還打造了“圖生文”工具OCSU。

在通用大模型層面，基于最新DeepSeek-R1帶來的推理技術(shù)，站在行業(yè)巨人肩膀上，水木分子與清華AIR聯(lián)手推出了升級版的生物醫(yī)藥多模態(tài)開源基礎(chǔ)大模型BioMedGPT-R1，把強推理慢思考的范式，帶到了醫(yī)藥研發(fā)領(lǐng)域。

效果也非常顯著，不僅以67.1%的正確率通過了USMLE美國醫(yī)師資格考試，還在CheBI-20化學(xué)分子理解任務(wù)中，實現(xiàn)了15%的性能提升，進(jìn)一步提高了由BioMedGPT-10B創(chuàng)造的最好成績。

而這一系列技術(shù)能力和工具，被封裝集成，然后在智能體平臺OpenBioMed實現(xiàn)了All in One。

更難能可貴的是，作為全球首個該領(lǐng)域的智能體平臺，OpenBioMed發(fā)布即開源，或者說為開源而生——OpenBioMed站在了開源基礎(chǔ)大模型、開源生命科學(xué)成果的基礎(chǔ)上，然后也通過開源的方式，進(jìn)一步把智能火炬?zhèn)鬟f更深入、更廣泛。

匯集眾智，賦予眾人。

在制藥或者更廣泛的生命科學(xué)研發(fā)領(lǐng)域，如果最好的資源能無差別覆蓋到更多研發(fā)者，或許會讓整個領(lǐng)域的推進(jìn)更快更高效，一旦生物醫(yī)藥領(lǐng)域進(jìn)入了涌現(xiàn)期，商業(yè)價值和社會價值，無疑會輻射到每一個人。

但依然有問題懸而未決，作為水木分子首席科學(xué)家，聶再清不只一次被問及這個問題——

會有AI獨立制藥的一天嗎？

“AI在制藥領(lǐng)域必須是助手”

“AI在制藥領(lǐng)域，必須是助手。”

這就是水木分子首席科學(xué)家聶再清的回答。實際上，作為科學(xué)家、AI領(lǐng)域的大牛，聶再清很少有如此絕對的論斷，但這一次他無比肯定，他補充說，從價值觀上就需要明確AI的“助手”設(shè)定。

這也是AI在深入生命科學(xué)等前沿領(lǐng)域之時，常被人討論的話題。

一方面，AI的能力正在不斷突破人類的極限，或許用不了多久，AI就會獨立發(fā)現(xiàn)新規(guī)律、新材料、新方法，人類已經(jīng)不再是最聰明的那一個；另一方面，生命醫(yī)藥領(lǐng)域關(guān)系的是人類最基本最脆弱的身體健康……

有一派的觀點是需要最大化助力AI的發(fā)展，包括在“獨立”問題上，因為只有如此才能打造出真正強大的AI模型和系統(tǒng)，如果硅基正在覺醒，那碳基讓出統(tǒng)治權(quán)也是歷史發(fā)展的必然選擇。

但另一派不這樣認(rèn)為，他們堅守的依然是“以人為本”的原則和信條，AI需要為人所用、幫助人向善，并且從一開始設(shè)計的時候就要確保其安全性。

很顯然，聶再清選擇站在以人為本這一邊。

他本科碩士都畢業(yè)于清華大學(xué)計算機系，博士師從美國人工智能學(xué)會前主席Subbarao Kambhampati教授，先后在微軟、阿里巴巴達(dá)摩院從事AI技術(shù)研發(fā)，是能力、資歷和影響力兼具的AI大牛，帶隊獲得過中國AI領(lǐng)域的最高獎項吳文俊人工智能科技進(jìn)步獎。

2020年開始，他獲得張亞勤院士感召，加入清華大學(xué)AIR智能產(chǎn)業(yè)研究院，擔(dān)任清華大學(xué)國強教授、清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員，并以水木分子首席科學(xué)家身份對外亮相。

但聶再清自己來說，他覺得自己始終在做的事情只有一件——

智能助手。

他說從微軟亞洲研究院開始，做的其實就是“助手”相關(guān)的工作，比爾蓋茨對智能助手“Personal Assistant”情有獨鐘，希望打造出一套人機交互里的完美助手。

后來去阿里巴巴達(dá)摩院，負(fù)責(zé)的天貓精靈，更是直接的AI助手，只不過交互方式更偏向于語音。

現(xiàn)在在清華大學(xué)智能產(chǎn)業(yè)研究院，“AI助手”也是其主軸，水木分子所做的事情，只不過是把“助手”放在了AI與生命科學(xué)兩大前沿的交叉創(chuàng)新地帶。

即便Agent智能體的定義業(yè)內(nèi)還沒有清晰的共識，但聶再清看來，AI智能體就是AI助手的另一種表述——更時髦流行的表述而已。

水木分子為生物制藥領(lǐng)域的研發(fā)人員提供Autopilot和Copilot兩種智能體可選模式。

OpenBioMed是由清華AIR和水木分子共同推出的全球首個生命科學(xué)與制藥智能體開源平臺，可以開源供業(yè)界開發(fā)生物醫(yī)藥智能體。

ChatDD是水木分子的商用平臺和產(chǎn)品，通過Copilot助手和AutoPilot智能體兩種模式，支持多種醫(yī)藥行業(yè)和企業(yè)的藥研任務(wù)，場景包括例如: 立項、藥物設(shè)計和分析報告生成等。

二者放在一起，組成的就是生物醫(yī)藥的智能雙引擎，可以幫助更多科學(xué)家接近他們曾經(jīng)在科幻里才能接近的向往——

之前有個統(tǒng)計說，讓科學(xué)家選擇想成為的超級英雄，最后被選擇最多的角色是：鋼鐵俠。以為他以凡人之軀，借助科技之力比肩神明，打造AI助手發(fā)現(xiàn)了新元素、新材料、完成了時空穿越的模型驗證。