AI智能體,確實到了爆發(fā)時刻。 不論是因為會炒出圈的Manus,還是后續(xù)一眾迅速跟進(jìn)的OpenManus們……都在印證之前“AI智能體元年”的論斷——背后核心印證的是基礎(chǔ)大模型能力,已經(jīng)到了足夠支撐上層建筑的時候。 無獨有偶,在更加垂直專業(yè)的生命科學(xué)領(lǐng)域,AI智能體也迎來了標(biāo)志性事件。 就在最近,一個名為OpenBioMed的智能體平臺低調(diào)亮相,率先對外開源開放。作為全球首個AI制藥領(lǐng)域的智能體開源平臺,生命科學(xué)領(lǐng)域、制藥領(lǐng)域的研發(fā)人員人人可用。 生命科學(xué)研究,開始進(jìn)入智能體驅(qū)動的新范式時代。 而驅(qū)動OpenBioMed智能體平臺的,是清華智能產(chǎn)業(yè)研究院(AIR)和清華系專注于AI制藥的高精尖創(chuàng)業(yè)公司——水木分子。 以及雖然是新團隊,但核心人物卻是AI老面孔——大牛聶再清,他是水木分子的首席科學(xué)家,也是前天貓精靈背后的首席AI科學(xué)家,一個因為AI騷擾電話不堪其擾而打造“二哈”反騷擾AI的硬核程序員。 現(xiàn)在,他希望通過為制藥研發(fā)人員打造智能體,把AI之力,AI智能體之用,帶入每一個人都是受眾、每一個人都會受益的制藥產(chǎn)業(yè)中。 清華果然是清華,俠之大者果然為國為民。 恰如清華大學(xué)智能科學(xué)講席教授、清華大學(xué)AIR院長張亞勤院士所說,經(jīng)過近四年的發(fā)展,清華大學(xué)AIR已匯聚了一批既懂科研又懂產(chǎn)業(yè)的人工智能領(lǐng)域?qū)W者: 如今,大模型與生成式AI技術(shù)正引領(lǐng)科學(xué)研究進(jìn)入一個全新的人機協(xié)作新范式。生命科學(xué)智能體的出現(xiàn)與廣泛應(yīng)用,將徹底改變科學(xué)發(fā)現(xiàn)的進(jìn)程,大幅提升科研效率。 在這一新范式下,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗和直覺。而智能體則通過高通量的文獻(xiàn)閱讀、海量實驗數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。這種深度的人機協(xié)作,將推動科學(xué)研究進(jìn)入一個全新的時代。 全球首個生命科學(xué)與制藥智能體開源平臺 名叫OpenBioMed,架構(gòu)如下: 最底層是AI制藥任務(wù)用到的科研數(shù)據(jù)和知識圖譜,中間則是專為生命科學(xué)和制藥打造的垂直大模型和該領(lǐng)域研發(fā)中涉及的核心任務(wù)算法,然后最上層集成了最新最強的基座大語言模型、智能體設(shè)計平臺…… 最后可以實現(xiàn)面向場景的定制化應(yīng)用。 流程全自動,效率指數(shù)級提升。 OpenBioMed可以實現(xiàn)什么?實現(xiàn)藥物設(shè)計項目、生命科學(xué)研究項目的Autopilot。 舉個例子,在過去,如果要發(fā)起一項藥物設(shè)計,即便是一份報告生成,可能也需要一位老法師(制藥專家),描述需求后讓一個團隊來配合執(zhí)行。 但如果通過水木分子打造的AI智能體平臺,完全可以Autopilot——老法師發(fā)出議題:針對攜帶KRAS G12C突變的局部晚期或轉(zhuǎn)移性非小細(xì)胞肺癌(NSCLC)患者,設(shè)計新型藥物分子。 接著AI智能體就會調(diào)動大模型展開推理,然后調(diào)用工具并形成工作流。 整個流程完全實現(xiàn)了完全自動化,大模型能力之下,整合了蛋白質(zhì)結(jié)構(gòu)分析、AI分子生成、計算篩選等技術(shù)和工具調(diào)用,形成從靶點分析到候選藥物確定的閉環(huán)設(shè)計報告。 顯而易見,按照Autopilot這樣的節(jié)奏,過往數(shù)周數(shù)月甚至數(shù)年的制藥設(shè)計周期,會被顯著加快。 而且容易忽略的是,由于基座大模型的加持,Autopilot對于老法師的門檻也在降低,即便無法實現(xiàn)“人人都是老法師”,但對于制藥領(lǐng)域的資源依賴降低也大有助益。 以及智能體可以7×24小時工作——未來制藥領(lǐng)域,可能會出現(xiàn)智能體在凌晨3點自主優(yōu)化分子結(jié)構(gòu)的場景。 需要說明的是,Autopilot是水木分子在制藥AI智能體上的最新成果,但不是全部路線。 作為智能雙引擎的另一個,基于旗下ChatDD——AI制藥領(lǐng)域的DeepSeek,水木分子還推出了Copilot模式,主打人類專家的“智能助手”。 在制藥領(lǐng)域,類似設(shè)計報告一樣的工作已經(jīng)是非常成熟、標(biāo)準(zhǔn)化的任務(wù),或者在某些特定領(lǐng)域中,智能體當(dāng)前的能力已經(jīng)足夠強大,可以達(dá)到人類專家的水平,Autopilot作為全流程自動化執(zhí)行角色,可以大大縮短研發(fā)周期。 而在需要高度專業(yè)知識和經(jīng)驗的任務(wù)中,把關(guān)者和決策者就必須是人類專家。 所以有了Copilot模式,就可以實現(xiàn)智能體與人類專家共同協(xié)作,智能體提供輔助支持,但最終決策權(quán)在人類專家手中。 具體如針對難成藥靶點3D構(gòu)象生成、藥物篩選等任務(wù),Autopilot來執(zhí)行;AI靶點挖掘、驗證實驗方案優(yōu)化,則由Copilot來實現(xiàn)。 Autopilot和Copilot被水木分子視為生物醫(yī)藥的智能雙引擎,二者配合之下,可以顯著縮短研發(fā)周期,降低系統(tǒng)誤差,從而實現(xiàn)藥物研發(fā)成本的下降。 當(dāng)然,Autopilot和Copilot只是生命科學(xué)領(lǐng)域研發(fā)的最新進(jìn)展,是行業(yè)智能體落地應(yīng)用的表現(xiàn)。 在水木分子的設(shè)計中,完整的制藥研發(fā)新范式,由三部分構(gòu)成—— 通用大模型底座+行業(yè)大模型+行業(yè)智能體。 三位一體,缺一不可。 一個時代有一個時代的制藥研發(fā)范式 大模型為核心技術(shù)的制藥研發(fā)范式,被水木分子命名為ChatDD,Chat Drug Design——對話式藥物設(shè)計。 ChatDD將專家的認(rèn)知和大模型的知識連接起來,通過人機協(xié)作對話式的方式進(jìn)行藥物研發(fā)。這一模式不僅重新定義了藥物研發(fā),還通過藥物研發(fā)AI智能體(Copilot / Autopilot)實現(xiàn)了更高的靈活性和效率。 而在此之前,連點成線回溯,人類的制藥研發(fā)大致歷經(jīng)了三大階段: 第一代:TMDD——傳統(tǒng)手工藥物設(shè)計。 在遠(yuǎn)古時代至19世紀(jì)末,藥物設(shè)計主要依賴傳統(tǒng)手工方法(TMDD,Traditional Manual Drug Design)?茖W(xué)家通過手工合成、提取和篩選藥物,基于大量試驗和經(jīng)驗進(jìn)行探索。然而,這種方法存在低通量、缺乏系統(tǒng)性、耗時長和成本高等局限性。 第二代:CADD——計算機輔助藥物設(shè)計。 20世紀(jì)中葉,計算機技術(shù)的興起帶來了計算機輔助藥物設(shè)計(CADD,Computer-Aided Drug Design)。CADD通過計算機技術(shù)加速藥物發(fā)現(xiàn)和設(shè)計過程,具有高通量篩選和工具屬性強的特點,但仍依賴研究人員的經(jīng)驗和直覺。 第三代:AIDD——人工智能藥物設(shè)計。 21世紀(jì)初,人工智能技術(shù)的發(fā)展推動了人工智能藥物設(shè)計(AIDD,AI Drug Design)。AIDD具有超高通量和流程化的特點,能夠從大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)中挖掘藥物發(fā)現(xiàn)和設(shè)計的規(guī)律。然而,AIDD缺乏模型與專家的交互,且對大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)的依賴成為瓶頸。 在第四代制藥范式中,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗和直覺。 而智能體則通過高通量的文獻(xiàn)閱讀、海量實驗數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。 按照水木分子的架構(gòu)圖譜,最底層是“知識”,上面是大模型和工具,再往上就是智能體,通過調(diào)用大模型能力,完成立項決策、臨床前藥物發(fā)現(xiàn)、藥物開發(fā)、臨床試驗以及其他企業(yè)私有任務(wù)的部署。 但即便架構(gòu)圖譜清晰,路徑明確,智能體要真正成為第四代制藥范式的主角,就需要解決最核心的行業(yè)痛點——打通兩大模態(tài)。 一個模態(tài)是文本模態(tài),或者可以稱為自然語言模態(tài),是通用大模型底座。 另一個模態(tài)則是生物模態(tài),以生物數(shù)據(jù)為“語言”,是行業(yè)大模型基礎(chǔ)。 類比來說,兩個模態(tài)很像目前基礎(chǔ)大模型領(lǐng)域文本和圖像兩個模態(tài),文生圖和圖生文如果要相互轉(zhuǎn)換,就需要“跨模態(tài)翻譯”,或者說對齊。 于是在生物數(shù)據(jù)大模型層面,水木分子打造了PharMolixFM。 它采用全原子建模的方式,把小分子、肽、蛋白質(zhì)、DNA、RNA和離子等結(jié)構(gòu)生物學(xué)研究對象的基本單元,實現(xiàn)了多尺度統(tǒng)一。 其次又把蛋白質(zhì)折疊、蛋白質(zhì)序列與結(jié)構(gòu)設(shè)計、大小分子對接、基于靶點的分子生成等多任務(wù)統(tǒng)一。 最終完成了全原子基礎(chǔ)大模型PharMolixFM。 該模型在多個關(guān)鍵任務(wù)上也實現(xiàn)了SOTA,包括分子對接任務(wù)、基于靶點結(jié)構(gòu)的藥物設(shè)計任務(wù)等,都在對應(yīng)的行業(yè)基準(zhǔn)測試數(shù)據(jù)集,創(chuàng)造了性能新紀(jì)錄。 并且為了把分子結(jié)構(gòu)翻譯為化學(xué)家可理解且機器可利用的文本,水木分子還打造了“圖生文”工具OCSU。 在通用大模型層面,基于最新DeepSeek-R1帶來的推理技術(shù),站在行業(yè)巨人肩膀上,水木分子與清華AIR聯(lián)手推出了升級版的生物醫(yī)藥多模態(tài)開源基礎(chǔ)大模型BioMedGPT-R1,把強推理慢思考的范式,帶到了醫(yī)藥研發(fā)領(lǐng)域。 效果也非常顯著,不僅以67.1%的正確率通過了USMLE美國醫(yī)師資格考試,還在CheBI-20化學(xué)分子理解任務(wù)中,實現(xiàn)了15%的性能提升,進(jìn)一步提高了由BioMedGPT-10B創(chuàng)造的最好成績。 而這一系列技術(shù)能力和工具,被封裝集成,然后在智能體平臺OpenBioMed實現(xiàn)了All in One。 更難能可貴的是,作為全球首個該領(lǐng)域的智能體平臺,OpenBioMed發(fā)布即開源,或者說為開源而生——OpenBioMed站在了開源基礎(chǔ)大模型、開源生命科學(xué)成果的基礎(chǔ)上,然后也通過開源的方式,進(jìn)一步把智能火炬?zhèn)鬟f更深入、更廣泛。 匯集眾智,賦予眾人。 在制藥或者更廣泛的生命科學(xué)研發(fā)領(lǐng)域,如果最好的資源能無差別覆蓋到更多研發(fā)者,或許會讓整個領(lǐng)域的推進(jìn)更快更高效,一旦生物醫(yī)藥領(lǐng)域進(jìn)入了涌現(xiàn)期,商業(yè)價值和社會價值,無疑會輻射到每一個人。 但依然有問題懸而未決,作為水木分子首席科學(xué)家,聶再清不只一次被問及這個問題—— 會有AI獨立制藥的一天嗎? “AI在制藥領(lǐng)域必須是助手” “AI在制藥領(lǐng)域,必須是助手。” 這就是水木分子首席科學(xué)家聶再清的回答。實際上,作為科學(xué)家、AI領(lǐng)域的大牛,聶再清很少有如此絕對的論斷,但這一次他無比肯定,他補充說,從價值觀上就需要明確AI的“助手”設(shè)定。 這也是AI在深入生命科學(xué)等前沿領(lǐng)域之時,常被人討論的話題。 一方面,AI的能力正在不斷突破人類的極限,或許用不了多久,AI就會獨立發(fā)現(xiàn)新規(guī)律、新材料、新方法,人類已經(jīng)不再是最聰明的那一個;另一方面,生命醫(yī)藥領(lǐng)域關(guān)系的是人類最基本最脆弱的身體健康…… 有一派的觀點是需要最大化助力AI的發(fā)展,包括在“獨立”問題上,因為只有如此才能打造出真正強大的AI模型和系統(tǒng),如果硅基正在覺醒,那碳基讓出統(tǒng)治權(quán)也是歷史發(fā)展的必然選擇。 但另一派不這樣認(rèn)為,他們堅守的依然是“以人為本”的原則和信條,AI需要為人所用、幫助人向善,并且從一開始設(shè)計的時候就要確保其安全性。 很顯然,聶再清選擇站在以人為本這一邊。 他本科碩士都畢業(yè)于清華大學(xué)計算機系,博士師從美國人工智能學(xué)會前主席Subbarao Kambhampati教授,先后在微軟、阿里巴巴達(dá)摩院從事AI技術(shù)研發(fā),是能力、資歷和影響力兼具的AI大牛,帶隊獲得過中國AI領(lǐng)域的最高獎項吳文俊人工智能科技進(jìn)步獎。 2020年開始,他獲得張亞勤院士感召,加入清華大學(xué)AIR智能產(chǎn)業(yè)研究院,擔(dān)任清華大學(xué)國強教授、清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員,并以水木分子首席科學(xué)家身份對外亮相。 但聶再清自己來說,他覺得自己始終在做的事情只有一件—— 智能助手。 他說從微軟亞洲研究院開始,做的其實就是“助手”相關(guān)的工作,比爾蓋茨對智能助手“Personal Assistant”情有獨鐘,希望打造出一套人機交互里的完美助手。 后來去阿里巴巴達(dá)摩院,負(fù)責(zé)的天貓精靈,更是直接的AI助手,只不過交互方式更偏向于語音。 現(xiàn)在在清華大學(xué)智能產(chǎn)業(yè)研究院,“AI助手”也是其主軸,水木分子所做的事情,只不過是把“助手”放在了AI與生命科學(xué)兩大前沿的交叉創(chuàng)新地帶。 即便Agent智能體的定義業(yè)內(nèi)還沒有清晰的共識,但聶再清看來,AI智能體就是AI助手的另一種表述——更時髦流行的表述而已。 水木分子為生物制藥領(lǐng)域的研發(fā)人員提供Autopilot和Copilot兩種智能體可選模式。 OpenBioMed是由清華AIR和水木分子共同推出的全球首個生命科學(xué)與制藥智能體開源平臺,可以開源供業(yè)界開發(fā)生物醫(yī)藥智能體。 ChatDD是水木分子的商用平臺和產(chǎn)品,通過Copilot助手和AutoPilot智能體兩種模式,支持多種醫(yī)藥行業(yè)和企業(yè)的藥研任務(wù),場景包括例如: 立項、藥物設(shè)計和分析報告生成等。 二者放在一起,組成的就是生物醫(yī)藥的智能雙引擎,可以幫助更多科學(xué)家接近他們曾經(jīng)在科幻里才能接近的向往—— 之前有個統(tǒng)計說,讓科學(xué)家選擇想成為的超級英雄,最后被選擇最多的角色是:鋼鐵俠。以為他以凡人之軀,借助科技之力比肩神明,打造AI助手發(fā)現(xiàn)了新元素、新材料、完成了時空穿越的模型驗證。 哪個科學(xué)家不想擁有一個賈維斯\星期五? 現(xiàn)在,水木分子邁出了引領(lǐng)全球的一步,率先開源OpenBioMed的智能體平臺,希望生物醫(yī)藥研發(fā)人員,每一個都可以變成鋼鐵俠。 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選