AI智能體,確實(shí)到了爆發(fā)時(shí)刻。 不論是因?yàn)闀?huì)炒出圈的Manus,還是后續(xù)一眾迅速跟進(jìn)的OpenManus們……都在印證之前“AI智能體元年”的論斷——背后核心印證的是基礎(chǔ)大模型能力,已經(jīng)到了足夠支撐上層建筑的時(shí)候。 無(wú)獨(dú)有偶,在更加垂直專業(yè)的生命科學(xué)領(lǐng)域,AI智能體也迎來(lái)了標(biāo)志性事件。 就在最近,一個(gè)名為OpenBioMed的智能體平臺(tái)低調(diào)亮相,率先對(duì)外開(kāi)源開(kāi)放。作為全球首個(gè)AI制藥領(lǐng)域的智能體開(kāi)源平臺(tái),生命科學(xué)領(lǐng)域、制藥領(lǐng)域的研發(fā)人員人人可用。 生命科學(xué)研究,開(kāi)始進(jìn)入智能體驅(qū)動(dòng)的新范式時(shí)代。 而驅(qū)動(dòng)OpenBioMed智能體平臺(tái)的,是清華智能產(chǎn)業(yè)研究院(AIR)和清華系專注于AI制藥的高精尖創(chuàng)業(yè)公司——水木分子。 以及雖然是新團(tuán)隊(duì),但核心人物卻是AI老面孔——大牛聶再清,他是水木分子的首席科學(xué)家,也是前天貓精靈背后的首席AI科學(xué)家,一個(gè)因?yàn)锳I騷擾電話不堪其擾而打造“二哈”反騷擾AI的硬核程序員。 現(xiàn)在,他希望通過(guò)為制藥研發(fā)人員打造智能體,把AI之力,AI智能體之用,帶入每一個(gè)人都是受眾、每一個(gè)人都會(huì)受益的制藥產(chǎn)業(yè)中。 清華果然是清華,俠之大者果然為國(guó)為民。 恰如清華大學(xué)智能科學(xué)講席教授、清華大學(xué)AIR院長(zhǎng)張亞勤院士所說(shuō),經(jīng)過(guò)近四年的發(fā)展,清華大學(xué)AIR已匯聚了一批既懂科研又懂產(chǎn)業(yè)的人工智能領(lǐng)域?qū)W者: 如今,大模型與生成式AI技術(shù)正引領(lǐng)科學(xué)研究進(jìn)入一個(gè)全新的人機(jī)協(xié)作新范式。生命科學(xué)智能體的出現(xiàn)與廣泛應(yīng)用,將徹底改變科學(xué)發(fā)現(xiàn)的進(jìn)程,大幅提升科研效率。 在這一新范式下,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問(wèn)題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗(yàn)和直覺(jué)。而智能體則通過(guò)高通量的文獻(xiàn)閱讀、海量實(shí)驗(yàn)數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。這種深度的人機(jī)協(xié)作,將推動(dòng)科學(xué)研究進(jìn)入一個(gè)全新的時(shí)代。 全球首個(gè)生命科學(xué)與制藥智能體開(kāi)源平臺(tái) 名叫OpenBioMed,架構(gòu)如下: 最底層是AI制藥任務(wù)用到的科研數(shù)據(jù)和知識(shí)圖譜,中間則是專為生命科學(xué)和制藥打造的垂直大模型和該領(lǐng)域研發(fā)中涉及的核心任務(wù)算法,然后最上層集成了最新最強(qiáng)的基座大語(yǔ)言模型、智能體設(shè)計(jì)平臺(tái)…… 最后可以實(shí)現(xiàn)面向場(chǎng)景的定制化應(yīng)用。 流程全自動(dòng),效率指數(shù)級(jí)提升。 OpenBioMed可以實(shí)現(xiàn)什么?實(shí)現(xiàn)藥物設(shè)計(jì)項(xiàng)目、生命科學(xué)研究項(xiàng)目的Autopilot。 舉個(gè)例子,在過(guò)去,如果要發(fā)起一項(xiàng)藥物設(shè)計(jì),即便是一份報(bào)告生成,可能也需要一位老法師(制藥專家),描述需求后讓一個(gè)團(tuán)隊(duì)來(lái)配合執(zhí)行。 但如果通過(guò)水木分子打造的AI智能體平臺(tái),完全可以Autopilot——老法師發(fā)出議題:針對(duì)攜帶KRAS G12C突變的局部晚期或轉(zhuǎn)移性非小細(xì)胞肺癌(NSCLC)患者,設(shè)計(jì)新型藥物分子。 接著AI智能體就會(huì)調(diào)動(dòng)大模型展開(kāi)推理,然后調(diào)用工具并形成工作流。 整個(gè)流程完全實(shí)現(xiàn)了完全自動(dòng)化,大模型能力之下,整合了蛋白質(zhì)結(jié)構(gòu)分析、AI分子生成、計(jì)算篩選等技術(shù)和工具調(diào)用,形成從靶點(diǎn)分析到候選藥物確定的閉環(huán)設(shè)計(jì)報(bào)告。 顯而易見(jiàn),按照Autopilot這樣的節(jié)奏,過(guò)往數(shù)周數(shù)月甚至數(shù)年的制藥設(shè)計(jì)周期,會(huì)被顯著加快。 而且容易忽略的是,由于基座大模型的加持,Autopilot對(duì)于老法師的門檻也在降低,即便無(wú)法實(shí)現(xiàn)“人人都是老法師”,但對(duì)于制藥領(lǐng)域的資源依賴降低也大有助益。 以及智能體可以7×24小時(shí)工作——未來(lái)制藥領(lǐng)域,可能會(huì)出現(xiàn)智能體在凌晨3點(diǎn)自主優(yōu)化分子結(jié)構(gòu)的場(chǎng)景。 需要說(shuō)明的是,Autopilot是水木分子在制藥AI智能體上的最新成果,但不是全部路線。 作為智能雙引擎的另一個(gè),基于旗下ChatDD——AI制藥領(lǐng)域的DeepSeek,水木分子還推出了Copilot模式,主打人類專家的“智能助手”。 在制藥領(lǐng)域,類似設(shè)計(jì)報(bào)告一樣的工作已經(jīng)是非常成熟、標(biāo)準(zhǔn)化的任務(wù),或者在某些特定領(lǐng)域中,智能體當(dāng)前的能力已經(jīng)足夠強(qiáng)大,可以達(dá)到人類專家的水平,Autopilot作為全流程自動(dòng)化執(zhí)行角色,可以大大縮短研發(fā)周期。 而在需要高度專業(yè)知識(shí)和經(jīng)驗(yàn)的任務(wù)中,把關(guān)者和決策者就必須是人類專家。 所以有了Copilot模式,就可以實(shí)現(xiàn)智能體與人類專家共同協(xié)作,智能體提供輔助支持,但最終決策權(quán)在人類專家手中。 具體如針對(duì)難成藥靶點(diǎn)3D構(gòu)象生成、藥物篩選等任務(wù),Autopilot來(lái)執(zhí)行;AI靶點(diǎn)挖掘、驗(yàn)證實(shí)驗(yàn)方案優(yōu)化,則由Copilot來(lái)實(shí)現(xiàn)。 Autopilot和Copilot被水木分子視為生物醫(yī)藥的智能雙引擎,二者配合之下,可以顯著縮短研發(fā)周期,降低系統(tǒng)誤差,從而實(shí)現(xiàn)藥物研發(fā)成本的下降。 當(dāng)然,Autopilot和Copilot只是生命科學(xué)領(lǐng)域研發(fā)的最新進(jìn)展,是行業(yè)智能體落地應(yīng)用的表現(xiàn)。 在水木分子的設(shè)計(jì)中,完整的制藥研發(fā)新范式,由三部分構(gòu)成—— 通用大模型底座+行業(yè)大模型+行業(yè)智能體。 三位一體,缺一不可。 一個(gè)時(shí)代有一個(gè)時(shí)代的制藥研發(fā)范式 大模型為核心技術(shù)的制藥研發(fā)范式,被水木分子命名為ChatDD,Chat Drug Design——對(duì)話式藥物設(shè)計(jì)。 ChatDD將專家的認(rèn)知和大模型的知識(shí)連接起來(lái),通過(guò)人機(jī)協(xié)作對(duì)話式的方式進(jìn)行藥物研發(fā)。這一模式不僅重新定義了藥物研發(fā),還通過(guò)藥物研發(fā)AI智能體(Copilot / Autopilot)實(shí)現(xiàn)了更高的靈活性和效率。 而在此之前,連點(diǎn)成線回溯,人類的制藥研發(fā)大致歷經(jīng)了三大階段: 第一代:TMDD——傳統(tǒng)手工藥物設(shè)計(jì)。 在遠(yuǎn)古時(shí)代至19世紀(jì)末,藥物設(shè)計(jì)主要依賴傳統(tǒng)手工方法(TMDD,Traditional Manual Drug Design)。科學(xué)家通過(guò)手工合成、提取和篩選藥物,基于大量試驗(yàn)和經(jīng)驗(yàn)進(jìn)行探索。然而,這種方法存在低通量、缺乏系統(tǒng)性、耗時(shí)長(zhǎng)和成本高等局限性。 第二代:CADD——計(jì)算機(jī)輔助藥物設(shè)計(jì)。 20世紀(jì)中葉,計(jì)算機(jī)技術(shù)的興起帶來(lái)了計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD,Computer-Aided Drug Design)。CADD通過(guò)計(jì)算機(jī)技術(shù)加速藥物發(fā)現(xiàn)和設(shè)計(jì)過(guò)程,具有高通量篩選和工具屬性強(qiáng)的特點(diǎn),但仍依賴研究人員的經(jīng)驗(yàn)和直覺(jué)。 第三代:AIDD——人工智能藥物設(shè)計(jì)。 21世紀(jì)初,人工智能技術(shù)的發(fā)展推動(dòng)了人工智能藥物設(shè)計(jì)(AIDD,AI Drug Design)。AIDD具有超高通量和流程化的特點(diǎn),能夠從大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)中挖掘藥物發(fā)現(xiàn)和設(shè)計(jì)的規(guī)律。然而,AIDD缺乏模型與專家的交互,且對(duì)大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)的依賴成為瓶頸。 在第四代制藥范式中,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問(wèn)題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗(yàn)和直覺(jué)。 而智能體則通過(guò)高通量的文獻(xiàn)閱讀、海量實(shí)驗(yàn)數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。 按照水木分子的架構(gòu)圖譜,最底層是“知識(shí)”,上面是大模型和工具,再往上就是智能體,通過(guò)調(diào)用大模型能力,完成立項(xiàng)決策、臨床前藥物發(fā)現(xiàn)、藥物開(kāi)發(fā)、臨床試驗(yàn)以及其他企業(yè)私有任務(wù)的部署。 但即便架構(gòu)圖譜清晰,路徑明確,智能體要真正成為第四代制藥范式的主角,就需要解決最核心的行業(yè)痛點(diǎn)——打通兩大模態(tài)。 一個(gè)模態(tài)是文本模態(tài),或者可以稱為自然語(yǔ)言模態(tài),是通用大模型底座。 另一個(gè)模態(tài)則是生物模態(tài),以生物數(shù)據(jù)為“語(yǔ)言”,是行業(yè)大模型基礎(chǔ)。 類比來(lái)說(shuō),兩個(gè)模態(tài)很像目前基礎(chǔ)大模型領(lǐng)域文本和圖像兩個(gè)模態(tài),文生圖和圖生文如果要相互轉(zhuǎn)換,就需要“跨模態(tài)翻譯”,或者說(shuō)對(duì)齊。 于是在生物數(shù)據(jù)大模型層面,水木分子打造了PharMolixFM。 它采用全原子建模的方式,把小分子、肽、蛋白質(zhì)、DNA、RNA和離子等結(jié)構(gòu)生物學(xué)研究對(duì)象的基本單元,實(shí)現(xiàn)了多尺度統(tǒng)一。 其次又把蛋白質(zhì)折疊、蛋白質(zhì)序列與結(jié)構(gòu)設(shè)計(jì)、大小分子對(duì)接、基于靶點(diǎn)的分子生成等多任務(wù)統(tǒng)一。 最終完成了全原子基礎(chǔ)大模型PharMolixFM。 該模型在多個(gè)關(guān)鍵任務(wù)上也實(shí)現(xiàn)了SOTA,包括分子對(duì)接任務(wù)、基于靶點(diǎn)結(jié)構(gòu)的藥物設(shè)計(jì)任務(wù)等,都在對(duì)應(yīng)的行業(yè)基準(zhǔn)測(cè)試數(shù)據(jù)集,創(chuàng)造了性能新紀(jì)錄。 并且為了把分子結(jié)構(gòu)翻譯為化學(xué)家可理解且機(jī)器可利用的文本,水木分子還打造了“圖生文”工具OCSU。 在通用大模型層面,基于最新DeepSeek-R1帶來(lái)的推理技術(shù),站在行業(yè)巨人肩膀上,水木分子與清華AIR聯(lián)手推出了升級(jí)版的生物醫(yī)藥多模態(tài)開(kāi)源基礎(chǔ)大模型BioMedGPT-R1,把強(qiáng)推理慢思考的范式,帶到了醫(yī)藥研發(fā)領(lǐng)域。 效果也非常顯著,不僅以67.1%的正確率通過(guò)了USMLE美國(guó)醫(yī)師資格考試,還在CheBI-20化學(xué)分子理解任務(wù)中,實(shí)現(xiàn)了15%的性能提升,進(jìn)一步提高了由BioMedGPT-10B創(chuàng)造的最好成績(jī)。 而這一系列技術(shù)能力和工具,被封裝集成,然后在智能體平臺(tái)OpenBioMed實(shí)現(xiàn)了All in One。 更難能可貴的是,作為全球首個(gè)該領(lǐng)域的智能體平臺(tái),OpenBioMed發(fā)布即開(kāi)源,或者說(shuō)為開(kāi)源而生——OpenBioMed站在了開(kāi)源基礎(chǔ)大模型、開(kāi)源生命科學(xué)成果的基礎(chǔ)上,然后也通過(guò)開(kāi)源的方式,進(jìn)一步把智能火炬?zhèn)鬟f更深入、更廣泛。 匯集眾智,賦予眾人。 在制藥或者更廣泛的生命科學(xué)研發(fā)領(lǐng)域,如果最好的資源能無(wú)差別覆蓋到更多研發(fā)者,或許會(huì)讓整個(gè)領(lǐng)域的推進(jìn)更快更高效,一旦生物醫(yī)藥領(lǐng)域進(jìn)入了涌現(xiàn)期,商業(yè)價(jià)值和社會(huì)價(jià)值,無(wú)疑會(huì)輻射到每一個(gè)人。 但依然有問(wèn)題懸而未決,作為水木分子首席科學(xué)家,聶再清不只一次被問(wèn)及這個(gè)問(wèn)題—— 會(huì)有AI獨(dú)立制藥的一天嗎? “AI在制藥領(lǐng)域必須是助手” “AI在制藥領(lǐng)域,必須是助手! 這就是水木分子首席科學(xué)家聶再清的回答。實(shí)際上,作為科學(xué)家、AI領(lǐng)域的大牛,聶再清很少有如此絕對(duì)的論斷,但這一次他無(wú)比肯定,他補(bǔ)充說(shuō),從價(jià)值觀上就需要明確AI的“助手”設(shè)定。 這也是AI在深入生命科學(xué)等前沿領(lǐng)域之時(shí),常被人討論的話題。 一方面,AI的能力正在不斷突破人類的極限,或許用不了多久,AI就會(huì)獨(dú)立發(fā)現(xiàn)新規(guī)律、新材料、新方法,人類已經(jīng)不再是最聰明的那一個(gè);另一方面,生命醫(yī)藥領(lǐng)域關(guān)系的是人類最基本最脆弱的身體健康…… 有一派的觀點(diǎn)是需要最大化助力AI的發(fā)展,包括在“獨(dú)立”問(wèn)題上,因?yàn)橹挥腥绱瞬拍艽蛟斐稣嬲龔?qiáng)大的AI模型和系統(tǒng),如果硅基正在覺(jué)醒,那碳基讓出統(tǒng)治權(quán)也是歷史發(fā)展的必然選擇。 但另一派不這樣認(rèn)為,他們堅(jiān)守的依然是“以人為本”的原則和信條,AI需要為人所用、幫助人向善,并且從一開(kāi)始設(shè)計(jì)的時(shí)候就要確保其安全性。 很顯然,聶再清選擇站在以人為本這一邊。 他本科碩士都畢業(yè)于清華大學(xué)計(jì)算機(jī)系,博士師從美國(guó)人工智能學(xué)會(huì)前主席Subbarao Kambhampati教授,先后在微軟、阿里巴巴達(dá)摩院從事AI技術(shù)研發(fā),是能力、資歷和影響力兼具的AI大牛,帶隊(duì)獲得過(guò)中國(guó)AI領(lǐng)域的最高獎(jiǎng)項(xiàng)吳文俊人工智能科技進(jìn)步獎(jiǎng)。 2020年開(kāi)始,他獲得張亞勤院士感召,加入清華大學(xué)AIR智能產(chǎn)業(yè)研究院,擔(dān)任清華大學(xué)國(guó)強(qiáng)教授、清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員,并以水木分子首席科學(xué)家身份對(duì)外亮相。 但聶再清自己來(lái)說(shuō),他覺(jué)得自己始終在做的事情只有一件—— 智能助手。 他說(shuō)從微軟亞洲研究院開(kāi)始,做的其實(shí)就是“助手”相關(guān)的工作,比爾蓋茨對(duì)智能助手“Personal Assistant”情有獨(dú)鐘,希望打造出一套人機(jī)交互里的完美助手。 后來(lái)去阿里巴巴達(dá)摩院,負(fù)責(zé)的天貓精靈,更是直接的AI助手,只不過(guò)交互方式更偏向于語(yǔ)音。 現(xiàn)在在清華大學(xué)智能產(chǎn)業(yè)研究院,“AI助手”也是其主軸,水木分子所做的事情,只不過(guò)是把“助手”放在了AI與生命科學(xué)兩大前沿的交叉創(chuàng)新地帶。 即便Agent智能體的定義業(yè)內(nèi)還沒(méi)有清晰的共識(shí),但聶再清看來(lái),AI智能體就是AI助手的另一種表述——更時(shí)髦流行的表述而已。 水木分子為生物制藥領(lǐng)域的研發(fā)人員提供Autopilot和Copilot兩種智能體可選模式。 OpenBioMed是由清華AIR和水木分子共同推出的全球首個(gè)生命科學(xué)與制藥智能體開(kāi)源平臺(tái),可以開(kāi)源供業(yè)界開(kāi)發(fā)生物醫(yī)藥智能體。 ChatDD是水木分子的商用平臺(tái)和產(chǎn)品,通過(guò)Copilot助手和AutoPilot智能體兩種模式,支持多種醫(yī)藥行業(yè)和企業(yè)的藥研任務(wù),場(chǎng)景包括例如: 立項(xiàng)、藥物設(shè)計(jì)和分析報(bào)告生成等。 二者放在一起,組成的就是生物醫(yī)藥的智能雙引擎,可以幫助更多科學(xué)家接近他們?cè)?jīng)在科幻里才能接近的向往—— 之前有個(gè)統(tǒng)計(jì)說(shuō),讓科學(xué)家選擇想成為的超級(jí)英雄,最后被選擇最多的角色是:鋼鐵俠。以為他以凡人之軀,借助科技之力比肩神明,打造AI助手發(fā)現(xiàn)了新元素、新材料、完成了時(shí)空穿越的模型驗(yàn)證。 哪個(gè)科學(xué)家不想擁有一個(gè)賈維斯\星期五? 現(xiàn)在,水木分子邁出了引領(lǐng)全球的一步,率先開(kāi)源OpenBioMed的智能體平臺(tái),希望生物醫(yī)藥研發(fā)人員,每一個(gè)都可以變成鋼鐵俠。 本文來(lái)源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選