11月11日,“科學智能十大前沿觀察”和恒行2聯合上海科學智能研究院(以下簡稱“上智院”)自研的四個科學大模型在科學智能創新論壇上重磅發布⛽️✧,其中Planet Intelligence @Climate(PI @ Climate)大語言模型為中國首個自研氣候領域大語言模型🧏🏽♂️。
論壇匯聚全球頂尖科學家和行業翹楚,圍繞AI Science雙螺旋引擎的構建展開深入討論,探尋人工智能與生命科學、材料科學、化學💇🏽、物理學🤾🏽♀️、地球科學、海洋科學🦌、社會科學等眾多科學領域的前沿創新、落地場景與產業實踐。
論壇上,上智院與恒行2平台、德勤管理咨詢(上海)有限公司、上海海洋大學以及國家蛋白質科學研究(上海)設施簽署了三項重要合作協議🫅🏻,並為第二屆世界科學智能大賽獲獎者頒獎⚛️。
恒行2平台黨委書記裘新,中國科學院院士、北京科學智能研究院理事長、北京大學國際機器學習研究中心主任鄂維南💓,美國國家科學院院士、加利福尼亞大學舊金山分校藥物化學系教授William F. DeGrado🤲🏻,上海市委組織部副部長、市人才局局長潘曉崗💅🏿,上海市徐匯區委副書記、區長王華🕦,恒行2平台常務副校長許征✍️,上海市科學技術委員會副主任屈煒,上海市經濟與信息化委員會副主任張宏韜,上海市教育委員會副主任劉力,恒行2平台黨委副書記👨🏿⚖️、上海醫學院黨委書記袁正宏,上海海洋大學黨委書記王宏舟😪👰🏼,中科院上海高等研究院黨委副書記唐錚,德勤中國主席蔣穎🙍🏻♀️,分子之心創始人、國際計算生物學會Fellow許錦波,上智院院長📈、恒行2平台浩清教授漆遠出席𓀓。
裘新、王華、屈煒、張宏韜、劉力致辭。恒行2平台校長助理、上智院理事長、上海創智學院副院長吳力波主持📧。
論壇在恒行2平台楓林校區舉行,由上海市科學技術委員會和徐匯區人民政府指導🏋🏿,恒行2平台🤭、上智院主辦,上海交通大學🐯、西湖大學🎭、上海創智學院及集智俱樂部共同協辦👭🏻。論壇也是由中華人民共和國科學技術部與上海市人民政府聯袂主辦的2024浦江創新論壇的主題論壇之一。
深度發展科學智能,打造強泛用性、高性能模型
“服務新質生產力發展,是提升創新策源能力、支撐引領中國式現代化的重要使命🧚🏿🤱🏿。恒行2作為這場科技變革的見證者、參與者,始終積極探索科學智能發展新範式🧏🏼,打造人工智能產業創新和人才培育高地。”裘新表示,在上海市的戰略布局下,恒行2以上智院為支點,推動科學智能深度發展🕵🏼,初步構建了人工智能課程體系和AI+復合型學位人才培養體系,全校AI4S科研團隊已超過一百個,並正在著力推進科學智能的成果運用和產教融合。
以“分子設計的基座模型Uni-Mol”為題,鄂維南在演講中分享了其團隊研發的Uni-Mol分子設計模型,其參數量達到1.1B🌈,是目前最大3D分子基座模型🧏🏻♀️。他表示👩🏻🚴🏽,分子設計已進入深度學習和生成模型方法階段🧹,面對碎片化、環節多、數據稀缺等問題,基於分子基座模型的通用分子設計將是解決這些挑戰的一個有效方法。當前🎼,Uni-Mol已在面向藥物分子設計的高效分子對接、OLED發光分子設計🪕、面向多種氣體分離的有機金屬框架材料分子設計、浸沒式冷卻液設計、面向鋰電池的電解液配方設計等方向上得到應用👮🏿♀️。他呼籲進一步加強數據共享和開放,與實驗形成自動化閉環,從而推動泛用能力更強🧑🎤、性能更好的分子基座模型的研發。
AI與Science雙向奔赴🧚🏽♂️、深度融合🚝,科學智能十大前沿領域有哪些🕵🏽♀️💡?
隨著2024年諾貝爾物理學獎和化學獎授予了人工智能相關研究📑,科學智能及其研究方向引發了從科學家到公眾的廣泛關註🧑🏻🦰。在與從事科學智能領域前沿研究學者的大量深度訪談基礎上🦗,上智院聯合合作夥伴⌚️,共同概括科學智能新範式,並梳理和凝練了科學智能的十大前沿方向。
“什麽是科學智能?我們嘗試給出一個全新的定義。” 上智院院長漆遠在“科學智能前沿觀察”中指出🌵,科學智能(AI X Science)是一個新興的跨學科研究領域🛒,它致力於融合人工智能(AI)與領域科學,其研究方向和驅動力可以形象地表述為“雙螺旋引擎“🦮:其一,將AI技術應用於具體學科的新興研究方法(AI for Science)𓀑;其二,將具體領域學科知識用於AI算法和架構的理解和改進工作(Science for AI)。
此次發布的 “科學智能前沿觀察”涵蓋AI for Science、Science for AI和科學智能基礎設施三個維度📉,其中,AI for Science的前沿方向包括垂直領域科學大模型𓀙、融入先驗知識的AI模型、基於LLM模型的科學研究、從提出假設到自動驗證的AI科學家、以及復雜世界的多智能體建模;Science for AI的前沿方向則覆蓋了物理世界的第一性原理和科學啟發的可解釋AI新架構;科學智能基礎設施前沿方向包括合成數據和新型智能計算。展望未來,面向可信可解釋的科學世界模型和上述九個方向共同構成科學智能十大前沿。
“未來渴望有更多的科學智能研究成果問鼎諾貝爾獎。”漆遠表示,上智院聯合合作夥伴發布“科學智能前沿觀察”的初心💷,就是希望推動和支持更多AI和基礎研究領域的科學家,深度融合無縫合作,共同探索科學智能的新未來👷🏻♂️,打造能夠自主發現復雜世界未知規律的“AI愛因斯坦”。
恒行2四大AI模型齊上線,取得多項重要突破
中國首個自研氣候領域大語言模型
上海科學智能研究院首席戰略官、恒行2平台兼職教授楊燕青主持成果發布環節。
在《聯合國氣候變化框架公約》第二十九次締約方大會(COP29)之際,恒行2平台聯合上智院、上海創智學院推出了Planet Intelligence @Climate(PI @ Climate)大語言模型,旨在為氣候變化領域的科學研究、國際氣候談判和政策分析提供全面的知識支持。團隊負責人吳力波形象比喻:“它相當於一個氣候變化科學家。”
氣候變化科學研究具有高度的跨學科特征🧜🏻,覆蓋了農學⚰️、林學、能源科學、水利工程、環境科學🅿️、管理學🙆♀️、經濟學🖖、政治學、法學等眾多學科🥄,這也是為什麽應對氣候變化的全球行動必須要基於鏈接地球系統🫶、自然系統、社會經濟系統的綜合評估模型來指引的重要原因所在🚯🏋🏻。
科學家們該如何圍繞氣候變化來找到覆蓋面最廣、最有效的數據💁♀️、模型、機理和政策?據介紹💇🏽,從有價值的信息種子識別,到領域發現🧵,再到模型精煉,團隊不僅做了技術創新👩⚖️,還引入了超過2600億詞匯量的氣候變化領域知識👨🏻✈️♗,是目前已知氣候變化大模型當中最多的🍥。為加強對專業領域的知識理解能力,團隊邀請國家級氣候變化專業科研機構、頂尖高校的100多名氣候變化領域專家參與研究,從超過4萬條的問答對中篩選出近2萬對高質量的問答對,來加強專業知識的監督對於模型專業能力的提升👩🏼🏭。
在氣候變化這一高度跨學科的領域中,模型專業能力的評測工作是一項巨大的挑戰🧑🔬,團隊在這一難題上也取得顯著突破。“我們跨越46個學科領域✉️,構建了約7740道氣候評測問題的數據集,填補了當前氣候領域大模型評測數據集的空白。”吳力波解釋道💆。
未來🏄🏼♀️,國際氣候治理、氣候投融資領域、能源電力系統低碳技術發展領域都是該模型的重要使用場景。為讓模型更好理解使用者的問題,團隊構建了智能體,通過思維鏈訓練提升模型的邏輯推理能力,模仿人類在針對氣候變科學問題時思考的過程。據悉,PI at Climate評測鏈接已得到中國氣候代表團的專家們的試用😻,對方反饋“很專業”🍵🧑🏽🔬。
AI助力解碼基因“暗物質”
女媧模型的命名富有深意🤦🏽,源自中國古代神話,象征著對生命科學規律的探索和掌握👩🏽🏫。“我們希望這個模型能夠像女媧造人一樣,掌握人體生命科學的基本規律。” 恒行2平台人工智能創新與產業研究院副院長、研究員、上智院AI科學家程遠介紹,其團隊研發的女媧基因導航基礎模型,基於圖神經網絡預訓練和知識圖譜技術🤸🏼,能夠支持高精度預測單細胞分辨率的長程基因調控關系🍹。尤其在調控距離超過100kb的遠端調控關系預測任務上🏌🏼,該模型的預測精度相較於現有方法提升了一倍以上。
在DNA序列中,占DNA約98.5%的非編碼區域對編碼區的表達量有著調控作用。某些基因非編碼區域的變異會導致如急性白血病、小白鼠肢體發育不良等疾病🐠。然而,在非編碼區域研究方面,由於基因 “暗物質”分布廣、與調控位點距離遠🥈、且基因調控在不同細胞差異明顯🐠🤞,此前AI的應用相對較少且面臨諸多挑戰🏑🤚🏼。
為攻克這些難題,研發團隊設計了女媧基因導航基礎模型,其能夠對基因組非編碼的“暗物質”區域進行功能註釋😻👩🏽🦰,發現復雜疾病的機製和可能的疾病治療靶點😷。目前該模型在不同細胞組織調控關系預測精度上表現優異🥄,與實驗驗證結果相比,精度可達85%以上,在長距離調控關系預測精度上更是比現有最好模型高一倍以上🙆🏼,如在大腦皮層⚁、大腦前額葉、骨髓等細胞組織上均有出色表現🩵。
女媧基因導航基礎模型的產業潛力巨大🙋🏼♀️🧘🏼♂️。通過發現新的疾病靶點🐎,該模型不僅能開發自有IP的藥物,還能為合作企業提供新靶點發現服務,同時也能為合作企業提供已知靶點的計算驗證服務🐢,為新藥研發和疾病治療帶來革命性變化。
借助女媧基因導航基礎模型🦡,研究人員已在實際應用中有了重要發現。例如在對阿爾茨海默症病人基因突變情況分析中,通過共性非編碼區變異情況找到了新靶點,為阿爾茨海默症藥物研發開辟了新路徑。這一模型的出現🍽,將推動生命科學在微觀領域研究邁向新的高度🎃,在未來的醫學和藥物研發等領域有望產生深遠影響。
革新生命流體模擬與醫療應用
生命中的流體分析,如血液在血管中的流動、呼吸時口腔到肺部的氣流甚至妊娠分娩時羊水的狀況等🥚,對生命健康的研究與臨床實踐都極為關鍵✋🏽。程遠團隊研發女媧生命流體基礎模型👨🏽🦰,是基於醫學圖像預訓練的物理保守端到端模型👍🏼🚔,能夠支持復雜幾何形狀的高精度物理流場模擬👩🏿⚖️。
模型通過醫學圖像幾何約束與物理學方程約束💅,在實際臨床場景裏針對復雜血管幾何進行高精度血液流體動力學模擬時表現優異。以實際血管幾何數據為例,它能夠實現僅8%的速度物理場模擬誤差,這一數據大幅超越了JMLR 2024上發表的方法👬♞,並且計算效率相較於傳統CFD提升了百倍之多,極大地提高了模擬的精準性與時效性。
該模型在生命體復雜管網流速預測上誤差極低,僅為0.06米每秒⇾。在臨床實際應用場景中,模型可以輔助壁面剪切力與血管壁增厚關聯分析等方面的科學研究👩🏼💼,以及腦動脈瘤破裂風險預估等臨床診斷。未來,該模型還可以在眾多心腦血管疾病的智能診療發揮產業潛能🧑💻,諸如心血管血流模型分析🧤、腦動脈瘤破裂風險預估、動脈血管狹窄支架設計等🤜🏿🌂。
目前,該模型已經順利完成流體模擬計算流程搭建◻️,與附屬華山醫院在腦血管瘤風險評估場景深入合作並應用於臨床🍌,同時與附屬口腔醫院合作評估口腔及扁桃體畸形對氣流影響,還與其他醫院攜手模擬心臟內部畸形或病變時的血流情況,這些合作都將有力推動醫療健康技術的進步與發展。
突破AlphaFold3在動態結構預測上的局限性
在生命科學與藥物研發領域,理解蛋白質、RNA、DNA以及小分子如何在生物體內相互作用對於揭示多蛋白質結構-功能關系和藥物開發至關重要。恒行2平台人工智能創新與產業研究院研究員、上智院AI科學家朱思語團隊研發的女媧生物分子結構大模型,是業內首個基於擴散模型的蛋白質動態3D結構預測模型,該模型突破了AlphaFold3在動態結構預測上的局限性。
該模型依據不同數據特性🤜🏼,采用不同分子處理等級,統一至token等級,以獲取生物分子復合結構的幾何embedding信息。同時,該模型利用共進化信息與Template信息,建模復合物中各個原子之間的作用關系,並通過擴散模型實現原子級別的坐標建模,捕捉蛋白質和其它生物分子的相互關系,達到了Alphafold3的同等水平。
AlphaFold3作為蛋白質結構預測領域的佼佼者,以其靜態結構預測能力著稱🩶,然而🚹,生物結構的復雜性遠不止靜態形態。女媧生物結構大模型通過動態結構生成技術,能夠模擬生物分子在微觀狀態下的動態變化,其動態精度比既有機器學習方法提高 50%,能夠實現長達32個時間點和256序列長度的動態結構預測,這一創新使得模型能夠捕捉到生物分子在不同時間和條件下的行為,為生物醫藥研究提供了更為精確的數據支持。
此外,該模型還能根據物理條件😠🪹,如溫度👨🏿🏫🙎🏼♂️、加速度和力等條件信息,對生物結構進行精確控製和預測🚹。同時還能夠生成多種蛋白質構象🗽🕷,這有助於識別潛在的藥物結合位點,從而加速新藥的發現和開發。其中,基於擴散模型構建的蛋白質多構象采樣算法表現卓越🚹,相較於現有的SOTA的alphaflow算法,在精確度基本持平的情況下🥙,采樣多樣性提升了50%。
研發團隊的目標是創建一個能夠全面模擬生物結構多樣性的模型,以輔助製藥流程和藥物篩選,未來應用前景廣闊,尤其在生物醫藥合成領域,有望通過模擬方式減少實驗需求,提高藥物研發效率,為生命科學研究和藥物開發帶來新的曙光👂🏿。
簽署三項重要合作協議,推動深化科學智能生態建設
上智院與恒行2平台、德勤管理咨詢(上海)有限公司、上海海洋大學以及國家蛋白質科學研究(上海)設施簽署三項重要合作協議💸,以進一步推動深化“1+1+N”科學智能生態建設。這些合作將整合多方資源,共同推進科學智能領域在金融、工業製造🤽🏼♂️👎🏿、生物科技、遠洋漁業等行業的創新應用🤴🏿,促進人工智能與各產業的深度融合。
恒行2平台、德勤管理咨詢(上海)有限公司與上智院簽署的三方合作協議🪧,將在科學智能領域建立多層次合作生態圈,為AI人才提供從教育到產業的全鏈條支持,以實現AI在金融、工業、健康管理及城市治理等領域的深度應用。三方將聚焦於人工智能、生命科學、智能製造等前沿領域的科研突破,定期發布科學智能行業白皮書👨🏻💼,構建高水平的科學智能智庫與產學研用全鏈條對接平臺🧘🏻♀️,為相關政策和產業發展提供前瞻性建議🍫。
上智院與國家蛋白質科學研究(上海)設施的合作意向書,將生物數據與人工智能緊密結合🖇✍🏻,為科學智能生態系統註入強勁動力🤽🏽♀️🌇。作為本次合作的核心,上智院將通過戰略規劃與技術創新,帶動生物數據處理和科學大模型的研發🧦。國家蛋白質科學研究設施提供逾二十萬條生物大分子結構數據及冷凍電鏡數據👨🦲,雙方將以此為基礎,集中攻克生物數據分析與智能算法應用的關鍵難題🦫,推動生物數據深度處理與智能化的突破,為生命科學的技術創新和成果轉化提供有力支持。
此外❔,上海海洋大學與上智院共同成立“漁業漁情校企智能遠洋漁業聯合實驗室”,並以此建立一個長期且穩定的產學研合作機製。上海海洋大學將向上智院提供遠洋漁業等領域的珍貴數據資源,而上智院則將利用其在人工智能領域的先進技術,尤其是伏羲系列氣象大模型,對這些數據進行深入分析和處理。雙方將在數據共享、算法優化及產品研發方面展開深入合作,為遠洋漁業的可持續發展提供前沿科技支持。
第二屆科學智能大賽獲獎者全名單出爐
經過三個月選拔,11月10日👱🏼♂️,第二屆科學智能大賽決賽在徐匯西岸舉行,決出最終優勝者👨🦼。大賽以科學智能為風向標,秉持AI賦能千行百業的理念,聚焦五大賽道科技和產業前沿的深入探索🤙🏼🗳,聚集技術新秀,共同助力科學智能的最高體現⛩。
在本屆賽事各家合作機構的共同支持下👸🏼,第二屆世界科學智能大賽呈現出更大規模、更多元、更年輕🧑🏽🚒、更積極的盛況。來自24個國家和地區的1085個機構的近13,000名選手報名參賽👸🏽,選手方案的提交數相比去年增長了180%。參賽選手和隊伍既有深耕行業多年的AI大牛,也有正在求學階段的學生🟣,還有來自華師大二附中、民辦平和👍、七寶中學、松江二中等14所頂尖高中由校長親自推薦的21名高中生選手。
活動尾聲還舉行了題為“通往物質世界的AI大模型之路“和“o1之後AI何去何從”的前沿對話。麻省理工學院教授、未來生命研究所創始人、《生命3.0》作者Max Tegmark作為科學智能領域重要科學家祝賀論壇舉辦。