ChatGPT熱炒下的AI制藥:不能承受之重

3 月 15 日,OpenAI 發(fā)布 GPT-4,成為公司在ChatGPT之后最先進的人工智能系統(tǒng)。

ChatGPT的出現(xiàn),再次讓和AI相關(guān)的一切領(lǐng)域站上風口?!?021年那一波AI制藥的投資人又開始活躍起來了,見面就聊ChatGPT能不能帶來什么新的機會,這也是最近醫(yī)藥寒冬里為數(shù)不多的積極話題了。”一名投資機構(gòu)人員說到。

而看到這條消息,國內(nèi)最早從事AI行業(yè)的曹翎(化名)在朋友圈留下了一句很“不應(yīng)景”的話:“真正的失落都是無聲的。”

十幾年來,曹翎一直在AI行業(yè)穿行不歇。他的最后一份工作,是在國內(nèi)某知名大廠背景的AI制藥公司從事AIDD(AI藥物發(fā)現(xiàn)和設(shè)計)。如今退圈的他有一些寫書的計劃,只想“為這個行業(yè)做一些基礎(chǔ)建設(shè)工作”。

對于像曹翎一樣的AI從業(yè)者而言,這個行業(yè)就像是幸運大轉(zhuǎn)盤上的指針,曾經(jīng)定格在電商、游戲、直播等行業(yè)。2021年,這枚指針落到了生物醫(yī)藥領(lǐng)域。一眾國內(nèi)AI制藥初創(chuàng)便像雨后春筍一般崛起。但隨之而來的,還有意料之中的內(nèi)卷、路演,和資本的游戲。

一邊,AI制藥已經(jīng)成為了一個大型投注箱,其中回蕩著金錢的碰撞聲:如果人類生命科技的未來注定屬于多特異性藥物,那善于分析復(fù)雜分子的AI必定大有可為;另一邊,則是AI制藥的算力、數(shù)據(jù)庫、準確性問題一直沒有得到突破性解決,現(xiàn)階段AI只能把藥物研發(fā)效率從11%提高到14%。

“制藥行業(yè)其實根本不在乎AI。”曹翎有點苦澀地說?!澳鉇I做成的數(shù)據(jù)再漂亮,藥企可能只會花研發(fā)中的5%的權(quán)重去買它。現(xiàn)在大藥企就是看這些AI制藥企業(yè)表演著,等表演得差不多了,再大家一起把這一塊兒買走?!?/span>

而在大藥企作壁上觀的另一邊,是這些AI初創(chuàng)人員為了數(shù)據(jù)準確性能再提升零點幾加班加點、苦不堪談。“AI制藥是一個數(shù)據(jù)驅(qū)動的活兒,產(chǎn)品迭代特別快,但其實背后的規(guī)律性沒有搞透,真正的生物科學家又看不上?!薄诓荇峥磥恚缃竦腁I制藥從所謂的前沿科技漸漸滑落為一種四不像的尷尬產(chǎn)品,這是行業(yè)真正的失落所在。

相比于過去的AI投資人再次燃起的熱情,在二級市場重新吃香的相關(guān)企業(yè),諸如復(fù)星醫(yī)藥、成都先導(dǎo)、藥石科技等,卻在業(yè)內(nèi)人士看來并不是純粹的AI制藥企業(yè):要么是AI技術(shù)只占公司業(yè)務(wù)很小一部分,要么底子上是制造業(yè)化工的邏輯。而二級市場的重新繁榮,并沒有帶動起整個投融圈的熱情。業(yè)內(nèi)人士透露,對于大部分真正只做AI制藥的初創(chuàng)而言,現(xiàn)金流即將在半年之內(nèi)出現(xiàn)巨大黑洞。

如今,大部分的人已經(jīng)認清AI制藥的工具屬性,應(yīng)服從制藥業(yè)本身的邏輯。而只要它在行業(yè)中的應(yīng)用程度和作用強度不發(fā)生改變,那么不管是股市的喧囂一片、還是AI技術(shù)的飛馳而過,對于AI制藥行業(yè)都只是一些遙遠的消息而已。

-01-2021-2023,AI制藥資本的冷與熱

去年12月,晶泰科技回應(yīng)了港股 18C咨詢文件,這距離它最后一次融資已經(jīng)過去了一年半的時間。

作為國內(nèi)AI制藥的頭部,晶泰科技在2021年時也經(jīng)歷過50家國際機構(gòu)融資競標、額度達到8億美元、投后估值達到19.68億美元的盛況。然而,隨著2022年生物醫(yī)藥市場環(huán)境的失速,公司不得不擱淺了美股IPO的計劃。

2021年是AI制藥最好的年頭。DeepMind的深度學習算法Alphafold剛剛被驗證能夠準確預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),就遇到了那一年的biotech上升期。AI制藥公司的數(shù)億融資俯拾皆是,與藥企合作捷報頻傳?!爱敃r我們公司為了挖人,曾經(jīng)開出過100萬美元的天價高薪?!币幻鸄I制藥企業(yè)員工回憶。

然而,僅僅一年時間,AI制藥卷起的泡沫就被打得粉碎。醫(yī)藥寒冬一來,錢去人空不可避免。去年一整年,部分美國上市的AI制藥市值已經(jīng)低于1億美元,跌幅超過90%,其中不乏Absci、Schrdinger這樣的獨角獸。在國內(nèi),風口也巔峰不再,去年上半年融資總額同比縮水2/3。

除了突如其來的資本風暴以外,AI制藥式微的主要原因還在于:它并沒有像原先人們所料想的那樣,幫藥企解決卡點問題。本質(zhì)上,它只是把藥企目前面臨的問題,用不同的語言再重新書寫一遍。

一名AI制藥領(lǐng)域的專家介紹到,這個行業(yè)最早是賣軟件的,但是只收服務(wù)費,上限比較低;如今是在做CRO還是做藥之間產(chǎn)生分歧:晶泰偏CRO,英矽偏biotech——但不管是哪種路線,它都沒有在根本上解決藥物研發(fā)的失敗率和成本問題。

資本市場曾經(jīng)流行著一個誘人的故事:AI可以將公司的藥物發(fā)現(xiàn)成本降低高達70%。但事實上,這只是理想數(shù)據(jù),因為目前市場還沒有見證到AI制藥的最終產(chǎn)品——2022年,第一款由AI設(shè)計、號稱只用了12個月便進入臨床的分子DSP-1181因I期未達標而折戟。

公司需要在前期打通數(shù)據(jù)、算力、算法,這絕非小數(shù)目;交叉學科中人才的稀缺問題,造成昂貴的人才成本;生物驗證過程中的各種不確定性,造成來來回回的退回和返工——而這一切都讓AI制藥,絕不像它聽上去那么省錢。

最重要的是,大部分AI制藥公司目前并沒有清晰的發(fā)展主線,商業(yè)化通路處于觀望狀態(tài),往往會在“既要又要”的“嘗試”中損耗精力。曹翎提到,自己的老東家,就因為一些預(yù)算以外的投入,導(dǎo)致產(chǎn)出的虎頭蛇尾?!霸谧鏊幹?,公司必須把周邊的東西搞齊或摸排清楚,其中包括不同的生物技術(shù)路線,包括產(chǎn)業(yè)鏈上下游的東西,要保證企業(yè)又能賣產(chǎn)品,又有自己做藥的能力。這部分成本是非常大的?!?/span>

AI制藥同樣面臨著生物醫(yī)藥領(lǐng)域同質(zhì)化競爭的問題。簡單來說,AI的學習資料是人類已經(jīng)創(chuàng)造的實驗數(shù)據(jù),對于那些冷門的靶點信息,AI無法無中生有。“AI制藥公司用的數(shù)據(jù)庫都差不多,算法技術(shù)也沒有太大的技術(shù)壁壘,無非是針對場景慢慢進行優(yōu)化。說到最后,還是拼靶點。”上述AI制藥企業(yè)員工說。

一切似乎都回到了AI制藥出現(xiàn)之前的原點,邏輯和難點都沒有改變。

2023年,隨著ChatGPT的大火,不少AI制藥企業(yè)就像殺入18C的晶泰科技一樣,意圖再度抬頭。成都先導(dǎo),皓元醫(yī)藥、藥石科技、泓博醫(yī)藥等醫(yī)藥上市公司先后披露布局AI制藥賽道相關(guān)情況?!巴顿Y人們最關(guān)心的就是,ChatGPT這種生成式AI能不能給制藥行業(yè)帶來什么新的東西?!鄙鲜鐾顿Y機構(gòu)人員說。

AI制藥不能和ChatGPT比較,因為訓練后者的,是強大的互聯(lián)網(wǎng)工業(yè)和二十年左右的語言模型發(fā)展。相對而言,AI制藥實在是太年輕了。”這名投資機構(gòu)人員繼續(xù)說道,“甚至可以說,對于AI制藥公司而言,最難的時刻還沒有到來。因為大批的產(chǎn)品還沒有進入到臨床階段,真正的大考還沒有到來?!?/span>

-02-ChatGPT給的機會在哪里

在這一輪熱度之前,AI制藥還只是生物醫(yī)藥行業(yè)的一個影子,無法擺脫跟隨式發(fā)展的限制。而ChatGPT這一劑強心針,不僅打在了二級市場的心坎上,還讓不少投資機構(gòu)給出觀點:ChatGPT給了AI制藥一個從輔助性向創(chuàng)造性遷移的機會。

“ChatGPT是一個數(shù)據(jù)與經(jīng)驗結(jié)合的大模型,而藥物研發(fā)比較重要的是靶點的發(fā)現(xiàn),本來也是對基因、蛋白組學的數(shù)據(jù)進行分析,建立關(guān)聯(lián),所以比較容易被大模型所替代。短期來看,GPT可以取代初級和中級的藥物專家。”上述AI制藥領(lǐng)域?qū)<艺f。

一方面,GPT架構(gòu)的排序訓練方式,在理論上可以融合所有藥物研發(fā)的模態(tài)數(shù)據(jù),支持通用的藥物研發(fā)模型;另一方面,它可以成為一個整合核心,通過API的方式調(diào)用各個子模塊,而子模塊返回的結(jié)果可以通過核心GPT進行整合報告,從而實現(xiàn)更加專業(yè)的預(yù)測。

簡單來說,GPT有一個大底座,可以承載更多的生物信息(小分子結(jié)構(gòu),蛋白質(zhì)序列,化學反應(yīng),小分子與蛋白質(zhì)對接,過濾規(guī)則等),也可以在不同步驟進行及時反饋,趨近準確。

這其實解決的是AI制藥曾經(jīng)出現(xiàn)過的兩個問題:第一,是模態(tài)不全,不同維度的生物信息之間無法協(xié)同導(dǎo)出綜合判斷;第二,是運算壓力造成的算力問題,經(jīng)常會導(dǎo)致預(yù)測結(jié)果不夠準確。

可以說,如果AI制藥是一把槍的話,那么ChatGPT的確讓它彈夾更大、彈道更直了;然而,如今AI制藥最頭疼的數(shù)據(jù)問題——即:子彈該如何被完美地上膛后射出,卻始終沒有得到清晰的答案。

水木未來CEO郭春龍曾表示過,給數(shù)據(jù)做標簽,這是 ChatGPT 能夠突飛猛進發(fā)展的一個前提條件,而AI制藥在這方面還沒有準備好。“你給一段話加上個標簽,成本最多1分鐘甚至幾秒鐘的事。但是你要希望給一個蛋白質(zhì)的序列加上標簽,往往需要大量的實驗,包括電鏡的收數(shù)據(jù)、解數(shù)據(jù),它的成本要高很多。”

比起貼標簽的成本,更嚴峻的是數(shù)據(jù)來源問題ChatGPT依托在互聯(lián)網(wǎng)這一共享平臺上,而在可見的未來,制藥行業(yè)的數(shù)據(jù)壁壘無法被打破。

除去有限的公共數(shù)據(jù)庫外,AI制藥公司只能通過與藥企合作、自有實驗平臺、委托CRO等形式獲取用以訓練系統(tǒng)的信息;同時,因為不同實驗室或公司數(shù)據(jù)標準化程度都不一樣,前期輸入的標準化轉(zhuǎn)譯也必須投入大量人力、財力。

“從數(shù)據(jù)來看,只有蛋白結(jié)構(gòu)這個事情是可以解決的,其他環(huán)節(jié)的一些定量的、定性的實驗數(shù)據(jù)因為標準化問題,80%實際上都是不可靠的?!辈荇嵴f。

另一個GPT能做到、而目前AI制藥無法做到的事情同樣和數(shù)據(jù)相關(guān)。GPT的特點之一在于對信息的理解和篩選,其中涉及到強度和權(quán)重的賦值,可以理解為:人工智能可以決定在海量信息中重點看什么,不去看什么。而目前,生物類數(shù)據(jù)還沒有找到一種有效的方式,可以表現(xiàn)突出關(guān)系或信息的重要性層級。

“目前大家希望可以通過蛋白序列和基因序列的手段去解決這個問題。但這些序列在發(fā)生功能的時候,已經(jīng)是一個結(jié)構(gòu)化的東西了。相當于我們用一維的手段,去研究四維狀態(tài)的現(xiàn)象背后的規(guī)律,然后再去映射它的功能,說實話挺難的?!辈荇嵴f。

-03-對AI制藥有期待,錯了么?


不管是科學界還是產(chǎn)業(yè)界,如今越來越多的人正在認定:多特異性藥物,將引發(fā)現(xiàn)代制藥工業(yè)的第四次革命性浪潮;那么,似乎沒有什么理由可以指摘人們對AI制藥的高度期待了。

面向未來的藥物形態(tài),將擁有多重治療機制和豐富的合成結(jié)構(gòu),其核心就是“以復(fù)雜對抗復(fù)雜”,其中便給了AI分析和設(shè)計的廣闊空間。

但同時,“復(fù)雜”也給了AI制藥一種無的放矢、無處著力的困境。一名AI制藥企業(yè)管理人員總結(jié)道:“做藥是個非常復(fù)雜的系統(tǒng)工程,AI在其中一個環(huán)節(jié)的加速,可能會被另一個環(huán)節(jié)所稀釋。因此,AI制藥必須要找準最關(guān)鍵的杠桿點。如果在一個點上能有千倍以上的提升,就會有一個從量變到質(zhì)變的過程?!?/span>

簡單點說,AI制藥企業(yè)未來的定位,應(yīng)該是像狙擊槍一樣?!按笏幤缶拖袷泅睆棙專驌舴秶?,總有那么一兩發(fā)是中的?!辈荇嵴f。不管是AI制藥初創(chuàng),還是傳統(tǒng)藥企,研發(fā)都是一個幾率問題。大藥企能承擔巨額的試錯成本;相對而言,AI制藥不能走量,只能在一些細分方向或步驟上做出四兩撥千斤的效果。

換句話說,如果我們所期待的,是AI在復(fù)雜問題中提供全面而完美的解決方案,那么失望是在所難免的;但如果AI可以在復(fù)雜環(huán)境中,做撬開問題的一個杠桿,那我們將很可能獲得一個全新的視角。

一名AI制藥初創(chuàng)的研發(fā)人員發(fā)現(xiàn),AI給人的感覺就像一個孩子一樣——經(jīng)常出錯,但也能帶來驚喜?!白罱覀兏粋€臨床的合作方在做一個類似于自免罕見病的項目。對方問:如果給你患者的血液樣本,你能不能分析它特定負極的bcr組庫,然后去反向找自免抗原?理論上,因為人體內(nèi)的蛋白是已知的,如果用高通量的結(jié)構(gòu)和親和力模型去做的話,是有機會的。我們就用AI試了試,最后給他推薦了4個。結(jié)果昨天他告訴我,其中一個挺有希望的?!?/span>

長期和AI打交道的經(jīng)驗告訴這名研發(fā)人員,任何時候都不能高興得太早。但只要有耐心,AI就能不斷在錯誤中爬起來、成長起來。

“之前我們用全人源的小鼠篩了一個相對復(fù)雜的靶點,是非特異性結(jié)合。我們就用AI去優(yōu)化了一下,明顯發(fā)現(xiàn)它在od450的層面的比值下降了很多,相當于我獲得了一個推薦結(jié)合的靶點。但后來測試的時候,才發(fā)現(xiàn)它沒有blocking function?!彼貞浀?,“后來我們大概又迭代了兩輪,這樣就把分子拿到了,就最終結(jié)果而言還是好的?!?/span>

在這名研發(fā)人員看來,目前AI制藥最受詬病的一點,就是沒法一步到位地實現(xiàn)目標,這背后涉及的是對其商業(yè)效率的焦慮。“在沒有找到正確路徑之前,一切都有可能發(fā)生,甚至有可能會出現(xiàn)迭代以后數(shù)據(jù)準確性下降的問題。而生物驗證那邊的反饋又很慢,效果好不好需要做上15天的實驗才能知道結(jié)果?!?/span>

在AI制藥方興未艾、勢單力薄的當下,大部分企業(yè)在面對藥企客戶時并不具有議價權(quán)。業(yè)內(nèi)人士稱,和AI制藥初創(chuàng)合作的藥企,大部分也都是抱著“玩票”的心態(tài),“象征性地”給一些合作款項。

總體而言,AI制藥的服務(wù)報價低、周期長,作為一款提供靈感的玩具而言,它顯得實在太奢侈了;而它什么時候能升級為一款成熟的工具,還得依靠“玩”出來的思路和可能性——這也正是AI制藥行業(yè)目前感到矛盾的地方。

李昀丨撰文

王晨丨編輯

來源:深藍觀