熱點 來源:21世紀經濟報道 時間:2023-05-16 14:01:41
當前,多模態AI通用技術正在高速迭代。ChatGPT火爆出圈,顛覆人們對AI能力的認知。近日,在“訊飛星火認知大模型”發布會上,科大訊飛董事長劉慶峰從7個維度演示了星火大模型的通用能力,以及大模型與訊飛現有產品結合的商業應用成果,其中也包括其在醫療領域的探索。
實際上,在產學研多方努力下,全球智能時代加速到來,醫療健康行業也正加速進入數智化的爆發期。據知名市場調研公司Report Linker最新報告數據顯示,全球醫療保健AI市場規模預計從2023年的146億美元,增長到2028年的1027億美元,年復合增長率達47.6%。
如何在GPT大潮中準確把握機會?在近期的一次座談會上,智云健康CPO、副總裁楊文琳的回答是:“我們首先要上船,水漲船高之后船就起來了?!?/p>
(資料圖片)
目前,無論在醫療領域還是醫藥領域,GPT技術都有較多的應用場景。如在醫療領域,包括問診、報告解讀、輔助診斷、知識問答方面輔助醫生臨床決策,幫助醫生提高效率等;在醫藥領域,GPT對藥物研發方面也有一定推動和影響,包括GPT可以識別分子,可以轉化成計算機語言能夠識別的SMILES格式等。
不過,如硬幣的兩面,在GPT等AI技術帶來的助推,另一方面也會有一定的“隱患”。如5月2日,被稱為“人工智能教父”,開發了ChatGPT等聊天機器人的杰弗里·辛頓博士宣布從谷歌離職,并對他長期推崇的這項技術的風險發出警告。3月29日,1000多名技術領袖和研究人員簽署了一封公開信,信中呼吁:所有AI實驗室立即暫停比GPT-4更強大的AI系統的訓練至少6個月。
據了解,目前國家網信辦發布的《生成式人工智能服務管理辦法(征求意見稿)》也正在征求意見中。據參與討論的寧人律師事務所合伙人、律師馬軍向21世紀經濟報道記者透露,其中爭議比較大的問題主要是數據來源的真實性、準確性等問題,部分還有一些有嚴重的政治問題?!靶枰鉀Q數據合規性問題,需要進行數據清洗。綜合來看都會清洗掉20%到40%的數據?!?
顛覆?輔助?
GPT技術對NLP(自然語言處理)方面的巨大突破尤其在需要進行文字、語言交流方面有著廣闊的前景。
“人工智能是‘人工的’智能,有多少人工就有多少智能?!睏钗牧栈貞?013、2014年許多醫療大數據公司發展起來的歷程。當時自然語言識別和標識存在著很多問題,數據的清洗、治理、標注、補充非常困難,搭建數據庫一年成本都要幾個億,醫療領域大量數據都“停留在醫生的抽屜里”,沒有數據化。
GPT技術崛起后,全新的大模型學習方式取代了傳統的分詞方式,工作量和所需數據量大幅減少。
高效的Transformer架構、非常大規模的數據模型、自監督的訓練方式結合起來促成了GPT的成功。GPT技術具有多任務的通用性,同時可以以小成本進行學習,并學會“推理”,進行舉一反三。通過大模型與別的流程和設備進行對接的“大模型+X”范式,可以簡化大量流程,減少企業雇員成本。根據不同的專門需求,喂養GPT更偏重于醫學的專業領域知識,可以在保證準確率和經濟型下建立專業GPT模型。
智云健康首席科學家劉曉華舉例稱,使用4個英偉達A800 GPU,4個小時就能做一個簡單的醫療助手,評測效果與大模型平級,而所需要的參數數量僅占1/4,提升了經濟性。
醫藥研發領域一直存在的“雙十定律”,即“十年攻關、十億美元投入”,在AI技術的協助下也可能發生重大轉變。2023年2月,由生成式人工智能驅動的臨床階段生物科技公司英矽智能(Insilico Medicine)宣布,公司首款自主研發的抗特發性肺纖維化藥物INS001_055即將啟動II期臨床試驗。第二款抗新冠病毒口服創新藥ISM3312已獲得中國國家藥監局的臨床試驗許可。
英矽智能僅花費18個月就找到了新的化合物,大幅度減少新化合物開發時間。這一成果鼓舞越來越多的藥物研發企業開始引入人工智能開發虛擬篩選技術,以取代或增強傳統的高通量篩選過程。
南開大學藥學院教授、博士生導師林建平向21世紀經濟報道記者分析稱,GPT在反向分子設計,包括抗體、藥物、蛋白的設計方面,需要通過生成模型產生新藥的部分有很大潛力,可能替代傳統技術?!癎PT能夠寫很多程序,預測化合物針對癌癥的活性,也可以在藥物研發中給出化合物相應的性質,同時還可以對測試數據進行挖掘和整理;對生物醫學領域文獻的文本提取、關系提取都會比以往的模型更高效?!?/p>
數據整合交互、臨床試驗的數據核查也是GPT技術的強項。例如,搜集上來的患者臨床試驗數據存在著各種形態的非結構化資料,以前都需要人力進行整理,現在很多可以靠GPT技術自動化歸納。AI協助下的臨床數據的遠程核查和翻看也可以降低人工干預的成本,提升患者管理的效率。由于機器對文獻的理解深度廣度遠高于一般的寫方案的人,撰寫臨床試驗方案上,機器也能幫助企業高效地寫出相對科學性高、符合監管機構的要求,同時也符合實際情況的方案。
此外,經過專門訓練的GPT不僅能回答知識性問題,還能參與到需要情感理解的心理治療。北京大學第六醫院臨床心理科主任黃薛冰以北醫三院與科技公司研發的“北小六心理咨詢師”舉例稱,“北小六”能根據對話中相關關鍵詞進行分類,提供對應精神治療方案,涵蓋診斷、治療、干預的心理治療全程,相比真人治療師,機器治療的勝任力相當不錯。中國現在心理健康醫師存在很大缺口,GPT能夠為患者提供預咨詢,處理輕癥和長期回訪任務,擔任治療師的助手,甚至能當老師,帶領經驗不足的治療師。
合規問題凸顯
在GPT掀起的熱潮中,也有業內人士等提示其所帶來的潛在風險,各國監管機構都開始制定相應的規章制度。
如4月11日,國家網信辦發布的《生成式人工智能服務管理辦法(征求意見稿)》也引發了高度關注,其中也引發不少爭議。馬軍向21世紀經濟報道記者列舉了其中爭議比較大的問題:現在數據集有的使用國內數據,有的使用國外數據,國外數據相對真實性、準確性、多樣性較高,但很多數據都來自于媒體,政治意識色彩濃厚,數據合規性存在問題,需要進行數據清洗。綜合來看都會清洗掉20%到40%的數據。
大數據時代,數據成為了新時代的“富礦”,擁有數據的各方都不愿意無償將自己的數據共享。尤其是醫療機構之間,信息化壁壘很強,各大醫院之間的數據打通非常困難。楊文琳向21世紀經濟報道記者介紹了其多年前在基金會協助下建立的聯盟項目,將十家醫院的肺癌、胸外科和腫瘤科半年的數據進行開放,十家醫院的團隊都可以訪問調取數據。在電子病歷的監控上有一定作用,但更多的應用遇到了很大問題,即使通過國家衛健委的行政手段都不一定能夠拿到很多醫院的數據。
為解決“數據孤島”問題,北京市計劃建立大模型、高質量的數據庫,讓大廠和醫院統一接入,從而避免意識形態問題,提升數據整理效率。中國體制和歐美國家不一樣,中央政府、地方政府、國企央企牽頭可以建立一些基礎性集中性的數據資源平臺和基礎設施,促進醫療GPT的學習和發展,這項工作還需要更多企業單位進行配合。
征求意見稿第四條還規定:利用生成式人工智能生成的內容應當真實準確,采取措施防止生成虛假信息。醫藥行業真實性要求很高,需要數據庫及時更新修正。例如藥物阿瓦斯?。ˋvastin)的乳腺癌適應癥已經被取消,而GPT回答問題時會給出錯誤的答案。如果設計醫療對話機器人,也需要防止GPT虛構引用文獻和資料。
OpenAI所使用的數據以書籍和雜志為核心,沒有使用生物醫藥數據進行訓練,所以ChatGPT在醫藥健康領域表現不是很好,未來能否增加這方面的數據也存在很多挑戰。因為數據的原理、質量、預訓練模型不同,直接接入數據生成生物健康內容會產生很多錯誤。
從醫療全方位來看,預防、康復、患者管理三方面應用的前景很好,而且已經得到了很多的應用,但在臨床環節,涉及到管理內容特別多,實際推行存在很大困難。北醫六院信息化建設辦公室主任孫世偉認為,在監管、患者和醫務人員三個層面都有相應的問題需要解決。監管方面需要獲得政府部門的準許,患者的滿意度,對療效的期望都很復雜。速速科技CEO呂寧表示,用機器人的方式和患者進行長期隨訪的效果很不理想,患者如果意識到對方是一個機器人,產生反感度非常高,更多還是輔助工作人員提升工作效率。最后,很多醫務人員都感到“很多科技公司跟我來談是訓練模型,結果是來取代我”,不愿意推廣,還需要企業在宣傳上考慮到使用者訓練者的感情。
(文章來源:21世紀經濟報道)
標簽:
上一篇:鵬華基金劉濤:客觀理性分析市場 保持平穩投資心態_微頭條
下一篇:最后一頁