我們每個人身邊,或許都有一個關于“看病難”的故事。
一位西北內陸的朋友,為掛上北京某醫院專家號,花了近2000元買黃牛票,還要協調假期、長途跋涉——優質醫療資源供給不足且分布不均,導致“小醫院看不好,大醫院擠不進”。
如果醫生有不知疲倦的“分身”,如果頂尖的診療經驗可以跨越山海與時差,7x24小時在線……
互聯網公司一直試圖找到解藥——但早期的入局者,如春雨醫生、好大夫在線、微醫等,其核心思路大多是解決醫患之間的“信息差”,本質還是“連接” 。
然而,這一模式很快觸及天花板,因為它并未解決優質醫療服務短缺的根本問題。
直到AI入場,“AI醫生”獲得候補資格,隨時等待“上場補位”——在智能導診、報告解讀、影像判斷、臨床決策支持,“賦能”并“擴容”仍顯短缺的醫療供給。
最近兩年,大廠相繼加入了A醫療大模型的團戰。
騰訊于2023年9月上線“騰訊醫療大模型” ,發力智能導診、電子病歷等;京東健康依托其在醫藥供應鏈和互聯網醫療領域的既有優勢,于2023年7月發布了模型“京醫千詢”,補全其服務生態的AI能力 ;平安好醫生作為保險巨頭平安集團旗下的醫療健康平臺,推出平安醫博通,探索“醫療+保險”的協同模式;科大訊飛發布“星火醫療大模型”等,旗下“智醫助理”率先通過了國家執業醫師資格測試……
在與海外AI大模型比拼時,中國企業似乎也沒輸陣——比如,今年6月,斯坦福大學發布了一項有關臨床醫療 AI 模型的全面評測,顯示DeepSeek R1以66% 的勝率和0.75的宏觀平均分,在九個前沿大模型中脫穎而出,成為全球冠軍。
在這條高門檻、長周期的賽道上,同出一脈的螞蟻集團與阿里旗下夸克,也在今年先后亮出了各自的王牌:
螞蟻集團推出獨立App“螞蟻AQ”,定位為C端AI健康管家,上線十個月已累計服務超過1億用戶,近期還登上蘋果商店醫療榜第一。
夸克則選擇更輕量的入口,將健康大模型集成在AI搜索框中,并成功通過中國12門核心學科主任醫師筆試,成為國內首家主任醫生級AI,力圖成為用戶AI健康信息的首選入口。
兩者的對比,清晰地揭示了醫療大模型落地的兩種核心路徑:做深服務的“健康管家”、盤踞線上的“健康入口”。
在這場醫療大模型的團戰中,大廠戰略分野,同向但不同路。
一
體驗有差異:夸克給“答案”,AQ出“方案”
為了比較螞蟻AQ和夸克在醫療大模型上的差異,我們以自己最近的睡眠問題為例,分別在兩個平臺上進行了完整問診。
先看螞蟻AQ,給了我近似“醫生面對面”版的問診體驗。
打開AQ智能體,會看到一個干凈清爽的頁面。中央是對話框,用戶可選擇“智能思考”“深度思考”或“極速模式”;下方則是“AI診室”“拍報告”“醫保碼”“拍藥盒”“找醫生”等快捷服務入口。
頁面左側還設有個人信息頁,包括“健康檔案”“消息”“對話歷史”以及“不同智能體”入口,可關聯硬件設備以實現長期健康數據監測。
正式進入AI健康咨詢階段。當我輸入我的問題后,AQ啟動深度思考模式,快速生成了一份結合醫學文獻的初步報告。內容涵蓋了可能的病因分析、生活方式建議和調理方案,并且嚴謹地在每條建議后附上了文獻出處。
但坦白說,盡管這些信息完整、專業,但偏向于普適性常識,如睡前避免使用手機、保持黑暗環境等,對癥但不夠個性化。
這正是許多醫療大模型產品面臨的體驗瓶頸:能夠“泛泛而答”,卻難以“深入追問”。針對這一瓶頸,螞蟻AQ設計了“AI診室”功能,通過多輪追問來模擬真實醫生的問診過程。
接下來,螞蟻AI診室基于我的初始問題,發起了一連串高達10至15個的連貫提問,旨在系統性地收集病情信息、厘清細節 。為提升交互的透明度,其界面會展示“提問進度”,并解釋每個問題的“提問目的”——整個交互從“答題”變成“對話”,讓我這個很少在網上看病的人相信,這不是模板化的對話,而是我在與一位醫生建立對話關系,他正在為我進行一對一的診斷。
問診結束后,系統自動匯總生成一份完整的診療建議報告。這份報告的結構邏輯清晰,契合了患者就醫時的核心關切點:醫生我這是什么問題、是否嚴重,為什么會得這個病呢;那該怎么治、調理?后續回去要注意什么?
在這些基礎上,AQ還增加了兩條就診路徑:
•線下就醫:系統自動匹配醫院和科室,依據地理距離、醫保接入、專科評級等維度排序,緩解了“去哪看”的決策壓力。
•線上問診:列出相關科室醫生,可跳轉至“好大夫在線”等平臺,全國范圍內名醫資源,一觸即達提供診療支持。
從體驗看,AQ不僅給出了問題的解釋,也推動后續行動安排,試圖將“AI問診”延展為一整套診療流程——不僅給“答案”,也在給“方案”。
再看夸克,給我一種“搜索即問診”的輕量級體驗。
夸克健康大模型嵌入在搜索欄內,我直接在搜索框輸入同樣的問題,系統會調用模型生成結構化回答。
夸克同樣展現了AI醫生應有的深度與慢思考能力,最終給出的診斷意見也相當全面,內容覆蓋:可能的原因、就醫判斷、建議科室、可能的檢查項目、可能的治療方案以及日常調理建議。回答的底部還附有醫生問答參考鏈接,方便我進一步查閱、參考。
在“深度思考”模式下,模型一次性生成完整內容,還支持多輪交互。這種設計相對高效,對于已有明確癥狀、希望快速了解相關信息的用戶而言,具備一定便利性。
整個過程最值得注意的是,盡管夸克健康大模型已通過12個核心學科的主任醫師級別評測,但整個回答能明顯感覺到夸克的謹慎和克制——不會直接下結論,而是多用“可能”“建議就醫”等措辭,系統對某些不確定問題會主動拒答,或僅提供一般建議,不涉及診斷。
這或許和醫療大模型的長尾效應有關,即一個負面的應用個例就會對整個行業前景產生質疑。對此,夸克官方曾表示,夸克健康在訓練中引入了“慢思考”推理機制,以提高推理的合理性與答案的解釋性,同時設置多道校驗機制以降低幻覺率。
從用戶體驗上看,夸克更像是我在掛號之前的“助理醫生”,幫助我了解癥狀與可能路徑,是否需要就醫、去哪個科室等,但不參與診療流程的具體環節——給出大致的“答案”,但不出整體“方案”。
總得來看,螞蟻AQ與夸克健康在醫療大模型的賽道上選擇了不同的路徑。夸克偏向于成為一個高效、可靠的“信息入口”,而螞蟻AQ則致力于打造一個深度介入的“診療中臺”。
個體端的感受之外,我們同樣關注這兩者在醫療實際落地的應用。
螞蟻AQ相關人士告訴我們,截至目前,螞蟻AQ已完成專業醫療大模型的核心研發與驗證,具備“深度推理+多模態”能力,能理解文本、處理圖像、語音與視頻,訓練規模超過萬億tokens。
除了推出面向C端用戶的獨立應用外,螞蟻AQ和B端(機構和醫院側)主要在合作與賦能階段,尚未直接進入診斷一線替代醫生診斷,主要還是提供診前—診中—診后的輔助服務。
B端落地上,螞蟻AQ與上海仁濟醫院共建專科數據集,探索模型在真實臨床場景中的應用;參與浙江衛健委“安診兒”項目,攜手硬件與數字醫療廠商推進模型部署等。
螞蟻AQ還打造了一系列AI工具輔助醫生工作,包括醫生工作站、病例管家和電子病歷生成工具等。
據悉,目前螞蟻AQ的智能體系統已進入多個專病管理領域,如聯合浙大二院,為心臟瓣膜病患者提供術后管理服務;與杭州市七院合作推出睡眠智能體,已覆蓋全國342個城市、服務用戶超500萬。
也就是說,除了在C端的影響力外,螞蟻AQ在B端也正在從技術平臺走向“系統能力提供者”,B、C端齊頭并進。
和螞蟻AQ相同,目前夸克健康大模型也沒有深入到臨床一線診斷治療環節的合作,主要是在健康知識提供、醫學思維訓練及輔助診療決策等方面發揮作用。
從行業格局看,夸克更偏向于“醫療AI信息基礎設施+健康搜索入口”的打法。為此,他們納入400多位副主任醫師及以上級別專家,深度參與模型訓練,以此提升醫療大模型的精準度。
在北京大學人民醫院皮膚科主任李厚敏為代表的多位專家看來,夸克的回答“像一個醫生在思考”。尤其是在優質醫療人才短缺、同時診治疾病較為多元的基層全科診療中,夸克可作為醫生的輔助工具,為其補充跨學科知識、提供治療建議,提升診療準確性與效率等。
不過,無論AQ還是夸克,其定位還是“輔助”醫生,而非“替代”醫生。
二
同向不同路:服務閉環VS信息入口
兩種體驗的背后,是兩條涇渭分明的戰略路線。
螞蟻AQ選擇了一條“重”且“深”的服務閉環之路,而夸克則選擇了一條“輕”而“廣”的信息入口之路。
先看螞蟻AQ。
螞蟻布局醫療大模型,其內部認為是“水到渠成”——從解決患者的支付困難到接入醫院幫患者掛號,再到打通醫保體系,支付寶不斷強化其一站式醫療服務平臺的站位。進入大模型時代,螞蟻將AI嵌入醫療“前端”,貫穿醫生診斷和醫院就診全流程。
AQ智能體通過學習頂級專家診療思路,輔助醫生處理病例,實現“分級診療”:80%的基礎問題由智能體解決,復雜的20%由線下專家跟進。它負責分診、導診和服務聯動,構建完整服務閉環。
一個被AI重塑的就醫路徑就這樣誕生了:用戶在感到不適時,先可在AQ咨詢。若為輕癥,AQ直接給出建議;若復雜或重癥,或用戶需要線下就診,AQ根據距離、科室、醫生等需求推薦醫院并完成導診、分診。之后還能協助支付和醫保報銷。
就診結束后,AQ還根據用戶體檢和就診情況,提供健康護理建議,如飲食、復診時間。用戶還能綁定智能硬件,實現日常健康監測和管理。
由此,AQ智能體貫穿患者“診前—診中—診后”全流程,甚至延伸至日常健康管理——此時,AQ要做的是一個“AI私人醫生+健康助手”,助力醫療資源擴容。
AI賦能醫療服務眾多環節
資料來源:甲子光年,招商銀行研究院
但要實現這一角色,僅靠一個“工具型小程序”是不夠的,螞蟻因此選擇獨立App這條“重”路徑。在螞蟻AQ看來,真正的健康管家需要主動觸達和及時交互。例如,當智能硬件監測到血糖異常時,AQ須能立刻預警。而支付寶內的小程序推送易被淹沒,入口路徑深,用戶感知受限。
此外,做健康管家還需在醫療生態產業鏈掌握主動權。螞蟻整合了支付寶十余年積累的醫療生態,包括醫保、醫院系統、商保渠道,以及年初收購的“好大夫”平臺。AQ還接入269個醫生智能體、200多家金融機構、華為、魚躍等硬件廠商,形成院內外全周期健康管理閉環。
這種生態聯動,或許將成為AQ智能體的核心壁壘,是純技術公司短期內難以復制的。
相比螞蟻AQ在醫療供給側的深耕,夸克選擇了一條輕量、非侵入、強調權威信息的路徑。
作為國內首個通過12門核心學科主任醫師評測的AI大模型,夸克健康大模型更像一個線上的“專業顧問”——它不承擔診療任務,也不構建服務閉環,而是通過“主任醫生級AI”能力,為用戶提供可信易懂的健康知識解答。
這條“輕”路徑,與其在阿里體系中的戰略角色高度一致。
阿里2025財年第三季財報電話會上,阿里巴巴集團CEO吳泳銘明確阿里未來三年將圍繞AI做三大投入:一是AI和云計算的基礎設施建設,二是AI基礎模型平臺與AI原生應用,三是現有業務的AI轉型升級。
其中,夸克被視為“模型能力外放的第一入口”。財報會結束一個月后,阿里把夸克正式確立為“AI旗艦應用”,產品形態升級為無邊界的“AI超級框”,并宣布未來通義系列大模型的最新能力將第一時間接入夸克。
作為阿里欽點的“AI旗艦應用”,夸克的目標成為AI時代的“超級入口”。健康大模型是夸克“多智能體矩陣”中的關鍵子Agent:通過深度參與醫療場景這個對專業門檻要求最高的領域,夯實平臺的可信認知,進而完成向教育、辦公等領域的能力遷移。
因此,夸克并不追求診療閉環,而是強調“專業可信+內容可讀”。它搭建了完整的“數據—模型—產品”體系,用“慢思考”“思維鏈”等技術提升推理質量,確保輸出內容的準確性與可理解性。
對此,夸克方面向《財經故事薈》透露:未來,團隊的重點仍將是內容質量與用戶滿意度,比如回答更精準、輸出的內容更容易讓用戶理解。總之,短期內并不追求醫療服務閉環,也不急于商業化落地。
三
尋找“新支柱”與搶奪“AI船票”
將視線拉高,兩條路線的選擇,最終都服務于各自母公司在AI時代的宏大棋局。
目前,“普惠醫療健康”已被正式納入螞蟻集團五大主業,與“普惠金融”并列。對螞蟻而言,醫療的價值不僅體現在新業務本身,也體現在與現有體系的協同效應上。
一個高頻、高信任度的健康服務入口,既能拉升支付寶平臺黏性(協同數字支付與生活服務),又為保險等金融產品創造數據驅動的個性化場景(協同數智普惠金融),同時還能作為集團AI能力的最佳范例,向政企端輸出模型能力(協同科技產業化)。
尤其是金融和健康醫療的協調,參考平安好醫生曾推動的“醫療+保險”打包增值路徑,未來AQ所沉淀的用戶健康檔案、慢性病行為數據,或許能反哺到保險產品的定價和風控,形成“健康管理+風險保障”的閉環協同——眼下答案尚不明確,但模式不難想象。
如果說螞蟻押注“普惠醫療”,是為了夯實新業務地基、拉動生態協同、尋找第二條增長曲線。那么夸克切入醫療并不只是押注某一個垂類場景,而是為了搶占AI時代的“船票”——建立一個AI時代真正意義上的超級入口。
在電商增長趨緩、平臺紅利見頂的背景下,阿里面臨的是從交易平臺向AI平臺轉型的結構性挑戰。這個轉型繞不開一個前提:必須有一個能承載大模型能力、與用戶保持高頻互動的通用入口。
正如普華永道中國AI咨詢主管張為峰所言,AI“超級入口”將重構下一代的流量控制權。一方面,它是用戶與智能服務的“第一觸點”;另一方面,它也是重構商業模式的關鍵支點——從廣告到訂閱,從一次性交易到多輪互動,從平臺分發到任務驅動,都是圍繞入口重新排布。
AI時代的“超級入口”之爭已經打響。PC時代,百度主導信息流;移動時代,微信掌控社交;而在AI時代,誰先占據用戶心智,誰就能重構平臺價值分配的規則。
被欽定為“AI旗艦應用”的夸克,要承擔起打造國內首個DAU破億AI超級App的使命。阿里巴巴智能信息事業群總裁吳嘉希望將夸克打造為“機器貓的口袋”——“一是Smart(聰明),二是專業,三是萬能,要All in one”,成為“每個人都可以用的工具”。
而健康咨詢幾乎算得上全民剛需,且一旦建立信任,用戶黏性極強。如果能在這一高門檻場景中建立起專業權威的品牌形象,就有機會將信任遷移至教育、辦公、搜索等更多領域,從工作到學習,搶占AI時代的“默認入口”。
四
中美有差距:星辰與泥濘
醫療大模型唯有與當前的醫療服務體系結合,才能充分釋放潛力。
對此,上海某三甲醫院院長告訴《財經故事薈》,“不夸張地說,醫生可能是最樂意擁抱新技術的群體。我們不講新舊,有用我們就想用就愛用。”
在他的微信朋友圈里,幾乎每隔兩三天,就會轉發AI大模型相關內容,“醫療服務體系的任何環節,AI大模型都有機會切入”。
據中國醫療大模型行業白皮書披露,2019—2023年,中國醫療大模型市場規模從27億元增長至107億元,預計2028年將達到976億元。
資料來源:《中國醫療大模型行業白皮書:精準醫療,智能未來》,招商銀行研究院
但在抵達這片星辰大海之前,所有玩家都必須正視并穿越一片由數據、技術、倫理和法規構成的“泥濘”地帶。
正如前述院長所提醒的,“在醫療領域,我們固然要迎接AI、用好AI,但不能夸大,必須先經過嚴苛的臨床驗證。”
這并非一句空話。相比之下,國際頭部醫療大模型在進入臨床前,其驗證的廣度與深度已為我們設立了極高的標桿。
例如,梅奧診所(Mayo Clinic)的AI心血管風險預測系統,在獲批前通過了覆蓋全球17個國家、136家醫院的聯合驗證,累計病例高達23萬例。這種工業級的、大規模的嚴謹驗證,正是國內模型需要補上的第一課,也是必須跋涉穿越的“泥濘”。
近期舉辦的世界人工智能大會醫療論壇上,國內外多位頂尖院士和專家坦言,當前醫療大模型要從“可見”走向“可靠”,仍需克服三大核心困境:
一是,“開放”與“安全”的沖突。
數據是模型的燃料,也是最敏感的資產,尤其在醫療領域。德國科學院院士Roland Eils教授指出,盡管技術上AI已在多項能力上超越人類,但大語言模型在臨床的落地率僅有5%,核心瓶頸就在于數據隱私的嚴格限制。
這背后是《中華人民共和國網絡安全法》《中華人民共和國數據安全法》和《中華人民共和國個人信息保護法》構筑的數據安全紅線。如何在這道紅線之上,破解醫療數據流通不暢的難題,已成為政策的焦點。
好消息是,從國家層面來看,2023年設立的數據局以及計劃于2025年啟動的國家數據集團,體現了國家對數據未來價值的認可與重視,醫療健康領域數據商業化政策雛形漸顯,各地也開始積極進行醫療數據商業化的嘗試。
政策持續加碼推動醫療數據智能化應用
資料來源:政府官網、招商銀行研究院
二是,“通用”與“專用”的技術鴻溝。
正如我們前面所說,醫療大模型領域一個負面例子足以引起公眾對整個行業的質疑——醫療不是一個通用大模型可以輕易征服的領域。
它需要專科化模型,像醫生分科室一樣,針對特定器官和疾病進行深度訓練,才能減少“算法幻覺”,真正提升臨床的精準度和實用性。這意味著,從通用技術到專用產品的轉化,仍有很長的路要走。
三是,“技術”與“溫度”的倫理考驗。
醫療的終點是服務于人。
中國科學院院士葛均波認為,AI作為臨床診療的得力助手,其倫理規范問題亟待厘清。這不僅是指算法的公平性、可解釋性和對隱私的保護,更是指如何將冰冷的技術融入充滿情感與信任的診療關系中。
這些現實困境,最終都指向一個核心原則:至少很長一段時間,AI醫生的角色只能是“輔助”,而非獨立的決策者。診斷決策仍然牢牢掌握在人類醫生手中。
從橫向對比來看,中國醫療大模型落地的速度和深度,相對美國,還有明顯差距——既有 技術的差距,還有從臨床驗證、系統整合到信任建立的系統性差距。
首先,在商業模式上,歐美逐漸形成了“價值驅動”的良性循環。
據天翼智庫發布的報告, 歐美頭部玩家已在醫療文書自動化、重癥管理、腫瘤精準診療等高價值領域,成功構建了“臨床信任→常態化使用→價值創造→商業付費”的閉環。AI不再僅僅是降本增效的工具,而是能夠直接參與價值創造并獲得回報的生產力平臺。
其次,在應用深度與廣度上,差距體現在“系統平臺”與“單點工具”的分野上。
•應用廣度失衡:歐美醫療大模型已均衡覆蓋診療全流程,其中診斷類占38%,治療規劃類占29%,預后監測類也達到了21%。以MD安德森癌癥中心為例,其AI系統已覆蓋從篩查到個性化治療的全鏈條。相比之下,國內三甲醫院的AI應用中,影像診斷類占比高達82%,而在治療和預后等核心環節的滲透嚴重不足。
•整合深度不足:國際標桿項目展現出真正的“人機協同”。梅奧診所的AI術前規劃系統,可實現從自動調取數據(準確率98%)、智能生成方案(符合率91%)到術中實時導航(誤差<0.5mm)的全流程支持。而國內同類應用多停留在提供術前靜態建議,導致實際采用率不足40%,未能深度融入臨床工作流。
中美差距還直觀地反映在臨床采納與信任度上。
在美國頂級醫療機構中,高達87%的科室已實現AI工具的常態化使用(每周>50次),其中放射科、病理科的采納率更是達到了95%。醫生對AI的信任已經轉化為日常工作習慣。
要填平中美醫療大模型之間的系統性差距,螞蟻和夸克們必須聯手中國醫療機構,一起加速追趕了。