黑馬與巨頭,角逐Agent Infra戰場。
今年Agent一波波熱浪下,一家捷克創業公司——E2B,意外爆火。
成立兩年,它的云端沙盒從默默無聞到月創建量突破1500萬,一年暴漲375倍。
這背后,是Agent正在掀起的新一輪云計算基礎設施變革。
E2B起初只是一個讓用戶在云端安全隔離“沙盒”中運行AI代碼生成的小項目,這些沙盒本質上是輕量級虛擬機。2024年10月,Anthropic推出Computer Use技術——讓AI能像人類一樣操作電腦。很快,E2B發現越來越多用戶將其沙盒用于此類任務。隨著Agent從實驗室走向生產環境,E2B也順勢將定位升級為Agent運行環境。
市場隨即引爆——士氣大增的E2B CEO也放話,要成為Agent時代的AWS,提供覆蓋Agent從開發到部署全生命周期的自動化基礎設施平臺。
在云計算的發展史上,每一次應用形態的重大變化,都會催生新一代基礎設施。十多年前,移動互聯網興起,推動云計算第一次大規模爆發——從社交到電商,從視頻到打車,幾乎所有應用后臺都搬上了云。如今,這一幕正在Agent身上重演。
從去年下半年到現在,Agent正從技術探索快速走向生產環境。它們會寫代碼、做數據分析,還能自主瀏覽網頁、跨軟件執行任務,甚至開始完成復雜的跨平臺業務操作。它們需要的,不是傳統意義上的云主機,而是全新的運行環境——Agent Infra。有業內人士向數智前線“斷言”,未來3~5年,Agent Infra將是云計算競爭最激烈的焦點。
大型云廠商豈能錯失這樣的機會?7月28日,在上海世界人工智能大會(WAIC)上,阿里云正式發布了專為Agent打造的無影AgentBay,歷時三個多月的內測和打磨,產品體驗煥然一新。此前不久,AWS也推出AgentCore,在部分區域試用。無論是E2B、AgentBay,還是AgentCore,它們本質都在做一件事——為Agent提供更好的基礎設施,也就是Agent Infra。
01
Agent上工,數字員工需要新一代“辦公室”
短短一年時間,Agent已經從技術圈的“玩具”,迅速進入企業生產一線。
在《財富》500強企業中,約79%已啟動Agent項目,金融、電商、客服等行業已進入規模實踐階段。Gartner高級首席分析師費天褀告訴數智前線,中國企業Agent落地速度甚至快于全球:15%已實現生產落地,高于去年全球平均水平的10%。
這背后,不只是技術熱度和噱頭,更是企業的現實壓力。對于中國企業,尤其是中小企業來說,引入Agent既是“生存創新”,也是“普惠升級”。他們傾向于先用小型、低成本Agent跑通業務,再逐步擴展。這種務實打法,讓Agent在中國的商業化速度格外快。
不過,從傳統應用到Agent,有質的不同。
如果說傳統應用開發像“劇本殺”,開發者提前寫好劇情,系統只需按流程演一遍,Agent則更像“即興演員”,能自己判斷場景、規劃動作,還會在執行中隨時調整。正如圖靈獎得主Yann LeCun所說,Agent不應是“缸中之腦”,而要能與環境交互、影響環境,并據此改變行為。
與傳統應用相比,Agent擁有更復雜的“工作能力和要求”:
•感知:有“眼耳口鼻”,能讀屏、識圖、聽音、解析界面結構;
•任務規劃:推理大模型將復雜目標拆成多步子任務,按反饋動態調整;
•多工具協同:調用多種工具和API,查數據、發郵件、翻譯、編程……就像帶著一把“瑞士軍刀”;
•長期記憶:跨會話保存狀態,能記住歷史信息持續優化決策;
•自主交互環境:像“數字員工”一樣操作電腦、手機和網絡,點擊、輸入、切換應用等。
阿里云無影事業部總裁張獻濤直言,如果每家公司開發Agent,都要從零搭建這些能力,尤其是中小企業或個人開發者,幾乎是不可能的。
跨境電商是Agent落地最快的行業之一。過去五年,中國跨境電商規模暴增10倍。整個跨境電商是一個復雜鏈路,從生產到在線交易再到物流、售后服務,Agent都在發揮作用。以運營小二為例,每天要花大約40%的時間聯系商家確認是否參加大促活動,他們提取Excel 名單、打開釘釘找商家、發消息、等回復,回填表格……流程機械、耗時。
有了Agent,這件事可以全自動化,模型規劃步驟、跨工具執行,一氣呵成。不過,跨境電商參與者大都是中小企業,在國內超過70萬家,多數缺乏技術能力。如何讓他們能參與到Agent開發應用中,帶來更加普惠和公平的交易秩序?
傳統的本地化部署根本不能很好地支撐這樣的需求,Agent上云迫在眉睫:
如本地算力,無法實現高并發。尤其是精準的Agent任務,會迅速耗盡算力資源。Manus年初demo期間的磕磕絆絆,問題也是出在了資源瓶頸上,AI推理的算力和執行任務的虛擬機都沒有上云。
環境不匹配,傳統云缺乏操作環境,難以讓Agent像人一樣操作電腦、手機和網絡。
數據割裂,跨工具難以保證數據一致性。
還有安全隱患,要防止Agent誤操作或泄密,需要額外隔離系統......
于是,Agent Infra誕生了。它就像為“數字員工”打造的云端辦公室——開箱即用,性能強勁,安全隔離到位,讓企業尤其是中小商家,可以低門檻把Agent從試點推向生產落地。
在世界人工智能大會期間,張獻濤進一步介紹,在阿里云看來,Agent開發需要構建一個類似“操作系統”的生態。
就像傳統操作系統產業鏈中,有人專注內核,有人打造中間件,有人開發應用層。張獻濤介紹,在Agent開發生態中,這次商用的無影AgentBay類似“內核層”,為Agent開發者提供從開發、測試到規模化運行的全生命周期服務。
它由阿里云無影事業部研發,該業務部在阿里云定位于云+端側AI的重要承載者。無影AgentBay克服了Agent在高并發場景下的運行挑戰。
同時,由于MCP協議只覆蓋部分工具,且缺乏評價體系,市面上MCP工具質量參差不齊,導致Agent在任務執行中,一致性和精準度不足。為此,AgentBay將Browser Use、Computer Use、Mobile Use、Code Space四大沙箱環境打包成服務,覆蓋了從Linux、Windows、Android主流環境,讓Agent在跨環境、跨工具時保持穩定與準確執行。
如果AI大模型是大腦,AgentBay則幫助Agent裝上“手和腳”,讓Agent不僅會思考,還能精準地動手做事。再加上跨環境持久化、智能感知與控制接口,以及秒級啟動能力。就像為Agent準備了“專用電腦”,但它不在你的桌子上,而是在云端。
數智前線獲悉,從去年底,無影事業部就開始著手AgentBay的研發,來搶占Agent Infra先機。而這些能力的上線,也有賴于該平臺“站在阿里云的肩膀上”來實現。
02
Agent Infra實戰,數字員工這樣干活
雖然Agent Infra建設時間不長,但市場已給出了積極反饋。
在海外,E2B沙盒月創建量一年暴漲375倍;國內,阿里無影AgentBay內測3個多月,就吸引了超過1000家客戶申請使用,頭部幾家Agent公司都在用它做開發和運行。
有了Agent Infra的加持,Agent開發和使用,體感到底怎么樣?在世界人工智能大會期間,我們看到了不少實操案例。
和去年相比,Agent的執行力已經完全不同——去年底,Agent像人一樣操作電腦、手機,還是個新鮮事,而且要大量定制化開發,接口限制、界面識別都是難題;今年,Agent已經可以融入工作流,開始完成各種跨平臺、多步驟任務。
場景一:跨平臺自動化操作
在AgentBay的Computer Use環境中,開發者只需一句話: “安排2025年7月26日無影WAIC準備會議。”右側沙箱顯示,Agent就會自動打開釘釘,解析界面布局,找到日程功能區,填寫會議信息并發送通知,整個過程僅十幾秒,就完成了任務閉環。
這種能力突破了傳統即時通訊軟件因為非常多的接口受限,自動化難以落地的瓶頸。
另一個“Browser Use”案例,是讓AI自動識別“2048”游戲并進行游玩。
這個操作看似簡單,背后卻有著復雜機制,AgentBay會解析游戲界面,識別數字區塊和空白區域,推算下一步滑動方向,然后進行操作,之后還要觀察下一個出現的數字,最后獲得相應分數,這個分數已比大部分人玩的成績要高很多。雖然只是個游戲場景,但技術核心和自動化業務流程相通——都要先看懂界面,再精準動手。
場景二:復雜任務拆解與執行
有位開發者在第三方編程工具 Cursor 中給了這樣一個指令:“打開一個無影安卓環境,查找最近的加油站并推薦給我,給我一個訪問鏈接,整個過程讓我能看到。”
過去,這種任務需要自己開虛擬機,一步步來編程。
現在,AgentBay聽懂后,會借助三方應用的能力把它自動拆成十幾個小步驟:先生成訪問鏈接,再打開高德地圖,輸入“加油站”,讀取結果并按距離排序,最后告訴你哪個最近。
更巧的是,如果執行中遇到UI元素識別失敗或輸入信息失敗,它不會卡死,而是自動回到那一步重新執行,而不是等你手動救場。僅這一個產品上的設計,就解決了眾多Agent開發者最頭疼的問題——“到底卡在哪了呢?”
場景三:人機協作
跨平臺操作中,還有一個老大難:賬號登錄與權限校驗。
很多時候,這類需要人工參與的環節會讓自動化流程中斷。那怎么既保證安全,又不讓任務半路夭折呢?
現場演示中,在Cursor里輸入:“搜索社交平臺上關于某商品的使用心得,如果需要登錄,就移交給我手動操作。”
Agent 執行到登錄界面時,會自動切換到人機協作模式,把控制權交給人類。用戶手動輸入手機號和驗證碼,登錄成功后,只需回復一句“我已登錄”,Agent就接過“接力棒”,繼續任務直到完成。
這種無縫切換得益于AgentBay自研的ASP協議,它能將云端環境完整、流暢地串流到本地,讓人和Agent像同桌一樣配合,任務不會半途而廢。
03
Agent Infra的長跑才剛剛開始
根據大會期間,阿里云智能集團無影事業部資深產品總監李航介紹,支撐這些能力的,是AgentBay的5+3+N體系:
其中,“5”是Browser Use、Computer Use、Mobile Use、Code Space四大沙箱環境 以及統一持久化系統(構建一套跨平臺數據漫游系統,確保任務切換時的連續性);
“3”是SDK、MCP、ASP三種交互方式,覆蓋本地開發、跨平臺工具、端云協作;
“N”是覆蓋了云環境鏡像、網絡配置、MCP工具、實例生命周期管理等全流程自由定制工具鏈。
有了它,開發者不必再為底層環境和工具兼容操心,專注于業務邏輯和智能體設計即可,這讓開發效率提升80%,運維成本降低60%,可靠性達99.99%。這將是新時代下,Agent應用開發的全新范式。
然而,這場關于Agent Infra的長跑才剛剛開始。
如果未來Agent真要成為“數字分身”,行業還需持續攻克優化一系列難題:讓它擁有真正的長期記憶、在多任務間高效協同、多工具間保持數據一致,并且在電腦、瀏覽器、手機等多終端中,都能用安全、易用、可擴展的沙箱來工作。
張獻濤還透露,未來Agentbay還將向全能型Agent Infra演進,可以托管Agents應用,覆蓋AI Agents從開發到部署的完整生命周期。
可以預見,Agent Infra不只是為Agent提供辦公桌,它更像是為未來的“數字分身”打地基。這是一場剛剛開始的基礎設施長跑,最終目標是——讓每個行業都能用上屬于自己的各種Agent。