亚洲国产成人91精品_99视频热这里只有精品免费_精品国产乱码久久久久久虫虫漫画_日韩精品三区

首頁 > 每日活動 > 每日活動 > 別擋在AI基礎模型廠商進化的路上做創業生意

別擋在AI基礎模型廠商進化的路上做創業生意

發布時間:2025-07-31 21:12:57

"別擋在AI基礎模型廠商進化的路上做創業生意。"

OpenAI創始人山姆·奧爾特曼的這句話含金量還在上升。

其中一個原因是,在模型進化的路上,即使是在一個窄小的領域,實現AI的無幻覺性能,都是一項困難的任務,初創公司很難有資源與模型大廠抗衡。

一家名叫Harmonic的初創公司偏不信邪,其正試圖解決這個問題——開發完美無缺的零幻覺AI。

近日,這家公司推出了面向IOS和Android的聊天機器人應用程序測試版,普通用戶可以通過這款程序,訪問其人工智能模型Aristotle。其首席執行官兼聯合創始人Tudor Achim表示,Aristotle是人類可以進行推理并正式驗證產出的第一款產品,在Aristotle支持的領域——定量推理,可以保證沒有幻覺。同時,Harmonic還表示計劃發布一個API,讓企業訪問Aristotle。在Harmonic的官網中宣稱,其正在Github上公開發布Aristotle的完整證明,由于其經過正式驗證,無需人工檢查,這使得Aristotle在前沿人工智能模型中,處于高級數學推理性能的最前沿。

Harmonic在新產品的宣傳攻勢中表示,Aristotle在第 66 屆國際數學奧林匹克IMO2025中取得了金牌。這場比賽也被視為AI數學能力和AI推理能力的“成人禮”。

雖然這一成績也同樣被谷歌和OpenAI斬獲,但Harmonic認為這兩家大廠“并非通過形式化驗證手段取得結果”。從目前AI領域發展的整體來看,形式化(Formal)和非形式化(Informal)兩種路徑,到底哪種更有優勢仍難以說清。

“如果從數學的角度,Scaling Law這條路跑到最后,一定會收斂。”一位頭部基金合伙人告訴虎嗅,即便已經具備極高的行業地位,他仍然會每天閱讀最新的論文,尋找突破AI邊界的新的理論創新,這將是如今最具潛力和價值的地方。

也正因如此,Harmonic,這個成立僅兩年,專注解決AI邊界問題的初創企業,吸引了幾乎所有頂級投資機構的目光,估值從零飆升到接近9億美元。

不久之前,它就像一塊磁石般吸引了近2億美元的投資——從紅杉資本到凱鵬華盈,從Index Ventures到Paradigm。這對于一家初創公司來說,都是一個不小的數字。

不過,針對基礎模型的技術創新和創業,從來是一項燒錢的生意,一位硅谷投資人表示,如今基于基礎模型的創業,早已是“富二代”的游戲,要么足夠天才,要么足夠有錢。

如果回溯Harmonic兩位創始人的經歷,這兩個條件,Harmonic都具備。

我們試圖拆解這家在數學領域,和Open AI同臺競賽的初創公司,其背后的技術路線和厲害之處,回答Harmonic這將近9億美金的估值,憑什么?其究竟如何實現數學推理中的AI零幻覺?

Harmonic的兩位聯合創始人——Vlad Tenev和Tudor Achim背景獨特,一位在數學天賦上得天獨厚,而另一位則在AI領域積累了深厚的經驗,還有一個關鍵因素是,Vlad Tenev很有錢。

左為Vlad Tenev,右為Tudor Achim

Vlad Tenev數學出身,他在斯坦福大學學數學,還曾在加州大學洛杉磯分校讀過數學碩士,甚至還師從數學大師陶哲軒。

后來他投身金融科技創業,創立并擔任Robinhood首席執行官,如果要更形象地比喻,Robinhood,是一個用手機 App 把股票、期權、加密貨幣甚至 IPO 打新都變成零傭金、低門檻、游戲化交易的互聯網券商平臺。2021年,Robinhood在納斯達克上市,這家公司在Forbes 的實時估值已經達到約 55 億美元。

Vlad Tenev的公司Robinhood的Forbes實時估值

這也是為何Harmonic和Vlad Tenev被稱為“美國版DeepSeek”和“梁文鋒”的原因,創始人資金非常雄厚,在最一開始可以以非常純粹的態度進行技術研究。Harmonic成立之初,用的一部分,就是Vlad Tenev的個人資金。

Tudor Achim則是計算機科學的專家,他從卡耐基梅隆大學計算機科學系畢業,后來在斯坦福讀博士,后來因為創業中途離開。

2016年,他和別人一起創立了自動駕駛公司Helm.ai并擔任技術總監。在那里,他積累了豐富的AI算法開發經驗,深知如何把AI技術應用到復雜的現實問題中。Helm.ai至今已經融資1.02億美元,還得到了本田的支持。

Tudor Achim創立和自動駕駛公司的產品演示

兩位創始人有個共同理念,就是"讓AI會思考、講真話,不撒謊"。他們的想法可以歸納為四點,首先,AI必須說實話:AI的輸出必須經過嚴格檢驗,確保結論準確無誤;其次,AI不能胡說八道,模型不能編造不存在的事實,寧可說"我不知道"也不要亂猜,通過嚴格的邏輯約束避免無根據的回答;第三,讓AI像科學家一樣思考:把假設-推理-驗證的科學方法植入AI,讓它能夠自動探索和證明新結論;第四,人機合作而非替代,Harmonic認為AI數學助手應該幫助人類,而不是讓用戶沒事可做。他們希望AI負責處理繁瑣的證明工作,人類負責提出有創意的想法。

正如他們在官網中寫道,驗證問題,是拓展人工智能工具效用的主要瓶頸,他們的使命是,探索人類理解的前沿。

Harmonic做了什么?

通用語言大模型的幻覺率長期居高不下,已成為制約其深入 AI下半場——“應用”的最大阻礙,也正因為如此,“幻覺”同時也是業界眼中的“最美的一塊肥肉”。哪家初創企業在這塊陣地將幻覺率限制到一個較低的水平,同時保持AI的智能水平,誰就能撬動更加龐大的市場。

比如,我們看到各類 AI 應用在 C 端紛紛強調“實用性”與“可交付性”,努力用工具鏈與插件系統來彌補模型輸出不穩定的問題,但在追求極低容錯率的B端精密場景——像是金融建模、自動化編程、科學推理、法律合規等“不允許幻覺出現”的領域,通用大模型仍然舉步維艱。

2024年,Harmonic的當家產品誕生了,一個叫Aristotle(亞里士多德)的數學推理AI模型。

Aristotle的特別之處在于,它是個一站式數學AI:從理解普通話的數學問題,到生成嚴格的數學證明,再到用人話解釋答案,一個模型全包了。雖然還沒有關于Aristotle底層技術架構的豐富信息,但Harmonic已經通過官網公開了不少信息和成果。

主要解決了三個問題:

首先是幻覺問題。通用大模型經常無中生有,編造不存在的內容。Aristotle通過Lean證明這個"硬約束"徹底解決了這個問題:每一步推導都需要得到系統認可,不允許憑空編造。一旦模型想輸出錯誤結論,Lean立即報錯拒絕。

其次,推理過程不清楚。傳統AI即使能給出正確結論,推理步驟往往混亂或不完整。Aristotle通過詳細展示每一步推理來解決這個問題。由于有Lean檢查,整個推理鏈上的每個環節都必須邏輯清晰,讓最終證明既正確又透明。這就像給出了"答案的答案"——不僅告訴使用者結論,還展示如何一步步得到它。

最后,傳統大模型往往不夠嚴謹。普通AI對問題的回答可能對錯不分、過于自信,而Aristotle因為內置了數學邏輯,回答風格更謹慎客觀。任何定理未經證明就不能用于下一步推導,這種嚴謹性確保了Aristotle非常適合高風險場景(如金融模型檢查、醫療推理),因為它不會"差不多就下結論"。

2024年中,Harmonic宣布Aristotle在評估AI是否能讀懂、建模并證明數學題的一項測試集——MiniF2F中創下了新紀錄,領先了一眾大模型,這個測試集包含 488 道形式化數學題目,涵蓋數學核心領域(如代數、數論)。

比如,其官網展示了一道2001年國際數學奧林匹克的難題:給出題目和人類證明草稿后,Aristotle能自動生成完整的嚴格數學證明。這個例子顯示了Aristotle如何把人類的自然語言證明翻譯成機器能檢查的嚴格代碼。

來源:Harmonic官網

在最近,Harmonic最新推出的Chatbot式應用程序的一波宣傳攻勢中,兩位創始人聲稱 Aristotle做數學推理問題時給出的答案完全“無幻覺”。 此外,Harmonic還計劃發布一個to B的 API以讓企業可以訪問,以及一個面向消費者的網絡應用程序。

兩年估值接近9億美元

Harmonic自成立以來,就受到了投資界的熱烈追捧,短短兩年內就完成了多輪大額融資。

從融資時機來看,Harmonic踩得很準, 2024年,OpenAI推出了新模型,雖然展現了一定的數學能力,但還是會犯錯,幻覺率仍居高不下。

這讓整個行業開始意識到"AI需要更嚴謹的推理能力",正好給Harmonic這樣的公司創造了機會。

A輪融資時,投資方大多有學術或技術背景,他們看好Harmonic在學術上的突破。

進入2025年,AI行業競爭越來越激烈,各大公司都在搶著布局更強的多模態和推理AI。特別是DeepMind在2024年底推出的AlphaProof取得成功,更是引發了市場對"AI證明"這個領域的關注。

Harmonic在此時又適時開始融資B輪,正值整個行業尋求將AI從“能用”到“可用”的節點。

根據公開信息,Harmonic的種子階段由聯合創始人Vlad Tenev 個人和天使投資人提供啟動資金,主要用來組建團隊和開展基礎研究。

A輪融資在2024年9月完成,拿到7500萬美元,公司估值達到3.25億美元。B輪融資于2025年7月宣布,又融了1億美元,公司估值接近9億美元,離10億美元大關僅差一小步。

Harmonic的融資圖

Harmonic的投資人陣容相當亮眼,既有頂級硅谷投資機構,也有行業基金和學術背景的資本,不僅有傳統的頂級風投,還有新興的科技基金。

例如其A輪由硅谷知名的紅杉資本(Sequoia Capital)領投,歐洲著名的Index Ventures緊跟其后。

同時,多家國際基金和知名個人也參與投資。B輪融資則由老牌投資機構Kleiner Perkins領投,專注加密和前沿科技的Paradigm大手筆跟投。紅杉和Index作為老投資者繼續投錢,金融科技投資機構Ribbit Capital新加入。此外,Quora聯合創始人查理·切沃(Charlie Cheever)也以個人身份參與了B輪。

一個叫做“Lean”的超級“數學監理”

Harmonic究竟做了什么解決AI在數學推理上的瓶頸?

這要從數學界正在發生一些有趣的變化說起。

越來越多的數學家開始使用一種叫Lean的工具來寫數學證明,這是一個由微軟研究院開發的交互式定理證明系統,它能結合數學證明和編程的系統,能用代碼形式精確地表達并驗證復雜的數學理論,這成為了Harmonic的技術核心。

在Lean之前,大模型寫數學證明的時候,幻覺往往表現在,看起來似乎說得頭頭是道,但往往會出現中間某一步是“AI覺得對”。

Lean則相當于一個數字化的超級監理和3D打印機器人

每寫下一行代碼,它就立刻像監理一樣,用激光尺、鋼筋掃描儀(形式化邏輯規則)分毫不差地檢查一遍。只要發現缺了一根釘子、少了一塊磚,它馬上紅燈報警,并要求返工。一旦全部綠燈,Lean 會把整個證明自動“3D 打印”出來——生成一個機器可檢驗、不可篡改的完整證明檔案。

Harmonic的產品,正是基于Lean的工具,以減少AI在數學上的幻覺。這條路線,需要大量已被人工標注或是驗證好的Lean的數據。Harmonic聲稱他們可以通過數據自動形式化的方式,解決人工和數據收集方面的問題。當然,這背后有極其復雜的技術建構。

簡單理解就是,在數學里,一句簡單的“顯然成立”,在Lean的代碼邏輯下,可能要拆成50條邏輯規則,少一條都不行,就像是給樂高城堡補上每一塊1*1的小磚。每一條都要具備極強的準確性、細節性(保證每個逗號都有出處)和一致性,就像在給一篇維基百科做逐條公證

至于Harmonic究竟用了什么技術細節,在可公開的信息中,獲取有限。一年前,模型Aristotle剛問世時,就有人質疑道:無法在網站上找到任何ArXiv預印本論文得以證明他們的方法。

目前的公開信息幾乎只有融資和測試成績,很難找到技術細節、模型架構或開放API信息。官方幾乎沒公開接口文檔、模型API或詳細的開發指南,技術社區也沒見到廣泛實測或開源樣例。

雖然他們強調未來將應用于軟件驗證、數學研究等,但目前沒有公眾可驗證的落地案例。對外能查到創始人背景和投資機構,但在核心算法、工程團隊、研究人員、具體解決方案方面完全"閉口不談"。

即便在AI聊天機器人應用程序發布后,Harmonic 也仍然表示,目前不會發布Aristotle的其他基準測試結果,全程觀看直播過后的網友們也紛紛提出疑惑。

看起來,Harmonic所采取的零幻覺的方法,很難說是否真正突破了現有模型的能力,因為目前似乎并沒能證據證明其模型已經完全沒有幻覺了,Harmonic通過直接生產Lean代碼的方式控制幻覺的產生,因此或許模型本身或許仍然存在幻覺,但因為幻覺錯誤的代碼會被Lean代碼檢查出來,予以排除,故而能夠使結果零幻覺。

Harmonic的對手都是“業界第一”

在這個用Lean 4技術生成完整數學證明,從根本上杜絕AI"瞎編亂造"的技術路線上,已經聚集了不少實力強勁的競爭對手。

從官方數據來看,Aristotle的成績確實很亮眼。 在MiniF2F這個包含488道從高中到競賽級數學題的測試中,Aristotle表現相當出色:2024年6月左右,它的成功率達到83%(可以用計算器等工具輔助);僅僅一個月后,成功率就提升到了90%,創下了當時的新紀錄。

2024年6月,Harmonic放出來的信息展現其測試水平

作為對比,之前那些最SOTA的模型(比如OpenAI的GPT-4)在同樣條件下的成功率大約只有20-35%,Aristotle實現了幾倍的跨越。這說明Aristotle的數學解題能力已經遠超普通的AI模型。

不過話說回來,現在那些SOTA模型的文采、想象力很大程度上都依靠"適度的幻覺",拿一個專門做數學的模型和通用AI比較,似乎有點"不太公平"。

并且,在讓AI零幻覺的領域,有錢有技術還努力的“富二代”并不只有Harmonic一家。

DeepSeek在兩個月前發布了Prover-V2模型,在MiniF2F測試中達到了88.9%的通過率,在其他數學競賽上也有不錯的表現。

技術架構上,DeepSeek Prover先用DeepSeek-V3把復雜問題拆解成一堆小目標,每解決一個小目標就把這些證明串成"思維鏈",然后用這些數據來訓練模型。

除了MiniF2F,PutnamBench評測集中收集了640道Putnam數學競賽題,代表了本科生高難度數學題,對AI來說極具挑戰性。最終,DeepSeek-Prover-V2在這658道題中成功解決了49道,也算是不錯的成績。

谷歌DeepMind也是這個賽道的老手,其走的技術路線和Harmonic類似,谷歌DeepMind的Alphaproof,它在2024年可謂是數學AI領域的超級明星,賺足了眼球。它的成名之戰就是2024年的國際數學奧林匹克競賽(IMO)的測試得分。

DeepMind團隊的AlphaProof和AlphaGeometry 2在這場比賽中拿到了銀牌成績——六道題解出了四道,這是一個里程碑式的存在。

《紐約時報》甚至用"數學家們讓路,AlphaProof來了"這樣的標題來突出它的重要性。

AlphaProof的工作原理是,一個用Lean語言來證明數學結論的"自我訓練"系統,結合了預訓練語言模型和AlphaZero強化學習算法。Lean這種形式化語言的最大優勢是能夠嚴格驗證數學推理的正確性。在此之前,這種方法在機器學習中用得不多,因為人工編寫的數據太少了。相比之下,基于自然語言的方法雖然可以使用更多數據,但經常會產生看起來合理實際上錯誤的推理步驟。

DeepMind當然也意識到這個問題,他們的做法是,通過調整Gemini模型,讓它自動把自然語言的數學題翻譯成形式化語言,在這兩個領域之間架起了一座橋梁,從而建立了一個包含各種難度數學題的大型題庫。

就在前幾天,OpenAI研究科學家Alex Wei在X上發布推文,稱一種全新的神秘推理模型斬獲了IMO2025年金牌,6道題解出了5道。值得注意的是,該模型是在沒有任何工具或網絡輔助的狀態下,自行閱讀題目并撰寫自然語言證明的。

結語

盡管在解決AI幻覺上,技術尚未收斂,但對于剛發布產品和融資后的Harmonic來說,這場與時間的賽跑正式開始了。

與Harmonic不同的是,這些基礎模型大廠有自己多年的模型和海量數據作為基礎,比如DeepSeek的Prover系列,直接讓自家的DeepSeek-V3當"教學者",先教它學會怎么把復雜問題拆解成簡單步驟,再用這些經驗去訓練專門的數學推理模型。谷歌的AlphaProof 背后有Gemini模型幫忙把日常語言翻譯成數學證明語言。

相比之下,Harmonic公司的Aristotle 并沒有像DeepSeek和谷歌那樣擁有完整的大模型"生態圈"做后盾。

但這也許是硅谷創新的獨特所在——收購的文化以及良好的投資退出環境,Harmonic的目標可能并非IPO一條路走到黑,他們可以在擁有足夠技術積累和實力時,選擇一條被大廠收購的路線,成為這些基礎模型廠商技術生態中的一環,對于Harmonic與其投資者來說,也是一個不錯的選擇。

每日活動更多>>

智界新款太火了,新款智界R7熱銷三個版本怎么選? 直面銷量下滑與轉型困局, 郭永鋒臨危受命一汽奧迪! 一汽紅旗架構調整?內部人士:僅新能源營銷事業部負責人有變動 華為Mate XTs非凡大師發布:三折疊+麒麟9020芯片,17999元起 時隔4年!華為首次宣布新麒麟處理器:整機性能提升36% 5A速度快人一步:華為Mate XTs三折疊手機支持第二代靈犀通信 前蘭博基尼設計師加入小米汽車,曾參與設計“小牛”超跑、保時捷911等 鎖死25km/h超速就斷電!新國標抬高成本:以后或難見到千元電動自行車 首屆鉑智 3X 用戶大會:廣豐首擔自燃泊車事故責,權益惠及新老用戶 8月新勢力眾生相 零跑領跑“蔚小米”邁過3萬輛門檻兒 奇瑞全新SUV,捷途X70L將上市,車長4810mm,5/7座都有,兩種動力 柴油動力逆襲!212 T01如何用1000km續航重新定義硬派越野經濟性? 實力硬剛百萬級豪華MPV!2026款嵐圖夢想家預售價38.99萬元起 6.58 萬起,半固態電池批量上車!全新 MG4 成都車展“殺瘋了” 無法復工復產!眾泰汽車公告 8月銷量成績出爐:比亞迪霸榜,理想掉隊 理想銷量三連跌,8月銷量不及零跑一半,大勢去、頹勢顯! 普拉多跌落神壇?豐田高管硬剛外界質疑 上汽大通:國內泛房車市場年銷近2萬輛 堅持用乘用車標準造品質房車 全新奇瑞QQ亮相成都車展,能再一次引領市場嗎? 沒加電池,還得燒油!新212 T01開一年卻更省錢了? 21.99萬起,啟源E07煥新卷到誰? 9.78萬起,四個角度解讀榮威M7 DMH值不值? 全階量產,突破千萬大關!地平線征程芯片不想低調了 紅旗成都車展“攻守道”:金葵花守豪華之正,天工系列攻年輕之奇 星途ET5成都全球首秀:年輕家庭智慧安全SUV新選擇 全新坦克500上市2小時大定破1.2萬臺,牽手張雨綺刷爆成都車展 2025成都車展新車:38.99萬起,2026款嵐圖夢想家公布預售價 售訂單破4.8萬臺,智己LS6這張“超級增程”牌打對了 短軸大V6,長城炮V6火炮22.98萬起開啟預售
主站蜘蛛池模板: 子洲县| 洞头县| 包头市| 大名县| 嘉祥县| 辰溪县| 宁国市| 禹州市| 外汇| 治多县| 英德市| 井陉县| 灵川县| 叶城县| 婺源县| 兴宁市| 南和县| 台州市| 宁南县| 碌曲县| 武乡县| 黑山县| 监利县| 安塞县| 嘉峪关市| 班玛县| 冕宁县| 张家界市| 嘉祥县| 余姚市| 环江| 永昌县| 筠连县| 含山县| 长海县| 双桥区| 海安县| 白银市| 伊川县| 石柱| 图们市|