国产91精品在线,国产精品五区,91精品1区

"別擋在AI基礎模型廠商進化的路上做創業生意。"

OpenAI創始人山姆·奧爾特曼的這句話含金量還在上升。

其中一個原因是，在模型進化的路上，即使是在一個窄小的領域，實現AI的無幻覺性能，都是一項困難的任務，初創公司很難有資源與模型大廠抗衡。

一家名叫Harmonic的初創公司偏不信邪，其正試圖解決這個問題——開發完美無缺的零幻覺AI。

近日，這家公司推出了面向IOS和Android的聊天機器人應用程序測試版，普通用戶可以通過這款程序，訪問其人工智能模型Aristotle。其首席執行官兼聯合創始人Tudor Achim表示，Aristotle是人類可以進行推理并正式驗證產出的第一款產品，在Aristotle支持的領域——定量推理，可以保證沒有幻覺。同時，Harmonic還表示計劃發布一個API，讓企業訪問Aristotle。在Harmonic的官網中宣稱，其正在Github上公開發布Aristotle的完整證明，由于其經過正式驗證，無需人工檢查，這使得Aristotle在前沿人工智能模型中，處于高級數學推理性能的最前沿。

Harmonic在新產品的宣傳攻勢中表示，Aristotle在第 66 屆國際數學奧林匹克IMO2025中取得了金牌。這場比賽也被視為AI數學能力和AI推理能力的“成人禮”。

雖然這一成績也同樣被谷歌和OpenAI斬獲，但Harmonic認為這兩家大廠“并非通過形式化驗證手段取得結果”。從目前AI領域發展的整體來看，形式化（Formal）和非形式化（Informal）兩種路徑，到底哪種更有優勢仍難以說清。

“如果從數學的角度，Scaling Law這條路跑到最后，一定會收斂。”一位頭部基金合伙人告訴虎嗅，即便已經具備極高的行業地位，他仍然會每天閱讀最新的論文，尋找突破AI邊界的新的理論創新，這將是如今最具潛力和價值的地方。

也正因如此，Harmonic，這個成立僅兩年，專注解決AI邊界問題的初創企業，吸引了幾乎所有頂級投資機構的目光，估值從零飆升到接近9億美元。

不久之前，它就像一塊磁石般吸引了近2億美元的投資——從紅杉資本到凱鵬華盈，從Index Ventures到Paradigm。這對于一家初創公司來說，都是一個不小的數字。

不過，針對基礎模型的技術創新和創業，從來是一項燒錢的生意，一位硅谷投資人表示，如今基于基礎模型的創業，早已是“富二代”的游戲，要么足夠天才，要么足夠有錢。

如果回溯Harmonic兩位創始人的經歷，這兩個條件，Harmonic都具備。

我們試圖拆解這家在數學領域，和Open AI同臺競賽的初創公司，其背后的技術路線和厲害之處，回答Harmonic這將近9億美金的估值，憑什么？其究竟如何實現數學推理中的AI零幻覺？

Harmonic的兩位聯合創始人——Vlad Tenev和Tudor Achim背景獨特，一位在數學天賦上得天獨厚，而另一位則在AI領域積累了深厚的經驗，還有一個關鍵因素是，Vlad Tenev很有錢。

別擋在AI基礎模型廠商進化的路上做創業生意

左為Vlad Tenev，右為Tudor Achim

Vlad Tenev數學出身，他在斯坦福大學學數學，還曾在加州大學洛杉磯分校讀過數學碩士，甚至還師從數學大師陶哲軒。

后來他投身金融科技創業，創立并擔任Robinhood首席執行官，如果要更形象地比喻，Robinhood，是一個用手機 App 把股票、期權、加密貨幣甚至 IPO 打新都變成零傭金、低門檻、游戲化交易的互聯網券商平臺。2021年，Robinhood在納斯達克上市，這家公司在Forbes 的實時估值已經達到約 55 億美元。

別擋在AI基礎模型廠商進化的路上做創業生意

Vlad Tenev的公司Robinhood的Forbes實時估值

這也是為何Harmonic和Vlad Tenev被稱為“美國版DeepSeek”和“梁文鋒”的原因，創始人資金非常雄厚，在最一開始可以以非常純粹的態度進行技術研究。Harmonic成立之初，用的一部分，就是Vlad Tenev的個人資金。

Tudor Achim則是計算機科學的專家，他從卡耐基梅隆大學計算機科學系畢業，后來在斯坦福讀博士，后來因為創業中途離開。

2016年，他和別人一起創立了自動駕駛公司Helm.ai并擔任技術總監。在那里，他積累了豐富的AI算法開發經驗，深知如何把AI技術應用到復雜的現實問題中。Helm.ai至今已經融資1.02億美元，還得到了本田的支持。

別擋在AI基礎模型廠商進化的路上做創業生意

Tudor Achim創立和自動駕駛公司的產品演示

兩位創始人有個共同理念，就是"讓AI會思考、講真話，不撒謊"。他們的想法可以歸納為四點，首先，AI必須說實話：AI的輸出必須經過嚴格檢驗，確保結論準確無誤；其次，AI不能胡說八道，模型不能編造不存在的事實，寧可說"我不知道"也不要亂猜，通過嚴格的邏輯約束避免無根據的回答；第三，讓AI像科學家一樣思考：把假設-推理-驗證的科學方法植入AI，讓它能夠自動探索和證明新結論；第四，人機合作而非替代，Harmonic認為AI數學助手應該幫助人類，而不是讓用戶沒事可做。他們希望AI負責處理繁瑣的證明工作，人類負責提出有創意的想法。

正如他們在官網中寫道，驗證問題，是拓展人工智能工具效用的主要瓶頸，他們的使命是，探索人類理解的前沿。

Harmonic做了什么？

通用語言大模型的幻覺率長期居高不下，已成為制約其深入 AI下半場——“應用”的最大阻礙，也正因為如此，“幻覺”同時也是業界眼中的“最美的一塊肥肉”。哪家初創企業在這塊陣地將幻覺率限制到一個較低的水平，同時保持AI的智能水平，誰就能撬動更加龐大的市場。

比如，我們看到各類 AI 應用在 C 端紛紛強調“實用性”與“可交付性”，努力用工具鏈與插件系統來彌補模型輸出不穩定的問題，但在追求極低容錯率的B端精密場景——像是金融建模、自動化編程、科學推理、法律合規等“不允許幻覺出現”的領域，通用大模型仍然舉步維艱。

2024年，Harmonic的當家產品誕生了，一個叫Aristotle（亞里士多德）的數學推理AI模型。

Aristotle的特別之處在于，它是個一站式數學AI：從理解普通話的數學問題，到生成嚴格的數學證明，再到用人話解釋答案，一個模型全包了。雖然還沒有關于Aristotle底層技術架構的豐富信息，但Harmonic已經通過官網公開了不少信息和成果。

主要解決了三個問題：

首先是幻覺問題。通用大模型經常無中生有，編造不存在的內容。Aristotle通過Lean證明這個"硬約束"徹底解決了這個問題：每一步推導都需要得到系統認可，不允許憑空編造。一旦模型想輸出錯誤結論，Lean立即報錯拒絕。

其次，推理過程不清楚。傳統AI即使能給出正確結論，推理步驟往往混亂或不完整。Aristotle通過詳細展示每一步推理來解決這個問題。由于有Lean檢查，整個推理鏈上的每個環節都必須邏輯清晰，讓最終證明既正確又透明。這就像給出了"答案的答案"——不僅告訴使用者結論，還展示如何一步步得到它。

最后，傳統大模型往往不夠嚴謹。普通AI對問題的回答可能對錯不分、過于自信，而Aristotle因為內置了數學邏輯，回答風格更謹慎客觀。任何定理未經證明就不能用于下一步推導，這種嚴謹性確保了Aristotle非常適合高風險場景（如金融模型檢查、醫療推理），因為它不會"差不多就下結論"。

2024年中，Harmonic宣布Aristotle在評估AI是否能讀懂、建模并證明數學題的一項測試集——MiniF2F中創下了新紀錄，領先了一眾大模型，這個測試集包含 488 道形式化數學題目，涵蓋數學核心領域（如代數、數論）。

比如，其官網展示了一道2001年國際數學奧林匹克的難題：給出題目和人類證明草稿后，Aristotle能自動生成完整的嚴格數學證明。這個例子顯示了Aristotle如何把人類的自然語言證明翻譯成機器能檢查的嚴格代碼。

別擋在AI基礎模型廠商進化的路上做創業生意

來源：Harmonic官網

在最近，Harmonic最新推出的Chatbot式應用程序的一波宣傳攻勢中，兩位創始人聲稱 Aristotle做數學推理問題時給出的答案完全“無幻覺”。此外，Harmonic還計劃發布一個to B的 API以讓企業可以訪問，以及一個面向消費者的網絡應用程序。

兩年估值接近9億美元

Harmonic自成立以來，就受到了投資界的熱烈追捧，短短兩年內就完成了多輪大額融資。

從融資時機來看，Harmonic踩得很準， 2024年，OpenAI推出了新模型，雖然展現了一定的數學能力，但還是會犯錯，幻覺率仍居高不下。

這讓整個行業開始意識到"AI需要更嚴謹的推理能力"，正好給Harmonic這樣的公司創造了機會。

A輪融資時，投資方大多有學術或技術背景，他們看好Harmonic在學術上的突破。

進入2025年，AI行業競爭越來越激烈，各大公司都在搶著布局更強的多模態和推理AI。特別是DeepMind在2024年底推出的AlphaProof取得成功，更是引發了市場對"AI證明"這個領域的關注。

Harmonic在此時又適時開始融資B輪，正值整個行業尋求將AI從“能用”到“可用”的節點。

根據公開信息，Harmonic的種子階段由聯合創始人Vlad Tenev 個人和天使投資人提供啟動資金，主要用來組建團隊和開展基礎研究。

A輪融資在2024年9月完成，拿到7500萬美元，公司估值達到3.25億美元。B輪融資于2025年7月宣布，又融了1億美元，公司估值接近9億美元，離10億美元大關僅差一小步。

別擋在AI基礎模型廠商進化的路上做創業生意

Harmonic的融資圖

Harmonic的投資人陣容相當亮眼，既有頂級硅谷投資機構，也有行業基金和學術背景的資本，不僅有傳統的頂級風投，還有新興的科技基金。

例如其A輪由硅谷知名的紅杉資本（Sequoia Capital）領投，歐洲著名的Index Ventures緊跟其后。

同時，多家國際基金和知名個人也參與投資。B輪融資則由老牌投資機構Kleiner Perkins領投，專注加密和前沿科技的Paradigm大手筆跟投。紅杉和Index作為老投資者繼續投錢，金融科技投資機構Ribbit Capital新加入。此外，Quora聯合創始人查理·切沃（Charlie Cheever）也以個人身份參與了B輪。

一個叫做“Lean”的超級“數學監理”

Harmonic究竟做了什么解決AI在數學推理上的瓶頸？

這要從數學界正在發生一些有趣的變化說起。

越來越多的數學家開始使用一種叫Lean的工具來寫數學證明，這是一個由微軟研究院開發的交互式定理證明系統，它能結合數學證明和編程的系統，能用代碼形式精確地表達并驗證復雜的數學理論，這成為了Harmonic的技術核心。

在Lean之前，大模型寫數學證明的時候，幻覺往往表現在，看起來似乎說得頭頭是道，但往往會出現中間某一步是“AI覺得對”。

Lean則相當于一個數字化的超級監理和3D打印機器人。

每寫下一行代碼，它就立刻像監理一樣，用激光尺、鋼筋掃描儀（形式化邏輯規則）分毫不差地檢查一遍。只要發現缺了一根釘子、少了一塊磚，它馬上紅燈報警，并要求返工。一旦全部綠燈，Lean 會把整個證明自動“3D 打印”出來——生成一個機器可檢驗、不可篡改的完整證明檔案。

Harmonic的產品，正是基于Lean的工具，以減少AI在數學上的幻覺。這條路線，需要大量已被人工標注或是驗證好的Lean的數據。Harmonic聲稱他們可以通過數據自動形式化的方式，解決人工和數據收集方面的問題。當然，這背后有極其復雜的技術建構。

簡單理解就是，在數學里，一句簡單的“顯然成立”，在Lean的代碼邏輯下，可能要拆成50條邏輯規則，少一條都不行，就像是給樂高城堡補上每一塊1*1的小磚。每一條都要具備極強的準確性、細節性（保證每個逗號都有出處）和一致性，就像在給一篇維基百科做逐條公證。

至于Harmonic究竟用了什么技術細節，在可公開的信息中，獲取有限。一年前，模型Aristotle剛問世時，就有人質疑道：無法在網站上找到任何ArXiv預印本論文得以證明他們的方法。

目前的公開信息幾乎只有融資和測試成績，很難找到技術細節、模型架構或開放API信息。官方幾乎沒公開接口文檔、模型API或詳細的開發指南，技術社區也沒見到廣泛實測或開源樣例。

雖然他們強調未來將應用于軟件驗證、數學研究等，但目前沒有公眾可驗證的落地案例。對外能查到創始人背景和投資機構，但在核心算法、工程團隊、研究人員、具體解決方案方面完全"閉口不談"。

即便在AI聊天機器人應用程序發布后，Harmonic 也仍然表示，目前不會發布Aristotle的其他基準測試結果，全程觀看直播過后的網友們也紛紛提出疑惑。

看起來，Harmonic所采取的零幻覺的方法，很難說是否真正突破了現有模型的能力，因為目前似乎并沒能證據證明其模型已經完全沒有幻覺了，Harmonic通過直接生產Lean代碼的方式控制幻覺的產生，因此或許模型本身或許仍然存在幻覺，但因為幻覺錯誤的代碼會被Lean代碼檢查出來，予以排除，故而能夠使結果零幻覺。

Harmonic的對手都是“業界第一”

在這個用Lean 4技術生成完整數學證明，從根本上杜絕AI"瞎編亂造"的技術路線上，已經聚集了不少實力強勁的競爭對手。

從官方數據來看，Aristotle的成績確實很亮眼。在MiniF2F這個包含488道從高中到競賽級數學題的測試中，Aristotle表現相當出色：2024年6月左右，它的成功率達到83%（可以用計算器等工具輔助）；僅僅一個月后，成功率就提升到了90%，創下了當時的新紀錄。

別擋在AI基礎模型廠商進化的路上做創業生意

2024年6月，Harmonic放出來的信息展現其測試水平

作為對比，之前那些最SOTA的模型（比如OpenAI的GPT-4）在同樣條件下的成功率大約只有20-35%，Aristotle實現了幾倍的跨越。這說明Aristotle的數學解題能力已經遠超普通的AI模型。

不過話說回來，現在那些SOTA模型的文采、想象力很大程度上都依靠"適度的幻覺"，拿一個專門做數學的模型和通用AI比較，似乎有點"不太公平"。

并且，在讓AI零幻覺的領域，有錢有技術還努力的“富二代”并不只有Harmonic一家。

DeepSeek在兩個月前發布了Prover-V2模型，在MiniF2F測試中達到了88.9%的通過率，在其他數學競賽上也有不錯的表現。

技術架構上，DeepSeek Prover先用DeepSeek-V3把復雜問題拆解成一堆小目標，每解決一個小目標就把這些證明串成"思維鏈"，然后用這些數據來訓練模型。

別擋在AI基礎模型廠商進化的路上做創業生意

除了MiniF2F，PutnamBench評測集中收集了640道Putnam數學競賽題，代表了本科生高難度數學題，對AI來說極具挑戰性。最終，DeepSeek-Prover-V2在這658道題中成功解決了49道，也算是不錯的成績。

谷歌DeepMind也是這個賽道的老手，其走的技術路線和Harmonic類似，谷歌DeepMind的Alphaproof，它在2024年可謂是數學AI領域的超級明星，賺足了眼球。它的成名之戰就是2024年的國際數學奧林匹克競賽（IMO）的測試得分。

DeepMind團隊的AlphaProof和AlphaGeometry 2在這場比賽中拿到了銀牌成績——六道題解出了四道，這是一個里程碑式的存在。

《紐約時報》甚至用"數學家們讓路，AlphaProof來了"這樣的標題來突出它的重要性。

AlphaProof的工作原理是，一個用Lean語言來證明數學結論的"自我訓練"系統，結合了預訓練語言模型和AlphaZero強化學習算法。Lean這種形式化語言的最大優勢是能夠嚴格驗證數學推理的正確性。在此之前，這種方法在機器學習中用得不多，因為人工編寫的數據太少了。相比之下，基于自然語言的方法雖然可以使用更多數據，但經常會產生看起來合理實際上錯誤的推理步驟。

DeepMind當然也意識到這個問題，他們的做法是，通過調整Gemini模型，讓它自動把自然語言的數學題翻譯成形式化語言，在這兩個領域之間架起了一座橋梁，從而建立了一個包含各種難度數學題的大型題庫。

就在前幾天，OpenAI研究科學家Alex Wei在X上發布推文，稱一種全新的神秘推理模型斬獲了IMO2025年金牌，6道題解出了5道。值得注意的是，該模型是在沒有任何工具或網絡輔助的狀態下，自行閱讀題目并撰寫自然語言證明的。

結語

盡管在解決AI幻覺上，技術尚未收斂，但對于剛發布產品和融資后的Harmonic來說，這場與時間的賽跑正式開始了。

與Harmonic不同的是，這些基礎模型大廠有自己多年的模型和海量數據作為基礎，比如DeepSeek的Prover系列，直接讓自家的DeepSeek-V3當"教學者"，先教它學會怎么把復雜問題拆解成簡單步驟，再用這些經驗去訓練專門的數學推理模型。谷歌的AlphaProof 背后有Gemini模型幫忙把日常語言翻譯成數學證明語言。

相比之下，Harmonic公司的Aristotle 并沒有像DeepSeek和谷歌那樣擁有完整的大模型"生態圈"做后盾。

但這也許是硅谷創新的獨特所在——收購的文化以及良好的投資退出環境，Harmonic的目標可能并非IPO一條路走到黑，他們可以在擁有足夠技術積累和實力時，選擇一條被大廠收購的路線，成為這些基礎模型廠商技術生態中的一環，對于Harmonic與其投資者來說，也是一個不錯的選擇。

亚洲国产成人91精品_99视频热这里只有精品免费_精品国产乱码久久久久久虫虫漫画_日韩精品三区

別擋在AI基礎模型廠商進化的路上做創業生意

每日活動更多>>