欧美国产中文高清,97成人超碰,老司机免费视频一区二区,国产精品一区二区三区www

登錄
首頁 > 奧迪 > 又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

發布時間:2025-08-11 20:31:44

27M小模型超越o3-mini-high和DeepSeek-R1!推理還不靠思維鏈。

開發者是那位拒絕了馬斯克、還要挑戰Transformer的00后清華校友,Sapient Intelligence的創始人王冠

這個27M小模型就是Sapient最新提出的開源可復現的分層推理模型Hierarchical Reasoning Model(下面簡稱HRM),模仿大腦的分層處理與多時間尺度運作機制,克服了標準Transfomer的計算局限。

2700萬參數,就實現了對現有大模型的精準超車。

不用預訓練補課,還不靠思維鏈打草稿,僅憑1000個訓練樣本,就把極端數獨、30x30迷宮玩得明明白白。

甚至連衡量通用智能的ARC-AGI測試都能碾壓一眾參數規模更大、上下文更長的Claude 3.7等“大前輩”。

有網友感嘆,這就像四兩撥千斤AI版……

所以,HRM這個小模型是如何做到的?

核心是仿腦的雙層循環模塊設計

HRM之所以能有如此出色的表現,源于其五項核心技術的巧妙設計。

首先是分層循環模塊與時間尺度分離

HRM受大腦皮層區域分層處理和時間分離機制啟發,設計了兩個相互配合的循環模塊:一個高層模塊負責慢節奏的抽象規劃,一個低層模塊處理快節奏的細節計算,不用明確監督中間過程,一次就能完成推理。

兩者在不同時間尺度上協同工作。低階模塊在每個高階周期內完成多次計算并達到臨時穩定狀態后,高階模塊才會更新決策,隨后低階模塊重置并開啟新一輪計算。

這種設計既保證了全局方向的正確性,又提升了局部執行的效率。

比如,在需要大量樹搜索和回溯的Sudoku-Extreme Full任務上,增加Transformer的寬度不能提升性能,增加深度才是關鍵,而標準架構會出現性能飽和,無法從深度增加中獲益。

HRM則克服了這一限制,能有效利用計算深度實現近乎完美的準確率。

其次是分層收斂機制

普通的循環神經網絡常出現過早收斂的問題——計算幾步就陷入穩定狀態,后續再復雜的任務也無法推進。

而HRM中,低階模塊在每輪計算中會收斂到基于當前高階狀態的局部結果,但高階模塊更新后,會給低階模塊設定新的目標,使其進入新的收斂周期。

這就像完成項目時,先攻克一個子任務,再根據整體進度調整目標,確保持續推進不偷懶。

第三項是近似梯度技術

傳統循環模型訓練時,需要存儲所有中間狀態并反向追溯,類似復盤時要回看每一步操作,既耗內存又低效。

HRM則采用一步梯度近似,只需根據最終狀態反推優化方向,如同根據考試結果直接定位薄弱知識點,內存需求恒定且計算高效,更符合生物大腦的學習規律。

第四是深度監督機制

它受大腦中神經振蕩調節學習節奏的啟發,引入了階段性測試。

模型在學習過程中被分成多個階段,每個階段結束后立即評估并調整參數,且前后階段的計算互不干擾。

這種方式能及時糾正偏差,就像學生每學一單元就測試鞏固,比期末一次性考試的學習效果更扎實。

自適應計算時間讓HRM能像人一樣靈活分配思考時間

它通過類似評估收益的算法(Q學習),動態決定是否繼續計算,在保證準確率的同時避免算力浪費,推理時還能通過增加計算資源進一步提升表現。

比如,簡單任務如簡單迷宮快速給出答案,復雜任務如高難度數獨則延長計算時間。

這些技術的融合,讓HRM在多項測試中表現不凡。

下圖通過可視化中間步驟,驗證了HRM的分層推理機制能夠有效拆解復雜任務,通過漸進式計算逼近正確結果,而非依賴黑箱式的一次性輸出。

在衡量AI通用推理能力的ARC-AGI挑戰中,HRM僅用2700萬參數和1000個訓練樣本,就達到40.3%的準確率,超過了參數規模更大的o3-mini-high(34.5%)和Claude 3.7 8K(21.2%)。

對于需要反復試錯的9x9極端數獨,現有思維鏈模型完全無法解決(準確率0%),即便是結構相似的Transformer模型,用同樣數據訓練也毫無頭緒。而HRM幾乎能全部做對。

在30x30復雜迷宮的最優路徑尋找任務中,HRM表現穩定,而1.75億參數的大型Transformer模型準確率不足20%。

雖然,HRM被指參數太小、訓練范圍有限,只針對特定領域表現好,無法泛化到領域外,并不通用。但有人認為小而精的模型或許在某些角度上更智能。

人工智能的飛躍在于創造性。

也有人認為HRM的前景更在于“仿腦”,通過精心設計的高低兩個模塊避免過早收斂,對過擬合具有極強的抵抗力

甚至有人相當樂觀,認為這種新架構是神經網絡一個巨大的進步。有可能是超越Transformer的時刻。

拒絕馬斯克,挑戰Transfomer

論文的第一作者王冠是一位00后,8歲開始學習編程,后保送至清華大學計算機系。

他是GitHub攬星5.1k開源項目OpenChat的獨立開發者,獨立完成了OpenChat全部版本的模型開發和訓練框架搭建。

也正是因為OpenChat這個項目,他和馬斯克產生了交集。

但他算得上是一個拒絕了馬斯克的男人——此前,王冠多次拒絕了xAI等一線機構創始人的加入邀請。

原因是他認為自己要做的是顛覆Transfomer

2024年,王冠和聯合創始人Austin創辦了Sapient Intelligence,并成功融資數千萬美元。致力于打造“真正具有復雜推理和規劃能力的全新大模型架構”。

Copyright 2015-2024 多趣味 版權所有  京ICP備2015051670號
欧美国产中文高清,97成人超碰,老司机免费视频一区二区,国产精品一区二区三区www
麻豆国产一区| 欧美91视频| 综合五月婷婷| 日韩专区一卡二卡| 爽好久久久欧美精品| 91久久国产| 午夜日韩在线| 免费日韩av片| 日韩欧美三区| 国产精品视频一区二区三区 | 国产精品多人| 久久只有精品| 中文字幕成在线观看| 99久久久久| 亚洲综合另类| 日韩avvvv在线播放| 国产伦精品一区二区三区在线播放| 欧美日韩亚洲一区三区| 久久精品女人| 婷婷精品视频| 蜜臀久久99精品久久久久宅男| 亚洲精品无播放器在线播放| 国产日韩欧美一区| 久久的色偷偷| 久久男女视频| 影音先锋久久| 日韩福利视频导航| av免费不卡国产观看| 日韩一区自拍| 视频一区在线视频| 国产精品一线| 国产91久久精品一区二区| 亚洲一区二区免费看| 久久精品97| 特黄毛片在线观看| 综合日韩在线| 在线手机中文字幕| 玖玖精品视频| 欧美日韩黄网站| 日韩电影二区| 蜜臀av一区二区三区| 美女久久精品| 99国产精品久久久久久久| 国产精品网站在线看| 日韩黄色大片| 日韩成人一级| 欧美91福利在线观看| 91欧美极品| 999国产精品| 国产日产一区| 影音国产精品| 精品国产亚洲一区二区三区在线| 亚洲欧洲一区| 国产毛片精品| 99在线精品视频在线观看| 国产精品超碰| 91精品高清| 国产在线不卡一区二区三区| 丝袜亚洲另类欧美| 91视频久久| 亚洲乱码一区| 久久亚洲国产| 国产精品免费精品自在线观看| 蜜桃一区二区三区| 美女精品久久| 亚洲天堂日韩在线| 精品国模一区二区三区| 国产亚洲久久| 欧洲激情综合| 精品中国亚洲| 亚洲欧美在线综合| 免费欧美一区| 国产91欧美| 久久黄色影视| 亚洲一区欧美| 久久中文字幕二区| 精品一二三区| 色综合视频一区二区三区日韩 | 久久国产精品色av免费看| 国产在线欧美| 久久激情综合网| 视频在线观看一区二区三区| 日韩久久精品网| 免费日韩成人| 欧美有码在线| 亚洲欧洲国产精品一区| 伊人影院久久| 91精品一区二区三区综合在线爱| 国产精品美女午夜爽爽| 免费在线视频一区| 欧美精选一区二区三区| 亚洲最新无码中文字幕久久 | 久久精品1区| 精品久久97| 国产欧美日韩影院| 亚洲香蕉视频| 久久高清国产| 亚洲精品电影| 欧美色图一区| 久久精品中文| 青青久久av| 日韩欧美一区二区三区在线观看| 久久亚洲精精品中文字幕| 国产欧美在线| 国产亚洲字幕| 国产精品综合色区在线观看| 91午夜精品| 日韩一区二区三区四区五区| 国产一区白浆| 亚洲男女av一区二区| 99久久夜色精品国产亚洲1000部 | 国产福利亚洲| 国产精品国码视频| 国产精品国码视频| 国产精品亚洲产品| 欧美激情在线精品一区二区三区| 欧美综合精品| 国产精品久久777777毛茸茸| 青青伊人久久| 国产免费av一区二区三区| 国产乱码精品一区二区三区四区 | 国产亚洲欧美日韩在线观看一区二区 | 美女高潮久久久| 美女视频黄久久| 精品国产亚洲日本| 日韩欧美自拍| 群体交乱之放荡娇妻一区二区| 蜜桃精品在线| 午夜视频精品| 国产视频亚洲| 性欧美精品高清| 亚洲97av| 国产精品1区在线| 精品高清久久| 欧美日韩国产v| 欧美女激情福利| 亚洲影视一区二区三区| 日韩精品欧美成人高清一区二区| 日本99精品| 另类综合日韩欧美亚洲| 国产精品13p| 欧美一区二区性| 久久亚洲精品伦理| 日韩高清国产一区在线| 国产精品久久国产愉拍| 精品国产91| 亚洲午夜精品久久久久久app| 日韩一区二区久久| 日本中文字幕不卡| 精品一区二区三区四区五区| 樱桃视频成人在线观看| 国产国产精品| 日本欧美在线| 久久久久久夜| 亚洲综合电影一区二区三区| 日韩精品电影一区亚洲| 久久99久久人婷婷精品综合| 黑人精品一区| 欧美精品黄色| 国产日韩在线观看视频| 美腿丝袜在线亚洲一区| av在线日韩| 亚洲综合图色| 国产91在线播放精品| 国产一区日韩一区| 天堂av一区| 欧美好骚综合网| 宅男噜噜噜66国产日韩在线观看| 天海翼亚洲一区二区三区| 精品国产一区二| 亚洲视频播放| 麻豆精品蜜桃视频网站| 国产一区欧美| 国产伦一区二区三区| 亚洲国内欧美| 日产欧产美韩系列久久99| 国产精品久久久久久久免费观看| 国产视频一区在线观看一区免费| 91大神在线观看线路一区| 免费污视频在线一区| 日韩国产精品久久久| 日韩成人亚洲| 国产欧美自拍一区| 狠狠色综合网| 精品视频免费| 亚洲香蕉久久| 欧美天堂视频| 91欧美极品| 欧美二区视频| 国产精品s色| 好看不卡的中文字幕| 日本不卡视频一二三区| 视频福利一区| 国产欧美日韩精品一区二区三区| 91精品久久久久久久久久不卡| 欧美日韩精品一区二区三区视频 | 婷婷精品在线观看| 久久天堂精品| 久久国产麻豆精品| 国产视频欧美|