91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久

登錄
首頁 > 媒體學習 > 北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

發布時間:2025-09-23 10:06:25

擴散 / 流匹配模型的人類偏好對齊中,實現高效采樣與穩定優化的統一,一直是一個重大挑戰。

近期,北京大學與字節團隊提出了名為 BranchGRPO 的新型樹形強化學習方法。不同于順序展開的 DanceGRPO,BranchGRPO 通過在擴散反演過程中引入分叉(branching)與剪枝(pruning),讓多個軌跡共享前綴、在中間步驟分裂,并通過逐層獎勵融合實現稠密反饋。

該方法在 HPDv2.1 圖像對齊與 WanX-1.3B 視頻生成上均取得了優異表現。最令人矚目的是,BranchGRPO 在保證對齊效果更優的同時,迭代時間最高近 5×(Mix 變體 148s vs 698s)。

  • 單位:該項目主要由來自北京大學、北京師范大學、字節跳動的師生聯合研究,作者包括李聿明、王一凱等,通訊作者為北京大學仉尚航。

 

研究背景與挑戰

近年來,擴散模型與流匹配模型憑借在圖像與視頻生成上的高保真、多樣性與可控性,已成為視覺生成的主流方案。然而,僅靠大規模預訓練并不能保證與人類意圖完全對齊:模型生成的結果常常偏離美學、語義或時間一致性的需求。

為解決這一問題,「人類反饋強化學習(RLHF)」被引入,用以直接優化生成模型,使其輸出更貼近人類偏好。

在 RLHF 體系中,「群體相對策略優化(GRPO)」被證明在圖生文、文生圖和視頻生成中具有良好的穩定性與可擴展性。然而,當 GRPO 應用于擴散 / 流模型時,依舊面臨兩大根本性瓶頸:

低效性:標準 GRPO 采用順序 rollout,每條軌跡必須在舊策略和新策略下獨立采樣,復雜度達到 O (N×T)(其中 T 是擴散步數,N 是組大小)。這種重復采樣帶來大量計算冗余,嚴重限制了大規模生成任務的擴展性。

稀疏獎勵:現有方法通常只在最終生成結果上計算單一獎勵,并將其均勻回傳至所有步。這種 “稀疏且均勻” 的反饋忽視了中間狀態中蘊含的關鍵信號,導致 credit assignment 不準確,訓練波動大、收斂不穩,甚至出現高方差梯度。

因此,一個關鍵問題被提出:如何在不破壞多樣性的前提下,既提升采樣效率,又讓獎勵信號更稠密、更穩定地作用于訓練過程?

正是在這一背景下,我們提出了 BranchGRPO。通過樹形分叉、獎勵融合與剪枝機制,BranchGRPO 做到了「又快又穩、又強又準」,為大規模視覺生成對齊開辟了新路徑。

Copyright 2013-2025 今日媒體網 版權所有  京ICP備13154207號-1
91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久
欧美另类专区| 亚洲区欧美区| 国产亚洲一区二区三区不卡 | 日本亚洲三级在线| 亚洲欧美日本国产专区一区| 日韩视频精品在线观看| 99久久亚洲精品| 久久国产亚洲| 国产视频一区在线观看一区免费| 亚洲午夜精品久久久久久app| 美女一区网站| 精品女同一区二区三区在线观看| 日韩在线电影| 免费在线观看精品| 国产精品日本欧美一区二区三区| 日韩欧美精品| www成人在线视频| 国产一区二区三区网| 欧美亚洲三级| 日韩不卡免费视频| 综合激情视频| 国产日韩专区| 午夜在线观看免费一区| 国产一区日韩一区| 久久久久欧美精品| 免费视频亚洲| 国产在线不卡| 日韩美女国产精品| 久久影院一区| 日韩精品中文字幕吗一区二区| 国产精品115| 欧美福利专区| 亚洲va久久久噜噜噜久久| 精品丝袜久久| 国产视频一区欧美| 麻豆一区二区99久久久久| 日韩和的一区二在线| 日韩三级视频| 亚洲午夜91| 你懂的网址国产 欧美| 天堂网在线观看国产精品| 97久久亚洲| 伊人久久大香线蕉av不卡| 日韩国产高清在线| 欧美日韩国产一区二区三区不卡 | 国产精品久久| 91久久久精品国产| 国产精品久久久久久久久久齐齐 | 国模精品一区| 国产精品普通话对白| 蜜桃久久久久久| 国产亚洲欧美日韩精品一区二区三区| 国产精品日韩精品中文字幕| av中文字幕在线观看第一页| 欧美性感美女一区二区 | 香蕉久久国产| 国产欧美一级| 捆绑调教日本一区二区三区 | 久久免费影院| 午夜影院一区| 三级欧美韩日大片在线看| 国产精品大片免费观看| 久久久久欧美精品| 亚欧成人精品| 欧美日韩免费看片| 免费一区二区三区在线视频| 日韩在线观看一区二区| 欧美日韩国产免费观看视频| 麻豆视频在线观看免费网站黄| 欧美精品三级在线| 免费在线观看日韩欧美| 美女少妇全过程你懂的久久| 日本精品不卡| 日韩免费看片| 精品久久久网| 在线人成日本视频| 蜜桃成人精品| 日韩一二三区在线观看| 91精品国产91久久久久久黑人| 91麻豆精品激情在线观看最新| 不卡在线一区二区| 久久精品国内一区二区三区| 日韩影院在线观看| 色老板在线视频一区二区| 日韩av网站在线免费观看| 久久人人97超碰国产公开结果| 日本不卡一区二区| 香蕉精品视频在线观看| 国产videos久久| 亚洲一区欧美| 欧美.日韩.国产.一区.二区| 精品免费视频| 日韩高清欧美激情| 亚洲主播在线| 好吊视频一区二区三区四区| 国产情侣一区在线| 日韩中文字幕亚洲一区二区va在线| 国产一区二区久久久久| 亚洲专区视频| 在线日韩av| 天堂√中文最新版在线| 日韩高清不卡一区二区| 红桃视频亚洲| 久久精品影视| 成人影视亚洲图片在线| 国产欧美日韩精品高清二区综合区 | 精品视频国产| 日本成人在线网站| 欧美日韩国产一区精品一区| 久久久精品日韩| 国产精品毛片久久| 日韩成人精品一区二区| 开心激情综合| 国产999精品在线观看| 国产一区二区三区日韩精品| 国产精品一页| 久久精品亚洲| 麻豆成全视频免费观看在线看| 久久精品国产99国产| 精品资源在线| 麻豆成全视频免费观看在线看| 精品久久97| 日韩毛片视频| 欧美 日韩 国产一区二区在线视频 | 久久国产精品毛片| 亚洲一区二区免费看| 亚洲国产不卡| 日韩中文字幕麻豆| 日韩精品免费视频一区二区三区| 香蕉久久久久久| 国产精品久久| 伊人久久av| 激情五月色综合国产精品| 夜久久久久久| 日韩欧美美女在线观看| 国产精品多人| 午夜精品成人av| 欧美另类综合| 日韩精品一页| 97精品国产福利一区二区三区| 久久精品91| 男人天堂欧美日韩| 国产午夜一区| 日韩精品一区二区三区免费观看| 国产亚洲在线观看| 国产精品日本一区二区不卡视频| 久久久久免费| 日韩一区精品字幕| 久久久国产精品网站| 美女网站一区| 国产精品美女午夜爽爽| 91精品久久久久久久久久不卡| 国产亚洲高清视频| 黄色精品视频| 日韩中文字幕1| 精品三区视频| www在线观看黄色| 久久久男人天堂| 美女视频黄 久久| 欧美一区=区三区| 蜜芽一区二区三区| 伊人久久婷婷| 99久久99视频只有精品| 亚洲美女久久精品| xxxxx性欧美特大| 国产欧洲在线| 日韩精品亚洲专区在线观看| 麻豆国产精品一区二区三区| 国产精品普通话对白| 国产aⅴ精品一区二区三区久久| 一区视频在线| 成人在线视频区| 日本亚洲欧美天堂免费| 久久国产亚洲| 久久一区欧美| 自拍自偷一区二区三区| 日韩中文在线电影| 国产精品xxx| 日本99精品| 久久aⅴ国产紧身牛仔裤| 日韩毛片视频| 精品美女视频 | 亚洲欧美网站| 欧美在线资源| 一区三区视频| 亚洲欧美日韩精品一区二区| 久久大逼视频| 亚洲欧洲av| 国产欧美日韩精品一区二区三区| 欧美亚洲网站| 精品伊人久久| 亚洲风情在线资源| 欧美日韩一区二区三区视频播放| 激情综合亚洲| 国产一区白浆| 亚洲欧美一级| 人人爱人人干婷婷丁香亚洲| 国产三级精品三级在线观看国产| 国产精品igao视频网网址不卡日韩| 精品一二三区|