91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久

登錄
首頁 > 媒體學習 > 北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

北大與字節團隊BranchGRPO,「樹形分叉 + 剪枝」重塑擴散模型

發布時間:2025-09-23 10:06:25

擴散 / 流匹配模型的人類偏好對齊中,實現高效采樣與穩定優化的統一,一直是一個重大挑戰。

近期,北京大學與字節團隊提出了名為 BranchGRPO 的新型樹形強化學習方法。不同于順序展開的 DanceGRPO,BranchGRPO 通過在擴散反演過程中引入分叉(branching)與剪枝(pruning),讓多個軌跡共享前綴、在中間步驟分裂,并通過逐層獎勵融合實現稠密反饋。

該方法在 HPDv2.1 圖像對齊與 WanX-1.3B 視頻生成上均取得了優異表現。最令人矚目的是,BranchGRPO 在保證對齊效果更優的同時,迭代時間最高近 5×(Mix 變體 148s vs 698s)。

  • 單位:該項目主要由來自北京大學、北京師范大學、字節跳動的師生聯合研究,作者包括李聿明、王一凱等,通訊作者為北京大學仉尚航。

 

研究背景與挑戰

近年來,擴散模型與流匹配模型憑借在圖像與視頻生成上的高保真、多樣性與可控性,已成為視覺生成的主流方案。然而,僅靠大規模預訓練并不能保證與人類意圖完全對齊:模型生成的結果常常偏離美學、語義或時間一致性的需求。

為解決這一問題,「人類反饋強化學習(RLHF)」被引入,用以直接優化生成模型,使其輸出更貼近人類偏好。

在 RLHF 體系中,「群體相對策略優化(GRPO)」被證明在圖生文、文生圖和視頻生成中具有良好的穩定性與可擴展性。然而,當 GRPO 應用于擴散 / 流模型時,依舊面臨兩大根本性瓶頸:

低效性:標準 GRPO 采用順序 rollout,每條軌跡必須在舊策略和新策略下獨立采樣,復雜度達到 O (N×T)(其中 T 是擴散步數,N 是組大小)。這種重復采樣帶來大量計算冗余,嚴重限制了大規模生成任務的擴展性。

稀疏獎勵:現有方法通常只在最終生成結果上計算單一獎勵,并將其均勻回傳至所有步。這種 “稀疏且均勻” 的反饋忽視了中間狀態中蘊含的關鍵信號,導致 credit assignment 不準確,訓練波動大、收斂不穩,甚至出現高方差梯度。

因此,一個關鍵問題被提出:如何在不破壞多樣性的前提下,既提升采樣效率,又讓獎勵信號更稠密、更穩定地作用于訓練過程?

正是在這一背景下,我們提出了 BranchGRPO。通過樹形分叉、獎勵融合與剪枝機制,BranchGRPO 做到了「又快又穩、又強又準」,為大規模視覺生成對齊開辟了新路徑。

Copyright 2013-2025 今日媒體網 版權所有  京ICP備13154207號-1
91精品国产三级_国语对白做受xxxxx在线中国_国产精品12p_黄色成人在线看_久久久久久久久久久99_91嫩草国产丨精品入口麻豆_各处沟厕大尺度偷拍女厕嘘嘘_久久9精品区-无套内射无码_国产原创精品在线_国产成人免费高清视频_国产高清视频网站_国产l精品国产亚洲区久久
日韩视频在线视频| 乱子伦一区二区| 奇米777在线视频| 国产第一页视频| 99在线精品免费视频| 四虎影院一区二区| 国产一级片自拍| 黄色免费网址大全| 可以在线看的黄色网址| 久久综合九色综合88i| www.av91| 精品无码国产一区二区三区av| 免费国产成人看片在线| 天天av天天操| 在线观看日本www| 青青草久久伊人| 九九九九九国产| 在线观看免费不卡av| 狠狠操狠狠干视频| www亚洲成人| 一道本在线免费视频| 国产野外作爱视频播放| 美女一区二区三区视频| 无码少妇一区二区三区芒果| 成人一级片网站| 久久精品午夜福利| 国产v亚洲v天堂无码久久久| 妞干网在线免费视频| 亚洲黄色a v| 亚洲欧美国产中文| 免费网站在线观看黄| 二级片在线观看| 成人毛片100部免费看| 欧美日韩不卡在线视频| 亚洲 高清 成人 动漫| 2022亚洲天堂| 日韩肉感妇bbwbbwbbw| 中日韩av在线播放| 国产经典久久久| 青娱乐自拍偷拍| 一本色道无码道dvd在线观看| av污在线观看| 中文字幕日韩久久| 欧美黄色免费网址| 亚洲 高清 成人 动漫| 久久久精品麻豆| 污网站在线免费| 永久免费在线看片视频| 日韩国产成人无码av毛片| 国产成人无码a区在线观看视频| 国产淫片av片久久久久久| 中文字幕有码av| 法国空姐在线观看免费| 无码熟妇人妻av在线电影| 国产男女无遮挡| av亚洲天堂网| 久草视频这里只有精品| 精品www久久久久奶水| 日韩视频在线观看一区二区三区| 国产精品国产三级国产专区51| 不卡中文字幕在线观看| 国产黑丝在线视频| www.av片| 在线观看免费视频高清游戏推荐| 亚洲爆乳无码精品aaa片蜜桃| 无码播放一区二区三区| 国产又猛又黄的视频| 懂色av粉嫩av蜜臀av| 97在线播放视频| 欧美日韩视频免费在线观看| 日韩精品一区二区三区久久| 中文字幕中文在线| 青草青青在线视频| 亚洲18在线看污www麻豆| 国自产拍偷拍精品啪啪一区二区| 午夜免费看毛片| www..com日韩| 2025韩国大尺度电影| 免费日韩视频在线观看| 男女裸体影院高潮| 色婷婷综合网站| 蜜桃传媒一区二区三区| 在线免费看污网站| 精品一区二区中文字幕| 青草全福视在线| 一个色综合久久| 熟女性饥渴一区二区三区| 1314成人网| 激情 小说 亚洲 图片: 伦| 免费看毛片的网址| 永久av免费在线观看| 国产精品人人妻人人爽人人牛| 欧美黄网在线观看| 国产精品探花在线播放| 91香蕉视频污版| jizzjizz国产精品喷水| 国产盗摄视频在线观看| 奇米影视四色在线| 成熟老妇女视频| 日本欧美视频在线观看| 日本丰满少妇黄大片在线观看| 亚洲免费一级视频| 999香蕉视频| 欧美视频在线免费播放| 影音先锋男人的网站| 亚洲一区二区三区观看| 波多野结衣天堂| 国产99久久九九精品无码| 日韩精品在线中文字幕| 欧美日韩一区二区三区电影| 亚洲福利精品视频| 国产精品欧美激情在线观看| 欧美精品久久久久久久自慰| 99久re热视频精品98| 亚洲欧美手机在线| 小泽玛利亚视频在线观看| 任你操这里只有精品| 日韩国产欧美亚洲| www.av片| 免费观看国产精品视频| 成品人视频ww入口| 成人免费毛片在线观看| 欧美日韩中文字幕在线播放| 99久久久无码国产精品性色戒| 网站在线你懂的| www激情五月| 999久久久精品视频| 黄色大片在线免费看| 国产 欧美 日韩 一区| 777久久精品一区二区三区无码 | 最近免费中文字幕中文高清百度| 欧美视频免费看欧美视频| 免费拍拍拍网站| 男女视频网站在线观看| 激情综合在线观看| 99免费视频观看| 国产高潮免费视频| 一本色道久久亚洲综合精品蜜桃 | 欧美 亚洲 视频| 国产精品igao激情视频| 日本久久久网站| 欧美精品自拍视频| 黄色动漫在线免费看| 37pao成人国产永久免费视频| 成人在线看视频| 亚洲综合欧美激情| 免费不卡av网站| 浴室偷拍美女洗澡456在线| 日本免费成人网| 国产无限制自拍| 精品中文字幕av| 日韩av片网站| 免费不卡av网站| 欧美这里只有精品| 中文字幕av久久| 中文字幕一区二区三区四区在线视频| 亚洲黄色小视频在线观看| 欧美特黄aaa| 强伦女教师2:伦理在线观看| 日韩精品一区在线视频| 欧美日韩在线免费播放| 日本一二三区在线| 日韩激情视频一区二区| 中文字幕无码精品亚洲35| 三上悠亚在线一区二区| 日本黄xxxxxxxxx100| 国产91在线免费| 中文字幕第17页| 日韩精品一区二区三区四| 成人在线观看黄| 麻豆中文字幕在线观看| 97干在线视频| 亚洲中文字幕久久精品无码喷水| 午夜免费视频网站| 日韩国产欧美亚洲| 五月激情婷婷在线| 久久久久久久香蕉| 性生交免费视频| 成人免费看片'免费看| 国产又黄又猛又粗| 在线观看18视频网站| 女人扒开屁股爽桶30分钟| 四虎影院一区二区| 国产裸体免费无遮挡| 欧美人与动牲交xxxxbbbb| 久草福利视频在线| 青青在线视频免费观看| 免费一区二区三区在线观看| 国产精品自拍合集| 中文字幕第38页| 免费看的黄色大片| 在线视频一二三区| 婷婷六月天在线| 国产精品333| 成人免费看片视频在线观看| 在线观看的毛片| 少妇av一区二区三区无码| 日韩欧美中文在线视频| 国产成人精品视频ⅴa片软件竹菊| 国产精品av免费观看|