
一、前言
因為目前我們在黑洞逆問題上遇到了瓶頸,不得不暫時停下腳步重新審視整個研究方向,加上我好奇別人的最新進展是什麼,所以讀了這篇論文 Solving Inverse Problems via Diffusion-Based Priors
該論文提出了一種名為無近似擴散後驗採樣器 (Approximation-Free Diffusion Posterior Sampler, AFDPS) 的新框架,用於解決貝葉斯逆問題 (BIPs)。作者的核心論點是,現有方法要麼依賴於對後驗分布演化過程的啟發式近似 (heuristic approximations),要麼採用將數據一致性步驟與先驗採樣步驟解耦 (decouple) 的疊代方案(如PnP-DM)。
為了克服這些限制,作者採用第一性原理 (first principles) 的方法,直接從預訓練擴散模型所編碼的先驗演化(通過福克-普朗克方程描述)出發,嚴格推導出了一個控制相應後驗分布演化的精確偏微分方程 (Partial Differential Equation, PDE)。這個新的PDE包含了一個修正的飄移項和一個重加權項,可以自然地通過序貫蒙特卡洛 (SMC) 類型的加權粒子系綜來模擬求解。論文為該方法提供了理論保證,證明了其後驗估計誤差可以由分數匹配網路的訓練誤差和粒子數量來約束,並且在多粒子極限下收斂。實驗結果表明,該方法在多個圖像恢復任務上優於當前最先進的基線方法。
二、背景-貝氏逆問題的挑戰與擴散先驗的興起
逆問題 (Inverse Problems) 的核心挑戰是從不完整且帶有雜訊的觀測數據 中,推斷出未知的真實信號 。由於這個過程通常是「不適定的」(ill-posed),解不存在唯一性或穩定性,因此學界普遍採用貝氏框架 (Bayesian Framework) 來處理。此框架不追求單一的解,而是透過尋找完整的後驗機率分佈 來量化所有解的可能性。根據貝氏定理,後驗分佈正比於概似函數 與先驗分佈 的乘積:
然而,在實際應用中,尤其是在高維度問題裡,後驗分佈 往往極其複雜且呈現多模態 (multi-modal),使得傳統的MCMC等採樣方法效率低下,難以收斂到真實分佈。
近年來,擴散模型 (Diffusion Models, DMs) 的出現為此領域帶來了革命性的突破。擴散模型作為一種強大的深度生成模型,能夠極其精確地學習複雜數據(如自然圖像)的先驗分佈 ,從而為解決逆問題提供了前所未有的強大先驗知識。
即便有了強大的擴散先驗,如何有效地從後驗分佈 中採樣仍是核心難題。現有方法主要分為兩類:
-
基於近似的引導方法 (Approximation-based Guidance): 這類方法(如 DPS、ILVR)直接修改擴散模型的逆向採樣過程,試圖將觀測數據 的資訊「引導」進來。它們的理論基礎是
∇log(p(x|y)) = ∇log(p(x)) + ∇log(p(y|x))
。然而,∇log(p(y|x))
這一項通常難以計算,因此這類方法依賴於各種啟發式的近似 (heuristic approximations)。這些近似缺乏理論保證,可能導致結果出現偏差或瑕疵。 -
免於近似的方法 (Approximation-free Methods): 這類方法(如 SGS、SMC)避免修改擴散模型本身,而是將其作為一個完美的「黑箱」先驗採樣器,並與精確的貝氏更新步驟(如吉布斯採樣、粒子濾波)相結合。雖然它們在使用先驗時是免於近似的,但如何將先驗與概似函數結合(例如,如何為粒子重加權)往往依賴於研究者的**「設計選擇」(design choices)**,缺乏第一性原理的推導。
論文提出的 AFDPS 方法屬於第二類,但克服了其核心缺陷。它透過嚴格的數學推導,從根本上建立了一個控制後驗分佈演化的精確偏微分方程 (PDE)。此舉的貢獻在於,它不再需要任何啟發式近似或人為的設計選擇,而是將引導、採樣、重加權等過程統一在一個完全免於近似的、有嚴謹理論支撐的動力學框架下,從而解決了現有方法的根本性問題。
方法分類 | 核心思想 | 主要缺陷 | 本文 AFDPS 定位 |
---|---|---|---|
近似引導法 (如 DPS) | 修改擴散過程,使用近似的梯度引導 | 依賴啟發式近似,缺乏理論保證 | (不採用) |
免近似法 (如 SGS, SMC) | 使用黑箱先驗,結合其他採樣框架 | 採樣框架的結合方式依賴「設計選擇」 | 克服缺陷:提供一個精確的 PDE,從第一性原理出發統一了整個採樣動力學 |
三、AFDPS框架:一個有原則的、免於近似的途徑
AFDPS框架的核心理論貢獻在於其嚴謹的數學推導,它將後驗採樣問題轉化為求解一個高維PDE的問題。
3.1 思想
該方法的核心思想是,隨著擴散先驗分佈 在逆向時間 中從一個簡單的高斯分佈 演化到目標先驗分佈 的過程中,同步追蹤相應的後驗分佈 的演化。
3.2 時變後驗分佈
作者定義了一個時變的後驗分佈 ,它在任意時刻 都與該時刻的先驗分佈 和一個時間無關的概似因子 成正比,其中 是負對數概似函數。其數學表達式為:
這個定義是整個推導的關鍵橋梁,它將先驗的演化與後驗的演化聯繫起來。
3.3 本文演化的核心步驟
本文演化的核心推導過程,它揭示了後驗分佈所遵循的精確動力學:
-
第一步:從先驗的演化出發。先驗密度 的演化由一個已知的Fokker-Planck方程所描述,該方程是擴散模型逆向SDE的確定性 (密度層面) 對應:
其中 是用神經網路擬合的飄移項,而 是擴散係數。
-
第二步:代入後驗定義。將關係式 代入上述Fokker-Planck方程中,其中 是歸一化常數。
-
第三步:代數操縱。透過應用散度、梯度和拉普拉斯運算元的鏈式法則,對方程進行一系列繁複的代數變換,目的時分離出後驗分佈的顯式時間導數 ,這個過程會自然地引入與概似函數 及梯度和拉普拉斯運算元相關的新項。
-
第四步:最終的PDE。經過整理,最終得到控制後驗分佈 演化的PDE:
其中 是一個有效的位能項。
這個PDE傑出地揭示了後驗採樣的內在結構,它包含三個關鍵部分:
- 修正的飄移項 (Modified Drift): 在 此項表明,粒子不僅僅是處於先驗的飄移 ,還受到一個額外的「引導項」 的作用,該項將粒子推向概似函數值更高的區域。
- 擴散項 (Diffusion): 擴散項 維持標準的擴散項,負責在狀態空間中進行探索,防止採樣陷入局部最優。
- 重加權/生滅項 (Reweighting/Killing Term): 此項與概似函數 密切相關,它控制著每個粒子隨時間演化的重要性 (即權重) 的變化。
此構想的精妙之處在於,它將「引導」和「重加權」這兩個看似相互獨立的概念,統一在一個個數學的對象 (PDE) 之下。它表明,引導和重加權並非可以隨意添加的技巧,而是後驗動力學中兩個密不可分、相互關聯的方面。該PDE精確地闡明了它們應有的形式和相互作用。
四、透過帶權重粒子動力學實現演算法
將推導的PDE (式3.4) 轉化為可行的演算法,是透過一個由 個帶權重的粒子 組成的系統來數值求解的。這在文獻中被稱為序列蒙地卡羅 (SMC) 或隨機帶權粒子方法。
4.1 帶權重粒子動力學
從後驗演化PDE可以推導出每個粒子所遵循的隨機微分方程 (SDE) 系統:
- 的演化由PDE中的修正飄移項和擴散項決定。
- 的演化由PDE中的重加權項決定,它描述了粒子權重的相對變化。
4.2 兩種實踐演算法路線
基於對擴散模型EDM框架中擴散係數 的不同處理,作者提出了兩種具體的演算法:
-
AFDPS-SDE (演算法 2):
- 設定:讓 ,這對應於一個最完整、作者完全隨機的擴散過程。
- 實現:直接使用Euler-Maruyama格式對上述粒子SDE系統進行數值演化。
- 特點:該演算法的探索能力完全依賴於SDE內在的隨機性 (即維納過程 )。
-
AFDPS-ODE-Corrector (演算法 4):
-
設定:讓 ,這使得先驗演化退化為一個確定性的機率流ODE (Probability Flow ODE)。
-
實現:粒子位置的演化遵循一個常微分方程 (ODE),這構成了一個「預測步」(Predictor)。然而,純粹的ODE演化缺乏隨機性,可能導致探索不足。為了解決這個問題,作者在每個時間步之後引入了一個「校正步」(Corrector)。
-
校正步 (演算法 3):
校正步的靈感來自於拉氏擴散的前向到後向的中間採樣分佈 上。這是透過運行一個「未經調整的朗之萬算法」(ULA) 來實現的,ULA的更新同時利用了預訓練的分數函數 和概似的梯度 ,從而有效地注入隨機性並改善採樣質量。
-
在SMC方法中,一個常見的關鍵問題是粒子權重退化,即隨著時間的推移,少數粒子的權重會趨近於1,而其他粒子的權重趨近於0。這會導致有效樣本量 (Effective Sample Size, ESS) 急劇下降。為了解決這個問題,標準作法中包含了一個重採樣步驟,當ESS低於某個閾值時觸發。該步驟會根據權重,從當前帶權重粒子組進行重採樣,即淘汰低權重的粒子,並複製高權重的粒子。這對於維持粒子系統的健康和多樣性至關重要。
4.3 與FK-Corrector的路線比較
為了突顯AFDPS的獨特創新,與其最接近的同期工作FK-Corrector 進行直接比較是至關重要的。下表 (改編自該論文附錄) 清晰地展示了兩者在動力學上的核心差異。
項 | AFDPS (本文) | FK Corrector |
---|---|---|
飄移項 (Drift) | ||
重加權項 (Reweighting) |
從上表可以一目了然地看到,AFDPS的飄移項中明確包含了 這一項。這個「引導項」直接作用於粒子的運動軌跡,將其拉向高概似區域。相較之下,FK-Corrector的飄移項僅包含先驗動力學,它將所有的概似資訊都放入了重加權項中。這種結構上的差異是AFDPS性能優越的關鍵原因之一,因為它更主動、直接地利用了觀測數據來指導採樣路徑。
五、理論保證:誤差界與收斂性分析
本文的一項主要優勢在於其堅實的理論基礎,它超越了單純的經驗性展示,為所提出的演算法提供了嚴格的數學保證。
5.1 關鍵假設
理論分析建立在幾個合理的假設之上:
- 假設4.1 (對數概似函數的有界性): 是二次可微且有下界的,這是貝氏逆問題中的標准假設。
- 假設4.2 (跨界-龐加萊): 先驗分佈是「可擴散的」,即它被「龐加萊不等式」所約束。
- 假設4.3 (分數匹配誤差): 學習到的神經網路分數函數 與真實分數函數之間存在一個有界的誤差 。這個假設至關重要,它將理論與實踐中模型訓練不完美的問題聯繫起來。
- 假設4.4 (函數的有界性和Lipschitz連續性): 一些關於 和 的複合函數的技術性假設,用以確保粒子權重不會隨時間發散。在實踐中,這條可以透過權重裁剪來保證。
5.2 定理 4.1:後驗估計誤差
該定理量化了演算法在單粒子極限下,後驗分佈 與真實後驗分佈 之間的差距。
-
陳述: 兩者之間的總變差 (Total Variation, TV) 距離是有界的:
其中 和 是常數,而 是擴散總時長。
-
解讀: 這是一個深刻的結果。它揭示了一個由擴散時長 控制的權衡關係:較長的 可以減少由初始高斯分佈近似所帶來的誤差 (第一項),但同時也可能放大由不完美的分數函數在長時間積分下累積的誤差 (第二項)。最重要的是,這個誤差界明確指出,演算法的最終精度直接受限於預訓練擴散模型的質量 (即分數匹配誤差 )。
5.3 定理 4.2:多粒子系統下的收斂性
該定理闡明了粒子近似方法的有效性。
-
陳述: 當粒子數量 趨於無窮大時,由粒子系統構成的經驗測度,在2-Wasserstein距離的意義下,收斂到所推導的後驗PDE的真實解。
-
解讀: 這是一個平均場 (mean-field) 一致性結果。它從理論上證明了使用有限數量的粒子來採樣求解後驗PDE的合理性。這保證了我們所實現的演算法確實是在求解我們設定的那個目標PDE。
這兩個定理相輔相成,提供了一個完整的理論保證。定理4.1處理的是模型誤差 (即由於 不完美,導致PDE的解與真實後驗存在差距),而定理4.2處理的是離散誤差 (由於粒子數量 有限,導致數值解與PDE的真實解存在差距)。它們共同保證了演算法能夠收斂到一個被觀測數據與真實後驗分佈所約束的分佈,且誤差來源被清晰地刻畫。
六、經驗性能力分析與比較
除了堅實的理論,論文還進行了廣泛的實驗驗證,以證明其方法的實際效果。
6.1 實驗設置
- 任務:四個具有挑戰性的圖像逆問題:高斯去模糊 (GD)、運動去模糊 (MD)、超解析度 (SR) 和方框修復 (BI)。實驗中使用的觀測雜訊水平較高,增加了問題的難度。
- 數據集:兩個大規模、高解析度的標準數據集:FFHQ-256和ImageNet-256。
- 基線方法:與一系列當前最先進的方法進行了比較,包括DPS, DCDP, SGS-EDM, FK-Corrector, 和 PF-SMC-DM。
- 評估指標:同時使用像素級的準確性指標PSNR (峰值信噪比,越高越好) 和感知質量的指標LPIPS (學習感知圖像塊相似度,越低越好),以進行全面的評估。
6.2 定量結果分析
論文中的表格清晰地展示了AFDPS方法的優越性。
表1:FFHQ-256數據集上的定量結果
表2:ImageNet-256數據集上的定量結果
從數據中可以看出,AFDPS的兩種變體在所有任務上都表現出強大或領先的性能,經常在PSNR和LPIPS指標上都超越所有基線方法。這有力地證明了其理論框架在實踐中的有效性。
6.3 定性結果分析
論文附帶的視覺化結果,進一步揭示了兩種變體的互補優勢。
- AFDPS-SDE:通常能生成更銳利、細節更豐富的紋理,這與其在LPIPS指標上的優異表現相符。其內在的隨機性有助於恢復高頻細節。
- AFDPS-ODE:則傾向於產生更平滑、更忠實的重建結果,這通常對應著更高的PSNR。其確定性的ODE演化加上校正步,能在確保整體結構一致性的同時保持有效去噪。
這兩種算法特性與其理論框架的洞察是相符的,再次證實了框架設計的合理性。
七、結論與未來展望
7.1 核心貢獻與創新:從「解耦疊代」到「統一演化」
此論文在基於擴散模型的逆問題求解領域中取得了重要進展。其核心貢獻可總結為三點:
- 新穎的原理性方法:提出了 AFDPS,其核心是基於一個嚴格推導的偏微分方程 (PDE) 來描述後驗分佈的精確演化,徹底擺脫了對啟發式近似的依賴。
- 完備的理論保證:建立了後驗採樣精度與模型訓練誤差之間的直接聯繫,並證明了算法在多粒子極限下的收斂性,提供了堅實的理論基礎。
- 頂尖的實驗性能:在多個大規模數據集和具有挑戰性的逆問題上,其性能始終優於或媲美現有的最先進方法。
其真正的創新之處在於為「如何在擴散過程中融合觀測數據」這一核心問題,提供了一個數學上更為根本的視角,實現了從**「解耦與疊代」到「統一與演化」**的範式轉移。
過去的先進方法(如 PnP-DM / SGS-EDM)其哲學是解耦的:將問題分解為「數據保真」和「先驗投影」兩個獨立步驟交替執行。這種方法雖直觀,但其本質是基於最佳化算法的“運算元分裂”,並未直接回答該過程是否在從真實的後驗分佈 中採樣。
AFDPS 則採用統一的思路:它不去解耦問題,而是直接求解「當先驗 隨時間演化時,對應的後驗 應遵循何種動力學?」通過從福克-普朗克方程出發的嚴謹推導,本文得到一個描述後驗分佈演化的全新PDE。在這個統一的動力學系統中,先驗和似然資訊被內生地耦合在一起,共同、平滑地指導採樣過程。
為了更清晰地理解其差異,以下是 AFDPS 與代表性 PnP 方法 (SGS-EDM) 的對比:
特性 | Plug-and-Play (PnP) / SGS-EDM | AFDPS (本文方法) |
---|---|---|
核心思想 | 解耦與疊代 (Decoupling & Iteration)。將問題分解為數據保真和先驗投影兩個子步驟,交替進行。 | 統一與演化 (Unification & Evolution)。推導並求解一個統一的、描述後驗分布連續演化的PDE。 |
數學基礎 | 基於最佳化理論中的運算元分裂方法(如ADMM, Split Gibbs Sampler)。 | 基於隨機過程理論中的福克-普朗克方程和隨機微分方程 (SDE)。 |
似然資訊的作用方式 | 在一個獨立的步驟中,透過梯度下降將解拉向數據一致的方向。 | 內生地耦合在後驗演化PDE的飄移項中。它不是一個獨立的步驟,而是持續地、平滑地影響粒子演化的方向。 |
“無近似”的含義 | 框架本身是一種算法層面的近似,它將複雜的後驗採樣問題近似為兩個更容易的子問題。 | 在推導後驗演化PDE的過程中是無近似的。近似只存在於:1) 分數網路的訓練誤差;2) PDE的數值離散化。 |
產出 | 通常產生一個點估計解,或多次運行產生無權重的樣本。 | 直接產出帶權重的後驗樣本,能更好地描述後驗分布的形態。 |
一言以蔽之:PnP 方法是在每個離散的時間步上「修正」解,使其交替滿足數據和先驗約束。而 AFDPS 則是模擬了一個「平滑演化」的過程,這個過程的每一步都天然地、同時地考慮了這兩種約束。
7.2 理論價值與優點
- 理論框架嚴謹:論文最大的亮點在於其嚴謹的推導,為領域提供了一個有清晰數學基礎的框架,擺脫了以往方法的啟發式本質。
- 堅實的理論保障:論文提供了兩個核心定理,清晰地將算法的最終精度與模型的訓練誤差和粒子數量直接掛鉤,為算法的正確性和性能提升方向提供了理論依據。
- 出色的實驗表現:在多個基準測試中取得了SOTA或更優的結果,特別是在LPIPS等感知指標上表現突出,驗證了理論的有效性。
- 實現上的靈活性:同時提出了基於SDE和ODE+Corrector的兩種實現方式(AFDPS-SDE 和 AFDPS-ODE),兩者在實驗中展現了互補優勢,增加了方法的適用場景。
7.3 潛在挑戰與討論
- 計算成本與可擴展性:作為一種系綜方法,其計算成本與粒子數 成正比。為保證公平比較,實驗中的 值較小 (5或10),這對於複雜的後驗分佈可能不足。若需增加 ,其計算成本將如何與單軌跡方法競爭,是一個待解問題。
- 理論假設的完備性:理論分析依賴於一個關鍵函數有界性和連續性的假設(假設4.4),論文提到這在實踐中可透過重採樣來保證,但分析本身未包含對重採樣的嚴格證明,這在SMC相關文獻中是常見的理論與實踐的「缺口」。
- 超參數 的引入:附錄中引入了一個可插值於AFDPS和FK-Corrector之間的超參數 ,雖然這增加了靈活性,但也略微削弱了論文「無近似、無須手調」的核心賣點,使其在某種程度上回歸了啟發式調整。
7.4 未來展望與影響
這項工作為該領域的發展開闢了多條充滿希望的研究路徑:
- 方法論擴展:框架具有很強的通用性,未來可擴展到其他生成模型(如LDMs、Flow Matching)或與更快的求解器結合以提高效率。
- 應用領域拓展:除了圖像處理,該方法有望應用於流體動力學、聲學成像、地球科學等更廣泛的科學計算領域。
- 理論體系完善:未來可對數值離散化誤差進行更精細的分析,或為重採樣步驟建立更嚴格的理論。