隨機

引言

這是一篇針對隨機問題的科普性文章。

我最近在看Drift Diffusion Model,決定找個簡單的例子按照自己的理解獨立推導一遍,對理論工作者而言,這應該是掌握一套工具的最好方法。從大學時代開始,我逐漸養成了一種眼高手低的習慣:我會閱讀文本給出的理論搭建過程,卻鮮有動手。而實際上,任何文本由於篇幅所限,自然不能巨細靡遺填充所有的細節,而那些跳過的步驟你不親自動手算一遍,根本不可能知道。但我覺察這個光榮傳統,已經是很晚的事情了,源起是我問了自己幾個自以為掌握的問題,卻一個也答不上來:因為我並不真正理解它,我只是像一個倉庫保管員一樣知道它們被擺在哪個貨價上,僅此而已。

這也是我寫這篇文章的動機,方便自己梳理一些其實並不真正理解的東西。

相遇問題

這是一個小學生常會遇到的問題,譬如說某人正在前往某地,好巧不巧的是,友人也在向他這裡趕來,試問他們什麼時候相遇,又在何處相遇?

當然你會說這個問題簡直是個笑話,你把兩地距離除以兩人的速度和即可;即便不是勻速運動,將等式改寫為兩人速度對時間的積分和等於兩地距離即可,不能得到解析解也可以用數值方法處理。

不過且慢,現階段我只考慮最簡單的勻速情況。但是我加上了一個叫噪聲的東西,這個問題就足夠複雜了,為此我不得不介紹一系列概念與數學工具。

什麼是噪聲,跟噪聲沒有關係,只是相像而已。它指的是隨機的漲落,譬如說,你騎車前往某地,就算你試圖以一個勻速方式前進,但由於路況、風力、行人等不可預見的隨機因素,讓你看似平穩的速度放大細節後便可發覺無數上上下下的波動,這個東西就很像背景噪聲。這個例子並不好,更合適的例子是一個人穿過擁擠的舞廳,在此過程中不斷受到來自各個方向隨機的撞擊而短暫改變運動狀態,但總體依然維持勻速前進的趨勢。這種撞擊很像是來自分子熱運動,或許也讓你聯想到布朗運動花粉受到水分子而產生隨機運動的軌跡。你的感覺是對的,這些確實是一回事。

然而運動是隨機的,你並不能清楚花粉在某一個時刻的具體位置,那這種研究還有什麼意義?

依然有意義,只是理解的方式不同。花粉誠然在任何地方都會出現,但總有些位置出現的概率大一些,對不對?雖然運動是不確定的,但漲落,或者用你熟悉的方差,卻是可以精確計算出來的。這也使得隨機問題不像是決定論的經典物理,而像是不確定性的量子力學。

在開始之前了解一些數學工具是必要的,正如開頭所說,這是一篇科普性文章,我略去嚴格而瑣碎的數學證明給出最直觀的解釋,以及為什麼要用到它。

傅立葉變換

順便說個笑話,我一直到大學畢業都不知道傅立葉變換是什麼。

我想這也是大學教育難以讓人滿意的地方,我確實背誦了那些數學定義,卻對其意涵一無所知:不知道怎麼得出這個結論,以及這個東西可以用來做什麼。我相信這個東西背後一定有一個直觀的解釋,而民科聚集的互聯網尤擅此道。

譬如說,我記得一種說法是,傅立葉變換將時域信息變換到頻域上。以這個波$\frac{1}{2\pi}e^{i\omega_0t}$為例(通常會取實部,這就是熟悉的$\frac{1}{2\pi}\cos(\omega_0t)$餘弦函數),變換後為$\delta(\omega-\omega_0)$(在$\omega_0$以外均為零,在該點非零,但總積分為1)。頻域上只有一點,多麼簡單!

問題是你看得懂他們在說什麼嗎。

我並不是說這個結論是錯的:它是正確的,但沒什麼太多意義的一個微不足道的例子而已。相反它將簡單的問題複雜化了:它滿足了那些一知半解民科的表演慾望,而真實圖像變得愈發含混不清。

但如果你問我傅立葉變換是什麼,我會告訴你它什麼也不是,它是一個純粹的數學技巧,在處理一些問題,譬如說微分方程特別佔便宜而已。如果你看完下面的推導過程,你就會明白我在說什麼意思。

中學時代就已經學過一個平面上的向量可以用不共線的兩個基向量展開,譬如$\vec a = c_1\vec a_1 + c_2\vec a_2$,怎麼確定前面的係數$c_1$和$c_2$呢,答案是做內積,譬如
$$
\vec a\cdot\vec a_1 = c_1\vec a_1\cdot\vec a_1 + c_2\vec a_2\cdot\vec a_1
$$
這樣就可以了,如果想讓問題再簡單一點,乾脆讓基向量互相垂直好了,上面等式右邊的第二項自動為零:此為正交條件。如果再懶一點,讓基向量的模長為一,即$\vec a_1\cdot\vec a_1 = 1$:此為歸一化條件。那麼係數$c_1 = \vec a\cdot\vec a_1$就直接解出。如果用尖括號表示內積,可以總結為$\vec a = \langle \vec a,\vec a_1\rangle\vec a_1 + \langle \vec a,\vec a_2\rangle\vec a_2$

但對基函數而言,可以理解為一個無限維的向量,這時候內積要換成積分的形式,譬如$\langle\psi,\phi\rangle = \int \psi(x)^*\phi(x) dx$。取共軛是針對複數的情況,因為人們希望內積總是模長的平方。

現在我有一組基函數$e^{\frac{in\pi x}{L}}$,其中$n=0,\pm 1,\pm 2…$,它們滿足正交條件嗎?
$$
\langle e^{\frac{im\pi x}{L}},e^{\frac{in\pi x}{L}}\rangle = \int_{-L}^L e^{\frac{i(n-m)\pi x}{L}} dx = 2L\delta_{mn}
$$
$\delta_{mn}$表示僅在m和n相等時為一,此外為零。容易發現基函數是正交的,但不歸一。正交和歸一化都是無所謂的事情,無非就是計算方便一點而已。只要線性無關,任一函數$\phi(x)$用這組基函數展開(實質上還要考慮基函數的完備性,我略去證明,你只需要知道傅立葉基正交完備即可)
$$
\phi(x) = \sum_n \psi_ne^{\frac{in\pi x}{L}}
$$
$\psi_n$是係數,確定這個係數可以在上面等式兩邊乘以$e^{-\frac{in\pi x}{L}}$後再積分,可以得到
$$
\int_{-L}^L \phi(x)e^{-\frac{in\pi x}{L}} dx = 2L \psi_n
$$
這個實質上就是傅立葉變換。將係數$\psi_n$代回到求和符號當中
$$
\phi(x) = \frac{1}{2L}\sum_n [\int_{-L}^L \phi(x)e^{-\frac{in\pi x}{L}} dx]e^{\frac{in\pi x}{L}}
$$
這就是其逆變換,即傅立葉積分。你要做的就是把x前面的係數定義為$\omega \equiv n\pi/L$,那麼顯然有$d\omega = \pi/Ldn$,而dn是什麼,不就是1。

因為$dn = 1$,我在右邊多乘一個也沒關係,這樣就有
$$
\phi(x) = \frac{1}{2L}\sum_n [\int_{-L}^L \phi(x)e^{-i\omega x} dx]e^{i\omega x} dn = \frac{1}{2\pi}\sum_n [\int_{-L}^L \phi(x)e^{-i\omega x} dx]e^{i\omega x} d\omega
$$
把L推到無窮,求和替換為積分,即可
$$
\phi(x) = \frac{1}{2\pi}\int_{-\infty}^\infty [\int_{-\infty}^\infty \phi(x)e^{-i\omega x} dx]e^{i\omega x} d\omega
$$
所謂傅立葉變換,就是括號裡面的積分;所謂逆變換,就是外面那層積分。這些只是數學上面的恆等轉化,不會承載什新的內容,正如康德的先天分析判斷。

下面我來說它佔便宜的地方,其中之一即為求解微分方程。這是因為分部積分的緣故,譬如對$\frac{dy}{dx}$
$$
\int_{-\infty}^\infty \frac{dy}{dx}e^{-i\omega x} dx = \int_{-\infty}^\infty e^{-i\omega x} dy = y(x=\infty) - y(x=-\infty) + i\omega\int_{-\infty}^\infty ye^{-i\omega x}dx
$$
現在問題來了,y在邊界上是多少呢,默認是零,這是非常先驗的東西。如果記傅立葉變換$\tilde y = \int_{-\infty}^\infty ye^{-i\omega x}dx$,那麼微分dy/dx經過變換後即為$i\omega\tilde y$,這就變成代數方程了。解出$\tilde y$,通過逆變換$y = \frac{1}{2\pi}\int_{-\infty}^\infty \tilde ye^{i\omega x}dx$代回去可以求出y。

後面的推導都會用到這個結果。

動力學模型

現在可以回到正題。用$dx_1$與$dx_2$表示兩個人在一小段時間dt的運動距離,對第一個人有
$$
dx_1 = \mu_1dt + \sigma_1\xi_1(t)dt
$$
這裡假設初始時刻$x_1(t=0) = 0$,速度$\mu_1 > 0$。第二項為噪聲,它的意義我後面會詳細解釋,只是先記下它滿足$\langle\xi_1(t)\rangle = 0$以及$\langle\xi_1(t)\xi_1(t’)\rangle = \delta(t-t’)$兩個條件,這裡的尖括號表示對系綜(一個系統所有可能的狀態的集合)的平均。

同樣對第二個人有
$$
dx_2 = \mu_2dt + \sigma_2\xi_2(t)dt
$$
同樣假設初始時刻$x_2(t=0) = L$,速度$\mu_2 > 0$。第二項一樣滿足$\langle\xi_2(t)\rangle = 0$以及$\langle\xi_2(t)\xi_2(t’)\rangle = \delta(t-t’)$兩個條件,需要注意這兩個噪聲相互獨立。

考慮第二個人相對前者的相對運動
$$
d(x_2-x_1) = (\mu_2-\mu_1)dt + [\sigma_2\xi_2(t)-\sigma_1\xi_1(t)]dt
$$
毫不奇怪,噪聲的均值為零
$$
\langle\sigma_2\xi_2(t)-\sigma_1\xi_1(t)\rangle = \sigma_2\langle\xi_2(t)\rangle - \sigma_1\langle\xi_1(t)\rangle = 0
$$
再考察其協方差
$$
\langle[\sigma_2\xi_2(t)-\sigma_1\xi_1(t)][\sigma_2\xi_2(t’)-\sigma_1\xi_1(t’)]\rangle = \langle[\sigma_2^2\xi_2(t)\xi_2(t’)+\sigma_1^2\xi_1(t)\xi_1(t’)]\rangle = (\sigma_1^2+\sigma_2^2)\delta(t-t’)
$$
這是因為噪聲相互獨立,交叉項譬如$\langle\xi_1(t)\xi_2(t’)\rangle = \langle\xi_1(t)\rangle\langle\xi_2(t’)\rangle$為零。如果記$x = x_2 - x_1$,$\mu = \mu_2 - \mu_1$,$\sigma = \sqrt{\sigma_1^2 + \sigma_2^2}$,以及一個新的噪聲滿足$\langle\xi(t)\rangle = 0$與$\langle\xi(t)\xi(t’)\rangle = \delta(t-t’)$兩個條件,可以將其簡化為
$$
dx = \mu dt + \sigma\xi(t)dt
$$
以及初始條件$x(t=0) = L$,在速度$\mu < 0$的情況下,於T時刻撞擊到零點$x(t=T) = 0$,現在需要求解這個T,它顯然是一個概率分佈。這個問題,就是經典的First Passage Time Problem

不過在深入之前,先回顧一下那個被暫時擱置的問題,為什麼會有那兩個奇怪的條件?

隨機過程

$\xi(t)$表示在t時刻的一個隨機數,正式名稱為Gaussian White NoiseGaussian是指它服從標準高斯分佈,均值是零,方差為一:這也是$\langle\xi(t)\rangle$的由來,以及第二個條件中的係數需要額外乘上一個$\sigma^2$的緣故。

White是因為自我關聯函數為$\langle\xi(t)\xi(t-\tau)\rangle = \delta(\tau)$,根據Wiener-Khinchin Theorem,功率譜密度是其傅立葉變換$s(\omega) = \int \delta(\tau)e^{-i\omega\tau}d\tau = 1$為一個常數,這樣看上去就像是太陽光中多種頻率均勻混雜的白色。這個定理證明起來並不困難,在積分區間上按四十五度斜線劃分出新的積分微元即可證明。篇幅所限,我不在這裡展開了。

如果說均值為零還可以理解,但另外兩個問題:

  1. 為什麼關聯函數是$\delta(t-t’)$?
  2. 為什麼隨機數服從高斯分佈?

我先來回答第一個問題:答案是必須如此,才能構造出Wiener Process(或者叫Brownian Motion,這是數學和物理上的叫法不同,實質上是同一個東西,就像是向量與矢量一樣)。如果把隨機變量的累積效果記作$W_t = \int_0^t\xi(\tau)d\tau$,這就是熟知的布朗運動,那麼Wiener Process的一個重要結論便是
$$
\langle W_tW_s\rangle = \min(t,s)
$$
毫不奇怪,如果是Delta關聯隨機數$\xi(\tau)\xi(\tau’)\rangle = \delta(\tau-\tau’)$
$$
\langle W_tW_s\rangle = \int_0^td\tau\int_0^sd\tau’\langle\xi(\tau)\xi(\tau’)\rangle = \min(t,s)
$$
不難發現Wiener Process的方差與時間成正比$\langle W_t^2\rangle = t$。這會讓人頗為奇怪,譬如說,一個粒子以速度v運動一段時間t,那麼方差的均值顯然是$v^2t^2$而與時間的平方成正比,為什麼此處會正比於時間?

真實的原因是粒子並不是這麼運動的,就一維為例,它於每個時刻均在做無規則的折返運動。如果要理解這個問題,我們有必要深入到微觀層次觀察一下粒子的運動方式,這樣也同時回答了第二個問題。

一維隨機遊走

考慮一個簡單的模型,一個初始時刻在原點的粒子,它等可能地向左或是向右運動。我們考察一段時間後它在各個位置出現的概率。

假設粒子一次運動時間為$\Delta t$,相應的速度大小是v。在一段時間t(t是$\Delta t$的整數倍,記為$t = n\Delta t$)。如果考慮這樣一個母函數
$$
F = [\frac{1}{2}e^{-i\omega(v\Delta t)}+\frac{1}{2}e^{i\omega(v\Delta t)}]^n
$$
可以考察一下它具體講了一件什麼事情。二分之一是概率,左右均等,而第一項可以假設扣除$-i\omega$後為一次向右的距離,第二項則正相反。妙就妙在左右乘在一起的時候可以相互抵銷,留下來的扣除$-i\omega$後為淨位移x。那麼n次乘在一起,展開後每一項前面的係數正好是出現在該處的概率。

更巧的是,它正好是傅立葉變換。譬如說這一項$e^{-i\omega (mv\Delta t)}$
$$
P(mv\Delta t)e^{-i\omega (mv\Delta t)} = P(x_m)e^{-i\omega x_m} = p(x_m)e^{-i\omega x_m}dx
$$
其中$p(x)$是概率密度。而F是所有項的和
$$
F = \sum_m p(x_m)e^{-i\omega x_m}dx = \int p(x)e^{-i\omega x}dx
$$
可以看出求出$p(x)$,通過逆變換即可
$$
p(x) = \frac{1}{2\pi} \int Fe^{i\omega x}d\omega
$$
現在需要具體計算一下F
$$
F = \cos^n(\omega v\Delta t) \approx (1 - \frac{\omega^2v^2\Delta t^2}{2})^n = (1 - \frac{\omega^2v^2\Delta t}{2}\frac{t}{n})^n
$$
考慮這個極限
$$
\lim_{n \rightarrow \infty} (1+\frac{x}{n})^n = \lim_{n \rightarrow \infty} \exp[n\ln(1+\frac{x}{n})] = \exp[\lim_{n \rightarrow \infty}\frac{\ln(1+\frac{x}{n})}{\frac{1}{n}}] = \exp[\lim_{n \rightarrow \infty} \frac{-\frac{x}{n^2}\frac{1}{1+\frac{x}{n}}}{-\frac{1}{n^2}}] = e^x
$$
中間上下求導用到羅必達法則。因此$F = \exp[-\frac{\omega^2v^2t\Delta t}{2}] = \exp[-\alpha\omega^2]$,其中$\alpha \equiv \frac{v^2t\Delta t}{2} \propto t$正比於時間。

考慮高斯積分
$$
\int_{-\infty}^\infty \exp[-a(x+b)^2]dx = \sqrt{\pi/a}
$$
這樣p(x)可以解出
$$
p(x) = \frac{1}{2\pi} \int e^{-\alpha\omega^2+i\omega x}d\omega = \sqrt{\frac{1}{4\pi\alpha}}\exp(-\frac{x^2}{4\alpha})
$$
不難發現隨機遊走的均值為零,如果考察其方差
$$
\int x^2p(x)dx = \sqrt{\frac{1}{4\pi\alpha}}\int x^2\exp(-\frac{x^2}{4\alpha})dx
$$
考慮這種高斯積分$\int x^2\exp[-ax^2]dx$
$$
\int x^2\exp[-ax^2]dx = -\frac{\partial}{\partial a}\int \exp[-ax^2]dx = \frac{1}{2}\sqrt{\pi/a^3}
$$
即$\int x^2p(x)dx = 2\alpha = (v^2\Delta t)t \propto t$,方差正比於時間。注意到速度的平方項來自動能,根據能量均分原理,一維情況下動能即為$\frac{1}{2}mv^2 = \frac{1}{2}kT$,因此方差將正比於溫度T。這也是噪聲被常常稱為熱噪聲的原因。

現在考慮離散的情況,假設$W_t = \sum_i\xi_i(\tau)\Delta\tau$,而$\xi_i$是一個個均值為零,方差為$\sigma^2$的隨機變量。這些變量服從高斯分佈,而且相互獨立。由簡單統計結論,這種情況下總的方差就是這些變量方差的和$\frac{t}{\Delta\tau}\sigma^2\Delta\tau^2 = (\sigma^2\Delta\tau)t$,這與上面的結果如出一轍,而標準Wiener Process正是讓前面的係數為一。

特別地,記$\xi(t)dt = dW_t = d[\int_0^t\xi(\tau)d\tau]$。由於
$$
d(W_tW_{t’}) = (W_t+dW_t)(W_{t’}+dW_{t’}) - W_tW_{t’} = W_tdW_{t’} + W_{t’}dW_t + dW_tdW_{t’}
$$
正常情況下人們會略去最後一個二階小量,但這正是隨機過程不同的地方。反而一階小量中增量與另一過程獨立,因此對系綜平均為零
$$
d(\langle W_tW_{t’}\rangle) = \langle dW_tdW_{t’}\rangle
$$
這個結果很重要,它實質上在說
$$
\langle dW_tdW_{t’}\rangle = d(\langle W_tW_{t’}\rangle) = \langle d[\int_0^t\xi(\tau)d\tau\int_0^{t’}\xi(\tau’)d\tau’]\rangle = d[\int_0^td\tau\int_0^{t’}d\tau’\langle\xi(\tau’)\xi(\tau)\rangle]
$$
而噪聲Delta關聯$\langle\xi(\tau’)\xi(\tau)\rangle = \delta(\tau’-\tau)$,假設$t \leq t’$,則
$$
\langle dW_tdW_{t’}\rangle = d[\int_0^td\tau] = dt
$$
這就是增量方差正比於時間間隔。以此為基礎,我提供兩種推導Fokker-Planck Equation的方法。

Fokker-Planck Equation

這是研究隨機問題最重要的公式,它類似經典力學中的牛頓定律,是分析其他運動屬性的基礎。一般教科書上會從伊藤積分出發,但作為一個科普性的文章,我不想在任何方向都深入太多。事實上,基於上面內容,便可以提供兩種推導FPE的辦法。

第一種便是傅立葉變換,我只需要將母函數改寫一下
$$
F = [\frac{1 + q}{2}e^{-i\omega(v\Delta t)} + \frac{1 - q}{2}e^{i\omega(v\Delta t)}]^n
$$
其中$-1 \leq q \leq 1$,表示一個非對稱的參數。和前面一樣,指數項前面的係數分別表示一次運動向右和向左的概率。由前文的鋪墊已經知道F實質上是概率的傅立葉變換$\tilde p = F$,那麼現在需要具體算一下F
$$
F = [\cos(\omega v\Delta t)] - iq\sin(\omega v\Delta t)]^n \approx [1 - \frac{\omega^2v^2\Delta t^2}{2} - iq\omega v\Delta t]^n
$$
類似考慮$\Delta t = t/n$有
$$
\tilde p \equiv F \approx [1 - (\frac{\omega^2v^2\Delta t}{2} + iq\omega v)\frac{t}{n}]^n = \exp[-(\frac{\omega^2v^2\Delta t}{2} + iq\omega v)t]
$$
對時間求偏導數
$$
\frac{\partial}{\partial t}\tilde p = -i\omega(qv)\tilde p - \frac{\omega^2}{2}(v^2\Delta t)\tilde p
$$
由前面對傅立葉變換的求解微分方程的介紹可以知道,對x求一次偏導數將貢獻一個$i\omega$因子,換言之,上述方程實質上是這個方程經由傅立葉變換而來
$$
\frac{\partial}{\partial t}p = -(qv)\frac{\partial}{\partial x}p + \frac{(v^2\Delta t)}{2}\frac{\partial^2}{\partial x^2}p
$$
括號中的參數可以被替換,這是來自微觀層面的解釋。

第二種方法來自二階泰勒展開。如果直接考慮$dx = \mu dt + \sigma dW_t$,可以設想N個完全相同的粒子按照完全相同的條件彌散在座標軸上。當N很大時,概率將趨近於頻率,於是在某處聚集的粒子數密度將正比於概率,這樣只需要考察各處粒子數目變化即可。

考慮x處t時刻粒子數目變化
$$
[p(x,t+\Delta t)-p(x,t)]N\Delta x
$$
而造成這一變化的原因是由於本地粒子的離開以及外地粒子的遷入
$$
[p(x-\mu\Delta t-\sigma dW_t,t)-p(x,t)]N\Delta x
$$
這兩者應該相等
$$
p(x,t+\Delta t) - p(x,t) = p(x-\mu\Delta t-\sigma dW_t,t) - p(x,t)
$$
等式左邊LHS可以近似為
$$
\text{LHS} = \Delta t\frac{\partial}{\partial t}p
$$
而等式右邊RHS需要注意:

  • 這是隨機過程,但由於大量粒子的存在,結果應為對系綜平均後的結果
  • 只能保留到$\Delta t$的一階項,但如前所述,$\langle dW_t^2\rangle = dt$,需要將結果展開到二階,同時略去$\Delta t$的高階項

$$
\text{RHS} = -\langle(\mu\Delta t+\sigma\Delta W_t)\rangle\frac{\partial}{\partial x}p + \frac{1}{2}\langle(\mu\Delta t+\sigma\Delta W_t)^2\rangle\frac{\partial^2}{\partial x^2}p
$$

化簡即可得
$$
\text{RHS} = -\mu\Delta t\frac{\partial}{\partial x}p + \frac{\sigma^2}{2}\Delta t\frac{\partial^2}{\partial x^2}p
$$
等式左右兩邊相等,即可得到FPE
$$
\frac{\partial}{\partial t}p = -\mu\frac{\partial}{\partial x}p + \frac{\sigma^2}{2}\frac{\partial^2}{\partial x^2}p
$$
這是宏觀的結果,如果和前面的微觀結果比較,便可以清楚各參數的意義。

First Passage Time Problem

萬幸,終於可以回到開始的問題。

開始的問題是求解這個隨機過程
$$
dx = \mu dt + \sigma\xi(t)dt
$$
以及初始條件$p(x,t’) = \delta(x-x’)$。為了不失一般性,先假設初始時刻為$t’$以及初始位置為$x’$而不帶入具體數值。根據前面的結果,寫出FPE
$$
\frac{\partial}{\partial t}p(x,t|x,t’) = -\mu\frac{\partial}{\partial x}p(x,t|x,t’) + \frac{\sigma^2}{2}\frac{\partial^2}{\partial x^2}p(x,t|x,t’)
$$
考慮這一型偏微分方程
$$
p_t = ap_{xx} + bp_x
$$
下標表示求偏導數。做傅立葉變換得到
$$
\tilde p_t = -a\omega^2\tilde p + ib\omega\tilde p
$$
以及初始條件的傅立葉變換
$$
\int \delta(x-x’)e^{-i\omega x}dx = e^{-i\omega x’}
$$
這樣可以解出$\tilde p$
$$
\tilde p(\omega,t|x’,t’) = \exp[(-a\omega^2+ib\omega)(t-t’)-i\omega x’]
$$
現在只需要將其逆變換回去,利用前面用到的高斯積分
$$
p(x,t|x’,t’) = \frac{1}{2\pi}\int \tilde pe^{i\omega x}d\omega = \sqrt{\frac{1}{4\pi a(t-t’)}}\exp{-\frac{[(x-x’)+b(t-t’)]^2}{4a(t-t’)}}
$$
將a和b替換掉即可
$$
p(x,t|x’,t’) = \frac{1}{2\pi}\int \tilde pe^{i\omega x}d\omega = \sqrt{\frac{1}{2\pi \sigma^2(t-t’)}}\exp{-\frac{[(x-x’)-\mu(t-t’)]^2}{2\sigma^2(t-t’)}}
$$
有初始條件t’=0以及x’=L,現在問題是什麼時刻T會擊中x=0?假設T時刻仍然留在$(0,\infty)$這個區間的概率是G(x’,T)
$$
G(x’,T) = \int_0^\infty p(x,T|x’,0)dx
$$
而逃逸的概率分佈$\rho(x’,T)$為
$$
\rho(x’,T) = \frac{\partial}{\partial T}[1-G(x’,T)] = -\frac{\partial}{\partial T}\int_0^\infty \sqrt{\frac{1}{2\pi \sigma^2T}}\exp{-\frac{[(x-x’)-\mu T]^2}{2\sigma^2T}}dx
$$
如果用誤差函數表示,則比較簡單
$$
\rho(x’,T) = -\frac{1}{2}\frac{\partial}{\partial T}\text{erf}(\frac{x’+\mu T}{\sqrt{2\sigma^2T}}) = \frac{x’ - \mu T}{2\sigma T\sqrt{2\pi T}}\exp[-\frac{(x’+\mu T)^2}{2\sigma^2T}]
$$
如果想知道Mean First Passage Time平均時間,直接積分就可以
$$
\bar T = \int_0^\infty T\rho(x’,T)dT = \int_0^\infty -\frac{T}{2}d[\text{erf}(\frac{x’+\mu T}{\sqrt{2\sigma^2T}})]
$$
這樣可以用數值方法估計積分的近似值。將x’替換為L,即為相遇問題的答案,不難發現平均時間並不是直覺理解的$-L/\mu$。雖然不能直接獲得解析形式的結果,但不妨礙對其漸近行為做出一些推測。

考慮$\sigma \rightarrow 0$很小的情況。這樣微分符號裡面的誤差函數將無限趨近於符號函數$-\text{sgn}(T+L/\mu)$,因此
$$
\lim_{\sigma \rightarrow 0}\bar T = \int \frac{T}{2}d[\text{sgn}(T+L/\mu)] = \int T\delta(T+L/\mu)dT = -L/\mu
$$
這正是不考慮噪聲的結果。

後記

我花了三天寫這篇文章,這是我試圖不依賴任何已知結論完全從零推導出隨機問題的結果。我只需要紙和筆,除此以外不需要任何東西。這也是因為我希望自己的推導過程與記憶中的方法完全不一樣,如果做不到這一點,那我就希望不完全一樣——否則寫這篇文章就沒什麼意義。

我不太清楚是否會有人有興趣讀到這裡,但我自己受益良多:我在這一過程學到最多的東西便是謙卑,特別是我發現我不懂的東西遠比我懂得東西來的多,而我懂得那點可憐的東西,多半都是一知半解的,連續問上兩句便答不上來了。雖然我習慣於玩弄嘴皮子欺負那些熱衷於表演的貧下中農,但我似乎又是人群中為數不多的那幾個願意承認自己其實不是個東西的聰明人:這當然是個優點。至於有人質疑這一篇能否算是科普文章,雖然我也確實聽說過諸如多放一個公式會流失一半讀者之類的鬼話,但我還是會說,是的,這還是科普文章,而且中間的計算並不複雜,你要相信真正複雜的東西我自己也不懂。倘若這個難度都不能駕馭,我簡直不知道黎曼幾何那些東西,又該從何說起。

這也是我很早就觀察到的:把科學作為業餘愛好、主動抑或是被迫在上面花費時間的,主要是民科和該專業的從業人員,而後者像是性冷感的女人一樣,早已被科學磨滅了熱情,甚至未老先禿,對任何事情都提不起興趣來。而民科呢,他們彷彿生活在中世紀,對科學有著熱情洋溢而又不著邊際的幻想,而對近幾百年的學科發展一無所知。但你能說後者比前者優秀,或是後者比前者純粹嗎?如果是布爾什維克要打擊那些萬惡的白專學者,宣揚勞動人民偉大光輝的結論,大可引用這一套說辭。但現實肯定不是這麼回事,真實情況是那些學者在進入這個領域的青少年時代,身上都帶有民科式的幻想。換言之這些人已然是民科中的翹楚:他們不僅忍受了繁冗的職業做題家訓練,習慣了來自理論抑或是實驗工作中同行的智力打擊,並在認清自己真實能力這一難堪的現實之後仍然坐在那裡。至於民科,我只能說他們因自身能力還沒有資格經歷這些事情,我確信他們只需要在課堂上坐一個禮拜,就會誠實地發現自己其實不是個東西,接下來你就會在澡堂或是花鳥市場看到他們,因為在那裡他們已經放棄了批判相對論而找到新的愛好。

實際上知道能做什麼不能做什麼,本身就是已極為珍貴的經驗:它避免了你將時間花費在毫無意義的事情上面。