延森不等式
延森不等式(Jensen's inequality)以丹麥數學家約翰·延森(Johan Jensen)命名。它給出積分的凸函數值和凸函數的積分值間的關係。延森不等式有以下推论:过一个凸函数上任意两点所作割线一定在这两点间的函数图象的上方,即:
- tf(x1)+(1−t)f(x2)≥f(tx1+(1−t)x2),0≤t≤1.{displaystyle tf(x_{1})+(1-t)f(x_{2})geq fleft(tx_{1}+(1-t)x_{2}right),0leq tleq 1.}
目录
1 一般形式
1.1 測度論的版本
1.2 概率論的版本
2 特例
2.1 機率密度函數的形式
2.2 有限形式
2.3 統計物理學
3 大學圖徽
4 參考書目
5 注釋
6 外部連結
一般形式
延森不等式可以用測度論或概率論的語言給出。這兩種方式都表明同一個很一般的結果。
測度論的版本
假設μ{displaystyle mu }是集合Ω{displaystyle Omega }的正測度,使得μ(Ω)=1{displaystyle mu (Omega )=1}。若g{displaystyle g}是勒貝格可積的實值函數,而φ{displaystyle varphi }是在g{displaystyle g}的值域上定義的凸函數,則
φ(∫Ωgdμ)≤∫Ωφ∘gdμ{displaystyle varphi left(int _{Omega }g,dmu right)leq int _{Omega }varphi circ g,dmu }。
概率論的版本
以概率論的名詞,μ{displaystyle mu }是個概率測度。函數g{displaystyle g}換作實值隨機變數X{displaystyle X}(就純數學而言,兩者沒有分別)。在Ω{displaystyle Omega }空間上,任何函數相對於概率測度μ{displaystyle mu }的積分就成了期望值。這不等式就說,若φ{displaystyle varphi }是任一凸函數,則
φ(E(X))≤E(φ(X)){displaystyle varphi left(E(X)right)leq E(varphi (X)),}。
jesen 不等式 等号 成立 的 条件是什么?
特例
機率密度函數的形式
假設Ω{displaystyle Omega }是實數軸上的可測子集,而f(x){displaystyle f(x)}是非負函數,使得
∫−∞∞f(x)dx=1{displaystyle int _{-infty }^{infty }f(x),dx=1}。
以概率論的語言,f{displaystyle f}是個機率密度函數。
延森不等式变成以下關於凸積分的命題:
若g{displaystyle g}是任一實值可測函數,ϕ{displaystyle phi }在g{displaystyle g}的值域中是凸函數,則
φ(∫−∞∞g(x)f(x)dx)≤∫−∞∞φ(g(x))f(x)dx{displaystyle varphi left(int _{-infty }^{infty }g(x)f(x),dxright)leq int _{-infty }^{infty }varphi (g(x))f(x),dx}。
若g(x)=x{displaystyle g(x)=x},則這形式的不等式簡化成一個常用特例:
φ(∫−∞∞xf(x)dx)≤∫−∞∞φ(x)f(x)dx{displaystyle varphi left(int _{-infty }^{infty }x,f(x),dxright)leq int _{-infty }^{infty }varphi (x),f(x),dx}。
有限形式
若Ω{displaystyle Omega }是有限集合{x1,x2,…,xn}{displaystyle {x_{1},x_{2},ldots ,x_{n}}},而μ{displaystyle mu }是Ω{displaystyle Omega }上的正規計數測度,則不等式的一般形式可以簡單地用和式表示:
φ(∑i=1ng(xi)λi)≤∑i=1nφ(g(xi))λi{displaystyle varphi left(sum _{i=1}^{n}g(x_{i})lambda _{i}right)leq sum _{i=1}^{n}varphi (g(x_{i}))lambda _{i}},
其中λ1+λ2+⋯+λn=1,λi≥0{displaystyle lambda _{1}+lambda _{2}+cdots +lambda _{n}=1,lambda _{i}geq 0}。
若ϕ{displaystyle phi }是凹函數,只需把不等式符號調轉。
假設x1,x2,…,xn{displaystyle x_{1},x_{2},ldots ,x_{n}}是正實數,g(x)=x{displaystyle g(x)=x},λi=1/n{displaystyle lambda _{i}=1/n}及φ(x)=log(x){displaystyle varphi (x)=log(x)}。上述和式便成了
log(∑i=1nxin)≥∑i=1nlog(xi)n{displaystyle log left(sum _{i=1}^{n}{frac {x_{i}}{n}}right)geq sum _{i=1}^{n}{frac {log(x_{i})}{n}}},
兩邊取自然指數就得出熟悉的平均數不等式:
x1+x2+⋯+xnn≥x1x2⋯xnn{displaystyle {frac {x_{1}+x_{2}+cdots +x_{n}}{n}}geq {sqrt[{n}]{x_{1}x_{2}cdots x_{n}}}}。
這不等式也有無限項的離散形式。
統計物理學
統計物理學中,若凸函數是指數函數,延森不等式特別重要:
e⟨X⟩≤⟨eX⟩{displaystyle e^{langle Xrangle }leq leftlangle e^{X}rightrangle },
其中方括號表示期望值,是以隨機變數X的某個概率分佈算出。這個情形的證明很簡單(參見Chandler, Sec. 5.5):在以下等式的第三個指數函數
- ⟨eX⟩=e⟨X⟩⟨eX−⟨X⟩⟩{displaystyle leftlangle e^{X}rightrangle =e^{langle Xrangle }leftlangle e^{X-langle Xrangle }rightrangle }
套用不等式
eX≥1+X{displaystyle e^{X}geq 1+X,},
即得出所求的不等式。
大學圖徽
延森不等式是哥本哈根大學的數學系圖徽。
參考書目
Walter Rudin. Real and Complex Analysis. McGraw-Hill. 1987. ISBN 0-07-054234-1.
David Chandler. Introduction to Modern Statistical Mechanics. Oxford. 1987. ISBN 0-19-504277-8.
注釋
外部連結
- MathWorld上的延森不等式網頁