標準偏差的物理意義?

General 更新 2024-11-18

標準差的物理意義是什麼？為什麼標準差可以描述器件的好壞

協方差的物理意義

統計學的基本概念

學過概率統計都知道，統計裡最基本的概念就是樣本的均值，方差，或者再加個標準差。首先我們給你一個含有n個樣本的集合，依次給出這些概念的公式描述，

均值：

標準差：

方差：

很顯然，均值描述的是樣本集合的中間點，它告訴我們的信息是很有限的，而標準差給我們描述的則是樣本集合的各個樣本點到均值的距離之平均。以這兩個集合為例，[0，8，12，20]和[8，9，11，12]，兩個集合的均值都是10，但顯然兩個集合差別是很大的，計算兩者的標準差，前者是8.3，後者是1.8，顯然後者較為集中，故其標準差小一些，標準差描述的就是這種“散佈度”。之所以除以n-1而不是除以n，是因為這樣能使我們以較小的樣本集更好的逼近總體的標準差，即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。

為什麼需要協方差？

上面幾個統計量看似已經描述的差不多了，但我們應該注意到，標準差和方差一般是用來描述一維數據的，但現實生活我們常常遇到含有多維數據的數據集，最簡單的大家上學時免不了要統計多個學科的考試成績。面對這樣的數據集，我們當然可以按照每一維獨立的計算其方差，但是通常我們還想了解更多，比如，一個男孩子的猥瑣程度跟他受女孩子歡迎程度是否存在一些聯繫啊，嘿嘿~協方差就是這樣一種用來度量兩個隨機變量關係的統計量，我們可以仿照方差的定義：

來度量各個維度偏離其均值的程度，標準差可以這麼來定義：

協方差的結果有什麼意義呢？如果結果為正值，則說明兩者是正相關的(從協方差可以引出“相關係數”的定義)，也就是說一個人越猥瑣就越受女孩子歡迎，嘿嘿，那必須的~結果為負值就說明負相關的，越猥瑣女孩子越討厭，可能嗎？如果為0，也是就是統計上說的“相互獨立”。

從協方差的定義上我們也可以看出一些顯而易見的性質，如：

協方差多了就是協方差矩陣

上一節提到的猥瑣和受歡迎的問題是典型二維問題，而協方差也只能處理二維問題，那維數多了自然就需要計算多個協方差，比如n維的數據集就需要計算個協方差，那自然而然的我們會想到使用矩陣來組織這些數據。給出協方差矩陣的定義：

這個定義還是很容易理解的，我們可以舉一個簡單的三維的例子，假設數據集有三個維度，則協方差矩陣為

可見，協方差矩陣是一個對稱的矩陣，而且對角線是各個維度上的方差。

Matlab協方差實戰

上面涉及的內容都比較容易，協方差矩陣似乎也很簡單，但實戰起來就很容易讓人迷茫了。必須要明確一點，協方差矩陣計算的是不同維度之間的協方差，而不是不同樣本之間的。這個我將結合下面的例子說明，以下的演示將使用Matlab，為了說明計算原理，不直接調用Matlab的cov函數(藍色部分為Matlab代碼)。

首先，隨機產生一個10*3維的整數矩陣作為樣本集，10為樣本的個數，3為樣本的維數。

MySample = fix(rand(10,3)*50)

根據公式，計算協方差需要計算均值，那是按行計算均值還是按列呢，我一開始就老是困擾這個問題。前面我們也特別強調了，協方差矩陣是計算不同維度間的協方差，要時刻牢記這一點。樣本矩陣的每行是一個樣本，每列為一個維度，所以我們要按列計算均值。為了描述方便，我們先將三個維度的數據分別賦值：

dim1 = MySample(:,1);

dim2 = MySample(:,2);

dim3 = MySample(:,3);

計算dim1與dim2，dim1與dim3，dim2與dim3的協方差：

sum( (dim1-mean(dim1)) .* (dim2-mean(dim2)) ) / ......

標準正態分佈的標準差為1有什麼物理意義

這是定義.均值為0,標準差為1的正態分佈稱為標準正態分佈.

標準差算出來有什麼作用嗎

標準差是反應多組數據之間穩定值差異的，與樣本多少沒有關係，有多少樣本就反應多少樣本之間的數值的穩定性。

所以，只是反應穩定性而已。

下一個數字不是 9.3加減3.26的範疇

而是說

標準差越大數組偏差越不穩定，例如你的物理實驗結果的標準差太大，超出實驗結果允許的誤差範圍，那麼說明你的實驗失敗了。

理論上，合適合理的樣本數是減小標準差的方法，但是標準差的大小沒有物理意義，因為他是用來評價一組數據的穩定性的輔助數據。

不是樣本越多標準差越小的，而是越能反映穩定性的真實效果，但是樣本太少，會導致標準差失真。

在標準差的應用上還有雙重標準差。就是計算標準差的標準差。雙重標準差無限趨近於0的時候，就是你的最真實標準差。

五個一般不夠的，最簡單的實驗也基本在10個左右。

應用上主要用在風險資產評估：金融風險評估，各種實驗等

最後舉個最簡單例子：A、B兩組各有6位學生參加同一次語文測驗，A組的分數為95、85、75、65、55、45，B組的分數為73、72、71、69、68、67。這兩組的平均數都是70，但A組的標準差為17.078分，B組的標準差為2.16分，說明A組學生之間的差距要比B組學生之間的差距大得多。

標準差和算術平均值的標準差兩者的物理意義及實際用途有何不同

平均數有算術平均數和幾何平均數之分.算術平均數又有簡單算術平均數和加權算術平均數.在實際應用中,若不作特別說明,平均數指的是簡單算術平均數.本節介紹簡單算術平均數和加權算術平均數. 一、簡單算術平均數　　在統計學中,算術平均數是一個最基本的特徵量數,它對學習統計學中其他內容具有重要的基礎作用.同時,簡單算術平均數本身也有豐富的學術內涵和廣泛的應用範圍.

一批數據的簡單算術平均數,指的是簡單地把這批數據總和除以數據總次數所得的商數.

若用帶有下標的大寫英文字母表示一批觀測數據,n表示數據的總個數（總次數）,再用符號表示這批數據的簡單算術平均數（讀X 槓或X 罷）,則簡單算術平均數的一般計算公式為：　　　　　式中：“”是連加求和符號,讀作Sigma(西格瑪).下方和上方的字母符號,分別表示計算數據連加和時的數據起點與終點,即數據連加界限.在明確了進行連加的所有數據後,上下方符號可以省略.下方符號 =1,表示從第一個數據X1 開始連加；隨著下標逐步增加,數據不斷連加進去,即上方的符號n ,表示數據一直連加到下標為n的那個數據為止,即.下面舉幾個例子加以說明：

例1.設有一組觀測數據為70,64,78,69,72；求這組數據的平均數.

據公式（2-1）,不難知道這組數據的平均數為：　　　　例2.試根據表1-1中有關52名學生拼寫測驗分數觀測值, 求他們的測驗平均分數.

從表1-1中所列具體分數,按公式（2-1）,同樣可計算出這批學生的拼寫測驗平均分數（在實際計算時,由於數據較多,故可利用計算器進行計算）,其結果（保留1位小數）為：　　　　[例3]　已知8個數據分別是：請確定下列各值.　　（1）的值.　　（2）的值.　　首先,求平均數的值,可知：　　　　　　= 　　其次,注意到題目待求式中連加和符號的上下方所指定的界限,可知：　　　　　　　= 　　簡單算術平均數具有反應靈敏、確定嚴密、簡明易懂、概括直觀、計算簡便,並能作進一步的代數運算等優點,是應用最普遍的一種特徵量數.因此,在大多數情形下,人們喜歡使用平均數這一指標來代表一批數據或用它來反映大量事物的整體水平.例如,用平均分反映一個班組學生的某項能力測驗結果；用平均分來描述與代表某一年齡段兒童在特定標準化測驗上的通常表現；用平均受教育年限來反映某國家或某地區特定年齡段所有人的教育程度；用平均分來集中概括一些競賽場合下各位評委對參賽選手進行評分的總結果等等.

但是,簡單算術平均數需要每一個數據都加入運算,因此,在數據有個別缺失的情況下,則無法準確計算.特別是,簡單算術平均數易受極端數據的影響,一旦在數據分佈中出現個別極端數據,就會對平均數產生較大影響,從而使人對平均數產生懷疑.這也就是為什麼在許多競賽場合下,對評委亮分後的成績分數,要去掉一個最高分和一個最低分,而後再計算平均數.此外,在一些特別情況下,由於各個數據的重要性不同,因此,直接把數據簡單相加以確定平均數的方法,不能充分考慮到各個數據的重要性程度.為此,需要加權計算.二、加權算術平均數1.加權和概念與計算　　具體考慮到各個數據的重要性（即權重）後再相加求和,就是加權和.

[例3]　學生的成績記錄由三部分組成,即平時練習成績、期中檢測成績、期末考試成績. 假定學校規定這三部分成績一律按百分制考評,同時三部分成績的權重分別是0.20,0.30和0.50,那麼,對學生成績綜合考評公式是再假定某學生平時作業練習成績,期中檢測,成績分,期末考試成績分；則該學生的終評成績為：　　（分）　　進一步地推廣,若用分......