一、中位數(Median)
(一)定義:中位數是指將數據按大小順序排列形成一個數列,居於數列中間位置的數據稱之。以Me表示。
(二)求算
實數按大小順序(順序,降序皆可)排列為、
實數數列的中位數 為
odd number 為奇數,even number 為偶數。
1. 若資料個數是偶數,取最中間的兩個數之平均。
2. 若資料個數是奇數,取最中間的數。
(三)特性:
1. 中位數是一種集中趨勢或位置量數。
2. 從中位數的定義可知,數據中有一半小於中位數,一半大於中位數。
3. 在一個等差數列或一個正態分佈數列中,中位數等於算術平均數。
4. 中位數敏感性低,不受分佈數列的極大或極小值影響。
5. 當其數據分佈具偏態時,中位數的代表性會受到影響。
6.所有數值與中位數差的絕對值總和最小。
一、常態分布(英語:normal distribution)又名高斯分布(英語:Gaussian distribution)
(一)定義:是一個非常常見的連續機率分布。常態分布在統計學上十分重要,經常用在自然和社會科學來代表一個不明的隨機變量。[1][2]
(二)若隨機變量服從一個位置參數為、尺度參數為的常態分布,記為:
則其機率密度函數為
常態分布的期望值等於位置參數,決定了分布的位置;其變異數的開平方或標準差等於尺度參數,決定了分布的幅度。
常態分布的機率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線(類似於寺廟裡的大鐘,因此得名)。
我們通常所說的標準常態分布是位置參數,尺度參數的常態分布(見右圖中紅色曲線)。
有幾種不同的方法用來說明一個隨機變量。
最直觀的方法是機率密度函數,這種方法能夠表示隨機變量每個取值有多大的可能性。
累積分布函數是一種機率上更加清楚的方法,請看下邊的例子。還有一些其他的等價方法,例如cumulant、特徵函數、動差生成函數以及cumulant-生成函數。
這些方法中有一些對於理論工作非常有用,但是不夠直觀。請參考關於機率分布的討論。
常態分布的機率密度函數均值為 變異數為 (或標準差)是高斯函數的一個實例:
- 。
(請看指數函數以及.)
如果一個隨機變量服從這個分布,我們寫作 ~ . 如果並且,這個分布被稱為標準常態分布,這個分布能夠簡化為
- 。
右邊是給出了不同參數的常態分布的函數圖。
常態分布中一些值得注意的量:
- 密度函數關於平均值對稱
- 平均值與它的眾數(statistical mode)以及中位數(median)同一數值。
- 函數曲線下68.268949%的面積在平均數左右的一個標準差範圍內。
- 95.449974%的面積在平均數左右兩個標準差的範圍內。
- 99.730020%的面積在平均數左右三個標準差的範圍內。
- 99.993666%的面積在平均數左右四個標準差的範圍內。
- 函數曲線的反曲點(inflection point)為離平均數一個標準差距離的位置。 ㄧ
特性:
常態分布的一些性質:
- 如果且與是實數,那麼 (參見期望值和變異數).
- 如果與是統計獨立的常態隨機變量,那麼:
- 它們的和也滿足常態分布 (proof).
- 它們的差也滿足常態分布.
- 與兩者是相互獨立的。(要求X與Y的變異數相等)
- 如果和是獨立常態隨機變量,那麼:
- 它們的積服從機率密度函數為的分布
- 其中是修正貝塞爾函數(modified Bessel function)
- 它們的比符合柯西分布,滿足.
- 它們的積服從機率密度函數為的分布
- 如果為獨立標準常態隨機變量,那麼服從自由度為n的卡方分布。
在機率論和統計學中,指數分布(英語:Exponential distribution)是一種連續機率分布。指數分布可以用來表示獨立隨機事件發生的時間間隔,比如旅客進入機場的時間間隔、打進客服中心電話的時間間隔、中文維基百科新條目出現的時間間隔等等。
一個指數分布的機率密度函數是:
其中λ > 0是分布的一個參數,常被稱為率參數(rate parameter)。即每單位時間發生該事件的次數。指數分布的區間是[0,∞)。 如果一個隨機變量X 呈指數分布,則可以寫作:X ~ Exponential(λ)。
累積分布函數可以寫成:
-
-
比方說:如果你平均每個小時接到2次電話,那麼你預期等待每一次電話的時間是半個小時。
X 的方差是:
-
X 的偏離係數是: V[X] = 1
指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變量呈指數分布,它的條件機率遵循:
-
泊松過程是一種重要的隨機過程。泊松過程中,第k次隨機事件與第k+1次隨機事件出現的時間間隔服從指數分布。而根據泊松過程的定義,長度為t的時間段內沒有隨機事件出現的機率等於
- ,
-
長度為t的時間段內隨機事件發生一次的機率等於 , 所以第k次隨機事件之後長度為t的時間段內,第k+n次 (n=1, 2, 3,...)隨機事件出現的機率等於。這是指數分布。這還表明了泊松過程的無記憶性。
