一、中位數(Median)

(一)定義:中位數是指將數據按大小順序排列形成一個數列,居於數列中間位置的數據稱之。以Me表示。

(二)求算

實數按大小順序(順序,降序皆可)排列為

實數數列的中位數  為

odd number 為奇數,even number 為偶數。

1. 若資料個數是偶數,取最中間的兩個數之平均。

2. 若資料個數是奇數,取最中間的數。

(三)特性:

1. 中位數是一種集中趨勢或位置量數。

2. 從中位數的定義可知,數據中有一半小於中位數,一半大於中位數。

3. 在一個等差數列或一個正態分佈數列中,中位數等於算術平均數。

4.  中位數敏感性低,不受分佈數列的極大或極小值影響。

5.  當其數據分佈具偏態時,中位數的代表性會受到影響。

6.所有數值與中位數差的絕對值總和最小。

 

一、常態分布英語:normal distribution)又名高斯分布英語:Gaussian distribution

(一)定義:是一個非常常見的連續機率分布。常態分布在統計學上十分重要,經常用在自然社會科學來代表一個不明的隨機變量。[1][2]

(二)若隨機變量服從一個位置參數為、尺度參數為的常態分布,記為:

[3]

則其機率密度函數

常態分布的期望值等於位置參數,決定了分布的位置;其變異數的開平方或標準等於尺度參數,決定了分布的幅度。

常態分布的機率密度函數曲線呈鐘形,因此人們又經常稱之為鐘形曲線(類似於寺廟裡的大鐘,因此得名)。

我們通常所說的標準常態分布是位置參數,尺度參數的常態分布(見右圖中紅色曲線)。

有幾種不同的方法用來說明一個隨機變量。

最直觀的方法是機率密度函數,這種方法能夠表示隨機變量每個取值有多大的可能性。

累積分布函數是一種機率上更加清楚的方法,請看下邊的例子。還有一些其他的等價方法,例如cumulant、特徵函數動差生成函數以及cumulant-生成函數

這些方法中有一些對於理論工作非常有用,但是不夠直觀。請參考關於機率分布的討論。

 
四個不同參數集的機率密度函數(紅色線代表標準常態分布)

常態分布機率密度函數均值為 變異數 (或標準差)是高斯函數的一個實例:

(請看指數函數以及.)

如果一個隨機變量服從這個分布,我們寫作  ~ . 如果並且,這個分布被稱為標準常態分布,這個分布能夠簡化為

右邊是給出了不同參數的常態分布的函數圖。

常態分布中一些值得注意的量:

  • 密度函數關於平均值對稱
  • 平均值與它的眾數(statistical mode)以及中位數(median)同一數值。
  • 函數曲線下68.268949%的面積在平均數左右的一個標準差範圍內。
  • 95.449974%的面積在平均數左右兩個標準差的範圍內。
  • 99.730020%的面積在平均數左右三個標準差的範圍內。
  • 99.993666%的面積在平均數左右四個標準差的範圍內。
  • 函數曲線的反曲點(inflection point)為離平均數一個標準差距離的位置。  ㄧ

特性:

常態分布的一些性質:

  1. 如果實數,那麼 (參見期望值變異數).
  2. 如果統計獨立的常態隨機變量,那麼:
    • 它們的和也滿足常態分布 (proof).
    • 它們的差也滿足常態分布.
    • 兩者是相互獨立的。(要求X與Y的變異數相等)
  3. 如果是獨立常態隨機變量,那麼:
    • 它們的積服從機率密度函數為的分布
      其中是修正貝塞爾函數(modified Bessel function)
    • 它們的比符合柯西分布,滿足.
  4. 如果為獨立標準常態隨機變量,那麼服從自由度為n卡方分布

 

 

機率論統計學中,指數分布英語:Exponential distribution)是一種連續機率分布。指數分布可以用來表示獨立隨機事件發生的時間間隔,比如旅客進入機場的時間間隔、打進客服中心電話的時間間隔、中文維基百科新條目出現的時間間隔等等。

 

一個指數分布的機率密度函數是:

其中λ > 0是分布的一個參數,常被稱為率參數(rate parameter)。即每單位時間發生該事件的次數。指數分布的區間是[0,∞)。 如果一個隨機變量X 呈指數分布,則可以寫作:X ~ Exponential(λ)。

 

累積分布函數可以寫成:

 

隨機變量X (X 的率參數是λ) 的期望值是:

比方說:如果你平均每個小時接到2次電話,那麼你預期等待每一次電話的時間是半個小時。

X 的方差是:

X 的偏離係數是: V[X] = 1

 

指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示如果一個隨機變量呈指數分布,它的條件機率遵循:

 

泊松過程是一種重要的隨機過程。泊松過程中,第k次隨機事件與第k+1次隨機事件出現的時間間隔服從指數分布。而根據泊松過程的定義,長度為t的時間段內沒有隨機事件出現的機率等於

,

長度為t的時間段內隨機事件發生一次的機率等於 , 所以第k次隨機事件之後長度為t的時間段內,第k+n次 (n=1, 2, 3,...)隨機事件出現的機率等於。這是指數分布。這還表明了泊松過程的無記憶性。

文章標籤
全站熱搜
創作者介紹
創作者 iancindy721 的頭像
iancindy721

傻傻的萌貓妹(´・ω・`)喵ㄅ~

iancindy721 發表在 痞客邦 留言(0) 人氣(728)