統計名詞解釋

一、中位數(Median)

（一）定義：中位數是指將數據按大小順序排列形成一個數列，居於數列中間位置的數據稱之。以Me表示。

（二）求算

實數按大小順序（順序，降序皆可）排列為、

實數數列的中位數為

odd number 為奇數，even number 為偶數。

1. 若資料個數是偶數，取最中間的兩個數之平均。

2. 若資料個數是奇數，取最中間的數。

（三）特性：

1. 中位數是一種集中趨勢或位置量數。

2. 從中位數的定義可知，數據中有一半小於中位數，一半大於中位數。

3. 在一個等差數列或一個正態分佈數列中，中位數等於算術平均數。

4. 中位數敏感性低，不受分佈數列的極大或極小值影響。

5. 當其數據分佈具偏態時，中位數的代表性會受到影響。

6.所有數值與中位數差的絕對值總和最小。

一、常態分布（英語：normal distribution）又名高斯分布（英語：Gaussian distribution）

（一）定義：是一個非常常見的連續機率分布。常態分布在統計學上十分重要，經常用在自然和社會科學來代表一個不明的隨機變量。^[1]^[2]

（二）若隨機變量服從一個位置參數為、尺度參數為的常態分布，記為：

^[3]

則其機率密度函數為

常態分布的期望值等於位置參數，決定了分布的位置；其變異數的開平方或標準差等於尺度參數，決定了分布的幅度。

常態分布的機率密度函數曲線呈鐘形，因此人們又經常稱之為鐘形曲線（類似於寺廟裡的大鐘，因此得名）。

我們通常所說的標準常態分布是位置參數，尺度參數的常態分布（見右圖中紅色曲線）。

有幾種不同的方法用來說明一個隨機變量。

最直觀的方法是機率密度函數，這種方法能夠表示隨機變量每個取值有多大的可能性。

累積分布函數是一種機率上更加清楚的方法，請看下邊的例子。還有一些其他的等價方法，例如cumulant、特徵函數、動差生成函數以及cumulant-生成函數。

這些方法中有一些對於理論工作非常有用，但是不夠直觀。請參考關於機率分布的討論。

四個不同參數集的機率密度函數（紅色線代表標準常態分布）

常態分布的機率密度函數均值為變異數為 (或標準差)是高斯函數的一個實例：

。

(請看指數函數以及.)

如果一個隨機變量服從這個分布，我們寫作 ~ . 如果並且，這個分布被稱為標準常態分布，這個分布能夠簡化為

。

右邊是給出了不同參數的常態分布的函數圖。

常態分布中一些值得注意的量：

密度函數關於平均值對稱
平均值與它的眾數（statistical mode）以及中位數（median）同一數值。
函數曲線下68.268949%的面積在平均數左右的一個標準差範圍內。
95.449974%的面積在平均數左右兩個標準差的範圍內。
99.730020%的面積在平均數左右三個標準差的範圍內。
99.993666%的面積在平均數左右四個標準差的範圍內。
函數曲線的反曲點（inflection point）為離平均數一個標準差距離的位置。ㄧ

特性：

常態分布的一些性質：

如果且與是實數，那麼 (參見期望值和變異數).
如果與是統計獨立的常態隨機變量，那麼：
- 它們的和也滿足常態分布 (proof).
- 它們的差也滿足常態分布.
- 與兩者是相互獨立的。（要求X與Y的變異數相等）
如果和是獨立常態隨機變量，那麼：
- 它們的積服從機率密度函數為的分布
  
  其中是修正貝塞爾函數（modified Bessel function）
- 它們的比符合柯西分布，滿足.
如果為獨立標準常態隨機變量，那麼服從自由度為n的卡方分布。

在機率論和統計學中，指數分布（英語：Exponential distribution）是一種連續機率分布。指數分布可以用來表示獨立隨機事件發生的時間間隔，比如旅客進入機場的時間間隔、打進客服中心電話的時間間隔、中文維基百科新條目出現的時間間隔等等。

一個指數分布的機率密度函數是：

其中λ > 0是分布的一個參數，常被稱為率參數（rate parameter）。即每單位時間發生該事件的次數。指數分布的區間是[0,∞)。如果一個隨機變量X 呈指數分布，則可以寫作：X ~ Exponential（λ）。

累積分布函數可以寫成：

隨機變量X (X 的率參數是λ) 的期望值是：

比方說：如果你平均每個小時接到2次電話，那麼你預期等待每一次電話的時間是半個小時。

X 的方差是：

X 的偏離係數是： V[X] = 1

指數函數的一個重要特徵是無記憶性（Memoryless Property，又稱遺失記憶性）。這表示如果一個隨機變量呈指數分布，它的條件機率遵循：

泊松過程是一種重要的隨機過程。泊松過程中，第k次隨機事件與第k+1次隨機事件出現的時間間隔服從指數分布。而根據泊松過程的定義，長度為t的時間段內沒有隨機事件出現的機率等於

長度為t的時間段內隨機事件發生一次的機率等於 , 所以第k次隨機事件之後長度為t的時間段內，第k+n次 (n=1, 2, 3,...)隨機事件出現的機率等於。這是指數分布。這還表明了泊松過程的無記憶性。

iancindy721

傻傻的萌貓妹(´・ω・`)喵ㄅ~

iancindy721 發表在痞客邦留言(0) 人氣(728)

傻傻的萌貓妹(´・ω・`)喵ㄅ~

記錄生活點滴～

統計名詞解釋

個人資訊

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

誰來我家

參觀人氣