尼洛 📚
未讀完

《不流淚的統計學:寫給所有人的零基礎統計學入門》德瑞克.朗奇(Derek Rowntree)

「常態分布中大約有2/3(68%)的觀察值位於平均數兩邊1個標準差之內。我們稱呼這個範圍為『平均數正負1SD』,簡寫為M ± 1SD。」
https://images.plurk.com/4bLpTuVAWrcG0uADGj9Ht3.jpg
尼洛 📚
例:「一台警用測速器監測通過某個地點的1000輛車,車速大致上呈現常態分布。假設平均數是時速45公里,標準差是時速5公里。如果法定速限是時速40公里,你認為大約有幾輛車已經違規?」
https://images.plurk.com/7dpy5EgslBLDCpLpAE8IZa.jpg
https://images.plurk.com/6OxF2zzt2pFRiXSGRSCAs9.jpg
50% + 34% = 84%
1000 x 84% = 840,也就是840輛車超速了。

尼洛 📚
例:「假設我們知道比爾在經濟學考試中得了90分,琳達在法律考中得到80分,此外我們也知道,大多數狀況下,每個科目的全班分數大致上呈現常態分布,請問,這兩位學生和同班同學相比之下,哪位的分數比較好?」

「經濟學考試的標準差是15分,而法律考試是5分,你是否能依據這項資訊(以及自己對於常態曲線比例的了解)來判定:經濟學考試中,有多少比例的學生分數超過比爾的90分?而在法律考試中又有多少比例的學生超過琳達的80分?」
尼洛 📚
「在經濟學考試中,平均分數是60分,標準差是15分,所以比爾的90分是高於平均分數2個標準差(2 x 15分),分數高於比爾的同班同學只有2.5%。而在法律考試中,平均分數是65分,標準差是5分,琳達的80分高於平均分數3個標準差(3 x 5分),所以分數高於琳達的同班同學只有0.15%。」

「因此顯而易見地,我們可以從下圖得知,和同班同學相比,琳達的分數比較好。」
https://images.plurk.com/17T5fSetGIKQeemYxWWgLu.jpg
尼洛 📚
「因此,我們馬上可以知道,經濟學考試中的30分相當於法律考試中的55分,因為兩者都是低於平均數2個標準差。」

依據相同的原理,「經濟學考試的60分等於平均數,但在法律考試中,60分低於平均數1個標準差,所以經濟學考試的60分比較好。」

尼洛 📚
【樣本平均數分布】

「假設我們由相同的母體隨機取出大量樣本,這些樣本每一組都有自己的樣本平均數(S-平均數)。」

「S-平均數的分布本身也有個平均數,也就是S-平均數的平均數。如果我們取出大量樣本,它們的S-平均數分布曲線的中央將位於母體平均數附近。也就是說,S-平均數的平均數將等於P-平均數(母體平均數)。」
尼洛 📚
「在母體中,值比母體平均數大越多或小越多,數量就會越來越少。所以從這個母體取得樣本時,取得與P-平均數大小相仿的觀察值得機率也大於取得大小差很多的觀察值。」

「因此,S-平均數和P-平均數相仿的樣本也會比S-平均數和P-平均數差很多的樣本更常出現。」
https://images.plurk.com/4pN8jMZCve8wJ8Yta19k2.jpg
「這應該是常態分布最漂亮和最有用的特徵:無論母體(因此也包含樣本)是否為常態分布,我們由樣本算出的平均數都會大致呈常態分布。」

尼洛 📚
「樣本平均數分布的標準差會小於母體的標準差。也就是說,多組樣本平均數之間的差異沒有母體中原始值之間的差異那麼大。所以一般來說,樣本平均數分布的離散程度沒有個別樣本那麼大。」
https://images.plurk.com/1sRgIRoKZXKMCdHuH3dL3N.jpg
「(A)是母體的分布;(C)是單一樣本的分布,因為它的平均數比母體平均數稍微偏右,但全距大致相同;(B)則是大量樣本的平均數的分布,原因在於樣本平均數分布的平均數和母體平均數相同,但離散度明顯小於樣本或母體的離散度。」

尼洛 📚
「(例如樣本平均數)抽樣分布的標準差稱為標準誤差(Standard error,SE,這麼寫是為了區分它和樣本或母體的標準差)。標準誤差的概念可以協助我們估計某個樣本平均數相當大於或小於母體平均數的機率。」

「假設我們知道平均心率抽樣分布的平均數是每分鐘78次,標準誤差是每分鐘1.4次。請問有多少比例的樣本平均數大於每分鐘79.4次?」
https://images.plurk.com/2fukpOPJrHr6CylcOnDfOX.jpg
100 – (50 + 34)% = 16%

尼洛 📚
「現在我們只有一個樣本平均數,我們應該如何用它來推論母體平均數的大小?」

「以下是推論方法,請看次頁的圖,圖中說明樣本平均數的分布,並且標示出P-平均數兩邊距離1SE的位置(所有樣本平均數有68%位於這個範圍內)。思考一下位於P-平均數 ± 1SE範圍內的所有S-平均數(我已經標出兩個『樣品』M1和M2),對其中的每個S-平均數而言,S-平均數 ± 1SE的範圍包含母體平均數。」
尼洛 📚
「也就是說,母體平均數將位於任何一個樣本平均數某一邊1 SE的距離內。(我已經在圖中M1和M2的兩邊畫上虛線箭頭,長度同樣是1SE。你應該會注意到,在這兩種狀況下,都會有一條線通過分布的中點,也就是母體平均數。)」
https://images.plurk.com/3diCTM8PWtouJEJVvNv1iU.jpg
尼洛 📚
「因此,無論我們選擇任何樣本的平均數,S-平均數 ± 1SE的範圍都有68%的機率含括母體平均數,當然也有32%的機率不含括。」「這個範圍(或區間)稱為68%信賴區間(confindence interval)。」
尼洛 📚
「如果我們想擁有接近100%的信心(其實是99.7%),母體平均數會位於樣本平均數的加減幾個SE之間?」

「S-平均數 ± 3 SD的範圍應該可以大致包含所有樣本平均數(其實是99.7%),所以這是99.7%的信賴區間。」

「所以我們可以很有信心地提出概略的估計值,或是信心稍低地提出較精確的估計值。實際上,最常用的兩個信賴區間分別是95%和99%。」

end
尼洛 📚
筆記是5/20整理的,發現有些已經看不太懂是在講什麼了LOL

這本書應該算解釋得還可以,但還是覺得有點小難,雖然沒讀完,不過有讀的部分大概讀了兩次,大概比較適合對統計學有點概念的人吧
尼洛 📚
不過讀到後來忍不住覺得...... 恩... 統計學好乏味阿 後面兩個章節又不好理解,就放棄了
載入新的回覆