尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:41 PM
Mon, May 20, 2024 2:02 PM
10
3
書
讀嘛讀嘛
《統計的假象》蓋瑞.史密斯
假陽性問題
「95%的大麻檢測準確率,意味在使用大麻的人之中,95%的人會檢測出陽性。那麼,問題來了:在檢測出陽性的人之中,大麻使用者的比例是多少?」
用了大麻會測出陽性,測出陽性不就是用了大麻嗎?準確率有95%這麼高,就算有人被測出假陽性,也應該很少人吧?
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:44 PM
假設一項針對一萬名員工的大麻檢測,其中有5%的人用了大麻(500人),另外95%的人沒用大麻(9500人)。
先看用了大麻的500人的檢測結果:475人陽性,25人陰性。
雖然有25人明明用了大麻,卻沒被抓出來,不過答對了475人,符合95%的準確率!
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:45 PM
再看看沒用大麻的9500人的檢測結果:475人陽性,9025人陰性。
雖然有475人根本沒用大麻,卻被測出是陽性,不過還是答對了9025人,符合95%的準確率!
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:46 PM
總共有950人拿到了陽性結果,但其中有
一半
的人是假陽性
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:47 PM
假陽性問題也存在於疾病檢測之中,以乳房X光檢查為例,假設在一次例行檢查中,醫生在一位女性的乳房上發現一個腫塊:
「如果腫塊是惡性的,那麼X光檢查將其判斷為惡性的機率是0.8」
「如果腫塊是良性的,那麼X光檢查將其判斷為良性的機率是0.9」
經過X光檢查後,這位女性的腫塊是惡性的。「根據這個X光檢查結果,你認為這個腫塊是惡性腫塊的機率是多少?」
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:49 PM
這個表是X光檢查了一千名患者的情況:
檢查10個惡性腫塊的結果是:8個陽性,2個陰性。
哎呀,搞錯了兩個,不過答對8個,符合0.8的準確率!
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:49 PM
接著檢查990個良性腫塊,結果是:99個陽性,891個陰性。
有99個人要虛驚一場了,不過答對891個,符合0.9的準確率!
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:50 PM
總共有107個人拿到了陽性結果,但其中只有8個人是真的惡性腫塊,機率是 8/107 = 0.075。
尼洛 📚
@MUS2001147
Mon, May 20, 2024 1:56 PM
覺得雖然理解是可以理解,但實在太反直覺了,還是很難理解
(供蝦毀
作者說這個題目被拿去問了100位醫生,95位醫生都回答惡性腫塊的機率是0.75左右,錯估了十倍!
醫生的答案跟我亂猜的答案差不多,太令人不安了
尼洛 📚
@MUS2001147
Mon, May 20, 2024 2:01 PM
「當檢測數量很多時,假陽性是不可避免的。」
「隨著檢測數量變多,假陽性的機率將接近百分之百。」
「一項檢測很有可能顯示陽性結果,但陽性檢測結果並不能認定疾病的存在。」
尼洛 📚
@MUS2001147
Thu, May 23, 2024 11:47 AM
在另一本書《數盲、詐騙與偽科學》看到的假陽性問題:
「市中心有人被搶了,他說搶匪是黑人男子。但,當調查此案的法庭,在差不多照明環境下,多次重現場景時,受害者約只有80%的時間,能正確分辨出攻擊者的族裔。如此一來,這名搶匪確實是黑人的機率多高?」
尼洛 📚
@MUS2001147
Thu, May 23, 2024 11:47 AM
「我們假設,母體中約90%是白人,僅10%是黑人,本案的市中心地區也符合前述的族裔組成。而且,每個族裔可能會去搶劫別人的機率都一樣,受害者把白人誤認成黑人,或把黑人誤認成白人的機率也一樣。」
尼洛 📚
@MUS2001147
Thu, May 23, 2024 11:48 AM
「在這些前提條件下發生的100件搶劫案中,平均來說,受害者會指認攻擊者是黑人的有26件。而真正是黑人所為的案子有10件,受害者可以正確辨識出來的機率是80%,那就有8個人;另外90件是白人所為,受害者誤認兇手是黑人的機率為20%。
因此,既然在這26件、受害者指稱是黑人所為的搶案裡,只有8件確實犯人是黑人,在受害者說他被黑人搶劫的前提之下,犯人真的是黑人的機率僅有8/26,換算下來將近31%!」
尼洛 📚
@MUS2001147
Thu, May 23, 2024 11:50 AM
整理成表格:
尼洛 📚
@MUS2001147
Thu, May 23, 2024 11:54 AM
真正犯人是黑人,也正確辨識為黑人的機率為 8/26 *100% = 31%
但是,明明是白人犯人,卻誤認為黑人(假陽性)的機率為18/26 *100% = 69%
假陽性的機率比正確率還高兩倍
載入新的回覆
《統計的假象》蓋瑞.史密斯
假陽性問題
「95%的大麻檢測準確率,意味在使用大麻的人之中,95%的人會檢測出陽性。那麼,問題來了:在檢測出陽性的人之中,大麻使用者的比例是多少?」
用了大麻會測出陽性,測出陽性不就是用了大麻嗎?準確率有95%這麼高,就算有人被測出假陽性,也應該很少人吧?
先看用了大麻的500人的檢測結果:475人陽性,25人陰性。
雖然有25人明明用了大麻,卻沒被抓出來,不過答對了475人,符合95%的準確率!
再看看沒用大麻的9500人的檢測結果:475人陽性,9025人陰性。
雖然有475人根本沒用大麻,卻被測出是陽性,不過還是答對了9025人,符合95%的準確率!
總共有950人拿到了陽性結果,但其中有一半的人是假陽性
「如果腫塊是惡性的,那麼X光檢查將其判斷為惡性的機率是0.8」
「如果腫塊是良性的,那麼X光檢查將其判斷為良性的機率是0.9」
經過X光檢查後,這位女性的腫塊是惡性的。「根據這個X光檢查結果,你認為這個腫塊是惡性腫塊的機率是多少?」
檢查10個惡性腫塊的結果是:8個陽性,2個陰性。
哎呀,搞錯了兩個,不過答對8個,符合0.8的準確率!
接著檢查990個良性腫塊,結果是:99個陽性,891個陰性。
有99個人要虛驚一場了,不過答對891個,符合0.9的準確率!
總共有107個人拿到了陽性結果,但其中只有8個人是真的惡性腫塊,機率是 8/107 = 0.075。
作者說這個題目被拿去問了100位醫生,95位醫生都回答惡性腫塊的機率是0.75左右,錯估了十倍!
醫生的答案跟我亂猜的答案差不多,太令人不安了「隨著檢測數量變多,假陽性的機率將接近百分之百。」
「一項檢測很有可能顯示陽性結果,但陽性檢測結果並不能認定疾病的存在。」
「市中心有人被搶了,他說搶匪是黑人男子。但,當調查此案的法庭,在差不多照明環境下,多次重現場景時,受害者約只有80%的時間,能正確分辨出攻擊者的族裔。如此一來,這名搶匪確實是黑人的機率多高?」
因此,既然在這26件、受害者指稱是黑人所為的搶案裡,只有8件確實犯人是黑人,在受害者說他被黑人搶劫的前提之下,犯人真的是黑人的機率僅有8/26,換算下來將近31%!」
但是,明明是白人犯人,卻誤認為黑人(假陽性)的機率為18/26 *100% = 69%
假陽性的機率比正確率還高兩倍