尼洛 📚
讀嘛讀嘛

《統計的假象》蓋瑞.史密斯

假陽性問題

「95%的大麻檢測準確率,意味在使用大麻的人之中,95%的人會檢測出陽性。那麼,問題來了:在檢測出陽性的人之中,大麻使用者的比例是多少?」

用了大麻會測出陽性,測出陽性不就是用了大麻嗎?準確率有95%這麼高,就算有人被測出假陽性,也應該很少人吧?
尼洛 📚
假設一項針對一萬名員工的大麻檢測,其中有5%的人用了大麻(500人),另外95%的人沒用大麻(9500人)。

https://images.plurk.com/3bnE2mlMxXNlqfkO0LyvUz.jpg
先看用了大麻的500人的檢測結果:475人陽性,25人陰性。
雖然有25人明明用了大麻,卻沒被抓出來,不過答對了475人,符合95%的準確率!
尼洛 📚
https://images.plurk.com/18FNrsJXkqKIZympnJIyDz.jpg
再看看沒用大麻的9500人的檢測結果:475人陽性,9025人陰性。
雖然有475人根本沒用大麻,卻被測出是陽性,不過還是答對了9025人,符合95%的準確率!
尼洛 📚
https://images.plurk.com/eKtZqFKeN76p6uniJqF7X.jpg
總共有950人拿到了陽性結果,但其中有一半的人是假陽性
尼洛 📚
假陽性問題也存在於疾病檢測之中,以乳房X光檢查為例,假設在一次例行檢查中,醫生在一位女性的乳房上發現一個腫塊:

「如果腫塊是惡性的,那麼X光檢查將其判斷為惡性的機率是0.8」
「如果腫塊是良性的,那麼X光檢查將其判斷為良性的機率是0.9」

經過X光檢查後,這位女性的腫塊是惡性的。「根據這個X光檢查結果,你認為這個腫塊是惡性腫塊的機率是多少?」
尼洛 📚
這個表是X光檢查了一千名患者的情況:
https://images.plurk.com/4vdmHVkmdo2J3BxFd0hd8b.jpg
檢查10個惡性腫塊的結果是:8個陽性,2個陰性。
哎呀,搞錯了兩個,不過答對8個,符合0.8的準確率!
尼洛 📚
https://images.plurk.com/5jcz6nxosmKEi6KMAa5ICE.jpg
接著檢查990個良性腫塊,結果是:99個陽性,891個陰性。
有99個人要虛驚一場了,不過答對891個,符合0.9的準確率!
尼洛 📚
https://images.plurk.com/79AcrvsXKe1xvCagRMUw4x.jpg
總共有107個人拿到了陽性結果,但其中只有8個人是真的惡性腫塊,機率是 8/107 = 0.075。
尼洛 📚
覺得雖然理解是可以理解,但實在太反直覺了,還是很難理解 (供蝦毀

作者說這個題目被拿去問了100位醫生,95位醫生都回答惡性腫塊的機率是0.75左右,錯估了十倍!醫生的答案跟我亂猜的答案差不多,太令人不安了
尼洛 📚
「當檢測數量很多時,假陽性是不可避免的。」
「隨著檢測數量變多,假陽性的機率將接近百分之百。」
「一項檢測很有可能顯示陽性結果,但陽性檢測結果並不能認定疾病的存在。」
尼洛 📚
在另一本書《數盲、詐騙與偽科學》看到的假陽性問題:
「市中心有人被搶了,他說搶匪是黑人男子。但,當調查此案的法庭,在差不多照明環境下,多次重現場景時,受害者約只有80%的時間,能正確分辨出攻擊者的族裔。如此一來,這名搶匪確實是黑人的機率多高?」
尼洛 📚
「我們假設,母體中約90%是白人,僅10%是黑人,本案的市中心地區也符合前述的族裔組成。而且,每個族裔可能會去搶劫別人的機率都一樣,受害者把白人誤認成黑人,或把黑人誤認成白人的機率也一樣。」
尼洛 📚
「在這些前提條件下發生的100件搶劫案中,平均來說,受害者會指認攻擊者是黑人的有26件。而真正是黑人所為的案子有10件,受害者可以正確辨識出來的機率是80%,那就有8個人;另外90件是白人所為,受害者誤認兇手是黑人的機率為20%。

因此,既然在這26件、受害者指稱是黑人所為的搶案裡,只有8件確實犯人是黑人,在受害者說他被黑人搶劫的前提之下,犯人真的是黑人的機率僅有8/26,換算下來將近31%!」
尼洛 📚
整理成表格:
https://images.plurk.com/dOzEbRS1849qlw0LG4vjT.jpg
尼洛 📚
真正犯人是黑人,也正確辨識為黑人的機率為 8/26 *100% = 31%
但是,明明是白人犯人,卻誤認為黑人(假陽性)的機率為18/26 *100% = 69%

假陽性的機率比正確率還高兩倍
載入新的回覆