斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:23 AM
Wed, Apr 13, 2022 1:01 PM
1
花了一整天我還是整理不出 sensitivity 和 specificity,我真的對真陽性、假陰性、真陰性、假陽性,真真假假,負負得正,是最弱的QQ 當初我學 hypothesis testing,我也是花了很久才懂,現在要把以上兩項再融入,我就混亂了,就算套用武肺的實例,我都是搞不懂
所以只要朋友跟我說…你去反對他反對的那個什麼什麼,我的腦就當掉,所以我一直覺得自己既不屬於文科的腦,不擅長記東西,也不屬於理科的腦,我邏輯一點都不清晰,結果什麼都不是
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:31 AM
hypothesis testing 真的費了我很多功夫
H0=媽是男人 (不存在的假設)
H1=媽是女人 (你想證明的假設)
去驗證,並不是去驗H1,而是驗H0的可能性,H0的假設是虛無假設,當H0的可能性最低的時候,因為太過低了,就可以反駁H0了,從而H1的假設就會成立
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:38 AM
以上的假設都很絕對,但現實來講,抽樣100,總可能會有出現那個不存在的假設,所以有個臨界點,不是有科學根據,一般行業都是可以接受5%的錯誤,藥呀…人命那些,就更嚴謹,可能是1%的錯誤
如果抽樣中,真的有掉在那5%裡面,那就是 type I error 第一型錯誤,如果你的樣本錯誤越來越多,超過5%,那就是 type II error 第二型錯誤
假如最終錯誤概率,維持在5%以下,就可以推翻H0,從而支持H1,但如果大於5%的話,證明你所謂虛無不存在的假設,事實上真的存在,因此不夠強去支持H1,但統計上沒什麼絕對的字眼,因此要使用「fail to reject H0」無法推翻H0,因此 type I error 是在模組裡是好的
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:41 AM
跟我說錯誤是好的,這已經讓我頭昏眼花,不能說 support H1,但要說 reject or fail to reject 虛無假設,光是這個我就消化了很久,才能解說以上的
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:44 AM
然後我現在卡在 type II error 會產生 false negative 假陰性,而 type I error a是 false positive 假陽性,我就開始混亂了,明明 type I error 是好的,但就是 false positive 我討厭這個XDDD 我要消化一下
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:53 AM
而高的 sensitivity 敏感度是代表著你「預測的 model 有著 positive 結果」的表現很好,測出「媽是女人」,亦代表高真陽性 true positive
低的敏感度,跟上面相反啦…明明要測媽是女人,怎知道是男人,所以低 true positive,但代表高…… false positive 還是 negative??
高的 specificity 特異度是代表你「預測的 model 有著 negative 的結果」表現很好,測出「???? 我不知道,媽不是男人這個假設??」,亦代表高真陰性 true negative
低的特異度即表現很差,所以低真陰性,也就是高…… false 什麼呀…這設定是媽是男人但測出是女人?這樣嗎?
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:56 AM
我要死了,我真的很討厭這些…而考試唯一的 essay question,不需要用 python 就是考 sensitivity and specificity,現在我就是要把答案寫好,到時考試 copy and paste
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 12:57 AM
靈敏度和特異度 - 维基百科,自由的百科全书
看維基也沒用,是我的腦轉不過來,在多層 true/false 之中,加上 positive/negative,然後 reject/fail to reject,我要死了
小龜
@geniusrobot6174
Wed, Apr 13, 2022 2:45 AM
我比較常用 true/false negative/positive 的講法
(◔౪◔)
@rrrooo
Wed, Apr 13, 2022 5:05 AM
我一開始學這個時也邏輯打結,花了好多時間才理清它的概念
這篇文章寫得不錯,推一下
Which Statistical Error Is Worse: Type 1 or Type 2?
(◔౪◔)
@rrrooo
Wed, Apr 13, 2022 5:06 AM
我的理解是,type I error 未必比 type II error 好,主要也是看實驗設計,看哪個error出來的後果比較嚴重。
以下是我的理解only,如果有錯歡迎指正
例如
(1)測出A君確診了肺炎,但其實A君並沒感染肺炎(false positive, type I error)。
(2)測出A君沒有肺炎,但其實他是確診者(false negative, type II error)。
(1)A君被判有罪,但其實A君是無辜的(false positive, type I error)。
(2)A君被判無罪,但其實他是有罪的(false negative, type II error)。
(◔౪◔)
@rrrooo
Wed, Apr 13, 2022 5:06 AM
有人可能覺得寧可殺錯不放過,覺得出現type I error比type II error好。但有些情況,例如在無罪推定的原則下,認為送一個無辜的人去坐監比放走一個罪犯的後果嚴重,那出現type II error就比出現type I error好。
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 9:00 AM
小龜
: 所以我一定要搞好,搞不定我就死了(無法再走前一步)
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 9:19 AM
(◔౪◔)
: 可能你也是對的,說不定這個有派系之爭(?)
交給博士生想
,我理解是從假設著手,看你是怎樣設計題目來驗證你的H1
例如
H0: 教授薪酬 < 助教薪酬
H1: 教授薪酬 > 助教薪酬
但事實上偏向這樣假設
H0: 教授薪酬 = 助教薪酬
H1: 教授薪酬 > 助教薪酬
這個H1是可以設定大於小於(one tail test)或不等於(two tail test)
教授就是偏向你如何 frame question,從而令你的假設更有說服力(所以是捏造出來?
)
教授說了 threshold 就5%,1%,或是也有10%,就沒說到 type II error 可能都是好
當然也有可能教授不想我們混亂,先告訴我們 type I error 是好的,之後進階的話才去探討哪個好
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 9:30 AM
光是 hypotheses testing 已經嚇退了一半學生,我跟同學解說,他老是問我為何驗證H1時,為何要繞圈去否定H0去支持H1
我最初也是這樣,不是直接驗證「媽是女人」就好嗎?其實我到現在都不知道為什麼,到底是不是 hypotheses testing 只是一種方式而已,如果直接驗證「媽是女人」是另一種方式
教授從來沒提過是不是另一種方式,他的反駁是…你說驗了很多,媽是女人,但你能不能否定「媽是男人」的存在?(所以只要驗證「媽是男人」不存在,那麼一定是「媽是女人」)
所以很多同學都卡關了,就毅然放棄了
而我其實有疑問,只好說服自己 hypotheses testing 就是要這樣檢驗
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 9:38 AM
有些我以為是繞圈子的問題,但前因後果要很清晰(?)我有一學期修過邏輯,可恨我以為沒用,所以那些 notes 我都扔了,沒帶到英國(倒是心理學社會學看有帶過來)
回到 true/false positive/negative ,例如測是否 true positive,
不是
「你拿著陽性的報告,問醫生得到 Covid 的概率是多少?」而是「我得到了 Covid,測出陽性的概率是多少?」我……覺得沒分別😂只好先強記
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 9:48 AM
重點是在於 predict unseen?(因為我有 covid 還不知陽性測了才知道)還是重點因果?因為有病所以才測出陽性
在我眼中兩個問題是……
「拿著陽性問 Covid 概率」是因為不可以是誤判嗎?例如其他病也會顯示陽性 或 實驗環境控制不好 或 搞錯病人資料
「得了 Covid 測出陽性」我都有各種病徵了,會不會測不出來?然後到處散播??
呃,寫了出來,又好像真的不太一樣
花【50㍍6秒✦おのちゃ】莣
@hanaoh_fk
Wed, Apr 13, 2022 10:00 AM
看完斗斗的內容跟wiki我腦袋能理解但還沒想到什麼好的輸出(解釋)方式,所以跑去問了一個學統計的朋友現在在等他有什麼好例子可以舉
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 10:18 AM
花【50㍍6秒✦おのちゃ】莣
: 你居然有興趣,這也算那丁點學術討論,邏輯是有越,也幫助對事情的理解,不過我的腦就是轉不過來
例如
真陽性的相反,我會認為是假陽性,因真的相反是假,但事實上應該是假陰性(wiki 右邊那個圖),然後呢…陽性的相反就是陰性對吧,所以兩個相反(真假/陽陰)之後就會正確了,然後我就覺得真陽性=假陰性,並非相反而對立
好像好有道理,但是錯的
小龜
@geniusrobot6174
Wed, Apr 13, 2022 10:21 AM
假陽/假陰我是想成模型說你陽/陰,但是錯了
所以是 false positive/negative
小龜
@geniusrobot6174
Wed, Apr 13, 2022 10:22 AM
媽是女人那個例子會不會被跨性別噴
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 10:30 AM
我就因為這個圖,真陽錯了,不是 false negative 嗎?
我也有想過會否被跨性別噴,不過這是純邏輯討論,不論假設的真假,希望別來搞我,我老師拿男人懷孕作例子
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 10:31 AM
還是我應該看 false positive ?這個也是我混亂之一
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 3:33 PM
我想把媽是女人的套到這個上,我以為把病人和健康人,換成媽和女人就可以,結果怎麼好像不同的…
小龜
@geniusrobot6174
Wed, Apr 13, 2022 4:23 PM
媽是女人那個好像比較像若 p 則 q
不過我統計沒學好,不確定
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 4:48 PM
若 P 則 Q 是 if then 嗎?
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 5:01 PM
糟糕了,我越來越混亂,H0 有 true/false,到底是指…
1) true H0 是陽性測出陽性,false H0 是陰性測出陰性
2) Error rate 大過5%是 true H0,小過5%是 false H0
我越來越混亂了
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 6:24 PM
感覺是似傾向 (2)
當 error rate) > 0.05,大過5%臨界點,也就是證實了 H0 是存在,那就是 H0 is true,根據理論就掉進 type II error
相反
當 error rate) < 0.05,低於5%臨界點,也就是證實了 H0 只是微不足道的存在,那就是 H0 is false,根據理論就掉進 type I error
我可沒看錯,小於0.05就 type I error
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 6:31 PM
似是懂了,但參考接格,H0 is true 也是只有 type I error,找了其他都是一樣的,但我上面寫的 H0 is true 是掉進 type II error
我到底是哪裡出錯了?QQ
還有我是不明白 type I error 為何是 false positive 就不可以是 false negative 嗎?唉…只好先強記
logit model 搞了幾天都搞不好…QQ
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 6:32 PM
媽是男人還是女人我不管了…
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 8:37 PM
The tradeoff between sensitivity and specificity
這影片不錯
以疾病為例,假如疾病很嚴重的 (終國),會採取「寧枉勿縱」,就會要提高陽性,sensitivity 增加,specificity 減少
假如疾病不算嚴重,但一些開支和成本很貴 (英國),會採取「寧縱勿枉」,就會提高陰性,specificity 減少,sensitivity 增加
斗斗★前路迷茫中
@hokutok
Wed, Apr 13, 2022 8:38 PM
如增加 sensitivity,false negative 會少,false positive 會增加,FP 沒病都去治療,這是「寧枉勿縱」,因為 FN 越減越小,就會是 type I error,也是越來越小,那 type I error 為何不是假陰呢?
如增加 specificity,false positive 會少,false negative 會增加,FN 有事卻不隔離,這是「寧縱勿枉」,因為 FP 越減越小,就會是 type II error,也就是越來越小,type II error 為何不是假陽呢?
就是回到上面的問題,我怎麼看來看去,type I error 是 false negative,而 type II error 是 false positive… =_=
載入新的回覆
所以只要朋友跟我說…你去反對他反對的那個什麼什麼,我的腦就當掉,所以我一直覺得自己既不屬於文科的腦,不擅長記東西,也不屬於理科的腦,我邏輯一點都不清晰,結果什麼都不是
H0=媽是男人 (不存在的假設)
H1=媽是女人 (你想證明的假設)
去驗證,並不是去驗H1,而是驗H0的可能性,H0的假設是虛無假設,當H0的可能性最低的時候,因為太過低了,就可以反駁H0了,從而H1的假設就會成立
如果抽樣中,真的有掉在那5%裡面,那就是 type I error 第一型錯誤,如果你的樣本錯誤越來越多,超過5%,那就是 type II error 第二型錯誤
假如最終錯誤概率,維持在5%以下,就可以推翻H0,從而支持H1,但如果大於5%的話,證明你所謂虛無不存在的假設,事實上真的存在,因此不夠強去支持H1,但統計上沒什麼絕對的字眼,因此要使用「fail to reject H0」無法推翻H0,因此 type I error 是在模組裡是好的
低的敏感度,跟上面相反啦…明明要測媽是女人,怎知道是男人,所以低 true positive,但代表高…… false positive 還是 negative??
高的 specificity 特異度是代表你「預測的 model 有著 negative 的結果」表現很好,測出「???? 我不知道,媽不是男人這個假設??」,亦代表高真陰性 true negative
低的特異度即表現很差,所以低真陰性,也就是高…… false 什麼呀…這設定是媽是男人但測出是女人?這樣嗎?
這篇文章寫得不錯,推一下
以下是我的理解only,如果有錯歡迎指正
例如
(1)測出A君確診了肺炎,但其實A君並沒感染肺炎(false positive, type I error)。
(2)測出A君沒有肺炎,但其實他是確診者(false negative, type II error)。
(1)A君被判有罪,但其實A君是無辜的(false positive, type I error)。
(2)A君被判無罪,但其實他是有罪的(false negative, type II error)。
交給博士生想,我理解是從假設著手,看你是怎樣設計題目來驗證你的H1例如
H0: 教授薪酬 < 助教薪酬
H1: 教授薪酬 > 助教薪酬
但事實上偏向這樣假設
H0: 教授薪酬 = 助教薪酬
H1: 教授薪酬 > 助教薪酬
這個H1是可以設定大於小於(one tail test)或不等於(two tail test)
教授就是偏向你如何 frame question,從而令你的假設更有說服力(所以是捏造出來?
教授說了 threshold 就5%,1%,或是也有10%,就沒說到 type II error 可能都是好
當然也有可能教授不想我們混亂,先告訴我們 type I error 是好的,之後進階的話才去探討哪個好
我最初也是這樣,不是直接驗證「媽是女人」就好嗎?其實我到現在都不知道為什麼,到底是不是 hypotheses testing 只是一種方式而已,如果直接驗證「媽是女人」是另一種方式
教授從來沒提過是不是另一種方式,他的反駁是…你說驗了很多,媽是女人,但你能不能否定「媽是男人」的存在?(所以只要驗證「媽是男人」不存在,那麼一定是「媽是女人」)
所以很多同學都卡關了,就毅然放棄了
回到 true/false positive/negative ,例如測是否 true positive,不是「你拿著陽性的報告,問醫生得到 Covid 的概率是多少?」而是「我得到了 Covid,測出陽性的概率是多少?」我……覺得沒分別😂只好先強記
在我眼中兩個問題是……
「拿著陽性問 Covid 概率」是因為不可以是誤判嗎?例如其他病也會顯示陽性 或 實驗環境控制不好 或 搞錯病人資料
「得了 Covid 測出陽性」我都有各種病徵了,會不會測不出來?然後到處散播??
呃,寫了出來,又好像真的不太一樣
例如
真陽性的相反,我會認為是假陽性,因真的相反是假,但事實上應該是假陰性(wiki 右邊那個圖),然後呢…陽性的相反就是陰性對吧,所以兩個相反(真假/陽陰)之後就會正確了,然後我就覺得真陽性=假陰性,並非相反而對立
好像好有道理,但是錯的
所以是 false positive/negative
媽是女人那個例子會不會被跨性別噴我就因為這個圖,真陽錯了,不是 false negative 嗎?
我也有想過會否被跨性別噴,不過這是純邏輯討論,不論假設的真假,希望別來搞我,我老師拿男人懷孕作例子我想把媽是女人的套到這個上,我以為把病人和健康人,換成媽和女人就可以,結果怎麼好像不同的…
不過我統計沒學好,不確定
糟糕了,我越來越混亂,H0 有 true/false,到底是指…
1) true H0 是陽性測出陽性,false H0 是陰性測出陰性
2) Error rate 大過5%是 true H0,小過5%是 false H0
我越來越混亂了
感覺是似傾向 (2)
當 error rate) > 0.05,大過5%臨界點,也就是證實了 H0 是存在,那就是 H0 is true,根據理論就掉進 type II error
相反
當 error rate) < 0.05,低於5%臨界點,也就是證實了 H0 只是微不足道的存在,那就是 H0 is false,根據理論就掉進 type I error
我可沒看錯,小於0.05就 type I error
我到底是哪裡出錯了?QQ
還有我是不明白 type I error 為何是 false positive 就不可以是 false negative 嗎?唉…只好先強記
logit model 搞了幾天都搞不好…QQ
以疾病為例,假如疾病很嚴重的 (終國),會採取「寧枉勿縱」,就會要提高陽性,sensitivity 增加,specificity 減少
假如疾病不算嚴重,但一些開支和成本很貴 (英國),會採取「寧縱勿枉」,就會提高陰性,specificity 減少,sensitivity 增加
如增加 specificity,false positive 會少,false negative 會增加,FN 有事卻不隔離,這是「寧縱勿枉」,因為 FP 越減越小,就會是 type II error,也就是越來越小,type II error 為何不是假陽呢?
就是回到上面的問題,我怎麼看來看去,type I error 是 false negative,而 type II error 是 false positive… =_=