OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:51 PM
2
今天工作上遇到的邏輯問題,雖然思考這些很累,但非常有趣,紀錄一下:
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:52 PM
700個人中,以「2022買過東西」以及「2023買過東西」做分類,前者44人,後者132人
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:53 PM
請問2022跟2023都買過東西的幾人?直接資料庫查詢,得到360人
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:53 PM
這很不符合直覺,甚至chatgpt一開始也被騙
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:54 PM
可不可以取交集或聯集?但44跟132怎樣都不會變成360
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:56 PM
問題一:「2022買過東西」以及「2023買過東西」的條件定義不清楚
2022買過,但我們仍不知2023有無買過
2023買過,但我們仍不知2022有無買過
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 7:58 PM
所以兩次抽出來的人,每個人我們都只能知道,「他2022 or 2023有買過」,但對於「沒有確認」的那一年,根本不知道有沒有買
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:01 PM
所以唯一的方式,「2022買過,2023買過」兩者同時成立才可以
而這些人,可能會跟前兩者有重合,也可能完全沒重合(亦即前兩次調查,根本沒抽出某些兩年都買過的人)
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:03 PM
問題二:假設我們現在把2022與2023變成互斥條件,亦即只買過2022的50人,只買過2023的100人
請問同時買過兩者的是幾個?
這時又會很直覺想相加,或是求交集聯集等等的想法
但根本不行,因為這兩個群體是互斥的,所以根本不會有人「同時是2022又是2023」
寫出來後,好像很合理,但在腦中轉的時候想不過來
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:04 PM
所以定義條件的時候,要清楚定義inclusion跟exclusion
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:05 PM
不能單純只想「2022有買,所以設定條件為date = 2022」,還要加入「2022以外的date全部要排除」
或是定義問題時,就要說清楚「只有」2022有買
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:08 PM
最後,其實我們是在這700人中,label每個人的行為
有的人2022買過,有的2023買過,這些都不會影響「兩年都買過」的label
全部都是獨立的
但不知為何,交集聯集的想法會一直跑進腦中
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:14 PM
集合邏輯是觀察群體差異,分類邏輯是定義個體狀態
OUCHRUSH
@OUCHRUSH
Wed, May 7, 2025 8:16 PM
還是很複雜,自己一定要找到說明的方式
載入新的回覆
2022買過,但我們仍不知2023有無買過
2023買過,但我們仍不知2022有無買過
而這些人,可能會跟前兩者有重合,也可能完全沒重合(亦即前兩次調查,根本沒抽出某些兩年都買過的人)
請問同時買過兩者的是幾個?
這時又會很直覺想相加,或是求交集聯集等等的想法
但根本不行,因為這兩個群體是互斥的,所以根本不會有人「同時是2022又是2023」
寫出來後,好像很合理,但在腦中轉的時候想不過來
或是定義問題時,就要說清楚「只有」2022有買
有的人2022買過,有的2023買過,這些都不會影響「兩年都買過」的label
全部都是獨立的
但不知為何,交集聯集的想法會一直跑進腦中