Thinker
一堆有資訊科技背景的人,在質疑王義川說的電信資料分析有監控問題,我實在醉了。見獵心喜,連大腦都不管用了。

大家連精準廣告投放這麼常見的例子都沒想到。這就是很標準由買方出分析條件,資料擁有方進行分析和投放,再當將結果交給買方。這甚至有 API 服務,你直接分析公式傳給賣方。賣方運算完之後再把結果傳回給買方。大家能不能用大腦想一下啊?!
Thinker
常見做法是由賣方公開他的資料有哪些欄位,欄位的資訊有什麼義意。然後再由買方提供公式,在賣方的系統裡計算完再把結果傳回給買家。
rîch1ïû
是你不知道

一般電信資料他拿不到這些資料
他拿得到都是透過國安 API

就像傳說中的 NSA 和電信業介接的部份
rîch1ïû
如果只講到男女還可以說是靠人力統計
Thinker
https://images.plurk.com/27rMtMEWFGyDpTZgm5hkq0.png
Thinker
只要有10%的人在現場開社群軟體,基本上就可以分析出來了。
rîch1ïû
你只是在騙自己而已
Thinker
這是真實可以做到的。而且是商業實務了。
rîch1ïû
他最好改天出來說是亂說的唬弄過去
但是以他講的內容絕對是定位到個人
Thinker
不需要,你只需要買服務。
Thinker
你去找個社群平台做廣告投放的人聊一下,就知道這種東西運作多久了。
rîch1ïû
所以去識別化的資料可以分出這樣?

民進黨政策會執行長王義川昨天於政論節目表示,他們可以用手機訊號的定位去分析出在立法院外頭的群眾年齡,與之前太陽花群眾有沒有重複等。國民黨立委今天舉行記者會痛批,民進黨打著反黑箱,但做的就是黑箱,卻拿手機訊號資訊監視人民,要求賴清統總統出來講清楚、講明白
Thinker
可以
rîch1ïû
手機訊號定位耶
Thinker
我前面貼過, https://images.plurk.com/27rMtMEWFGyDpTZgm5hkq0.png
Thinker
我不知道台灣信業者有多先進,但歐美一些企業己經可以提供跨平台的去識別資料整合運算。這在過去幾年有許多研究和應用。
Thinker
其實找社群平台的資料會比電信業者多。
jimmyliao ()
已經有去識別化資料可以做到,就看有沒有賣成服務這樣
jimmyliao ()
目前幾家廣告投放商,都能做到
rîch1ïû
批踢踢實業坊 - Gossiping

這他的回應,不過要能跨十年
恐怕是沒這東西

要不然就他唬爛,要不然就他可以拿到不能拿到的東西
Thinker
rîch1ïû : 我只說技術上可行。至於電信公司怎麼管理,只能問電信公司。
rîch1ïû
Thinker : 乾脆說民進黨在現在配人臉辨識好了,這可信度更高
Thinker
另外我也要說,自由 big-data 這個名詞出現後。也很難說這些公司會囤多少資料。歐盟甚至規定資料多久時間後必需銷毀。
mhsin
你嘛好啊,十年前太陽花的時候是哪一黨執政。
還是你要說馬政府也把「國安 API」給 DPP 的人存取?
rîch1ïû
mhsin : 要說的話這些電信資料有沒有被保留這麼久可以被取出來,不知道

所以我說最好他承認是唬爛啊
mhsin
某前小公司在做行銷的,靠著埋在一些第三方網站的 beacon 就可以做出很多神奇的關聯分析。更不用說可以埋更多 beacon、經手更多資料的大公司。
mhsin
rîch1ïû : 疫情時為了做簡訊實聯制,政府編預算去補貼電信業者儲存那些簡訊的費用,被拿來抹黑說是補貼簡訊費用你都忘了?
如果真的有像你想像的十年前就一直在儲存什麼資料,哪還需要簡訊實聯制。
mhsin
簡訊實聯制的資料量就要補助好幾億了,像你想像的十年前就在存的話要多少經費?政府沒給預算哪個電信業者要幫你存?
還是你要說(至少從)馬政府開始就在祕密用大筆預算監控人民?
mhsin
真的是活在想像的世界捏。
wens
美國好像變成辦案去買資料比跑傳票調取票容易 ._.
檸檬酸/蠟/被世界耍得團團轉
現在的人怎麼都不知道自己的個資被big tech掌握得精確到什麼程度
John Smith
John Smith
mhsin : 國安api (rofl)
JOJO79
我只知道國安感冒液, 沒想到還有國安API XD
John Smith
贊成AI有選舉權
國安版礦工寮API
Paul@TW
"他們可以用手機訊號的定位去分析出在立法院外頭的群眾年齡,與之前太陽花群眾有沒有重複等。"
這句話是在說號碼行為的 clustering, 得到年齡的分布曲線, 然後拿這個結果跟太陽花群眾的分布曲線比較差異吧
怎麼理解成存十年資料的
沃夫☆別再當年剿匪不力了
拼拼圖不一定要從邊邊開始找
所以這樣做,就能拼出一些需要保護隱私的人的樣態
向來都是知道的太少
莫忘史諾登
John Smith
Paul@TW : 請問誰有年齡資料?
Thinker
John Smith : 前面有寫
一庸人
單純年齡資料根本無法判別政治立場

他自己說還可以對比這群人並沒有出現在民進黨的選前之夜

這只有號碼、ID等足以辨識獨立個體的個資才能判別的,根本沒去識別化
Thinker
Thinker
就是有方法,只是你們硬要説沒有
Thinker
我都懷疑各位的專業都跑到哪去了
沃夫☆別再當年剿匪不力了
智慧型手機一直是很優秀的電子鐐銬
rîch1ïû
Thinker : 他這篇是錯的... 懶得再解釋了
沃夫☆別再當年剿匪不力了
其實不要問對錯,只問能不能辦到就好了
用無聲室找出來的那個硬體後門也是這樣
你又不是NSA
Thinker
算了吧。你昨天都還在質疑去識別化的資料能不能分析出這些資訊。
Thinker
人家都上太空了
Thinker
還真以爲法律限制下,自己就很安全。
John Smith
John Smith
Thinker : 你說的技術方法都有,但是王義川說的不是你的方法
John Smith
電信公司就不能提供性別、年齡...等資料,沒資料王義川是如何分析啦
John Smith
提供就是犯法/王義川唬爛...選一個
Thinker
不用提供就能分析。
Thinker
Plurk 提供你的發言給我,然依我看出 87% 是男人。這樣是否洩露個資了?別搞笑了
John Smith
Thinker : 電信公司不能提供性別、年齡...等資料上萬筆,沒資料王義川是如何分析啦
Thinker
王義川有可能唬弄的,也有可能違法。但要做這種分析,不用違法也能做到。而且技術很成熟了。
John Smith
Thinker : 一筆很容易觀察。
John Smith
Thinker : 我就說你的方法合法啊。
沃夫☆別再當年剿匪不力了
賣刀子的當然能主張自己沒犯意,但他仍然在產業鏈當中
Thinker
人家都上太空了,你還一筆很容易。
John Smith
Thinker : 我也知道你是男的啊!
JOJO79
新北耶誕城的人流資料, 供各位參考~ https://images.plurk.com/57CyKcspCi8FASMYIEaP2.png https://images.plurk.com/1du5XxvJxnmiabV2t97AQe.png
小雪~
手機裝抖音小紅書,家裡用小米掃地機器人監視器,然後擔心電信業的資料分析。
John Smith
小雪~ : 因為內政部有規範電信業者資料的處理不能涉及性別、年紀
沃夫☆別再當年剿匪不力了
電鋸和菜刀都能切肉,沒問題的
JOJO79
中華電信的個人資料使用告知說明, 裡面就有 消費者年齡/性別分布

https://images.plurk.com/43nMUk9pNM9dDCmSZOCXfH.png https://images.plurk.com/h0icVHk3c76ahmvq3MX3P.png
Zaious|AI 情報屋
JOJO79 : 只有分布是沒辦法比對兩群人是否重疊的
JOJO79
Zaious|AI 情報屋 : 有沒有重疊, 我就不清楚怎麼比對了. 我只是貼出資料, 資料是有涉及 性別, 年齡區間的~
沃夫☆別再當年剿匪不力了
你就看他有沒有跟合作公司或自己的業務單位分享資訊的條款,
如果有,就是另一件事了
Zaious|AI 情報屋
JOJO79 : 所以重點是"分布"哦,具體到每一個個體的年齡、性別,依舊是不行
JOJO79
Zaious|AI 情報屋 : 本來就是分布, 是有人說他手上有七萬人每個人的年齡性別嗎?
Zaious|AI 情報屋
JOJO79 : 但分布不可能比對啊XDDD 要比對一定要有可識別的具體資料
JOJO79
Zaious|AI 情報屋 : 所以我說我不知道他怎麼比對的, 搞不好是電信公司有什麼辦法可以辨別人流有沒有重複, 但是我不是資料科學家, 我也不好隨便亂講
一庸人
光年齡性別是無法分析出該活動的群體屬於哪個政治傾向

而且阿川還能把單一場的"訊號"拿來跟其他場的訊號做比較

如何能知道沒有重疊?就是有"可識別"的資料才能分析知道.
一庸人
電信資料能辨識出精確人流沒錯,每一個手機"訊號"就是一個流量啊
Thinker
一庸人 : 看來你對去識別化完全不懂,只會從字面解釋。
Thinker
例如我有一支手機,訊號上無法識別出這是我的,但可以在 A 基地台和 B 基地台上識別上這是同一支手機。而這不能稱作這兩個訊號能識別出我。這只能識別出這兩個訊號都是同一個人,但不知是誰.
Thinker
不過,邏輯推理能力不好的話,應該也看不懂上面的解釋.
John Smith
Thinker : 現在麻煩的是他有扯到太陽花資料。
Thinker
看來張善正不只比較正直,還比較聰明,不用花這麼多間就知道自己錯了.
Thinker
Zaious|AI 情報屋 : 只要付錢讓擁有資料的單位進行分析,交出最後重疊的比例.這樣就沒有散佈個體的資訊. 身為技術人員,應該都知道怎麼轉彎吧!
Thinker
現在廣告投放都是這麼進行,我一開頭就說很清楚了。別說看不懂。
Thinker
人家都上太空了,你們這些人還傻傻的以為一定要拿到某種資料。
Thinker
雖然我不太贊成這種做法,但法律上允許「內部合理使用」。只要資料不交給第三者,都被當成內部了。
沃夫☆別再當年剿匪不力了
eula都寫白紙黑字了,同意是自己按下的
Zaious|AI 情報屋
Zaious|AI 情報屋
https://images.plurk.com/4t7GtUO9lCUTQ1lIaDQa9M.png
John Smith
就沒事捅出個馬蜂窩,就愛講話啊(LOL)
Zaious|AI 情報屋
然後我強調一下哦,廣告公司真的沒辦法從電信取得使用者個資,廣告投放也不是這麼做的... 因為我人在廣告公司

資訊科技背景才知道那些資料摸的到、那些技術的極限在哪裡,不會無上限的幻想資訊科技的神通廣大
一庸人
Thinker : 同一支手機沒問題啊

問題是他知道這些手機訊號有沒有出現在其他場合喔

而且還知道年齡跟政治傾向喔

去識別化個屁啦

叫他把買的資料拿出來看就知道,不要說那些資料是機密啊
Thinker
看來你完全不懂,還要裝懂。我從你的行為看出你不懂裝懂,是 plurk 洩漏你的個資囉? 別再說笑話了好嗎。不懂就算了,前面別人都己經說明怎麼做了,還拗。張善政看起來真的算是正直的了。
Thinker
世界都進步成這樣了。你們還這麼天真的在殺豬公.
一庸人
把他買的資料公開就好了,不用廢話太多

是要懂啥?三家電信都發聲明沒跟他交易了,他哪裡來的基地台手機訊號資料?還能分析政治傾向?去識別話個屁啦!擺明就是國家機器動了
JOJO79
反正已經他字案了, 到時候他也必須要說明
載入新的回覆