puni桑
問一下專業的 Miles 裡面說的技術真的辦得到嗎? 講得跟吃飯喝水一樣輕鬆www
@kellerlin - [心得]想替噗浪的偷偷說平反一下...從2013年一月服務開啟到現在,我覺得偷...
Miles
字太長求懶人包
puni桑
Miles
聽他放屁,這跟大數據啥關係,就單純的非對稱式加密,這算得出來就能破解噗浪密碼了
Miles
不對,這應該只是單純的SHA加密之類的,基本上這種只要夠長,一般電腦要算出來都不可能
Miles
如果他有辦法做到攔上游封包就另當別論,但這大概已經違法了吧
Miles
=======================
Miles
似乎好像有另一種做法,但也不可能太容易,前提假設是此偷偷說是自己噗上的,而且並沒有被轉出去
Miles
那可以將範圍限制在此偷偷說為自己好友,回噗為好友的好友
Miles
再假設所有人都不鎖噗
Miles
然後把好友及好友的好友的文都爬回來,做語意的前後文分析,找出每個人用詞習慣 (光這個就可以找教授做一年以上還成效不好了)
Miles
然後用用詞習慣去比對,我看至少做三年,準確率87%
Miles
=======================
Miles
結論: 基本上只要有人會脫口而出"大數據"三個字,那個人的話就可以不用聽了
puni桑
Miles : 感恩! 我覺得他比較像在說第二種方式, 但就是對準確率相當質疑, 果然是沒這麼容易, 而且真的這樣搞只會讓大家把他黑單而已吧...
Miles
光我那些前提假設就不可能成立了
puni桑
Miles : 大數據真的已經是詐騙起手式惹www
Miles
而且語意分析這塊我還不相信有人敢說他很強 www
puni桑
Miles : 語意分析這塊目前還是需要自己來嗎? 我以為現成的詞彙庫+Deep Learning門檻應該比以前低很多了...(我有搞錯定義嗎?)
Miles
現成的我還沒看過準確率能看的 (rofl)
Miles
門檻低只是大家可以做一套出來豪洨,但如果準確率這麼簡單,大廠早就做出來了,還輪的到我們
puni桑
Miles : 這倒是www
載入新的回覆