開水◎無世界漫遊中
【廢】
(最近在念海德格的技術哲學中的資訊概念)
我對讀資工的朋友:應用資訊學
我對讀資管的朋友:資料庫管理
我對讀統資的朋友:資料與數據分析
我對讀資財的朋友:資管+統資+財金
我對讀資傳/大傳的朋友:媒介與文化人類學與群體心理學
很少有人真的在乎資訊本身
開水◎無世界漫遊中
真的在研究資訊本身的應該是在社會學或一般的媒介研究居多,每次都會想到Luhmann區分告知(utterance)與資訊(information),還有媒介(media)與形式(form)的區分;感覺Habermas和Luhmann對於資訊的研究或多或少都有使海德格的理論得到擴展和延伸。
Form跟in-form之間的關係在這裡特別的重要。
海德格:不是人在說話,而是語言在言語語言。
Luhmann: 人不會溝通,只有溝通會跟溝通發生溝通。
銀_1/4個組長
倒也沒有,整個資工/CS領域其實很大,研究資訊理論(information theory)還有正規語言(formal language)的人其實很多。只是做這些理論的人通常不會跑出來當工程師而已。
開水◎無世界漫遊中
銀_1/4個組長 : CS領域裡的資訊理論大多已經侷限在數位資訊了,對數位資訊的研究只是資訊研究本身的一個分支,然後對正規/形式語言的研究的研究對象主要還是在語言上,(資訊)形式(form)都變形容詞了;我指的「資訊本身」比較像是在研究資訊的本質,也就是判別「什麼是資訊(以及什麼不是)?」這個問題的學說,所以還是有一定程度的枝幹關係或研究興趣上的距離。
銀_1/4個組長
開水◎無世界漫遊中 : 也不只啦,做機器學習的很在意signal vs noise,有研究data分佈的學門也有研究模型表現力跟可解釋性的學門,而且我們做的也很多是自然語言或是電腦視覺之類的類比訊息,我覺得做這種研究的還是不少,只是應用上我們更注重的是如何把這些東西數位化而已。
開水◎無世界漫遊中
銀_1/4個組長 : 感謝提點!我剛剛真的沒有注意到機器學習的過程中對於模型feedback的內容要判讀它在多大程度是noise、以及為什麼不是noise的解釋確實也牽涉於「是否是資訊?」此一問題上,雖然理論地說這類研究之於剛剛提及的「資訊本身」我會傾向主張把它放在枝幹的節點的位置,這乃是由於我所知到的多數情況(特別是應用的場合中),對於noise或資訊的判斷指是實現另一目的(模型所預期達成的目標)的手段,而為了達成這個目的則通過試錯這種帶有實用主義方法的方式去進行,如果是抱持著這種不關心how it works而只把訓練過程當黑盒子去反覆試錯的話,那麼就會離我所說的對「資訊本身」的研究較遠;反之,一旦進入試圖對「黑盒子」進行解釋的工作那麼就近上許多了。
開水◎無世界漫遊中
說到signal就讓我想到,我會把CS領域中對於機器學習的訓練、調整與解釋所包括的所有工作看作是那個節點的原因主要是在於它仍然是在做那個signal的東西是sinsign還是legisign的判斷活動,這種判斷活動仍算是應用的範圍,因為我所說的那種資訊研究更關注從qualisign到legisign的十種sign中哪些在什麼條件下足以成為資訊、哪些則一定不是資訊,諸如這種對於資訊更後設去思考的研究。
銀_1/4個組長
機器學習上會去做explainability一部分是為了debug另一部分也是為了去解析黑盒子裡面究竟在做什麼、跟人類認知有什麼相同或不同。具體上來說的話我們會去理解每一筆data對模型有什麼影響、模型的輸出是源自什麼feature之類的,基本上是去試圖理解模型學到甚麼以及為什麼。
這邊有個tutorial有興趣的話可以看看:
EMNLP 2020 Interpretability Tutorial
開水◎無世界漫遊中
銀_1/4個組長 : 感謝分享資源;雖然原本就對於這種做explainability的工作的目的稍有理解,但我對於其粗略的機制還是不甚清楚;儘管這仍然和普遍且純粹的(先驗的)資訊研究有所不同,但經過說明有更清楚它是如何進行的!
載入新的回覆