kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:13 AM
Fri, Sep 2, 2022 5:50 AM
我完全可以理解繪師不想要自己的圖被拿去餵給AI訓練
但這真的有可能禁嗎?怎麼禁?該禁嗎?
我怎麼想都覺得只能接受?
感覺就算真想限制也非常難辦到
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:18 AM
原圖不會無授權公開在任何地方 不會讓任何人看到 訓練完後的產出也跟描圖扯不上半點關係
頂多就是說風格有像 偏偏風格不被保護
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:20 AM
也就是說要限制只能從限制私下使用著手
所謂私下指的是類似個人拿來臨摹練習但不公開 這種程度的事
這是最接近餵給AI訓練的比喻了
但是既然東西都不公開 要從何限制起?
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:22 AM
更別說要從訓練完的AI模型舉證訓練用資料有用到你的圖 難上加難
跟ML Security的目標也是背道而馳
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:28 AM
再說了
整個模型固然是建立在千千萬萬張圖片的基礎上學到怎麼產出圖像的
但要說單一個別的畫作對模型的影響有多少?
微乎其微吧
要說解釋或舉證這影響究竟是有多少 模型究竟從你的畫學到了什麼
大家倒是想知道啊 問題是辦不到
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:30 AM
如果是成品模型 吃幾張圖 蹦出一個合成風格和構圖之類的這種應用
倒是還好限制一些
這算是重製吧?即使現行法律沒cover到 也不難想像如何修
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:30 AM
至少不像拿圖去訓練一樣無從限制起
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:30 AM
不只是圖
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:31 AM
自然語言的訓練 多少也會用版權物吧? 這又怎麼禁
成品和所謂原作之間的關聯又更小了
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:36 AM
目前是靠口頭呼籲和自主規制
但下一步在哪裡?
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 9:44 AM
至於有些跟AI完全無關的可能爭議......
例如當一個AI完全學會某繪師的畫風 然後自主產生一堆觸及了麻煩題目的圖片 可能讓人對繪師本人誤會
這種事情不限於AI
人怎麼處理 AI就怎麼處理
人處理不了 那AI也基本別想動
當然也不是說這個洞沒有問題
人做這件事的成本高門檻高又花時間
AI做這件事便宜快速又簡單
量變引起質變囉
銀_1/4個組長
@silver9450
Tue, Aug 30, 2022 10:03 AM
自然語言的版權物比較簡單,因為文字的版權物在網路上本來就難找,加上wikipedia跟現成資料集都非常成熟,基本上沒有人會去用版權物。
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 10:09 AM
銀_1/4個組長
: 合理 不過我說版權物算是筆誤了
拿來類比的話應該是用公開的、個人的文字創作才對
舉凡社交平台上的廢文、連載小說、公開發表的散文、網路新聞等等
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 10:13 AM
不知道如果是花錢買下來的 那又該怎麼算......
買來的電子書能用嗎 買來的圖能用嗎 花錢加會員才得到的文字或圖片能用嗎
之類的
銀_1/4個組長
@silver9450
Tue, Aug 30, 2022 10:16 AM
我自己是覺得 除非是公開資料集有明說可以無償使用/模型訓練用 要不然都是不行啦
銀_1/4個組長
@silver9450
Tue, Aug 30, 2022 10:17 AM
社群網站的部分 其實user data使用本來就規範得滿嚴格的 我現在的team用不到user generated content所以我不是很確定 不過就我所知也不是說想用就用
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 10:18 AM
我的理解是現在就是停在自主規制的階段
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 10:21 AM
我直觀上會有種
用自家的user generated content來想 需要多多考慮
反而是用別家的、公開的user generated content少了一層限制的感覺
kk☆穩穩前進🌈
@seankao31
Tue, Aug 30, 2022 10:27 AM
另一種資料需要授權的場景是用在研究或調查上 可能可以走這條路?
載入新的回覆
但這真的有可能禁嗎?怎麼禁?該禁嗎?
我怎麼想都覺得只能接受?
感覺就算真想限制也非常難辦到
頂多就是說風格有像 偏偏風格不被保護
所謂私下指的是類似個人拿來臨摹練習但不公開 這種程度的事
這是最接近餵給AI訓練的比喻了
但是既然東西都不公開 要從何限制起?
跟ML Security的目標也是背道而馳
整個模型固然是建立在千千萬萬張圖片的基礎上學到怎麼產出圖像的
但要說單一個別的畫作對模型的影響有多少?
微乎其微吧
要說解釋或舉證這影響究竟是有多少 模型究竟從你的畫學到了什麼
大家倒是想知道啊 問題是辦不到
倒是還好限制一些
這算是重製吧?即使現行法律沒cover到 也不難想像如何修
成品和所謂原作之間的關聯又更小了
但下一步在哪裡?
例如當一個AI完全學會某繪師的畫風 然後自主產生一堆觸及了麻煩題目的圖片 可能讓人對繪師本人誤會
這種事情不限於AI
人怎麼處理 AI就怎麼處理
人處理不了 那AI也基本別想動
當然也不是說這個洞沒有問題
人做這件事的成本高門檻高又花時間
AI做這件事便宜快速又簡單
量變引起質變囉
拿來類比的話應該是用公開的、個人的文字創作才對
舉凡社交平台上的廢文、連載小說、公開發表的散文、網路新聞等等
買來的電子書能用嗎 買來的圖能用嗎 花錢加會員才得到的文字或圖片能用嗎
之類的
用自家的user generated content來想 需要多多考慮
反而是用別家的、公開的user generated content少了一層限制的感覺