山特▶黑暗料理之路

談談這個。
@Kazaru_paraiso - 不曉得河道上的各位有沒聽過AO3Beta,或網址裡有ao3beta....

怎麼說,繼上次的 FB 連結偷個資事件後,又一個讓我感到無力吐槽的事件。
先說我的結論:
(1) 取得用戶&文章內容是用爬蟲技術做到的
(2) AO3 本身是 GPL 沒錯,但不代表內容也可GPL AO3beta的創辦人腦袋是不是有問題?(【編輯】對不起,我為此言論道歉,他們還是很真誠的)
(3) 鏡像網站很正常
(4) AO3beta 不是鏡像網站且違反 AO3 守則
【編輯】感謝噗幣。
山特▶黑暗料理之路
心好累,心累到有點不想打字了,而且手好冷(
是這樣,AO3beta 有問題沒錯,但原噗很多留言也是錯到不知道應該說什麼
所以這邊先提醒一下(儘管我不覺得我有需要被海巡的價值,但以防萬一我還是先放這了):原噗主以及原噗留言者,我建議你不要繼續閱讀
我知道要求所有人都需要具備某些領域相關知識很荒謬,但有時候我們真的太把一切當常識,導致我們第一反應會比較不善一點,請見諒
山特▶黑暗料理之路
【第一:怎麼取得我帳號跟文章內容的?】
Internet 第一守則:所有網路上的內容都是公開的
亦即:當一個人有能力把整個網站的所有連結都點過一次並存下來的話,當然他可以取得你的文章內容與使用者名稱,畢竟都寫在網路上
山特▶黑暗料理之路
但人類顯然不可能有那個閒工夫慢慢去點,所有有個網路技術,叫爬蟲(crawler)
就是把以上事情自動化:自動根據設定收集網址、自動存下網站上的內容以供日後使用
這是很正常且常用的技術
1. 比如你可能聽過「每日頭條」(原諒我不想付上網址幫他增加點閱率)
2. 或者你在發現常用的網站關閉時,可能用過網路備份器(相關wiki)
3. 更不要提現在許多學術研究的研究資料都是網路爬蟲
山特▶黑暗料理之路
爬蟲沒有好也沒有壞,他就是個工具,可以被用在很垃圾的地方,也可以用來做出很多貢獻
山特▶黑暗料理之路
回歸正題,所以

1. AO3beta 的內容怎麼來的?
[Sol] 爬取 AO3 中文 tag,分析作者與文章內容,根據某些規則篩選想搬的內容,於他們網站內為作者創建帳號,然後導入文章

2. 我怎麼知道的?
[Sol] 他們網站寫的……(我心好累

3. 為什麼可以爬 AO3?
[Sol] 首先,爬蟲不難,AO3 更是易中之易;其次,網路上 一堆 API(我心真的好累
山特▶黑暗料理之路
【第二:OTW 跟 AO3 是什麼關係?】
對不起,但我看到原噗有人貼 OTW 的官方帳號懷疑是盜文主謀,我真的有點……ry
山特▶黑暗料理之路
了解一下 OTW 歷史吧
簡單來說就是 OTW 是一個Transformative Works(可簡單理解為二次創作)權益發聲的非營利組織,包含法律方面以及作品存檔 (archive) 等等,包括很多人都聽過的 Fanlore 以及 ArchiveOfOurOwn (aka, AO3),以及一些二次創作相關學術研究
(ps. OTW 創辦的具體故事還挺精采,創辦人也很精采——無論是經歷還是作品——有興趣可以自己查一下吃個瓜)
山特▶黑暗料理之路
所以:OTW 不是盜文網的頭頭,他是 AO3 的老爸
(沒有冒犯的意思,知道提出疑惑的人是好意,但其實看到當下反應真的是 Pffff(偷笑) 覺得有點可愛)
山特▶黑暗料理之路
【第三:AO3beta 說他們內容是 GPL 許可,AO3 也是 GPL 許可,這是什麼意思?】

GPL 是一種 license,什麼是 license?就是你每次安裝應用程式他會跳出來落落長的授權條約。
我都不想說大家一定看過了,因為大家一定都直接跳過根本沒看(ry
山特▶黑暗料理之路
而跟一般應用程式的 license 不太相同,GPL 是開源軟體授權
簡單來說:
1. GPL 授權的軟體程式碼是公開且開放自由使用
2. GPL 授權軟體內容不可商業使用
3. 只要你的軟體引用到 GPL 授權的工具,那你的軟體也需要使用 GPL 授權
山特▶黑暗料理之路
【第四:所以意思是說,AO3beta 本來就可以自由搬運使用 AO3 上的文章內容囉?】
……先讓我深吸一口氣
山特▶黑暗料理之路
不是的。可以仔細看看我第三寫的內容,或者查一下所謂「Open-source software(開源軟體)」。
就算你不查應該也要看到,這個詞的翻譯是:開源軟體
一般來說,軟體協議中開放的只有原始碼,也就是俗稱的程式碼,至於軟體上收集的內容——
山特▶黑暗料理之路
對不起,我不敢百分之百篤定, but tbh, as far as my best best knowledge, 沒人在跟你開源使用者資料的
山特▶黑暗料理之路
https://images.plurk.com/CRicpaBEZGRn1RXn4j2al.png
有人懂我在看這段時內心的荒謬之感嗎?
What the fuck. 文章版權 GPL 是什麼鬼。AO3beta的創辦人腦袋是不是有洞?
(【編輯】我為此言論道歉)
山特▶黑暗料理之路
首先,你可以先看一下 GPL 嗎?
官方網站附上,不用謝
> The GNU General Public License is a free, copyleft license for software and other kinds of works.
大哥。
自由軟體開放協議。
軟體。軟體! You understand me????
【編輯】 更正:文章是可以且有人在用 GPL license 的,感謝 Keeper 提供的補充討論! ↓
How does GPL work for articles on a website?
山特▶黑暗料理之路
好吧你要說後面接了 other kinds of works.
我就先不吐槽你一定沒看 GPL 全文才會覺得可以用在 App 以外的地方了,就算真的要在文章上用 GPL 也不是不行,但——這是什麼意思?

意思是:
「只要發表在上面的文章只要就可以隨便引用,修改,再發表。」

你看你會不會被燒。
山特▶黑暗料理之路
再者,大哥,license。LICENSE。
什麼叫授權?授權的意思是:
1. 我看看你開的條件
2. 如果我接受,那我被容許使用你的服務,並且有義務服從你的遊戲規則
3. 若我不接受,我們一拍兩散
請記得,使用者有拒絕的權利。

然後現在 AO3beta 的行為是:我不經過你的意願,直接把你的文章爬下來作為免費文章在我的網站上,而且我們網站上所有免費文章強制以 GPL 發表——而一切的一切之中,並沒有經過你同意。
用膝蓋想都有問題。
山特▶黑暗料理之路
【第五:鏡像網站是什麼?為什麼對岸還有 AO3 鏡像網站的存在?】
鏡像網站可以當作一種網站的「分流」或「備份」。
顧名思義,他的特點是:他的內容應該與原網站一模一樣。就算有技術上的因素,可能會比原始網站更新的稍慢一些,那也應該要在一段時間後趕上原網站更新內容。
山特▶黑暗料理之路
鏡像網站的用途是:
1. 分流,防止一次太多人從同一個地方讀取資料,造成服務緩慢
(有玩遊戲的應該經歷過有很多分流點可以載同樣安裝包?可以理解成類似的概念)
2. 加速。比如原始檔案在美國,但跨海傳輸會比較慢,所以在台灣設了個鏡像點,你可以從台灣的資料庫直接抓到美國的檔案
(很多網路服務其實都有偷偷做類似的功能,很多軟體比如 linux 跟 python 也都有鏡像檔案存在)
3. 繞過防火牆,比如中國境內被牆的內容可以透過鏡像網站取得
(但請不要覺得只有中國有這個需求,比如學校內網,比如公司內網,其實很多地方的網路都並不完全公開的,只是你並不一定會發現)
4. 等等。有興趣自己查。
山特▶黑暗料理之路
所以為什麼對岸還有 AO3 鏡像網站,應該不需要我多說了。
山特▶黑暗料理之路
【第六:AO3beta 是 AO3 的鏡像嗎?】
不是。
鏡像,顧名思義,是像鏡子一樣,他要完全一樣
先不提他們介面差了十萬八千里,AO3beta 上有 AO3 上沒有的內容,且 AO3 上的內容也不是完全複製,他的資料庫也不是跟 AO3 共通,所以他不是鏡像。
不過他網站上提到的 AO4 確實是鏡像沒錯,而且警告也有好好標註,這點還算可取。
山特▶黑暗料理之路
關於同樣是鏡像但被我嫌惡的例子,比如之前的雨果計畫
@boxbox557 - 我針對雨果計畫的一些想法的集中樓

順帶一提雨果也正式死掉了。Bless them.
山特▶黑暗料理之路
【第七:AO3 beta 這樣爬蟲重建的行為是被 AO3 允許的嗎?】
說實話,我還沒把 AO3 的 TOS 翻完,所以我並不確定。
但就我目前看到的內容——不,我不覺得。
山特▶黑暗料理之路
根據 AO3 TOS 中的 版權抄襲 規範,我覺得 AO3 並不會允許這樣行為,畢竟 AO3 連抄襲都管,這個幾乎可以說是原封不動的「再發表」了。
但那只是 AO3 的站內守則,站內抄襲他管,像這樣搬到其他網站去的,我記得好像是需要創作者自己去進行法律程序,畢竟作者發表的內容也不屬於 AO3,他想管也沒法管。
山特▶黑暗料理之路
但個人的力量難免太過微小,我覺得比較合理的作法是:
直接諮詢 AO3 法律小組(我前面提過他們有法律小組吧?),詢問他們這樣的行為是否在 AO3 的容許範圍內
若否,諮詢他們:我們下一步比較好的做法是什麼
畢竟他們比較專業(
山特▶黑暗料理之路
【第八:所以,AO3 的 beta 網站的分辨方法是 Logo 旁邊的 beta 圖標嗎?】
Pffffff(笑)
對不起,無意冒犯,只是太可愛了,看到的時候我真的啞然失笑
山特▶黑暗料理之路
答案:不是。不是!!!

原噗有個噗友貼了【beta | AO3 】之類的連結,那個不是 beta 網站啦,那是一個用戶名剛好就是 beta 的使用者(為了不打擾他我就不重貼連結了)
山特▶黑暗料理之路
Gentlemen, AO3 的網站,一直,都有,beta 圖標啊wwwwww
不信的自己點首頁看一眼嘛
AO3 一直都沒有「正式上線」喔,具體原因其實我也不清楚?大概是因為他本意只是提供給大家一個可以用自己建立的 archive 而已,沒想到會變成社群吧?
不信的可以拉到最末看他目前的網站版本,目前是 v0.9.xxx 喔(具體忘記了)
山特▶黑暗料理之路
===========
原本試圖繼續翻 AO3 的 TOS 但我有點懶了,改天吧
應該就這樣,拉個線(
山特▶黑暗料理之路
ao3beta: 您好:我确实没有预料到 AO3beta 的人会亲自看到这篇,上方有些言论可能有点过激与涉及人身攻击,这边我想先跟您致歉。(1/4)
山特▶黑暗料理之路
我明白也支持你们有维持同人生态的权利,就我个人的看法,镜像可以留着(比如AO4),但请让他保持【镜像】,不要与其余非 AO3 用户和文章混为一谈。
另外,您发表的公开信我看了,其中有提到面对海量的作者无法一一征询意见,我的一点浅见是:您或许可以提供一个功能,让用户可以选择直接汇入他在 AO3 内的文章数据,这么一来用户在汇入文章时相当于同意了您的使用条款,同时他也保有对自己文章的绝对权力。(很老套,但安全)
当然这么一来势必不会有现在这么多的 AO3 文章资源来吸引新用户——但有能力吸引到自己的客群并让他们愿意导入资料,才是社群软件最大的卖点,不是吗?
(2/4)
山特▶黑暗料理之路
最后……嗯,我觉得 GPL 授权这部分,您真的需要再仔细检视一下,首先 AO3 的 GPL 是指他愿意开放代码供人使用或修改,并且修改者也需要公开代码,并不是代表网站上的内容是公开且可自由使用的
且,我个人认为小说文章是不应该强制履行 GPL 的,虽然我本人可以接受,但我相信绝大多数人不行,否则網路上也不会天天都有这么多抄袭争议了(笑
(3/4)
山特▶黑暗料理之路
自从你们无法访问 AO3 后,我看到了非常多志愿者的努力,说实话我很欣赏你们所有人的热忱与付出(当然有些手段令人有些……存疑),也希望你们能找到更好的解法,为你们的创作环境争取到更好的环境,加油。
(4/4)
山特▶黑暗料理之路
=
日常厭世欣
清楚明白!謝謝科普!
簡單易懂的逸董
感謝科普
司藍⭕空想飯糰
這篇太棒了,謝謝噗主!
赤楓Ꮤ🕶️🌸青椒炒花
給你摁個讚,辛苦,有心了
米芬蘭達蔥師表中毒ing
感謝科普!
Keeper
簡單說就是 AO3 GPL license 的授權範圍僅止於 AO3 這個網站服務,而不是往站上的內容。

如果對 GPL 對創作的適用範圍有興趣可以參考一下這篇討論:
How does GPL work for articles on a website?
鶴♡龍蝦潔世界可愛♡
推科普!
山特▶黑暗料理之路
感謝閱讀與留言的各位,就不一一回覆了。

赤楓Ꮤ🕶️🌸青椒炒花 : 我考完試打開噗浪時嚇到😂😂救命
Keeper : 哦哦這篇滿有參考價值的,感謝 reference!(還請借我移到上方進行補足了XD)
山特▶黑暗料理之路
Keeper 提供的那篇問答滿有意思的,姑且整理那篇討論內容給大家參考一下

【論壇問題】
(1) 網路文章可以使用 GPL 授權嗎?
(2) 如果我部落格文章使用 GPL 授權,網站也受到 GPL 約束嗎?

【下方回覆】
(1) 文章是可以使用 GPL 授權的,事實上在 2000 年以前大多都使用 GPL,但現在不建議這麼做(CC 是當前比較推薦的選擇)
(2) 不會。因為網站本身並不衍伸自 GPL 授權作品。
山特▶黑暗料理之路
其實這個問題跟我們這邊的情形恰巧相反(文章 GPL 是否代表網站 GPL v.s. 網站 GPL 是否代表文章 GPL),但反過來我覺得也是一樣的:
OTW 開放的 GPL 是他們網站的原始碼,不是使用者文章,所以使用者文章並不是 GPL 授權。
山特▶黑暗料理之路
=
載入新的回覆