Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 5:17 AM
Wed, Oct 5, 2022 5:17 AM
131
44
在討論繪圖AI是在『致敬』『抄襲』還是『學習』人類繪師的作品之前,必須把使用者要求繪圖AI執行的任務作出區隔
個人的觀察&觀點是:
。當使用者提供一張圖片讓AI以此為底算圖,AI是在抄襲該圖的構圖,並沿用該圖的配色
。當使用者提供prompt (關鍵字) 要求AI生成圖片,AI將致敬(並且有機會過度參考) 訓練資料集當中與prompt相關的最熱門作品,使用其畫風與配色產出圖像
。AI模型克服自身弱點的方法,需透過加入該主題的大量訓練資料。就像電腦的記憶體只會越來越大,商用AI模型在遭遇硬體算力限制前,只會越來越全能
。生成圖像的美或醜,訓練結果的好或壞,哪些大神的作品值得被挑來給AI學習,這些部分目前都還仰賴人類判斷。
我認為繪圖AI的現狀傳達了一個訊息,即『練習是廉價的,但審美是昂貴的』
Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 5:28 AM
AI是如何『學習』生成
這裡我用最簡單的生成模型來解釋為何AI,或說神經網路可以透過prompt指令來生成一張吸睛的圖片
事實上artificial intelligence (AI)一詞在此有些誤導,因為此類模型僅是透過機器學習工程師所設計的演算法,執行被規定好的任務
依我的觀點,當一組程式能自動自發地主動『創作』作品,內部設計存在這種驅力,才比較接近真正『人工智能』
目前我們接觸的繪圖生成服務都還只是『產圖機』而已
解碼&編碼
當一個人決定開始學畫,他會做兩件事情:理解一幅畫由哪些元素構成+練習那些元素
比方說,瑟瑟是流量密碼,於是他開始研究什麼樣的構圖與服裝才夠色。某某大神的配色和筆觸非常美,於是他開始練習大神配色的邏輯,筆觸的運用
『研究』的部分我們可稱之為解碼,而『練習』稱之編碼
Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 5:40 AM
一個簡單的生成模型便是由這兩個部分組成:解碼器(decoder)與編碼器(encoder)
解碼器想達成的任務是找出訓練資料中的『模式』,以臨摹畫風為例,人類繪師會試圖從多幅畫作中找到共通的規則,更甚而之,所有的繪圖教學也是在教導學生系統化地吸收這些規則
換言之,人類早就認知到『美』與一些既定的規則有關
然而模型自資料中找出的模式與規則,並無法用人類語言表達,因此工程師需要再接上一個編碼器,才能運用這些大神們的經驗和精華來作畫
這個編碼器便是繪圖AI之於使用者的靈魂部位——你所寫下的prompt必須通過編碼器才能生成那一幅幅圖像
而編碼器所能駕馭的風格、運用關鍵字的傾向,則是解碼器透過大量資料訓練所產生的結果
Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 5:51 AM
所以AI到底有沒有在學畫?
這就端看我們對學畫的定義是什麼,目前圖像生成模型的手畫不好,機器學習工程師可能就會搜集一大堆手的圖像,讓編碼器可以針對這個主題產生更多種『畫手的模式』
而在訓練過程中,工程師會設計一套「讓模型了解自己畫得好不好」的演算法
這個演算法是什麼呢?最最簡單的方式就類似於「要求AI描圖」。只要畫出來的圖跟訓練集裡的手很像就成功了,越像就給越高分
這也是為何繪圖AI的生成品往往能看出它「過分參考」哪位畫家的作品,因為訓練模型就是這樣設計的
但若每次給一樣的prompt都會得到完全相同的畫作,那也不有趣,因此這類生成模型都會加入一些雜訊(noise)。事實上神經網路本身就有隨機性,使用者可以透過seed來改動random number generator的輸出,並對生成結果造成影響
Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 6:05 AM
Wed, Oct 5, 2022 6:12 AM
繪圖AI的學習過程,事實上是在找出訓練資料中的共通模式,至於哪些圖像會被歸類成同一主題,好讓解碼器去抓模式,這也往往需要另外的模型去上tag。在生成完畢後,圖像是否會令使用者滿意,通常也需要一組人類專家來對其生成結果做仔細評分
說到底,一個繪圖AI擅長什麼主題,背後對於美圖與醜圖的邏輯為何,都是經營這個模型的團隊在設計
只是他們無法像繪圖老師一樣用人類的語言告訴大家「Midjourney就是這樣這樣畫」,繪圖AI用數字而非語言把眾多圖像中的構成元素紀錄下來,然後使用者透過關鍵字觸發編碼器,讓它將解碼器紀錄的規則挑選+組合之後,用圖像的形式呈現出來
於是你就得到一張自動生成的圖了!
Uniparity@創作mod
@j35234
Wed, Oct 5, 2022 6:09 AM
但是這張圖你滿不滿意,除了AI不要畫出六根手指四隻腿之外,還有更多的條件
而這些條件構成了屬於你的
審美
,也是所有繪圖AI訓練過程中最昂貴的部分
『判斷』之所以昂貴,是因為人腦中的解碼器包含了你畢生的所見所聞
沒有任何一個模型能達到這種程度
也許等它實現的那一天,我們才會接觸到真正的AI人工智能
綾瀬亞夜@FF44六B07
@Aya_Ayase
Wed, Oct 5, 2022 7:06 AM
其實,總歸來說,AI只是工具。工具沒有人格,所以自然不存在抄襲、學習、致敬之類的事。AI透過運算的方式畫圖,就像是計算函數一樣,給定的變數如果相同,那麼輸出的結果就相同。因為輸出結果受到輸入變數的影響很大,所以人們覺得是抄襲,但實際上,AI只是遵循著設計時的演算法加以運算而已,並沒有屬於自己的人格,當然也就不存在抄襲。
隨著運算次數增加,AI的運算結果逐漸令人滿意,這或許被人們視為「學習」。然而並非如此,AI在尚未建立資料庫以前,只能從現有的變數去做計算,未知的部分只能透過隨機數的方式處理。當資料累積越來越多,AI會逐漸去定義各種變數的意義,產生類似於「學習」的樣貌,但實際上,利用同樣的方法一樣可以把AI給「矯正」回來,這過程依然取決於用戶而不是AI自身。
綾瀬亞夜@FF44六B07
@Aya_Ayase
Wed, Oct 5, 2022 7:07 AM
就像是你給Photoshop安裝新筆刷,並不會說Photoshop學會新的畫法一樣。它只是追加了新的資料庫而已。AI的所謂學習實際上就類似於新增資料庫這種原理,因此意思是一樣的。
綾瀬亞夜@FF44六B07
@Aya_Ayase
Wed, Oct 5, 2022 7:08 AM
總結來說,用戶用Photoshop畫一張圖,說是致敬,卻被人嗆抄襲的情況,矛頭指向的仍是用戶而不是Photoshop本身。今天,把Photoshop換成AI,整個命題依然成立,因此有問題的還是用戶而不是軟體本身。
Uniparity@創作mod
@j35234
Sun, Oct 9, 2022 11:49 PM
綾瀬亞夜@FF44六B07
: 針對「抄襲」我個人的觀點是這麼分析
在法理上可以把抄襲分成兩個部分,一是「主觀犯意」,這個產生作品的人有沒有侵犯他人財產權的意圖;二是「客觀事實」,這個作品是否跟先前有版權的作品有過高的相似度,有沒有因為這個相似度而取得利益的事實
關於第一點,AI當然無法擁有犯意,但是營運AI的團隊若使用了無授權的訓練資料,甚至刻意將模型訓練成與既有的版權作品有高度相似度,提告者就可依此主張訓練AI的法人或自然人有侵權、牟利的意圖
至於第二點,一個訓練不佳的繪圖AI很容易產生構圖照抄的成品,如果今天用量化的方式來評斷A圖與B圖是否有過高相似度,以此來決議B圖是否抄襲A圖,那無論是描圖的繪師還是受限於模型限制的AI,都會被歸類於抄襲
注意這邊是以圖本身來討論,而非誰產生了這張圖
載入新的回覆
個人的觀察&觀點是:
。當使用者提供一張圖片讓AI以此為底算圖,AI是在抄襲該圖的構圖,並沿用該圖的配色
。當使用者提供prompt (關鍵字) 要求AI生成圖片,AI將致敬(並且有機會過度參考) 訓練資料集當中與prompt相關的最熱門作品,使用其畫風與配色產出圖像
。AI模型克服自身弱點的方法,需透過加入該主題的大量訓練資料。就像電腦的記憶體只會越來越大,商用AI模型在遭遇硬體算力限制前,只會越來越全能
。生成圖像的美或醜,訓練結果的好或壞,哪些大神的作品值得被挑來給AI學習,這些部分目前都還仰賴人類判斷。
我認為繪圖AI的現狀傳達了一個訊息,即『練習是廉價的,但審美是昂貴的』
這裡我用最簡單的生成模型來解釋為何AI,或說神經網路可以透過prompt指令來生成一張吸睛的圖片
事實上artificial intelligence (AI)一詞在此有些誤導,因為此類模型僅是透過機器學習工程師所設計的演算法,執行被規定好的任務
依我的觀點,當一組程式能自動自發地主動『創作』作品,內部設計存在這種驅力,才比較接近真正『人工智能』
目前我們接觸的繪圖生成服務都還只是『產圖機』而已
解碼&編碼
當一個人決定開始學畫,他會做兩件事情:理解一幅畫由哪些元素構成+練習那些元素
比方說,瑟瑟是流量密碼,於是他開始研究什麼樣的構圖與服裝才夠色。某某大神的配色和筆觸非常美,於是他開始練習大神配色的邏輯,筆觸的運用
『研究』的部分我們可稱之為解碼,而『練習』稱之編碼
解碼器想達成的任務是找出訓練資料中的『模式』,以臨摹畫風為例,人類繪師會試圖從多幅畫作中找到共通的規則,更甚而之,所有的繪圖教學也是在教導學生系統化地吸收這些規則
換言之,人類早就認知到『美』與一些既定的規則有關
然而模型自資料中找出的模式與規則,並無法用人類語言表達,因此工程師需要再接上一個編碼器,才能運用這些大神們的經驗和精華來作畫
這個編碼器便是繪圖AI之於使用者的靈魂部位——你所寫下的prompt必須通過編碼器才能生成那一幅幅圖像
而編碼器所能駕馭的風格、運用關鍵字的傾向,則是解碼器透過大量資料訓練所產生的結果
這就端看我們對學畫的定義是什麼,目前圖像生成模型的手畫不好,機器學習工程師可能就會搜集一大堆手的圖像,讓編碼器可以針對這個主題產生更多種『畫手的模式』
而在訓練過程中,工程師會設計一套「讓模型了解自己畫得好不好」的演算法
這個演算法是什麼呢?最最簡單的方式就類似於「要求AI描圖」。只要畫出來的圖跟訓練集裡的手很像就成功了,越像就給越高分
這也是為何繪圖AI的生成品往往能看出它「過分參考」哪位畫家的作品,因為訓練模型就是這樣設計的
但若每次給一樣的prompt都會得到完全相同的畫作,那也不有趣,因此這類生成模型都會加入一些雜訊(noise)。事實上神經網路本身就有隨機性,使用者可以透過seed來改動random number generator的輸出,並對生成結果造成影響
說到底,一個繪圖AI擅長什麼主題,背後對於美圖與醜圖的邏輯為何,都是經營這個模型的團隊在設計
只是他們無法像繪圖老師一樣用人類的語言告訴大家「Midjourney就是這樣這樣畫」,繪圖AI用數字而非語言把眾多圖像中的構成元素紀錄下來,然後使用者透過關鍵字觸發編碼器,讓它將解碼器紀錄的規則挑選+組合之後,用圖像的形式呈現出來
於是你就得到一張自動生成的圖了!
而這些條件構成了屬於你的審美,也是所有繪圖AI訓練過程中最昂貴的部分
『判斷』之所以昂貴,是因為人腦中的解碼器包含了你畢生的所見所聞
沒有任何一個模型能達到這種程度
也許等它實現的那一天,我們才會接觸到真正的AI人工智能
隨著運算次數增加,AI的運算結果逐漸令人滿意,這或許被人們視為「學習」。然而並非如此,AI在尚未建立資料庫以前,只能從現有的變數去做計算,未知的部分只能透過隨機數的方式處理。當資料累積越來越多,AI會逐漸去定義各種變數的意義,產生類似於「學習」的樣貌,但實際上,利用同樣的方法一樣可以把AI給「矯正」回來,這過程依然取決於用戶而不是AI自身。
在法理上可以把抄襲分成兩個部分,一是「主觀犯意」,這個產生作品的人有沒有侵犯他人財產權的意圖;二是「客觀事實」,這個作品是否跟先前有版權的作品有過高的相似度,有沒有因為這個相似度而取得利益的事實
關於第一點,AI當然無法擁有犯意,但是營運AI的團隊若使用了無授權的訓練資料,甚至刻意將模型訓練成與既有的版權作品有高度相似度,提告者就可依此主張訓練AI的法人或自然人有侵權、牟利的意圖
至於第二點,一個訓練不佳的繪圖AI很容易產生構圖照抄的成品,如果今天用量化的方式來評斷A圖與B圖是否有過高相似度,以此來決議B圖是否抄襲A圖,那無論是描圖的繪師還是受限於模型限制的AI,都會被歸類於抄襲
注意這邊是以圖本身來討論,而非誰產生了這張圖