🌈AkiRa
nijijourney
研究筆記
https://images.plurk.com/1LRUbcdnEakRSIJ8OQG6YU.jpg https://images.plurk.com/5LBNZQqLHKzRIrsebIYNYq.jpg https://images.plurk.com/UEcNu51kzXdA9xo3P4ph5.jpg
主題是:如何養自己的帳號。
先聲明,很多養成方式涉及使用者自己的直覺體感甚至玄學,官方在很多方面並沒有明確解釋他們的運作方式,並且Ai學習形同在黑盒子中。
並非教學,不會提供提詞。
本文禁回應免得亂。
🌈AkiRa
A.整理一下一些老使用者公認或者官方承認過的點。
1.越靠前的提詞影響力越大
2.應該要減少贅字
3.什麼masterpiece, 或是SD會用的符號都只是安慰效果
4.雖然有時候敘述句會有用,但結果多半會變得不受控制
5.給予生成的圖評分很重要
🌈AkiRa
B. 我個人推測或是有感的,其他也有人有感。
1.Ai會記錄使用者的評分,還會把那些圖當作重要參考對象,因此在一個帳號中,如果持續畫一些主題,會型塑Ai的傾向,但如果畫了別的東西,或是版本更新,很可能會稍微偏移。
2.所有使用者也有共享的偏好,Ai並非只有在網路圖片或什麼資料庫上學習,它學習的很多是全部的使用者,可能會有些汙染災害,比如說某個時間點,女孩貓咪不知道為何就跟櫻花連結在一起。
3. 一種東西畫太多,它會固化那組提詞,造成鬼打牆。
🌈AkiRa
C.AI生成圖像的組成在niji之中包含
1.核心版本跟模組,模組可以理解為智能濾鏡。
2.使用者的提詞
3.擲骰與主觀選擇
🌈AkiRa
個人研判nijijourney的核心模組是附加在Midjourney上面,對於各種圖像的理解與呈現來自Mj資料庫(mj資料庫也有更多日式內容),Nj則是有強化一些所謂anime風格的理解,以及日式主題(二次元審美以及服裝街景)
這造成一些現象比如說想要京劇但你會得到藝妓之類的,想要戰士會給你武士,想要台灣街道也很日本等問題。
🌈AkiRa
D.條列個人過往的嘗試
發現Ai會記錄使用者之前很常亂畫亂用,但後來還是有若干主題是我比較愛畫的。
1.背景是台灣的人物肖像
因為累積的圖不少所以很容易叫出來類似的背景
2.泛亞洲風格、東西折衷的服裝設計。
🌈AkiRa
3.貓
4.金屬工藝
🌈AkiRa
5.抽象現代風景畫
🌈AkiRa
E.總結一下策略
1.將提詞分成三個部份

類型(design, painting, photo, )/ 主體 (boy, girl,)/ 風格提詞,標籤用提詞
🌈AkiRa
2. 類型的訓練方式: design我長期都只會選背景白色的圖,並且動作跟骨架都其次
🌈AkiRa
https://images.plurk.com/5OTvbcCPjtpZAhzd73I1UO.jpg https://images.plurk.com/HKPFNXiZfMwdYC3k4DKmY.jpg https://images.plurk.com/6FgrzprfLZZx5KpRpLt27e.jpg https://images.plurk.com/5U6atimHFzIua77qIzdjDj.jpg
🌈AkiRa
偶而還是會送背景,但我都會有意避免
🌈AkiRa
painting
https://images.plurk.com/15vOGRbkPolw36Eh0qtp2A.jpg https://images.plurk.com/4UNSmslw2oCMSSeUIDB9or.jpg https://images.plurk.com/3nQeZErkRNQIpbFA5xSlDP.jpg https://images.plurk.com/4qwEghZRCoWjsJ8qx4joMx.jpg
🌈AkiRa
3.主體最多兩人或人跟貓或窗戶跟貓
🌈AkiRa
3.風格提詞
之前有介紹過例如core的用法
🌈AkiRa
或是一些形容詞
🌈AkiRa
4.標籤用提詞
比如說範例這組,我有用一個一直以來都愛用的詞
台南神農街
🌈AkiRa
https://images.plurk.com/39VkpGg4dyG0DicgsBBMpo.jpg 例如以前的這張
🌈AkiRa
F.移除標籤詞

design母圖(關鍵字進去直接出現的結果)
https://images.plurk.com/1SRAgbfLZ9yo5cJCIFHCHt.jpg
東方元素跟背景都沒有了,可以看到四張都是白底站姿並且兩者衣服有差異,算是訓練有成了。
🌈AkiRa
painting
https://images.plurk.com/6PnrOz4ftFk6PKU3TGgr6J.jpg
🌈AkiRa
5.置入別的標籤詞比如說我剛使用過的抽象背景
🌈AkiRa
https://images.plurk.com/7bHamS2Lwt1rnuji4Ntif.jpg https://images.plurk.com/5IkS5AeMHk5t9P6kP2nlmv.jpg https://images.plurk.com/uhiDRGU5NsgRjWn1ld1ZY.jpg
🌈AkiRa
因為這組詞訓練了很多不同場景並且以場景表現為主,主體就會產生干擾,比如說不是惡魔雙胞胎了(主體使用的提詞)
而是雙胞胎與惡魔,或是兩個主體一個人一個惡魔。
AI對主體的認知上,曾經堅持什麼都畫妹子,現在似乎在摸索人類真正的需求,但又會想太多。
🌈AkiRa
補充:
為何我會把design, painting放在最前面,因為我覺得Ai最先思考的是構圖,如果要設計稿它就會先來個底色,
如果要求繪畫場景它就會先出來透視圖的部份
🌈AkiRa
G.避免汙染
結構稍微改過之後,出現了比較BL的畫面。
我用的是 twin, 並非two, 也不是lovers,
所以雖然畫面很不錯,我忍不住放大了,還是要適可而止
https://images.plurk.com/5KTsl5RRgTmRQR5yAPp41D.jpg https://images.plurk.com/3h3OTPVyawP3MGSNKcPXbP.jpg 本來只是這樣我覺得ok
https://images.plurk.com/LDkPr4rBtuaDo6S65kN5R.jpg https://images.plurk.com/3mCGyjlffbs2A4y1wQM5gS.jpg https://images.plurk.com/3pec1qWUmoPpsaIXKy82LH.jpg 結果很快就醬醬釀釀了
不承認是我的帳號裡面有雜訊
🌈AkiRa
Ai表示:骨科了解一下
🌈AkiRa
H. 雖然可以使用其他AI來提詞,但我覺得並沒有很好。
當然,我在懶得思考的時候也會用一下,比如說忽然有個想法想生一張圖,而並非長期研究,或是某些非正式委託,但其實越短的詞AI表現越好,而且某個詞下如果有很多雜七雜八的圖,也會汙染自己的資料庫。
比如design, 我為了讓它一個字就產生影響力,我不會有很多一長串的提詞裡面一堆design, 或是畫painting時用design。
🌈AkiRa
每個詞都最好珍惜使用
🌈AkiRa
I.並非不願意分享提詞
1.假設某個提詞跟了我很久,它會從公用的風格提詞,偏移到標籤提詞,所以我用起來的效果跟他人是不同的。複製貼這種不良習慣至少在mj nj使用者上,會有長久的傷害,因為他可能會都是雜質,也可能無法洗經伐髓。
2.Mj已經有在統整歸納一些風格元素,所以你如果要走捷徑,就應該用官方默默統整的詞。
比如說core字根的提詞
3./describe 功能可以告訴你,他們怎麼分析一張圖,所以與其伸手拿別人在自己帳號玩爛的,不然看看官方怎麼判斷,以及你自己的習慣。
🌈AkiRa
J.沒有實踐操作過SD
不過我看了一些基礎的教學,稍微了解邏輯。
(名詞有點忘記了,沒空去查,以下為懂的人懂就好了)
🌈AkiRa
以下描述為本人體感:
1.mj nj的提詞的使用狀態,跟SD訓練也要綁定提詞有點相似,只是它是在使用中訓練,有時骰到一個地步會有整體很不錯,但是細節開始劣化的狀態。
我自己來形容,它似乎是疲勞了。
這時候要重新在放一次字,你會發現很多你之前放大過的構圖在裡面重組。
解析度也會回來。
🌈AkiRa
2.不熟的提詞,尤其自己想的,容易出現雜訊區塊,反之使用core會減少雜訊,在1的訓練之中的過程也會快很多。
🌈AkiRa
3.自己訓練久的詞,如果比較獨特,就會維持自己的特色,類似自己訓練的SD(L開頭那個啥),但無法固定,也無法分享給別人。
優點是它會無縫自己進步,不會因為版本更新而不能用。
🌈AkiRa
所以我個人將來的策略,會把之前練熟的詞,加一點有辨識度的提詞,讓它繼續保持,減少被污染。
不過我認為主體是不需要去自我訓練的,尤其是人類的動作跟表情,官方更新很容易覆蓋掉,甚至訓練這些反而會影響情境的多變程度。(所以我只有在design的訓練中避免過度有戲的肢體動作)
🌈AkiRa
K.一些實際範例
1.剛才算twin boy時,加入抽象背景的標籤提詞,就開始出現超出雙胞胎範疇的曖昧互動。
原因是painting我偏向讓它有更多的「情境」,並且design基本不會假上抽象背景的標籤提詞,所以AI的「自由小劇場」就出來了。
nj跟mj都在努力增加這種戲劇效果或是故事性,而放棄比較多骨架跟完美構圖,這點它十分有企圖心,所以它現在不如有controlnet的SD還要好控制,遭到一些人詬病,甚至有人覺得它將被淘汰。
但我個人認為這是不同的策略,他走的是便捷跟簡易性,並且很可能會從記錄使用者到形塑使用者,不需在電腦前,不需安裝東安裝西很方便,使用者累積的記錄也會讓他們不想輕易離開。
🌈AkiRa
https://images.plurk.com/6H14HtaCmOqbOZxNaoIZ6c.jpg https://images.plurk.com/2amw3TWzZfTShi9doJMWro.jpg https://images.plurk.com/6391olrZaoL8TE2YUE2RPb.jpg
喜歡nj的使用者,可能會向我一樣,並不排斥不受控制之處。
但我現在有意識地避免汙染,於是我把走偏的提詞全部複製,只把twin 改成two,結果影響不大,他們可以繼續搞曖昧,但不會繼續汙染主體的「twin boy」這個提詞。
🌈AkiRa
2.為了進一步佐證,我找了自己以前算過不少,但還沒有特別有結構的用詞的舊圖新算看看
https://images.plurk.com/2NTFcd38nvGsCaeAcDTmRr.jpg
🌈AkiRa
除了細節更多,它並沒有完全變成陌生的東西(當初這組要算出詭異感也花了蠻久的)
🌈AkiRa
3.抽象背景+台南神農街兩個標籤提詞的融合測試
🌈AkiRa
https://images.plurk.com/2g2lroQqkBzrIm6QJKUb7t.jpg
第一組母圖傾向抽象背景的標籤詞因為它在前面
🌈AkiRa
https://images.plurk.com/1o2qwbmj2DuFXhTeitxpne.jpg
擲骰後偏後面那組標籤但有「照片化」傾向
🌈AkiRa
https://images.plurk.com/5rLfTMXKAGm7j1CyKC7iLd.jpg
稍微訓練一下,融合的效果比有人物的明顯
🌈AkiRa
補充一點,前面的惡魔雙胞胎範例並沒有使用背景標籤,因為它主要影響的是筆觸,但有使用神農街
🌈AkiRa
神農街當時是人物、服裝跟背景一起訓練的,花費很多GPU(當時內測免費)
🌈AkiRa
4.關於新提詞會有照片化、高斯模糊化的原因,我認為是因為新的提詞組合會需要mj的照片資料庫,去思考那個場景是如何,然後niji的智能濾鏡再去補完。
期間會耗費比較多GPU。
🌈AkiRa
個人認為mj的gpu先使用後,niji的濾鏡就會變得比較草率一點,所以變成照片化。
或是提詞被mj拿去解讀所以就不是anime的質感。
🌈AkiRa
AI生成紋也會變多。
載入新的回覆