一發布就失望?Stable Diffusion 3有什麼大問題

娛樂頭條 9970℃

前不久,stabilityai發布了開源的stablediffusion 3medium,讓各大探索ai的網友們興奮不已,畢竟sd1.5、sdxl的發布已經帶來了很多震撼,這次的sd3更是期待拉滿,很多網友都在開源的第一時間去下載,然而體驗似乎並沒有stabilityai所說的那麼神。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

在一開始的宣傳中,stabilityai表示sd3已經能生成文字,但目前只能生成英文,中文還無法識別,而且最重要的是,sd3似乎在人物生成上開了倒車,對於人畫像的生成,sd3經常產出畸形的人物形態,特別是人的四肢、手腳方面的錯誤,整體體驗還不如上一代模型。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

也就是說,只要不生成人物的四肢,sd3模型在局部畫面上的表現還是很精緻的,在物品和動物的生成上,sd3也基本沒有什麼問題,對於複雜的長提示詞也有著很高的識別率,但是就是畫不好四肢健全的人類,在這方面反而退化了一般,引起了很多人的不解。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

國外論壇reddit用戶則分析稱,表示sd3的人體四肢理解錯誤,是因為在訓練時,開發者過多干預內容,設置過濾限制級內容,而且通過的條件非常苛刻,從而導致ai識別錯誤,一些正常的圖片也因此被識別為限制級內容,因此在公開的sd3模型中,人體的效果因為訓練不足而導致畸形。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

這就解釋了,為什麼sd3並未翻起很大風浪,因為除了會識別英文外,最主要的人體識別反而開了倒車,原本在解決手部問題,這下子演變成了還要解決四肢的問題,需要很長的提示詞去修復,但對於非人類,sd3的效果還是出奇的好,細節都很到位,也遵循物理規則,可惜這一版本並不完美。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

當然這也許和stabilityai陷入困境有關,在此之前,公司財務狀況並不佳,且ceo辭職,曾經的主要成員也離開,加上裁員風波,如今能推出sd3也是不容易,更有網友表示公司內部混亂,如今不成熟的sd3就是證明,但終究它還是推出了,並且開源了,這都遵守了之前的承諾,也許只是單純的出錯了呢?(圖為stablediffusion 3 模型架構)

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

但這也只是個中杯的sd3,也就是說後續還有大杯和小杯的推出,也許要經歷過這次問題後,stabilityai會對訓練數據進行修改,完善出更好的sd3也說不定,而且現在也有sd1.5與sdxl的在持續創作與使用,如果修改後的sd3能在sdxl的基礎上再進步,那就值得讚賞,當然sd3如果支持其他語言的理解那就更好了

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

目前sd3模型還暫時只支持comfyui,想要體驗的網友可以下載comfyui進行嘗試,雖然sd3開源的為中杯版本,但對於顯卡的要求,還是比較推薦大顯存會更好,因此我們推薦使用影馳rtx4070 ti super星曜oc顯卡。

一發布就失望?Stable Diffusion 3有什麼大問題 - 陸劇吧

影馳rtx4070 ti super星曜oc顯卡,相比於4070ti,顯存上為更大的16gbgddr6x,並且核心性能也得到了加強,無論是ai創作者還是遊戲玩家,都能感受到明顯的提升,同時16gb顯存也是非常適合ai軟體運行,是一款不容錯過的高性能大顯存的顯卡,如果你對這張顯卡感興趣,歡迎前往影馳官方商城挑選~

(8801617)

標籤: 娛樂頭條