
另一種功能。
AI 作畫又有了新的風向。
最近,來自慕尼黑大學的研究者與多方機構(gòu)合作,共同推出了一款名為 "Stable Diffusion" 的文本轉(zhuǎn)圖像模型,能夠在消費級 CPU 上運行,且圖片無需任何預(yù)處理。目前該模型代碼已經(jīng)開源,任何人都可自行下載并運行這個程序。

一幅由 Stable Diffusion 自動生成的圖片
只需等待數(shù)秒鐘,程序便可根據(jù)給出的文本自動生成圖片,且允許免費商用。由于開源、生成時間短、圖片精美等原因,讓 Stable Diffusion 連同 AI 作畫再次成為了網(wǎng)友們熱議的話題。
而除了使用最廣也最流行的 " 文本作畫 " 功能外,不少人也開始在這個程序中開發(fā)更多的新玩法。
比如一位 ID 為 "frigis9" 的用戶就在國外論壇上發(fā)布了一則關(guān)于 " 像素高清化 " 的帖子,介紹了他是如何通過 AI 技術(shù)將過去經(jīng)典的像素游戲畫面轉(zhuǎn)變?yōu)楦咔鍒D畫的。


他選用的素材是曾在 MS-DOS 平臺上非常經(jīng)典的《基恩指揮官 6》與《猴島小英雄》,通過 AI 的處理后,可以看到原本較為粗糙且清晰度不高的游戲畫面被渲染成了高清且更加真實的圖片。
實現(xiàn)這樣的效果,依靠的是模型中一種名為 "img2img"(圖像到圖像)的功能,和常見的 AI 作畫不同,除了文本以外,它還允許用戶提前給定一幅圖片,系統(tǒng)最終會根據(jù)用戶文本,在已有圖片的基礎(chǔ)上生成新的畫面。
除了前面提到的兩款經(jīng)典 DOS 游戲外,frigis9 還發(fā)布了通過 AI 升級后的多幅像素圖畫,比如來自《星球大戰(zhàn):黑暗原力》的角色凱爾 · 卡塔恩,原有的像素畫面在經(jīng)過 AI 處理后,變成了更接近真人的圖片:

不過雖然看上去非常智能,但為了能夠讓 AI 準確地還原畫面,這項技術(shù)目前依舊需要人工的干預(yù)。frigis9 就在帖子中坦白為了得到觀感更好的圖片,他需要在軟件中調(diào)整多方面參數(shù),并且不斷更換關(guān)鍵詞的描述,前后經(jīng)過了近百次的微調(diào),才最終得出了理想的還原圖。
就拿《基恩指揮官》的像素圖片來說,如果你只是簡單在文本框中輸入 "a helmet holding a laser gun"(帶頭盔的人拿著一把激光槍)而沒有做更多微調(diào)和細節(jié)描述,那么最終生成的圖片很可能讓人哭笑不得:
原文地址:http://www.myzaker.com/article/63161c73b15ec02e6c591598






川公網(wǎng)安備51012402001058號