2022 .06 .13 By Infinities

Midjourney：有如畫家的人工智慧藝術

今年五月，全世界研究人工智慧的學者和藝術家，紛紛都為一個能夠生成細膩作品的人工智慧感到驚艷，這個服務稱為 Midjourney。使用 Midjourney 完全不需要具備任何電腦科學或是藝術創作的深厚背景知識。只需要輸入一段文字，接下來等待 Midjourney 的人工智慧算圖即可。

令所有人最訝異的是，Midjourney 和之前的生成式藝術 AI 所產生的作品並不相同，Midjourney 不但能夠某種程度地消化自然語言的含意，甚至會加入某些「合理化的情境」，看起來就像是非常資深的畫家，在理解了作畫目的之後，所畫出來「有意識」的作品。而且速度相當快，1 分多鐘就可以生成使用者想要的作品。

人工智慧將取代藝術家？

其實人工智慧嘗試藝術創作並非新點子，早在 2018 年，法國藝術家聯盟「Obvious」，便撰寫了演算法，生成名為《艾德蒙・德・貝拉米》（Edmond de Belamy）的作品。Obvious團隊在線上藝術百科 WikiArt 上蒐集了15,000幅14世紀到19世紀的圖像，並輸入到 GAN（Generative Adversarial Network，生成對抗網路）中進行計算。總共創造了11幅作品，其中有一幅甚至在佳士得拍賣會上，以一萬歐元的價格賣出。但此時的畫作品質還非常粗糙，也屬於模仿風格的程度，並不能選定特定主題。

有如畫家的人工智慧藝術

美國羅格斯大學（Rutgers University）的 Ahmed Elgammal 教授也設計了 AICAN（AI Creative Adversarial Network，創造性對抗網路）來產生全新的創作。和之前使用 GAN 的做法不同，AICAN學習了藝術史中的所有風格，消化之後生成一個全新的風格。

2021 年，一家名為 Wombo 的新創公司，推出了名為「DREAM」的 APP。這款 APP 能夠讓使用者輸入特定的關鍵字，接著選定風格，大約30秒左右的時間就能生成一張唯一的畫作。即便再次輸入同樣的關鍵字和風格，也不會出現一樣的結果。此時的作品意境還相當抽象，還是可以看得出並非人類畫家的作品。

DREAM

用自然語言理解藝術風格的人工智慧

雖然使用類神經網路可以生成各種風格的畫作，但還是與人類進行創作的方式有所出入。2021 年，NVIDIA 發表了GauGAN2，輸入關於天候、風景的字眼，就能夠產生一幅極為逼真的風景畫。GauGAN2 是史上第一個在單一對抗生成網路（Generative Adversarial Network，GAN）運算中，加入文字語意識別的人工智慧。訓練過程中，使用了1千萬張高品質的風景圖片，甚至也能調整風格，畫出超現實或是栩栩如生的風景。

用自然語言理解藝術風格的人工智慧

2022 年 4 月，藝術家 Somnai 用 CLIP 人工智慧圖像生成技術，在 Google Colab 上發表了名為 Disco Diffusion 的專題，使用者即便沒有高級的算圖設備，也能使用 AI 進行繪畫。 Disco Diffusion 可以將輸入的語句，拆分成繪畫風格、內容、畫家敘述、渲染方式、顏色五個面向來理解。得到相當細膩的結果

Midjourney