Midjourney:有如畫家的人工智慧藝術
今年五月,全世界研究人工智慧的學者和藝術家,紛紛都為一個能夠生成細膩作品的人工智慧感到驚艷,這個服務稱為 Midjourney。使用 Midjourney 完全不需要具備任何電腦科學或是藝術創作的深厚背景知識。只需要輸入一段文字,接下來等待 Midjourney 的人工智慧算圖即可。
令所有人最訝異的是,Midjourney 和之前的生成式藝術 AI
所產生的作品並不相同,Midjourney
不但能夠某種程度地消化自然語言的含意,甚至會加入某些「合理化的情境」,看起來就像是非常資深的畫家,在理解了作畫目的之後,所畫出來「有意識」的作品。而且速度相當快,1
分多鐘就可以生成使用者想要的作品。
人工智慧將取代藝術家?
其實人工智慧嘗試藝術創作並非新點子,早在 2018 年,法國藝術家聯盟「Obvious」,便撰寫了演算法,生成名為《艾德蒙・德・貝拉米》(Edmond de Belamy)的作品。Obvious團隊在線上藝術百科 WikiArt 上蒐集了15,000幅14世紀到19世紀的圖像,並輸入到 GAN(Generative Adversarial Network,生成對抗網路) 中進行計算。總共創造了11幅作品,其中有一幅甚至在佳士得拍賣會上,以一萬歐元的價格賣出。但此時的畫作品質還非常粗糙,也屬於模仿風格的程度,並不能選定特定主題。
美國羅格斯大學(Rutgers University)的 Ahmed Elgammal 教授也設計了 AICAN(AI Creative Adversarial Network,創造性對抗網路)來產生全新的創作。和之前使用 GAN 的做法不同,AICAN學習了藝術史中的所有風格,消化之後生成一個全新的風格。
2021 年,一家名為 Wombo 的新創公司,推出了名為「DREAM」的 APP。這款 APP 能夠讓使用者輸入特定的關鍵字,接著選定風格,大約30秒左右的時間就能生成一張唯一的畫作。即便再次輸入同樣的關鍵字和風格,也不會出現一樣的結果。此時的作品意境還相當抽象,還是可以看得出並非人類畫家的作品。
用自然語言理解藝術風格的人工智慧
雖然使用類神經網路可以生成各種風格的畫作,但還是與人類進行創作的方式有所出入。2021 年,NVIDIA 發表了GauGAN2,輸入關於天候、風景的字眼,就能夠產生一幅極為逼真的風景畫。GauGAN2 是史上第一個在單一對抗生成網路(Generative Adversarial Network,GAN)運算中,加入文字語意識別的人工智慧。訓練過程中,使用了1千萬張高品質的風景圖片,甚至也能調整風格,畫出超現實或是栩栩如生的風景。
2022 年 4 月 ,藝術家 Somnai 用 CLIP 人工智慧圖像生成技術,在 Google Colab 上發表了名為 Disco Diffusion 的專題,使用者即便沒有高級的算圖設備,也能使用 AI 進行繪畫。 Disco Diffusion 可以將輸入的語句,拆分成繪畫風格、內容、畫家敘述、渲染方式、顏色五個面向來理解。得到相當細膩的結果
做出Disco Diffusion 的 Somnai 也參與了 Midjourney 專案,試圖讓 AI 理解敘述需求中的整體邏輯,讓作品看起來更具「人味」。目前 Midjourney 還是 beta 專案,作畫能力不斷變強大的同時,也不禁讓人訝異人類在藝術上的追求,能夠如此浩瀚多變。