你瀏覽的是我們在Google的加速版網頁,你可以點選Logo回到主網站取得更多的資訊

Midjourney:有如畫家的人工智慧藝術

今年五月,全世界研究人工智慧的學者和藝術家,紛紛都為一個能夠生成細膩作品的人工智慧感到驚艷,這個服務稱為 Midjourney。使用 Midjourney 完全不需要具備任何電腦科學或是藝術創作的深厚背景知識。只需要輸入一段文字,接下來等待 Midjourney 的人工智慧算圖即可。

令所有人最訝異的是,Midjourney 和之前的生成式藝術 AI 所產生的作品並不相同,Midjourney 不但能夠某種程度地消化自然語言的含意,甚至會加入某些「合理化的情境」,看起來就像是非常資深的畫家,在理解了作畫目的之後,所畫出來「有意識」的作品。而且速度相當快,1 分多鐘就可以生成使用者想要的作品。


人工智慧將取代藝術家?


其實人工智慧嘗試藝術創作並非新點子,早在 2018 年,法國藝術家聯盟「Obvious」,便撰寫了演算法,生成名為《艾德蒙・德・貝拉米》(Edmond de Belamy)的作品。Obvious團隊在線上藝術百科 WikiArt 上蒐集了15,000幅14世紀到19世紀的圖像,並輸入到 GAN(Generative Adversarial Network,生成對抗網路) 中進行計算。總共創造了11幅作品,其中有一幅甚至在佳士得拍賣會上,以一萬歐元的價格賣出。但此時的畫作品質還非常粗糙,也屬於模仿風格的程度,並不能選定特定主題。




美國羅格斯大學(Rutgers University)的 Ahmed Elgammal 教授也設計了 AICAN(AI Creative Adversarial Network,創造性對抗網路)來產生全新的創作。和之前使用 GAN 的做法不同,AICAN學習了藝術史中的所有風格,消化之後生成一個全新的風格。

2021 年,一家名為 Wombo 的新創公司,推出了名為「DREAM」的 APP。這款 APP 能夠讓使用者輸入特定的關鍵字,接著選定風格,大約30秒左右的時間就能生成一張唯一的畫作。即便再次輸入同樣的關鍵字和風格,也不會出現一樣的結果。此時的作品意境還相當抽象,還是可以看得出並非人類畫家的作品。




用自然語言理解藝術風格的人工智慧


雖然使用類神經網路可以生成各種風格的畫作,但還是與人類進行創作的方式有所出入。2021 年,NVIDIA 發表了GauGAN2,輸入關於天候、風景的字眼,就能夠產生一幅極為逼真的風景畫。GauGAN2 是史上第一個在單一對抗生成網路(Generative Adversarial Network,GAN)運算中,加入文字語意識別的人工智慧。訓練過程中,使用了1千萬張高品質的風景圖片,甚至也能調整風格,畫出超現實或是栩栩如生的風景。



2022 年 4 月 ,藝術家 Somnai 用 CLIP 人工智慧圖像生成技術,在 Google Colab 上發表了名為 Disco Diffusion 的專題,使用者即便沒有高級的算圖設備,也能使用 AI 進行繪畫。 Disco Diffusion 可以將輸入的語句,拆分成繪畫風格、內容、畫家敘述、渲染方式、顏色五個面向來理解。得到相當細膩的結果



做出Disco Diffusion 的 Somnai 也參與了 Midjourney 專案,試圖讓 AI 理解敘述需求中的整體邏輯,讓作品看起來更具「人味」。目前 Midjourney 還是 beta 專案,作畫能力不斷變強大的同時,也不禁讓人訝異人類在藝術上的追求,能夠如此浩瀚多變。

Infinities

數位無限軟體(InfinitiesSoft)專注於為企業解決虛擬化、容器化、微服務、邊緣運算、混合雲管理、異質IT環境與人工智慧帶來的挑戰,整合異質雲管與熱門的開源AI深度學習架構和開發工具環境,提供一站購足的AI機器學習雲平台方案AI-Stack。