如何用 DALL·E 2 生成AI圖像?

Dall-E 是 OpenAI 於 2020 年 6 月首次開始討論的概念的演變,最初稱為 Image GPT,這是演示如何使用神經網絡創建新的高質量圖像的初步嘗試。

DALL·E 2 是什麼?

借助 Dall-E,OpenAI 能夠擴展圖像 GPT 的初始概念,使用戶能夠通過文本提示生成新圖像,就像 GPT-3 可以根據自然語言文本提示生成新文本一樣。

DALL·E 2 是一種基於深度學習的圖像生成系統,它可以根據自然語言的描述創造出各種有趣和創意的圖像。它是在 DALL·E 的基礎上進行了改進和擴展,增加了更多的圖像類別和細節,並提高了生成圖像的質量和多樣性。DALL·E 2 的目標是探索人工智能和人類創造力之間的關係,並為視覺藝術、設計、娛樂等領域提供一種新的工具和靈感。

為什麼叫做「DALL·E」?

Dall-E 這個名字是對技術兩個不同核心主題的致敬,暗示了融合藝術和人工智能技術的目標。第一部分(DALL)旨在讓人想起西班牙著名超現實藝術家薩爾瓦多·達利(Salvador Dali),而第二部分(E)則與虛構的迪士尼機器人瓦力有關。這兩個名稱的組合反映了由機器自動化的技術的抽象和有點超現實的說明能力。

DALL·E 2 使用介紹及使用限制

DALL·E 2的使用介紹如下:

  • DALL·E 2可以接受中文或英文的輸入,並根據輸入的語意生成相應的圖像。
  • DALL·E 2可以處理多種類型的輸入,例如物體、場景、人物、動物、風格等,並可以組合不同的元素創造出新的概念。
  • DALL·E 2可以生成多個候選圖像,讓使用者選擇最合適或最喜歡的一個。
  • DALL·E 2可以根據使用者的反饋進行微調,例如增加或減少細節、改變顏色、角度等。

DALL·E 2的使用限制如下:

  • DALL·E 2不保證生成的圖像是準確或真實的,它只是根據輸入的描述進行推測和創造,因此使用者應該自行判斷和驗證生成的圖像。
  • DALL·E 2不應該用於生成任何違法、侵權、色情、暴力或令人反感的圖像,這些圖像可能會對他人造成傷害或不良影響,並可能違反相關法律法規。
  • DALL·E 2不應該用於生成任何涉及個人隱私或敏感信息的圖像,例如身份證、銀行卡、密碼等,這些圖像可能會被盜用或濫用,並可能導致安全風險。

如何使用DALL·E 2?

網址:https://openai.com/dall-e-2

進入 DALL•E 2首頁,首先點選右上角「Sign Up」註冊帳號並驗證手機。若您有 ChatGPT 的帳號,可以直接使用同個帳號登入。

註冊完並登入之後,頁面往下滑可以看到一些範例作品,將游標移至圖片,即可檢視其用以生成的文本內容。

在輸入欄填上想要生成的圖片風格以及內容主題,盡量用英文描述會比較準確,再按下「Generate」。

系統便會依照你所描述的內容,自動產生出4張擁有類似主題的圖片。

點擊單張圖片可放大,按「Save」保存至個人帳號內,之後即可以隨時透過 Collections 進行檢視並下載。

針對AI生成圖像進行再編輯

DALL•E 2每次僅會產生4張圖,由於每次都是重新算繪,即使重複使用相同的描述句,也不會出現一模一樣的圖像,如果你覺得某張圖片已經相當接近你的需求,那就不用重新去調整語意反覆生成新的圖像,而是可以開啟 DALL•E 2新增的編輯模式,針對畫面中的元素進行增補或刪除。而藉由 Outpainting 的新功能,DALL•E 2還可以依照圖像的原本風格,將原圖延伸繪製出新的內容。

透過輸入描述句生成圖片後,可以在喜歡的圖片右上角按「…」圖示,點選「Generate variations」。

DALL•E 2就會依照使用者指定的圖片,再另外產生出4張類似風格的圖片。

使用者可以隨時從記錄中提取圖片進行編輯,只需點開圖片按下「Edit」。

進入編輯頁面,假設要替換畫中元素,可點擊下方橡皮擦圖示,並可在右方調整範圍大小。

被擦除的部分會以透明圖層表示,然後在輸入欄填入要置換的內容,我們以 bicycle 為例,再按下「Generate」。

原本圖片中的人影就會被替換為車輛,並會再生成4張圖片可供選擇。

若要進行圖片拓展,可選擇圖片後進入編輯模式,點選「Add generation frame」,並將出現的藍框放置在要延伸的位置。

藍框要與原圖片交疊以便延伸相同風格,然後可在輸入欄填入想要生成的元素,再按下「Genetate」。

在下方的工具列以左右箭頭挑選符合需求的圖片,按下「Accept」確認所選。

按下「Undo」可以回上一步重新製作,也可以循先前的步驟繼續新增延伸區域,按下載箭頭圖示即可將圖片完整下載。

喜歡這篇文章嗎?

目錄

其他相關文章

學無止盡!再來看看其他教學文章吧!

隨著人工智慧技術的進步,影片生成工具如 Haiper AI 和 Luma AI 迅速崛起,成為創作者的新寵。Haiper AI 以其易用性和多樣化的創作模式著稱,適合各類創作者。而 Luma AI 則專注於高質量的 3D 視覺效果,為商業應用提供了強大的支持。究竟哪個更好用?這取決於您的具體需求和創作偏好。
本文介紹了在 Tensor.Art 平台上如何使用 ControlNet 的色塊相關模型來進行圖像處理和生成。這些模型能夠有效地分割和識別圖像中的不同區域,生成各種風格的色塊圖像,提升創作效率和圖像質量。無論是圖像分割、色塊風格的藝術創作,還是顏色標記,這些工具都能滿足不同的創意需求。
ChatGPT 推出新的圖像輸入功能,它可讓您分析圖像、識別物件、閱讀文本並獲得反饋。一起來看看可以如何運用這個新功能!