Amazon 現在擁有自己的 AI 圖像生成器

Amazon 今年也跟上了許多大型科技公司的潮流,推出了自己的影像產生器。 AWS 客戶現在可以在 Bedrock 主機上查看 Titan Image Generator 的預覽版。他們可以輸入文字提示從頭開始建立圖像,也可以上傳圖像並進行編輯。

什麼是 AWS?什麼是 Amazon Bedrock?

Amazon Web Services (AWS) 是全球最全面、最廣泛採納的雲端服務,透過全球資料中心提供超過 200 項功能完整的服務。數百萬個客戶,包括成長最快的新創公司、最大型企業以及領先的政府機構,都使用 AWS 來降低成本、變得更靈活,且更迅速地創新。

Bedrock 主機:https://aws.amazon.com/bedrock/

Amazon Bedrock 是一項全受管服務,透過單一 API 提供來自 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和 Amazon 等領先 AI 公司的各種高效能基礎模型(FM)選擇,以及提供建置生成式 AI 應用程式所需的各種廣泛功能,在維護隱私和安全的同時簡化開發。透過 Amazon Bedrock 的全方位功能,您可以輕鬆實驗各種頂尖的 FM,使用微調和擷取擴增產生 (RAG) 等技術透過自己的資料私有自訂這些模型,以及建立可執行複雜業務任務的受管代理程式,從預訂差旅和處理保險索賠到建立廣告宣傳活動和管理庫存,並且全部不需要撰寫任何程式碼。由於 Amazon Bedrock 是無伺服器的,因此您不必管理任何基礎設施,而且可以使用已熟悉的 AWS 服務,將生成式 AI 功能安全整合並部署至應用程式中。

Amazon Titan Image Generator

Amazon Titan 不是一個獨立的應用程式或網站,而是一個工具,開發人員可以在其基礎上建立自己的由模型驅動的圖像生成器;要使用它,開發人員需要存取 Amazon Bedrock。

Titan Image Generator 可以創建「逼真的、工作室品質的圖像」,並且應該具有內建的防範毒性和偏見的防護措施。

Amazon 表示,該工具可以以低成本產生大量工作室品質的逼真圖像。它聲稱 AI 可以根據複雜的文字提示產生相關圖像,同時確保物件組成準確且扭曲有限。該公司表示,這有助於「減少有害內容的產生並減少錯誤訊息的傳播」。

(圖片來源:影片截圖)
(圖片來源:影片截圖)

那些想要編輯圖像的人可以隔離他們想要添加或刪除細節的區域。例如,它們可以替換背景或交換物件手中的物體。 AI 還可以透過添加人工細節來擴展圖像的邊界,就像 Photoshop 中的生成擴展功能一樣。

Amazon 表示,Titan 在其生成的圖像上應用了隱形浮水印。該公司表示,這將「透過提供謹慎的機制來識別人工智慧生成的圖像,有助於減少錯誤訊息的傳播,並促進 AI 技術的安全、可靠和透明的發展。」它聲稱水印無法修改。根據圖像生成器的演示,AI 還可以產生圖像的描述或相關文字以在社群媒體貼文中使用。

關於圖像生成器的消息出現在 Amazon 的 AWS re:Invent 會議上,該公司在會上還展示了其最新的人工智慧晶片,並展示了一款名為「Q」的 AI 聊天機器人(類似ChatGPT)。該公司最近開始為廣告商提供一種工具,讓他們添加 AI -生成產品圖像的背景。

Titan 圖像生成器 Demo:

Titan 生成圖像的隱形浮水印

Titan Image Generator 中的所有圖像都會自動包含亞馬遜所說的隱形浮水印。 AWS 生成人工智慧副總裁 Vasi Philomin 表示,這是亞馬遜 7 月與白宮簽署的自願承諾的一部分。

「我們想要一種方法來標記由人工智慧創建的圖像,並且是專門用 Titan Image Generator 製作的,不會干擾視覺,沒有延遲,並且不能被裁剪或壓縮,」Philomin 在接受採訪時說。

然而,問題在於如何偵測隱形浮水印。Amazon 創建了一個 API,人們可以連接 API,然後提供圖像來檢查圖像的來源。 Philomin 表示這是設計使然。畢竟,Titan 不是最終產品,而是一個模型,因此使用 Titan Image Generator 構建的開發人員將選擇如何向用戶提供該資訊。

資料來源:Amazon joins AI image creation fray with new modelAmazon now has its own AI image generator

喜歡這篇文章嗎?

目錄

其他相關文章

學無止盡!再來看看其他教學文章吧!

在與 ChatGPT 互動的過程中,你可能曾經遇過「回覆速度變慢」,或是跳出「視窗額度不足」、「超出 token 限制」等訊息提示,這些訊息其實都與一個關鍵性的技術概念息息相關,那就是 Token(代幣)。
在 Google I/O 2025 開發者大會上,Google 宣布超過百項 AI 相關創新成果,從 Gemini 2.5 Pro、即時多模態助理 Project Astra,到強化版搜尋體驗與創作者工具,無不展現其重返 AI 領導地位的野心。本文精選 50 項最值得關注的亮點,帶你一次看懂 Google 如何用 AI 改變未來生活與工作模式。
NotebookLM 最近的更新帶來了重大改進,包括擴展到 50 多種語言的多語言支持,以及 Podcast 風格的語音摘要。現在,您可以匯入 YouTube 影片和音訊檔案,以實現簡化的筆記建立和摘要。