Google Gemini AI 模型正式發表!ChatGPT-4 的強大敵人來了?!

Google Gemini
Google 正式推出 Gemini AI 模型,Google Gemini 是從頭開始建立的多模態——跨文字、圖像、視訊、音訊和程式碼無縫推理。

Google和 Alphabet 執行長 Sundar Pichai 表示:「現在,我們正在與 Gemini 一起邁出下一步,這是我們迄今為止最強大、最通用的模型,在許多領先的基準測試中都具有最先進的性能。我們的第一個版本 Gemini 1.0 針對不同尺寸進行了最佳化:Ultra、Pro 和 Nano。這些是 Gemini 時代的第一個模型,也是我們今年稍早成立 Google DeepMind 時的願景的首次實現。這個模型的新時代代表了我們作為一家公司所做的最大的科學和工程努力之一。我對未來以及 Gemini 將為世界各地的人們帶來的機會感到由衷的興奮。」

Google Gemini 是什麼?

Google Gemini 是 Google 在 2023 年 5 月的 Google I/O 大會上宣布的大型語言模型(LLM)。它是一個多模態模型,可以處理和理解文字、圖像、音訊、視訊

和程式碼。它是 PaLM 2 的繼任者,被認為是 Google 迄今為止功能最強大的 AI 模型。

Gemini 在 2023 年 12 月 6 日已正式發表,在問答、文字摘要和翻譯等任務中表現出色。它能夠生成不同格式的文字內容,例如詩歌、程式碼、腳本、音樂片段、電子郵件、信件等。它還被用於開發 Google 產品的新功能,例如搜尋和助手。

Gemini 是整個 Google 團隊(包括 Google Research 的同事)大規模協作努力的成果。它是從頭開始建立的多模式,這意味著它可以概括和無縫地理解、操作和組合不同類型的資訊,包括文字、程式碼、音訊、圖像和視訊。

Google Gemini 的介紹:「我們最大、能力最強的人工智慧模型。」

Gemini 也是 Google 迄今為止最靈活的模型 – 能夠在從資料中心到行動裝置的所有裝置上有效運作。其最先進的功能將顯著增強開發人員和企業客戶利用人工智慧進行建置和擴展的方式。

Gemini 提供三種版本,將整合至 Google Pixel 手機

為了滿足大到資料中心等級,小到到行動裝置等不同使用環境需求,Gemini 一共推出三個版本:

  • Ultra:最大、能力最強的模型,適用於高度複雜的任務。Google 正在進行一系列的安全測試,將會釋出少量試用版給企業客戶與開發者,估計明年推出正式版。
  • Pro:可擴展各種任務的最佳模型,已經在英文版的聊天機器人 Google Bard 中使用。
  • Nano :最有效率的裝置端任務模型,將給 Pixel 8 Pro 手機使用。

Pixel 8 Pro 是第一款運行 Gemini Nano 的智慧型手機,它支援 Recorder 應用程式中的 Summarize 等新功能,並從 WhatsApp 開始推出 Gboard 中的 Smart Reply,明年還會推出更多訊息應用程式。

Gemini 將是 ChatGPT-4、ChatGPT-4v的強大對手?

Google 一直在嚴格測試 Gemini 模型並評估其在各種任務中的表現。從自然影像、音訊和視訊理解到數學推理,Gemini Ultra 的性能在大型語言模型 (LLM) 研發中使用的 32 個廣泛使用的學術基準中的 30 個上超過了當前最先進的結果。

Gemini Ultra 的得分高達90.0%,是第一個在MMLU(大規模多任務語言理解)上超越人類專家的模型,該模型結合了數學、物理、歷史、法律、醫學和倫理學等57 個科目來測試知識和解決問題的能力。

Gemini 在文字和編碼等一系列基準測試中超越了 ChatGPT-4 最先進的效能。

根據 Google 測試的圖像基準,Gemini Ultra 的性能優於以前最先進的模型,無需從圖像中提取文字以進行進一步處理的物件字元辨識 (OCR) 系統的幫助。這些基準凸顯了 Gemini 天生的多模態性,並顯示了 Gemini 更複雜推理能力。

Gemini 在一系列多模式基準測試中超越了 CahtGPT-4v 最先進的性能。

Google 釋出測試 Gemini 的影片,真的非常厲害!期待它的正式推出!

現在可以在 Google Bard 先體驗 Gemini Pro

目前,已經可以在 Google Bard 上使用 Gemini Pro 的微調版本來進行更高級的推理、規劃、理解等。這是 Bard 自推出以來最大的升級。它將在 170 多個國家和地區提供英語版本,Google 計劃在不久的將來擴展到不同的模式並支援新的語言和地點。

我們在 Google Bard 上詢問它,Bard 回答:「Google AI 的 Gemini Pro 語言模型是我能力背後的引擎。經過大量文本和程式碼語料庫的培訓,自 2023 年 12 月 6 日以來,我已經可以在世界大部分地區進行英語互動。」

大家可以先去 Bard 試試看唷!

喜歡這篇文章嗎?

目錄

其他相關文章

學無止盡!再來看看其他教學文章吧!

MetaDemoLab 的 Animated Drawings 工具不僅操作簡單,而且能夠快速生成高質量的動畫。即使沒有任何動畫製作經驗,用戶也能夠輕鬆上手,讓你的手繪角色動起來!
擔心人工智慧的影響?了解什麼是AI 焦慮(AI anxiety),以及如何應對與人工智慧技術興起相關的恐懼和焦慮。
unspoken symphony 將視覺藝術轉化為音樂作品,為那些語言表達有困難的人提供了一種全新的溝通方式。這個平台利用先進的軟體分析藝術作品的形狀、顏色和紋理,並將這些視覺元素轉化為獨特的音樂旋律。每一段音樂都是對藝術品的獨特詮釋,使得視覺與聽覺的界限模糊,進而建立了一座連接不同感官體驗的橋樑。