Google Gemini AI 模型正式發表!ChatGPT-4 的強大敵人來了?!

Google Gemini
Google 正式推出 Gemini AI 模型,Google Gemini 是從頭開始建立的多模態——跨文字、圖像、視訊、音訊和程式碼無縫推理。

Google和 Alphabet 執行長 Sundar Pichai 表示:「現在,我們正在與 Gemini 一起邁出下一步,這是我們迄今為止最強大、最通用的模型,在許多領先的基準測試中都具有最先進的性能。我們的第一個版本 Gemini 1.0 針對不同尺寸進行了最佳化:Ultra、Pro 和 Nano。這些是 Gemini 時代的第一個模型,也是我們今年稍早成立 Google DeepMind 時的願景的首次實現。這個模型的新時代代表了我們作為一家公司所做的最大的科學和工程努力之一。我對未來以及 Gemini 將為世界各地的人們帶來的機會感到由衷的興奮。」

Google Gemini 是什麼?

Google Gemini 是 Google 在 2023 年 5 月的 Google I/O 大會上宣布的大型語言模型(LLM)。它是一個多模態模型,可以處理和理解文字、圖像、音訊、視訊

和程式碼。它是 PaLM 2 的繼任者,被認為是 Google 迄今為止功能最強大的 AI 模型。

Gemini 在 2023 年 12 月 6 日已正式發表,在問答、文字摘要和翻譯等任務中表現出色。它能夠生成不同格式的文字內容,例如詩歌、程式碼、腳本、音樂片段、電子郵件、信件等。它還被用於開發 Google 產品的新功能,例如搜尋和助手。

Gemini 是整個 Google 團隊(包括 Google Research 的同事)大規模協作努力的成果。它是從頭開始建立的多模式,這意味著它可以概括和無縫地理解、操作和組合不同類型的資訊,包括文字、程式碼、音訊、圖像和視訊。

Google Gemini 的介紹:「我們最大、能力最強的人工智慧模型。」

Gemini 也是 Google 迄今為止最靈活的模型 – 能夠在從資料中心到行動裝置的所有裝置上有效運作。其最先進的功能將顯著增強開發人員和企業客戶利用人工智慧進行建置和擴展的方式。

Gemini 提供三種版本,將整合至 Google Pixel 手機

為了滿足大到資料中心等級,小到到行動裝置等不同使用環境需求,Gemini 一共推出三個版本:

  • Ultra:最大、能力最強的模型,適用於高度複雜的任務。Google 正在進行一系列的安全測試,將會釋出少量試用版給企業客戶與開發者,估計明年推出正式版。
  • Pro:可擴展各種任務的最佳模型,已經在英文版的聊天機器人 Google Bard 中使用。
  • Nano :最有效率的裝置端任務模型,將給 Pixel 8 Pro 手機使用。

Pixel 8 Pro 是第一款運行 Gemini Nano 的智慧型手機,它支援 Recorder 應用程式中的 Summarize 等新功能,並從 WhatsApp 開始推出 Gboard 中的 Smart Reply,明年還會推出更多訊息應用程式。

Gemini 將是 ChatGPT-4、ChatGPT-4v的強大對手?

Google 一直在嚴格測試 Gemini 模型並評估其在各種任務中的表現。從自然影像、音訊和視訊理解到數學推理,Gemini Ultra 的性能在大型語言模型 (LLM) 研發中使用的 32 個廣泛使用的學術基準中的 30 個上超過了當前最先進的結果。

Gemini Ultra 的得分高達90.0%,是第一個在MMLU(大規模多任務語言理解)上超越人類專家的模型,該模型結合了數學、物理、歷史、法律、醫學和倫理學等57 個科目來測試知識和解決問題的能力。

Gemini 在文字和編碼等一系列基準測試中超越了 ChatGPT-4 最先進的效能。

根據 Google 測試的圖像基準,Gemini Ultra 的性能優於以前最先進的模型,無需從圖像中提取文字以進行進一步處理的物件字元辨識 (OCR) 系統的幫助。這些基準凸顯了 Gemini 天生的多模態性,並顯示了 Gemini 更複雜推理能力。

Gemini 在一系列多模式基準測試中超越了 CahtGPT-4v 最先進的性能。

Google 釋出測試 Gemini 的影片,真的非常厲害!期待它的正式推出!

現在可以在 Google Bard 先體驗 Gemini Pro

目前,已經可以在 Google Bard 上使用 Gemini Pro 的微調版本來進行更高級的推理、規劃、理解等。這是 Bard 自推出以來最大的升級。它將在 170 多個國家和地區提供英語版本,Google 計劃在不久的將來擴展到不同的模式並支援新的語言和地點。

我們在 Google Bard 上詢問它,Bard 回答:「Google AI 的 Gemini Pro 語言模型是我能力背後的引擎。經過大量文本和程式碼語料庫的培訓,自 2023 年 12 月 6 日以來,我已經可以在世界大部分地區進行英語互動。」

大家可以先去 Bard 試試看唷!

喜歡這篇文章嗎?

目錄

其他相關文章

學無止盡!再來看看其他教學文章吧!

想學程式卻被複雜的環境設定與除錯搞瘋了嗎?這篇教學專為 AI 初學者設計,我們會帶你從零完成安裝,讓你理解如何透過指令,就像在跟朋友聊天一樣,請 Claude 直接在你的電腦上修 Bug、寫測試。看完這篇,你將不再對程式感到焦慮,而是學會如何跟這位最強 AI 助理協作,輕鬆搞定開發大小事。
看到 AI 畫出的字總是亂碼讓你心煩嗎?Ideogram 3.0 正式登場,這次它不只提升了畫質,更強化了文字生成的準確度與排版美感。這篇文章將帶你釐清 Ideogram 3.0 的新功能,包含能動手修改細節的 Canvas 工具,並透過實測告訴你它適合解決哪些工作痛點。
覺得 AI 只能寫文章?這篇將帶你認識 OpenClaw,一個能讓 AI 像真人一樣操作電腦、點擊網頁的開源工具。我們參考李宏毅老師的教學,用白話解構 OpenClaw 的運作原理:從它如何獲得靈魂,到如何利用「心跳機制」自主運作。看完這篇,你會發現自動化處理雜事不再是工程師的專利,大幅降低你對新技術的學習焦慮。