Google Gemini AI 模型正式發表！ChatGPT-4 的強大敵人來了？！

Google Bard, Google Gemini, 人工智慧

Google 正式推出 Gemini AI 模型，Google Gemini 是從頭開始建立的多模態——跨文字、圖像、視訊、音訊和程式碼無縫推理。

Google和 Alphabet 執行長 Sundar Pichai 表示：「現在，我們正在與 Gemini 一起邁出下一步，這是我們迄今為止最強大、最通用的模型，在許多領先的基準測試中都具有最先進的性能。我們的第一個版本 Gemini 1.0 針對不同尺寸進行了最佳化：Ultra、Pro 和 Nano。這些是 Gemini 時代的第一個模型，也是我們今年稍早成立 Google DeepMind 時的願景的首次實現。這個模型的新時代代表了我們作為一家公司所做的最大的科學和工程努力之一。我對未來以及 Gemini 將為世界各地的人們帶來的機會感到由衷的興奮。」

Google Gemini 是什麼？

Google Gemini 是 Google 在 2023 年 5 月的 Google I/O 大會上宣布的大型語言模型（LLM）。它是一個多模態模型，可以處理和理解文字、圖像、音訊、視訊

和程式碼。它是 PaLM 2 的繼任者，被認為是 Google 迄今為止功能最強大的 AI 模型。

Gemini 在 2023 年 12 月 6 日已正式發表，在問答、文字摘要和翻譯等任務中表現出色。它能夠生成不同格式的文字內容，例如詩歌、程式碼、腳本、音樂片段、電子郵件、信件等。它還被用於開發 Google 產品的新功能，例如搜尋和助手。

Gemini 是整個 Google 團隊（包括 Google Research 的同事）大規模協作努力的成果。它是從頭開始建立的多模式，這意味著它可以概括和無縫地理解、操作和組合不同類型的資訊，包括文字、程式碼、音訊、圖像和視訊。

Google Gemini 的介紹：「我們最大、能力最強的人工智慧模型。」

Gemini 也是 Google 迄今為止最靈活的模型 – 能夠在從資料中心到行動裝置的所有裝置上有效運作。其最先進的功能將顯著增強開發人員和企業客戶利用人工智慧進行建置和擴展的方式。

Gemini 提供三種版本，將整合至 Google Pixel 手機

為了滿足大到資料中心等級，小到到行動裝置等不同使用環境需求，Gemini 一共推出三個版本：

Ultra：最大、能力最強的模型，適用於高度複雜的任務。Google 正在進行一系列的安全測試，將會釋出少量試用版給企業客戶與開發者，估計明年推出正式版。
Pro：可擴展各種任務的最佳模型，已經在英文版的聊天機器人 Google Bard 中使用。
Nano ：最有效率的裝置端任務模型，將給 Pixel 8 Pro 手機使用。

Pixel 8 Pro 是第一款運行 Gemini Nano 的智慧型手機，它支援 Recorder 應用程式中的 Summarize 等新功能，並從 WhatsApp 開始推出 Gboard 中的 Smart Reply，明年還會推出更多訊息應用程式。

Gemini 將是 ChatGPT-4、ChatGPT-4v的強大對手？

Google 一直在嚴格測試 Gemini 模型並評估其在各種任務中的表現。從自然影像、音訊和視訊理解到數學推理，Gemini Ultra 的性能在大型語言模型 (LLM) 研發中使用的 32 個廣泛使用的學術基準中的 30 個上超過了當前最先進的結果。

Gemini Ultra 的得分高達90.0%，是第一個在MMLU（大規模多任務語言理解）上超越人類專家的模型，該模型結合了數學、物理、歷史、法律、醫學和倫理學等57 個科目來測試知識和解決問題的能力。

Gemini 在文字和編碼等一系列基準測試中超越了 ChatGPT-4 最先進的效能。

根據 Google 測試的圖像基準，Gemini Ultra 的性能優於以前最先進的模型，無需從圖像中提取文字以進行進一步處理的物件字元辨識 (OCR) 系統的幫助。這些基準凸顯了 Gemini 天生的多模態性，並顯示了 Gemini 更複雜推理能力。

Gemini 在一系列多模式基準測試中超越了 CahtGPT-4v 最先進的性能。

Google 釋出測試 Gemini 的影片，真的非常厲害！期待它的正式推出！

現在可以在 Google Bard 先體驗 Gemini Pro

目前，已經可以在 Google Bard 上使用 Gemini Pro 的微調版本來進行更高級的推理、規劃、理解等。這是 Bard 自推出以來最大的升級。它將在 170 多個國家和地區提供英語版本，Google 計劃在不久的將來擴展到不同的模式並支援新的語言和地點。

我們在 Google Bard 上詢問它，Bard 回答：「Google AI 的 Gemini Pro 語言模型是我能力背後的引擎。經過大量文本和程式碼語料庫的培訓，自 2023 年 12 月 6 日以來，我已經可以在世界大部分地區進行英語互動。」

大家可以先去 Bard 試試看唷！

Google Bard, Google Gemini, 人工智慧

喜歡這篇文章嗎？

其他相關文章

學無止盡！再來看看其他教學文章吧！

Perplexity Labs 登場：將 AI 從搜尋助理提升為全能數位工作夥伴

2025-06-12
好分享

Perplexity 正式推出全新功能「Labs」，將 AI 工具從搜尋助理進化為任務執行夥伴。用戶可透過自然語言指令自動生成程式、整理資料、製作簡報與儀表板，甚至打造互動式 Web App。Perplexity Labs 不只是找答案，更能產出成果，重塑數位工作流程。

什麼是 Token？搞懂 ChatGPT 記憶限制與對話額度！

2025-05-30
好介紹

在與 ChatGPT 互動的過程中，你可能曾經遇過「回覆速度變慢」，或是跳出「視窗額度不足」、「超出 token 限制」等訊息提示，這些訊息其實都與一個關鍵性的技術概念息息相關，那就是 Token（代幣）。

重回 AI 龍頭！Google 在 I/O 大會上宣布 Google AI 驚人成果

2025-05-25
好分享

在 Google I/O 2025 開發者大會上，Google 宣布超過百項 AI 相關創新成果，從 Gemini 2.5 Pro、即時多模態助理 Project Astra，到強化版搜尋體驗與創作者工具，無不展現其重返 AI 領導地位的野心。本文精選 50 項最值得關注的亮點，帶你一次看懂 Google 如何用 AI 改變未來生活與工作模式。