在 Vertex AI 中建構及部署 AI 模型的費用
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,則會按照 Cloud Platform SKU 頁面列出的相應貨幣價格計費。
本頁面說明 Vertex AI 的生成式 AI 定價。如要瞭解所有其他 Vertex AI 定價 (包括機器學習平台和機器學習運作服務),請參閱 Vertex AI 定價頁面。
Google 模型
Gemini 2.5
模型 | 類型 | 價格 (每 100 萬個符記) 不超過 20 萬個輸入符記 | 價格 (每 100 萬個符記) > 20 萬個輸入符記 |
---|---|---|---|
Gemini 2.5 Pro | |||
輸入內容 (文字、圖片、影片、音訊) | $1.25 美元 | $2.5 美元 | |
文字輸出內容 (回應和推論) | $10 美元 | $15 | |
Gemini 2.5 Flash | |||
輸入內容 (文字、圖片、影片) | $0.15 美元 | $0.15 美元 | |
音訊輸入 | $1 美元 | $1 美元 | |
文字輸出 (不思考) | $0.60 美元 | $0.60 美元 | |
文字輸出 (思考回應和推理) | $3.50 美元 | $3.50 美元 |
Gemini 2.0
Gemini 2.0 的計費方式是依據使用者所需的 Token 數量。如要在傳送要求前計算要求中的輸入詞元數,可以使用 SDK 分詞器或 countTokens API。如果要求失敗並傳回 400 或 500 錯誤,您就不會因使用這些權杖而須付費。
使用價目表中的切換按鈕,比較以代碼為基礎和以模式為基礎的定價。
以代幣為基礎的定價方式
模型 | 類型 | 費用 | 使用 Batch API 定價 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 萬個輸入內容詞元 | $0.15 美元 | $0.075 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.50 美元 | |
100 萬個輸出文字詞元 | $0.60 美元 | $0.30 美元 | |
針對 100 萬個訓練符記進行微調 | $3.00 美元 | ||
Gemini 2.0 Flash Live API |
|||
100 萬個輸入文字符記 | $0.5 | ||
100 萬個輸入音訊符記 | $3 美元 | ||
100 萬個輸入影片詞元 | $3 美元 | ||
100 萬個輸出文字詞元 | $2 美元 | ||
100 萬個輸出音訊詞元 | $12 美元 | ||
Gemini 2.0 Flash Lite |
|||
100 萬個輸入內容詞元 | $0.075 美元 | $0.0375 美元 | |
100 萬個輸入音訊符記 | $0.075 美元 | $0.0375 美元 | |
100 萬個輸出文字詞元 | $0.30 美元 | $0.15 美元 | |
針對 100 萬個訓練符記進行微調 | $1.00 美元 | ||
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 每天提供最多 1,500 次實地查詢,不需額外付費。超過每日 1,500 次的 Grounded 要求 每 1,000 次要求的費用為 $35 美元 (每日最多 100 萬次要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
||
以資料為基準 | 2025 年 6 月 16 日起,每 1,000 次要求費用為 $2.5 美元。 | ||
企業適用的網站安全防護 |
自 2025 年 5 月 5 日起,每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
以模式為基礎的定價
下列模式定價是根據平均用途計算而得,僅供參考。實際計費只會以代幣為準:
- 4 個字元會產生約 1 個文字符記 (含空格)。
- 1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣,請參閱說明文件。
- 以每秒一張影格的取樣率計算,影片輸入每秒會消耗 258 個單位。影片和音訊帳單,分別列出影片和音訊代幣的使用量。
- 音訊輸入每秒會消耗 25 個權杖,且不含時間戳記。
模型 | 類型 | 費用 | 使用 Batch API 定價 |
---|---|---|---|
Gemini 2.0 Flash |
|||
輸入文字 ($/個千字元) | $0.0375 美元 | $0.01875 美元 | |
輸入圖片 ($/圖片) | $0.0001935 美元 | $0.00009675 美元 | |
輸入影片 ($/秒) | $0.0000387 美元 | $0.00001935 美元 | |
輸入音訊 ($/秒) | $0.000025 美元 | $0.0000125 美元 | |
輸出文字 ($/M 個字元) | $0.15 美元 | $0.075 美元 | |
Gemini 2.0 Flash Lite |
|||
輸入文字 ($/個千字元) | $0.01875 美元 | $0.009375 美元 | |
輸入圖片 ($/圖片) | $0.00009675 美元 | $0.000048375 美元 | |
輸入影片 ($/秒) | $0.00001935 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000001875 美元 | $0.000000938 美元 | |
輸出文字 ($/M 個字元) | $0.075 美元 | $0.0375 美元 | |
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 每天提供最多 1,500 次實地查詢,不需額外付費。超過每日 1,500 次的 Grounded 要求 每 1,000 次要求的費用為 $35 美元 (每日最多 100 萬次要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
||
企業適用的網站安全防護 |
自 2025 年 5 月 5 日起,每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當查詢帶回的結果至少包含一個 Google 搜尋 Grounding 支援網站的網址時,才會收取 Grounding with Google Search 費用。同時也須支付標準 Gemini 模型使用費。
* Gemini 2.0 Flash Live API:每秒 25 個音訊 (輸入/輸出) 單位,每秒 258 個影片 (輸入) 單位。在 Gemini 2.0 Flash Live API 的預先發布期間,使用 Google 搜尋建立基準仍不需付費。
Vertex AI Model Optimizer 定價 (實驗性功能)*
Vertex AI Model Optimizer 為 Gemini 模型要求提供單一元資料端點,讓企業客戶更輕鬆地使用 Gemini。使用這項服務的客戶不必指定要使用 Flash、Pro 或特定版本。而是只需提供可設定的設定 (費用、品質或平衡) 來表示偏好,Model Optimizer 就會將每個查詢傳送至最合適的模型,以便根據工作套用適當的智慧程度。
Vertex AI 模型最佳化器會採用動態定價。也就是說,每個符碼的平均價格取決於用來完成工作模型的智慧程度。因此,我們在下方提供計費範例,根據您的設定說明可能發生的情況 (請參閱下方表格)。模型最佳化器 SKU 的價格為 $1 美元,可用於購買單位,用於計費。使用模型後,您仍會依用量計費。
5:1 輸入/輸出比 | 範例 1: 聊天機器人 |
注意:這些範圍並非保證值,個別客戶的實際結果可能會有所不同 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
客戶偏好 | 已將客戶輸入的金鑰傳送給 MO | 已將客戶輸出權杖傳送至 Merchant Online | 每百萬單位代幣平均輸入價格 (高端) | 每百萬個代幣的平均輸出價格 (高端) | 每百萬個代幣的平均輸入價格 (低端) | 每百萬單位代幣的平均輸出價格 (低端) | |||||
費用 | 10,000,000 | 2,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
平衡 | 10,000,000 | 2,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
品質 | 10,000,000 | 2,000,000 | NT$567 元 | $7.50 | $1.26 美元 | $5.00 美元 |
1:20 輸入輸出比 | 範例 2:內容生成 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
客戶偏好 | 已將客戶輸入的金鑰傳送給 MO | 已將客戶輸出權杖傳送至 Merchant Online | 每百萬單位代幣平均輸入價格 (高端) | 每百萬個代幣的平均輸出價格 (高端) | 每百萬個代幣的平均輸入價格 (低端) | 每百萬單位代幣的平均輸出價格 (低端) | |||||
費用 | 1,000,000 | 20,000,000 | $0.63 美元 | $2.50 美元 | $0.16 美元 | $0.63 美元 | |||||
平衡 | 1,000,000 | 20,000,000 | $1.26 美元 | $5.00 美元 | $0.63 美元 | $2.50 美元 | |||||
品質 | 1,000,000 | 20,000,000 | NT$567 元 | $7.50 | $1.26 美元 | $5.00 美元 |
其他 Gemini 機型
除了 Gemini 2.0 外,所有 Gemini 模型的計費方式都是依據字元、圖片、影片/音訊秒數等模式計算。文字輸入內容的計費單位為每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應)。字元是以 UTF-8 碼點計算,空白字元則不列入計算,因此每個符記大約有 4 個字元。預測要求導致篩選回應時,只會收取輸入資料的費用。每個帳單週期結束時,小於一分美元的費用 ($0.01) 會四捨五入為一分美元。輸入媒體的費用是依圖片或影片每秒的費用計算。如果要求失敗並傳回 400 或 500 錯誤,您就不會因使用這些權杖而須付費。
模型 | 功能 | 類型 | 價格 ( =< 128K 輸入符記) |
價格: (超過 128,000 個輸入符記) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00002 美元 每秒$0.00002 美元 每 1,000 個字元$0.00001875 美元 每秒$0.000002 美元 |
每張圖片 $0.00004 美元 每秒$0.00004 美元 每 1,000 個字元$0.0000375 美元 每秒$0.000004 美元 |
||
文字輸出 | 每 1,000 個半形字元 $0.000075 美元 | 每 1,000 個字元 $0.00015 美元 | ||||
調整* | 訓練權杖 | $8 美元 / 百萬個代幣 | ||||
Gemini 1.5 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 音訊輸入 |
每張圖片 $0.00032875 美元 每秒$0.00032875 美元 每 1,000 個字元$0.0003125 美元 每秒$0.00003125 美元 |
每張圖片 $0.0006575 美元 每秒$0.0006575 美元 每 1,000 個字元$0.000625 美元 每秒$0.0000625 美元 |
||
文字輸出 | 每 1,000 個字元 $0.00125 美元 | 每 1,000 個字元 $0.0025 美元 | ||||
調整* | 訓練權杖 | $80 美元 / 百萬個符記 | ||||
Gemini 1.0 Pro | 多模態 | 圖片輸入 影片輸入 文字輸入 |
每張圖片 $0.0025 美元 每秒$0.002 美元 每 1,000 個字元$0.000125 美元 |
|||
文字輸出 | 每 1,000 個字元 $0.000375 美元 | |||||
利用 Google 搜尋建立基準 | 文字 | 基礎查詢 | 每 1,000 次要求收費 $35 美元 (每日最多 100 萬次要求)。 如需超過 100 萬次的每日要求,請與您的帳戶團隊聯絡。 |
|||
企業適用的網站資料來源 | 文字 | 自 2025 年 5 月 5 日起,每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
||||
以資料為基準 | 文字 | 自 2025 年 6 月 16 日起,每 1,000 次要求費用為 $2.5 美元。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 如果查詢脈絡長度超過 128, 000 個詞元,所有詞元都會以長脈絡費率計費。
* 以批次模式使用 Gemini 模型可享 50% 折扣。
* Gemini 1.0 Pro 僅支援最多 32,000 個詞元的脈絡窗口。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 使用 Google 搜尋功能進行 Grounding:如果您使用動態擷取功能來降低費用,只有回應中包含至少一個網站 Grounding 支援網址的查詢,才會產生使用 Grounding 功能的費用。使用 Gemini 時,一律須支付相關費用。
Imagen
有了 Vertex AI 的 Imagen,您就能根據提供的文字提示生成新圖片及編輯圖片,或是使用您定義的遮罩區域,只編輯圖片的某些部分,並享有眾多其他功能。
型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
---|---|---|---|---|---|
圖 3 | 圖像生成 | 生成圖片 編輯圖片 自訂圖片 |
文字提示 | 圖片 | 每張圖片 $0.04 美元 |
圖片 3 快速版 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張圖片 $0.02 美元 |
圖 2、圖 | 圖像生成 | 生成圖片 | 文字提示 | 圖片 | 每張 $0.020 美元 |
圖像編輯 | 使用無遮罩或遮罩方式編輯圖片 | 圖像/文字提示 | 圖片 | 每張 $0.020 美元 | |
提高解析度 | 將生成圖片的解析度提高至 2K 和 4K | 圖片 | 圖片 | 每張圖片 $0.003 美元 | |
微調 | 啟用使用者提供的「主題」,用於 Imagen 提示 (少量樣本訓練) | 主題(附文字識別碼) 和每個主題的 4 至 8 張圖片 | 微調模型 (使用者提供的主題訓練後) | 每個節點小時的價格 (Vertex AI 自訂訓練價格) | |
圖像說明生成 | 為圖片產生短文或長文說明 | 圖片 | 文字說明 | 每張圖片 $0.0015 美元 | |
圖像問題回答 | 根據提及圖片的問題提供解答 | 圖像/文字提示 | 文字答案 | 每張圖片 $0.0015 美元 |
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Veo
Veo 2 能製作出極為高品質的影片,主題與風格多元,且更能掌握真實物理效果,以及人體動作和表情的細微差別。
型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
---|---|---|---|---|---|
Veo 2 | 影片生成 | 根據文字提示或參考圖片生成影片 | 文字/圖片提示 | 影片 | 每秒 $0.50 美元 |
瞭解 AI 應用程式的嵌入成本
型號 | 功能 | 說明 | 輸入內容 | 輸出內容 | 價格 |
---|---|---|---|---|---|
多模態嵌入 | 多模態專用嵌入:文字 | 以文字為輸入內容,產生嵌入 | 文字 | 嵌入 | 每 1,000 個輸入字元 $0.0002 美元 |
適用於多模態的嵌入:圖像 | 以圖像為輸入內容,產生嵌入式表示 | 圖片 | 嵌入 | 每張圖片輸入 $0.0001 美元 | |
適用於多模態的嵌入內容:影片加 | 影片 Plus | 影片 | 嵌入內容 (每分鐘影片最多可加入 15 個嵌入內容) | 每秒影片 $0.0020 美元 | |
多模態嵌入:影片標準 | 影片標準 | 影片 | 嵌入 (每分鐘影片最多 8 個嵌入) | 每秒影片 $0.0010 美元 | |
多模態嵌入:影片基本要素 | 影片基本功能 | 影片 | 嵌入內容 (每分鐘影片最多可加入 4 個嵌入內容) | 每秒影片 $0.0005 美元 |
型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
---|---|---|---|
文字嵌入 | 輸入 | 全球 |
|
輸出 | 全球 |
|
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
Vertex AI 程式碼完成功能的定價
Vertex AI 的生成式 AI 服務是以每 1,000 個字元的輸入內容 (提示) 和每 1,000 個字元的輸出內容 (回應) 為單位計費。字元數是以 UTF-8 的編碼點計算,空白字元則不列入計算。預先發布階段的費用可享 100% 折扣。預測要求若導致篩選回應,只會收取輸入費用。每個帳單週期結束時,系統會將小於一分美元的金額 (0.01 美元) 四捨五入為一分美元。
型號 | 類型 | 區域 | 每 1,000 個字元的價格 |
---|---|---|---|
用於生成程式碼的 Codey | 輸入 | 全球 |
|
輸出 | 全球 |
|
價格均以美元 (USD) 表示。 如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
翻譯 (文字)
使用 Vertex AI API 和 Translation LLM 翻譯文字。與傳統翻譯模型相比,大型語言模型翻譯的內容通常更流暢,聽起來也更像人類說話,但支援的語言較少 (瞭解詳情)。
模型 | 方法 | 用量 | 每 100 萬個字元價格 |
---|---|---|---|
LLM | 文字翻譯* | 每月輸入字元數 |
每 100 萬個字元 $10 美元* |
每月輸出字元數量 |
每 100 萬個字元 $10 美元* |
價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* 價格是以模型處理的每個字元計算,如要進一步瞭解如何計算字元數,請參閱計費字元
運用 Vertex AI 的內容快取功能,盡可能降低成本
有了情境快取功能,您就能將 Gemini 輸入符記處理成本降低 75%,並將內容產生延遲時間縮短。您只要將輸入文字或媒體的情境部分快取到 Gemini 模型,就能達成這項目標。資料在快取中儲存的時間長短由使用者控制,這會影響「Context Cache Storage」的費用。建立快取內容時,使用者會被收取標準輸入權杖費用。輸入資料的快取命中會以較低的「快取輸入」費率計費,而非一般輸入費用。儲存空間和輸入資料的大小計算方式與 Gemini 輸入資料定價相同。
Gemini 2.5 模型
模型 | 功能 | 類型 | 價格 (每 100 萬個符記) <= 20 萬個輸入符記 |
價格 (每 100 萬個符記) > 20 萬個輸入符記 |
---|---|---|---|---|
Gemini 2.5 Pro | 快取輸入 | 輸入內容 (文字、圖片、影片、音訊) | $0.31 美元 (每 100 萬個符記) | $0.625 美元 (每 100 萬個代幣) |
輸出 | 不適用 | 不適用 | ||
脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $4.5 美元 (每小時每位使用者) | $4.5 美元 (每小時每位使用者) | |
Gemini 2.5 Flash | 快取輸入 | 輸入內容 (文字、圖片、影片、音訊) | $0.0375 美元 (每 100 萬個代幣) | $0.0375 美元 (每 100 萬個代幣) |
輸出 | 不適用 | 不適用 | ||
脈絡快取儲存空間 | 輸入內容 (文字、圖片、影片、音訊) | $1 美元 (每位 M Tok 每小時) | $1 美元 (每位 M Tok 每小時) |
Gemini 2.0 模型
以代幣為基礎的定價方式
模型 |
類型 |
儲存空間 (每小時每千次操作數百萬次) |
費用 |
---|---|---|---|
Gemini 2.0 Flash |
|||
100 萬個輸入內容詞元 | $1.00 美元 | $0.0375 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.25 美元 | |
100 萬個輸出文字詞元 | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
100 萬個輸入內容詞元 | $1.00 美元 | $0.01875 美元 | |
100 萬個輸入音訊符記 | $1.00 美元 | $0.01875 美元 | |
100 萬個輸出文字詞元 | 不適用 | 不適用 |
以模式為基礎的定價
下列模式定價是根據平均用途計算而得,僅供參考。實際計費只會以代幣為準:
- 4 個字元會產生約 1 個文字符記 (含空格)。
- 1024x1024 圖片會消耗 1, 290 個記號。每個圖片的符記數量會因圖片解析度而異。如要進一步瞭解如何計算代幣,請參閱說明文件。
- 以每秒一張影格的取樣率計算,影片輸入每秒會消耗 258 個單位。影片和音訊帳單,分別列出影片和音訊代幣的使用量。
- 音訊輸入每秒會消耗 25 個權杖,且不含時間戳記。
模型 |
類型 |
儲存空間 (Modality-hour) |
價格 |
---|---|---|---|
Gemini 2.0 Flash |
|||
輸入文字 ($/個千字元) | $0.25 美元 | $0.009375 美元 | |
輸入圖片 ($/圖片) | $0.00129 美元 | $0.000048375 美元 | |
輸入影片 ($/秒) | $0.000258 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000025 美元 | $0.00000625 美元 | |
輸出文字 ($/M 個字元) | 不適用 | 不適用 | |
Gemini 2.0 Flash Lite |
|||
輸入文字 ($/個千字元) | $0.25 美元 | $0.0046875 美元 | |
輸入圖片 ($/圖片) | $0.00129 美元 | $0.0000241875 美元 | |
輸入影片 ($/秒) | $0.000258 美元 | $0.000009675 美元 | |
輸入音訊 ($/秒) | $0.000258 美元 | $0.0000048375 美元 | |
輸出文字 ($/M 個字元) | 不適用 | 不適用 | |
利用 Google 搜尋建立基準 |
Gemini 2.0 Flash 每天提供最多 1,500 次實地查詢,不需額外付費。超過每日 1,500 次的 Grounded 要求 每 1,000 次要求的費用為 $35 美元 (每日最多 100 萬次要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
||
企業適用的網站安全防護 |
自 2025 年 5 月 5 日起,每 1,000 項要求的費用為 $45 美元 (每日最多 100 萬項要求)。 如需每天超過 100 萬個要求,請與帳戶團隊聯絡。 |
* 價格均以美元 (USD) 表示。
如果您使用美元以外的貨幣付費,系統將按照 Cloud Platform SKU 頁面上列出的相應貨幣價格計費。
* PDF 檔案會以圖片輸入形式計費,每個 PDF 頁面相當於一張圖片。
* 經調校的模型端點的預測價格與基本模型相同。
* 只有當查詢帶回的結果至少包含一個 Google 搜尋 Grounding 支援網站的網址時,才會收取 Grounding with Google Search 費用。同時也須支付標準的 Gemini 模型使用費。
佈建輸送量
已佈建的處理量可確保您能取得滿足生成式 AI 需求的處理量,並透過生成式 AI 擴充單元 (GSU) 進行交易。如要進一步瞭解每個 GSU 提供的處理量,請參閱這篇文章,並使用這項線上估算工具。
時間長度 | 每 GSU 的價格 | 每 |
---|---|---|
1 週承諾* | NT$36,000 | 週 |
1 個月的修訂版本 | $2,700 美元 | 月 |
3 個月的承諾 | NT$72,000 | 月 |
承諾使用 1 年 | $2,000 美元 | 月 |
*請注意,1 週承諾是付費的私人預先發布版服務
費用計算範例
使用者必須確保每秒查詢次數 (QPS) 可達 10 次,且查詢輸入內容為 1,000 個文字符記和 500 個音訊符記,並透過 gemini-2.0-flash 接收 300 個文字符記的輸出內容。
參考效能和消耗率表格,我們知道 gemini-2.0-flash 的輸入文字代碼消耗率為 1 個代碼、輸入音訊代碼消耗率為 7 個代碼,輸出文字代碼消耗率為 4 個代碼。
使用者的輸入詞元總數為 1,000* (每個輸入文字詞元為 1 個) + 500* (每個輸入音訊詞元為 7 個) = 4,500 個調整後的輸入詞元。使用者的輸出詞元總數為 300* (每個輸出文字詞元 4 個詞元) = 1,200 個經調整的輸出詞元。加起來就是 4,500 個經過消耗量調整的輸入權杖 + 1,200 個經過消耗量調整的輸出權杖 = 每個查詢總共 5,700 個權杖。
將每項查詢的總記號數乘以每秒查詢次數,即可得出每秒總記號數:5,700 個 (每項查詢的總記號數) * 10 (每秒查詢次數) = 57,000 個。
將這個數字除以每個 GSU 每秒的總處理量,即可得出每秒總代碼數 ÷ 每個 GSU 每秒處理量 = 16.96 GSU。這個購買模式的 GSU 最小增量為 1,因此使用者需要 17 個 GSU。
如果使用者想在 1 週內維持這個處理量,每週的費用為 $1,200 * 17 GSU = $20,400 美元。如果他們想在 1 個月內維持這個處理量,每月費用為 $2,700 美元 * 17 個 GSU = $45,900 美元。如果他們想在 3 個月內維持這個處理量,每月費用為 $2,400 * 17 GSU = $40,800 美元。最後,如果他們想在 1 年內維持這個處理量,每月需要支付 $2,000 美元 * 17 個 GSU = $34,000 美元。
比較 Vertex AI 合作夥伴模型的定價
合作夥伴模型是 Google 合作夥伴開發的生成式 AI 模型精選清單。合作夥伴模型是以代管 API 的形式提供。詳情請參閱合作夥伴模式總覽。以下各節列出 Google 合作夥伴模式的定價詳細資料。
AI21 Labs 的模型
模型 | 定價 |
---|---|
Jamba 1.5 大 | 輸入:每 100 萬個詞元 $2 美元 輸出:每 100 萬個詞元 $8 美元 |
Jamba 1.5 Mini | 輸入:每百萬個符號 $0.20 美元 輸出:每百萬個符號 $0.40 美元 |
Anthropic 的 Claude 模型
模型 | 定價 |
---|---|
Claude 3.7 Sonnet | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 批次輸入:每百萬個符記 $1.5 美元 批次輸出:每百萬個符記 $7.5 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 批次快取寫入:每百萬個符記 $1.875 美元 批次快取命中:每百萬個符記 $0.15 美元 |
Claude 3.5 Haiku | 輸入:每百萬個符記 $0.80 美元 輸出:每百萬個符記 $4 美元 批次輸入:每百萬個符記 $0.40 美元 批次輸出:每百萬個符記 $2 美元 快取寫入:每百萬個符記 $1 美元 快取命中:每百萬個符記 $0.08 美元 批次快取寫入:每百萬個符記 $0.50 美元 批次快取命中:每百萬個符記 $0.04 美元 |
Claude 3.5 Sonnet v2 | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 批次輸入:每百萬個符記 $1.5 美元 批次輸出:每百萬個符記 $7.5 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 批次快取寫入:每百萬個符記 $1.875 美元 批次快取命中:每百萬個符記 $0.15 美元 |
Claude 3.5 Sonnet | 輸入:每百萬個符記 $3 美元 輸出:每百萬個符記 $15 美元 快取寫入:每百萬個符記 $3.75 美元 快取命中:每百萬個符記 $0.30 美元 |
Claude 3 Haiku | 輸入:每百萬個符記 $0.25 美元 輸出:每百萬個符記 $1.25 美元 快取寫入:每百萬個符記 $0.30 美元 快取命中:每百萬個符記 $0.03 美元 |
Claude 3 Sonnet (deprecated) | 輸入:每百萬個詞元 $3 美元 輸出:每百萬個詞元 $15 美元 |
Claude 3 Opus | 輸入:每 100 萬個符號 $15 美元 輸出:每 100 萬個符號 $75 美元 快取寫入:每 100 萬個符號 $18.75 美元 快取命中:每 100 萬個符號 $1.50 美元 |
Meta 的 Llama 模型
模型 | 定價 |
---|---|
Llama 3.1 405B | 輸入:每百萬個詞元 $5.00 美元 輸出:每百萬個詞元 $16.00 美元 |
Llama 3.3 700 億 * | 輸入:每百萬個符記 $0.72 美元 輸出:每百萬個符記 $0.72 美元 |
Llama 4 Scout * | 輸入:每百萬個符記 $0.25 美元 輸出:每百萬個符記 $0.70 美元 |
小馬 4 馬維克 * | 輸入:每百萬個詞元 $0.35 美元 輸出:每百萬個詞元 $1.15 美元 |
- 2025 年 5 月 1 日前免費
Mistral AI 的模型
模型 | 定價 |
---|---|
Mistral Small 3.1 (25.03) | 輸入:每百萬個詞元 $0.10 美元 輸出:每百萬個詞元 $0.30 美元 |
Mistral Large (24.11) | 輸入:每 100 萬個詞元 $2.00 美元 輸出:每 100 萬個詞元 $6.00 美元 |
Mistral 尼莫 | 輸入:每百萬個符記 $0.15 美元 輸出:每百萬個符記 $0.15 美元 |
Codestral (25.01) | 輸入:每百萬個字元 $0.30 美元 輸出:每百萬個字元 $0.90 美元 |