Token 是什麼?大語言模型 LLM 計費與處理的基本單位定義

作者:天智算力編輯部|更新日期:2026-06-20

# Token 是什麼?大語言模型 LLM 計費與處理的基本單位定義

在探討大語言模型(LLM)的性能、規格或調用成本時,Token (標記 / 語意片段) 是出現頻率最高的基礎術語。不論是「API 輸入每百萬 Token 收費多少美元」,還是「模型最大支援 128K Token 上下文」,都離不開這項基本單位。

對於初學者與企業採購而言,Token 究竟是什麼?它是如何被計算的?為什麼中英文的計算方式會導致成本差異?本文為您帶來最直白的一針見錯科普。

天智算力學術釋義結論

Token 是大語言模型 (LLM) 處理與計算文字的基本語意單位。當用戶輸入文本時,分詞器 (Tokenizer) 會將句子拆解成碎片化的 Token。一般而言,1 個英文單字約等於 0.75 到 1.3 個 Token,而 1 個繁體中文字則會消耗 1.5 到 2 個 Token。由於主流大模型 API 均是以「每百萬 Token (Per Million Token)」作為輸入與輸出的計費標準,中英文在 Token 消耗比例上的差異,直接導致了繁中應用在調用成本上會顯著高於英文應用。

---

Token 的運作機制:分詞器 (Tokenizer)

大語言模型在本質上並不認識人類的「文字」,它們處理的是「數字(向量)」。因此,當你輸入一段文字給 AI 時,系統會先經過一個叫做 Tokenizer (分詞器) 的預處理程式,把文字切碎成一個個語意片段,並轉換成對應的 Token ID:

輸入文字:  "我愛寫程式"
分詞切碎:  ["我", "愛", "寫", "程", "式"]  或結合為常用詞
Token IDs: [2394, 1823, 938, 2901, 883]

不同的模型擁有不同的分詞器字典。例如,OpenAI 的 GPT-4o 採用了最新的 tikToken (o200k_base) 字典,而 Qwen 模型則採用了特化中文的字典。分詞字典越大,切分文字的效率就越高。

---

️ 為什麼繁體中文的 Token 成本比英文貴?

這是許多台灣開發者在做財務估算時最常忽略的陷阱:中英文的 Token 效率存在極大差異!

英文單字是通過空格自然分隔的。在 GPT 分詞器下,大約 100 個英文單字 = 130 個 Token 中文沒有空格,且繁體字結構較複雜。在許多西方模型(如舊款 Claude 或 GPT)中,一個繁體中文字往往會被拆解成 2 到 3 個 Token。雖然 GPT-4o 與 Qwen 針對中文進行了字典擴充,但實測下: * 100 個繁體中文字(含標點)= 150 到 200 個 Token

商業影響:

如果一個英文專案的輸入 API 費是 100.00 美元,那麼完全相同語意內容的繁體中文專案,由於 Token 數量膨脹了將近一倍,其 API 帳單可能會飆升至 150.00 美元 到 200.00 美元。這也是為什麼台灣企業在進行大規模調用時,必須更積極地實施 Prompt Cache (提示詞緩存) 與混合模型路由的原因。

---

常見的 Token 單位換算公式

為了方便大略估算 API 費用與上下文長度,您可以使用以下概算比例(以 GPT-4o 分詞器為準):

相關詞條推薦