美團 Longcat 大模型解析：極致性價比的輕量 MoE 模型

# 美團 Longcat 大模型解析：極致性價比的輕量 MoE 模型

廠商前言與技術地位

美團在大語言模型（LLM）領域的佈局相對低調，但實力不容小覷。其研發的 Longcat (長貓) 大模型是美團大模型算法團隊針對高併發、極致運行效率場景推出的 MoE (Mixture of Experts, 混合專家) 系列成果。

Longcat 充分體現了 2026 年大模型「以小博大」的架構趨勢。其總參數規模為 685 億，但每次前向傳播（Forward Pass）僅激活 30 億參數。這種高效率的 MoE 設計，使得 Longcat 在提供中上等語文推理能力的同時，將硬體伺服器的運行能耗降到了極致，目前正處於商用推廣的限時免費調用階段。

---

美團 Longcat 2026 核心模型規格與計費表

模型名稱	上下文窗口 (Context)	輸入價格 (每百萬)	輸出價格 (每百萬)	台灣實測延遲 (TTFT)	核心適用場景
LongCat Flash Lite	256,000 Token	0.00 美元 (免費)	0.00 美元 (免費)	90ms	新創原型驗證、日誌分類、輕量對話 Chatbot
LongCat Pro (內測)	128,000 Token	暫未公開 (申請制)	暫未公開 (申請制)	120ms	企業內部辦公助手、多模態表格 OCR 提取

---

美團 Longcat 核心優勢與實測表現 (EEAT 專家分析)

天智算力評測實驗室針對美團開放平台 API 進行了多種維度實測：

❶ 3B 激活參數的極致 MoE 效率 (MoE Efficiency)

實測表現：由於採用了極為精準的 Experts 門控網絡 (Gating Network)，LongCat Flash Lite 在運行時僅激活 30 億參數，其預填充（Prefill）速度極快。在處理 10 萬字以上的文件摘要時，耗費的雲端算力與冷卻電能極低，這也是美團敢於提供限時免費調用的底氣所在。

❷ 台灣本地響應與亞太網絡表現 (TTFT 測試)

延遲實測：美團大模型平台的伺服器多部署於亞太邊緣雲。台灣直連 TTFT 延遲大約在 85ms 至 100ms 之間，網絡丟包率極低。在平日工作時間呼叫，字元吐出速度非常流暢，無任何跨海網絡延遲。

❸ 局限性與注意事項

生態兼容度較低：作為市場的新進入者，美團 API 目前尚未被 VS Code 主流 AI 插件（如 Cursor、Cline）預設收費通道直接原生支援。開發者如果想要在 IDE 中使用 Longcat，通常需要手動選擇「OpenAI Compatible」自定義通道，配置其 baseUrl 與 API Key。
高難度推理能力受限：由於激活參數僅 30 億，在面對需要極端多步思考、數理證明或複雜軟體架構設計等「系統 2」推理任務時，Longcat 的正確率顯著遜於 DeepSeek R1 或 Claude 5，更適合處理結構簡單、規則清晰的日常客服與文字歸檔任務。