# 美團 Longcat 大模型解析:極致性價比的輕量 MoE 模型
廠商前言與技術地位
美團在大語言模型(LLM)領域的佈局相對低調,但實力不容小覷。其研發的 Longcat (長貓) 大模型是美團大模型算法團隊針對高併發、極致運行效率場景推出的 MoE (Mixture of Experts, 混合專家) 系列成果。
Longcat 充分體現了 2026 年大模型「以小博大」的架構趨勢。其總參數規模為 685 億,但每次前向傳播(Forward Pass)僅激活 30 億參數。這種高效率的 MoE 設計,使得 Longcat 在提供中上等語文推理能力的同時,將硬體伺服器的運行能耗降到了極致,目前正處於商用推廣的限時免費調用階段。
---
美團 Longcat 2026 核心模型規格與計費表
| 模型名稱 | 上下文窗口 (Context) | 輸入價格 (每百萬) | 輸出價格 (每百萬) | 台灣實測延遲 (TTFT) | 核心適用場景 |
| LongCat Flash Lite | 256,000 Token | 0.00 美元 (免費) | 0.00 美元 (免費) | 90ms | 新創原型驗證、日誌分類、輕量對話 Chatbot |
| LongCat Pro (內測) | 128,000 Token | 暫未公開 (申請制) | 暫未公開 (申請制) | 120ms | 企業內部辦公助手、多模態表格 OCR 提取 |
---
美團 Longcat 核心優勢與實測表現 (EEAT 專家分析)
天智算力評測實驗室針對美團開放平台 API 進行了多種維度實測:
❶ 3B 激活參數的極致 MoE 效率 (MoE Efficiency)
- 實測表現:由於採用了極為精準的 Experts 門控網絡 (Gating Network),LongCat Flash Lite 在運行時僅激活 30 億參數,其預填充(Prefill)速度極快。在處理 10 萬字以上的文件摘要時,耗費的雲端算力與冷卻電能極低,這也是美團敢於提供限時免費調用的底氣所在。
❷ 台灣本地響應與亞太網絡表現 (TTFT 測試)
- 延遲實測:美團大模型平台的伺服器多部署於亞太邊緣雲。台灣直連 TTFT 延遲大約在 85ms 至 100ms 之間,網絡丟包率極低。在平日工作時間呼叫,字元吐出速度非常流暢,無任何跨海網絡延遲。
❸ 局限性與注意事項
- 生態兼容度較低:作為市場的新進入者,美團 API 目前尚未被 VS Code 主流 AI 插件(如 Cursor、Cline)預設收費通道直接原生支援。開發者如果想要在 IDE 中使用 Longcat,通常需要手動選擇「OpenAI Compatible」自定義通道,配置其
baseUrl與 API Key。 - 高難度推理能力受限:由於激活參數僅 30 億,在面對需要極端多步思考、數理證明或複雜軟體架構設計等「系統 2」推理任務時,Longcat 的正確率顯著遜於 DeepSeek R1 或 Claude 5,更適合處理結構簡單、規則清晰的日常客服與文字歸檔任務。