关于免费和包月限量，你想知道的一切：一文搞懂各大模型的最新会员限额

什么是限量？

大模型是生意

毛利 = 包月价格 - 减渠道抽成 - 用户月总消耗 token×API 成本

月总消耗 token = ①单位时间次数限制 × 时间 × ②上下文窗口 × 平均浪费率 (重置时间越短浪费率越高)

上面公式一共 7 个变量，其中 5 个变量是基本固定的，因此控制你的总用量，尽量增加毛利，主要取决于对下面两个变量进行限量

①单位时间次数限制

②上下文窗口 = 最大输入 + 最大思考长度 + 最大最终输出。这个限量是很多人都没意识到的
尤其是最大思考长度，直接影响智力水平

限量重置时间是怎样计算的？

Ⓐ从最后一次重置之后，第一次用的时间起 ×× 小时：常见，GPT 等
这有个小技巧，比如 gpt 高级语音是 24 小时重置，你如果打算晚上 20 点用来练口语，就要第二天 20 点重置，但如果你早上 8 点一下语音然后退出，就可以第二天早上 8 点重置，相当于提前了 12 个小时。
其他模型同理

Ⓑ每天固定时间重置：常见，例如某中转站是每天早上 8 点重置

Ⓒ从第一次用起 ×× 小时内最后一个整点：比较少见，例如 Claude 是 4~5 小时整点

Ⓓ每月付款日重置

为什么很多模型的限量不透明？

OpenAI 带头，各大公司故意搞限量不透明，就是对限量不做任何官方说明

Ⓐ因为加入新模型，老模型可能缩减或下架，如果明示限量就是一种商业承诺，不明示就是不承诺，增减限量官方说的算

Ⓑ应对竞争对手的政策，随时可能调整限量

Ⓒ服务器紧张时，官方有权利降低限量，但一般不会这样做

Ⓓ以后可能用缩减限量作为降智的一种手段（现在并没有用到）

为什么 Chat 的上下文窗口和最大输出通常远少于 API？

因为 Chat 是包月的，上下文越多，官方越亏。API 是你自己花钱，上下文越多，官方赚的越多

在商言商，包月这种收费方式就决定了，绝大部分的 Chat 版，不管免费还是收费，上下文，最大思考，最大输出都不太可能是满血版，只有 $200 这种会员或者 Enterprise 版本，才会给与 API 一样的满血版上下文长度。

如果你的工作特别在乎上下文长度和最大输出，比如整本书翻译，要么用 API，要么用 $200 会员，或者来自 $200 会员的逆向

限量的浪费率问题

所有包月都存在严重浪费，
实际上这些包月服务，可能 80% 的限量，都是被浪费掉的，官方赚的就是这个浪费沉淀的钱。
如果你能每天把限量基本都用光了，按照 API 计价，价值肯定是包月月费的好几倍，官方铁定是亏的。

①重置时间间隔短，很容易造成浪费。间隔越短，浪费率越高
浪费率：2 小时重置 (grok) > 3 小时 (4o@$20) > 5 小时 (claude) > 1 天 (Chat01 / 高级语音 @$20，多数 Chat@$0) > 1 周 (o1@$20) > 一个月 (Deep research)

②节省心理，造成 “劣币驱逐良币”
比如 gpt $20 会员里，一般的问题尽量用 4o，不舍得用有限量的推理模型。对话优先用标准语音，不舍得用高级语音。结果重置时间到了，攒了一堆推理模型，高级语音没用掉，在 deadline 前胡乱问一些问题都来不及消耗掉
有跟我一样的人吗？

–

模型官网的限量

GPT 限量

250304 更新
OpenAI 的限量是最复杂，最不透明的，而且经常调整

另外有佬友说，$200 的 o1pro 并不是真的无限，大概每天能用 100 多次，再多就容易触发降智

佬友 LostMyHead 说，$20plus 和 $30team 会员，4.5 限量是每周 50 次

不同的会员，上下文和最大输出也不同

大多数人可能不知道，官方也很少提及（有故意误导嫌疑），ChatGPT 相同模型不同会员的上下文窗口，最大思维链，最大输出都是差距巨大的

$200 会员：官方说所有模型都是 128kt 上下文，最大输出根据各模型
我实测 Deep research 最终输出最大 66k+，一般 20k 左右（不含思维链）
金主说 4o 实测上下文 30k
金主说 4.5 实测输入 25k，我实测输出 2k（可能是 preview 版特意控制了输出，正式版应该 16k）

$20 会员：所有模型都是 32k 上下文，最大输出不确定

免费会员：所有模型都是 8k 上下文，最大输出 4k

API：4o/4omini/4.5 是 128k 上下文，16k 输出。但 4.5-preview 实测 2k 输出
o1/o3-mini 是 200k 上下文，100k 总输出（含推理），16k 最终输出

Grok3 限量

250303 更新

免费会员：给的限量挺多的，而且深度搜索和推理都有
x.com/i/grok 与 Grok.com 的限量是分开计算的，就是一个 google 账号可以同时登录两个网站
现在 grok ios 也有语音功能，限量不确定
安卓没上架，网页版和 x app 里没有语音功能

x.com 的 premium$8 会员：一般如果想买会员，$8 就足够了
现在也有语音功能，限量不确定

grok.com 的 SuperGrok 会员 $30，x.com 的 premium + 会员 $40：限量相同，只比 $8 多一点，而 $8 限量都很少能用光，$30 性价比低

买会员网页买就行，不要在 appstore 里买，贵很多（$11 和 $50），因为有苹果税

普通搜索：上下文 16k（另一说 128k），思考 4k，最终输出 4k，20 来源

深度搜索：50 来源

推理：上下文 100k，思考 + 最终输出 26k

API 版：还未上线，上下文 1m（现在开放 128k），最大输出不确定

显示剩余限量插件：https://chromewebstore.google.com/detail/grok-rate-limits/alfhaokdckjioipagadidpbldgfabgjp

Claude 限量

免费会员：3.7 每 4~5 小时整点重置，10 条左右，取决于长度
取消了 3.5 和 haiku，没有 thinking
上下文 32k，最大输出 8k。

$20 会员：每 4~~5 小时整点重置，有 30~~50 次，有 3.7 和 thinking
除了次数，也考虑 token 消耗
所以经常重开新提问，把上下文清零，可以显著减少 token 消耗
上下文，最大输出暂不清楚
thinking 不能调，推测是 16~32k（不确定）

API：上下文 200k，最大输出（含思维链）128k，思维链和最大输出可以自己用参数设置

显示剩余限量插件 https://chromewebstore.google.com/detail/claude-usage-tracker/knemcdpkggnbhpoaaagmjiigenifejfo
Claude 的限量计算很复杂，根据佬友花白的留言，可以装这个 Chrome 扩展

Gemini 限量

Gemini 免费会员：无限量，有 2.0flash，2.0flash thinking，App 版有语音
上下文 32kt
有一个月 $20 会员试用，佬友巧克力雷轰说到期再给两个月的 $9.9 订阅优惠
不过 aistudio 免费模型齐全，一般没必要买会员

Gemini$20 会员：无限量，有 2.0pro 和 1.5 pro deep research
上下文 1mt，输出 8k

AIStudio 免费：2.0flash-thinking-exp/2.0flash/lite：1500 次 / 天
2.0pro-exp：50 次 / 天
1.5pro：50 次 / 天，32k / 分
embedding-03-07：100 次 / 天，新的嵌入模型，3072 维
有语音 + 屏幕识别，只能听中文不能讲中文，貌似不限量
上下文：同 API

AIStudio Tier1：要设置结算卡，填写税务信息等

NotebookLM 免费会员：限量多

NotebookLM $20 会员：限量是免费 5 倍，可以与播客男女主播对话

API：flash 上下文 1m，输出 8k
pro 上下文 2m，输出 8k
flash thinking 上下文 1m，思考 40k，最终输出 26k

Microsoft Copilot（不是 Github Copilot）

免费会员：貌似无限语音，非推理是 4o，无限 o3-mini-high
o3mini 在 copilot.microsoft.com 里有，在 edge 浏览器右上角点 copilot 里面没有
有一个月 $20 会员试用

$20 会员：

Deepseek 限量

免费会员：没有次数限制
貌似邮件注册用户限制联网，手机注册用户可以联网
上下文不确定，最终输出 4k

没有收费会员

API：官方上下文 64k 思考 24k，最终输出 8k
佬友巧克力雷轰说部分第三方（together.ai 等）128k，

豆包

免费会员：没有次数限制，没有语音限制
普通上下文不确定，最大输出 4k
推理：上下文 / 最大输出 4 不确定

豆包 PC 版：提问 / 沉浸式翻译等，用的 doubao-1.5-pro 或 lite，不限量

Cici 的 PC 版：自称用的是 gpt，估计是 4o-mini，不限量
要用新加坡 / 日本等 IP，不能用中国 / 香港 / 美国 IP
Cici 搜索可以搜索被墙网站，豆包不能

没有收费会员

API：上下文 256k，最大输出 12k

第三方应用的限量

Perplexity 限量

免费会员：无限普通搜索（10 来源）
每天 3 次高级搜索（20 来源），推理或深度研究（几分钟）

$20 会员：每天 300 次高级搜索，10 次 4.5

秘塔限量

免费会员：每天 100 次普通搜索（20 来源），研究次数不确定（100 来源）

¥39 会员：每天 500 次普通搜索，50 次研究

Genspark 限量

免费会员：无限普通搜索
每天 5 次高级模型：4o/o1/o3mh/3.7t/3.7/r1
每天 1 次深度研究：266 + 来源，10~20 分钟
没有深度搜索功能

$25 会员：无限高级模型 (o1/4o/3.7/flux/ideogram/recraft/dalle)
感谢佬友 PSP 说：
$25 限制是免费的 5 倍。
所以 PLUS 也就是
每天 25 次以上高级模型对话（如果上下文较短，则可以使用更多次数）
每天 5 次深度研究
更早一步体验新功能

Felo 限量

免费会员：无限普通搜索
每天 5 次专业搜索 (80 + 来源，r1/o3m/4o/3.7)
每天 3 次文件分析
2k 输出

佬友巧克力雷轰说：felo 订阅用户有一个 felo chat，那个每天于 search 共享 300 次数，上下文、输出等可以自由控制（跳转到一个自建的 nextchat 界面）

$20 会员：每天 300 次专业搜索 (加 o3m-high)
深度研究（即将上线）

Poe 限量

免费会员：每天送 3000 积分
$10 会员：每天 1w 积分
$20 会员：每月 100w 积分
还有 $50 和 $100 会员，每积分价格同 $20 没有额外优惠
积分消耗根据不同模型有两种方式，一种是按次消耗，另一种是按次 + xx 积分 /kt

You 限量

免费会员：3 次高级模型或研究（4o/1.5pro/2.0flash/4omini）

$20 会员：佬友 xinxinzi 说每周 500 次高级模型，4.5/o3mh/o1/3.7/3.7thinking/r1，64k 上下文
有深度研究

$30 会员：200k 上下文

minimax.io 限量

是海螺的海外版，很少有人提到，但确是比较少见的，完全免费不限量，又支持搜索被墙网站的 r1 第三方
免费会员：只有 r1 和 minimax-text-01，貌似不限量

没有收费版

abacus 限量

佬友巧克力雷轰说，上下文全系 16k
绑卡支付才能使用，其中首月免费，但首次支付必须订阅两个月来扣除 $10（即每个月 $10）
每个月默认 250w 积分，允许额外购买积分，$10 可购买 100w

Lmarena direct chat 限量

不需要注册，只有免费版，没有收费版，买 API 的资金来自于个人，大学和公司捐赠
有大多数模型，有 3.7，3.7thinking-32k，o3m，3opus，grok3，但没有 4.5，o3mh，o1
上下文限制严重，以 3.7 为例，输入限 8k，输出默认 2k，最大设置 4k
有时会有一些未上市的模型，以代号的形式出现

OpenRouter Chat room 或 API 限量

免费会员：可以用里面免费模型，例如 r1:free，2.0pro-exp，2.0flash-thinking 等，免费模型一般有单位时间限量
但是不管收费还是免费模型，联网都要单独收费，$0.004 / 次
方法：在 Chat room 勾选联网图标，或 API 手动填模型名后加:online，例如 anthropic/claude-3.7-sonnet:online

因为使用 API，官方 API 上下文和最大输出是多少，OpenRouter 的就是多少，不会截断

编程 IDE 的限量

Cursor 限量

免费会员：14 天会员试用，以前可以无限注销再重新开始试用，现在加入了机器码审核机制，要用软件更改机器码
试用期后每月 2000 次自动补完（Cursor Tab）
自己添加 API Key 不收钱，但 API Key 不能用于自动补完

$20 会员：每月 500 次高级快速提问 (包括 3.7/r1/ds3/4o）
慢速提问次数不限（排队长度取决于系统繁忙程度）
特级模型 4.5/o1/opus 要额外单买积分兑换，而且价格不菲
低级模型不限量：4omini/2.0flash

241208：Cursor Chat/Composer 上下文限制 40k，Ctrl+k 限 10k，Agent60~120k
参考 3.7API 上下文是 200k，就是 Cursor 只用到了 claude 上下文上限的 20% 或 5%

某种角度来说，上下文限制，限制了包月 IDE 的性能，导致对 codebase 的视野受限
这可能也是有些人不要用包月，而要用要用 Cline/Roo code+API 的原因之一，API 可以尽量用满大模型 API 的上下文极限，反正花你自己的钱，Cline/Roo code 没必要去限制你的上下文
来源：Cursor – Models

Windsurf 限量

免费会员：无限自动补完
5 次高级模型（4o/3.7/r1/o3m）

$15 会员：每月 500 次高级模型
超出购买 $10=300 次

$50 会员：不限次高级模型

Github Copilot

免费会员：每月 2000 次补全，50 次高级提问（3.7/2.0flash/o3mini)
30 天会员试用

$10 会员：1.5pro/o1
241206：4o 是 64k 上下文，VSC Insider 会员 128k。
claude 上下文不确定
来源：Copilot Chat now has a 64k context window with OpenAI GPT-4o - GitHub Changelog

学生可以免费

Trae

国际版免费会员：3.7/3.5/4o，3.7 经常排队

国内板免费会员：r1/ds3

暂时没有收费会员

Tavily 联网 API

CherryStudio 联网用，每月 1000 次免费
如果不够，可以多注册几个 Tavily 账号，获得多个 API Key，也就麻烦一次，以后只要保存好 API Key 就行，各账号可能永远也不用再登录 Tavily 了

中转站限量

以 OpenAI 的模型为例，不同中转站逆向，即便不被降智，中转站不参水，不故意截断上下文和输出的前提下，根据来源是ⒶCursor 等第三方 /Ⓑ官方免费 /Ⓒ官方 $20/Ⓓ官方 $200 会员，四种情况，上下文，思考长度，最终输出长度也是有差距的，首选只做 $200 会员的逆向
因为逆向是非官方的东西，并没有规范的命名，从逆向名字里并看不出来是哪种来源，通常站长也不会明说，甚至有的站长自己都不知道什么来源，因为是买的二手三手的 api

From: https://linux.do/t/topic/480869

The Illusions Info