什么是限量?
大模型是生意
毛利 = 包月价格 - 减渠道抽成 - 用户月总消耗 token×API 成本
月总消耗 token = ①单位时间次数限制 × 时间 × ②上下文窗口 × 平均浪费率 (重置时间越短浪费率越高)
上面公式一共 7 个变量,其中 5 个变量是基本固定的,因此控制你的总用量,尽量增加毛利,主要取决于对下面两个变量进行限量
①单位时间次数限制
②上下文窗口 = 最大输入 + 最大思考长度 + 最大最终输出。这个限量是很多人都没意识到的
尤其是最大思考长度,直接影响智力水平
限量重置时间是怎样计算的?
Ⓐ从最后一次重置之后,第一次用的时间起 ×× 小时:常见,GPT 等
这有个小技巧,比如 gpt 高级语音是 24 小时重置,你如果打算晚上 20 点用来练口语,就要第二天 20 点重置,但如果你早上 8 点一下语音然后退出,就可以第二天早上 8 点重置,相当于提前了 12 个小时。
其他模型同理
Ⓑ每天固定时间重置:常见,例如某中转站是每天早上 8 点重置
Ⓒ从第一次用起 ×× 小时内最后一个整点:比较少见,例如 Claude 是 4~5 小时整点
Ⓓ每月付款日重置
为什么很多模型的限量不透明?
OpenAI 带头,各大公司故意搞限量不透明,就是对限量不做任何官方说明
Ⓐ因为加入新模型,老模型可能缩减或下架,如果明示限量就是一种商业承诺,不明示就是不承诺,增减限量官方说的算
Ⓑ应对竞争对手的政策,随时可能调整限量
Ⓒ服务器紧张时,官方有权利降低限量,但一般不会这样做
Ⓓ以后可能用缩减限量作为降智的一种手段(现在并没有用到)
为什么 Chat 的上下文窗口和最大输出通常远少于 API?
因为 Chat 是包月的,上下文越多,官方越亏。API 是你自己花钱,上下文越多,官方赚的越多
在商言商,包月这种收费方式就决定了,绝大部分的 Chat 版,不管免费还是收费,上下文,最大思考,最大输出都不太可能是满血版,只有 $200 这种会员或者 Enterprise 版本,才会给与 API 一样的满血版上下文长度。
如果你的工作特别在乎上下文长度和最大输出,比如整本书翻译,要么用 API,要么用 $200 会员,或者来自 $200 会员的逆向
限量的浪费率问题
所有包月都存在严重浪费,
实际上这些包月服务,可能 80% 的限量,都是被浪费掉的,官方赚的就是这个浪费沉淀的钱。
如果你能每天把限量基本都用光了,按照 API 计价,价值肯定是包月月费的好几倍,官方铁定是亏的。
①重置时间间隔短,很容易造成浪费。间隔越短,浪费率越高
浪费率:2 小时重置 (grok) > 3 小时 (4o@$20) > 5 小时 (claude) > 1 天 (Chat01 / 高级语音 @$20,多数 Chat@$0) > 1 周 (o1@$20) > 一个月 (Deep research)
②节省心理,造成 “劣币驱逐良币”
比如 gpt $20 会员里,一般的问题尽量用 4o,不舍得用有限量的推理模型。对话优先用标准语音,不舍得用高级语音。结果重置时间到了,攒了一堆推理模型,高级语音没用掉,在 deadline 前胡乱问一些问题都来不及消耗掉
有跟我一样的人吗?
–
模型官网的限量
GPT 限量
250304 更新
OpenAI 的限量是最复杂,最不透明的,而且经常调整
另外有佬友说,$200 的 o1pro 并不是真的无限,大概每天能用 100 多次,再多就容易触发降智
佬友 LostMyHead 说,$20plus 和 $30team 会员,4.5 限量是每周 50 次
不同的会员,上下文和最大输出也不同
大多数人可能不知道,官方也很少提及(有故意误导嫌疑),ChatGPT 相同模型不同会员的上下文窗口,最大思维链,最大输出都是差距巨大的
$200 会员:官方说所有模型都是 128kt 上下文,最大输出根据各模型
我实测 Deep research 最终输出最大 66k+,一般 20k 左右(不含思维链)
金主说 4o 实测上下文 30k
金主说 4.5 实测输入 25k,我实测输出 2k(可能是 preview 版特意控制了输出,正式版应该 16k)
$20 会员:所有模型都是 32k 上下文,最大输出不确定
免费会员:所有模型都是 8k 上下文,最大输出 4k
API:4o/4omini/4.5 是 128k 上下文,16k 输出。但 4.5-preview 实测 2k 输出
o1/o3-mini 是 200k 上下文,100k 总输出(含推理),16k 最终输出
Grok3 限量
250303 更新
免费会员:给的限量挺多的,而且深度搜索和推理都有
x.com/i/grok 与 Grok.com 的限量是分开计算的,就是一个 google 账号可以同时登录两个网站
现在 grok ios 也有语音功能,限量不确定
安卓没上架,网页版和 x app 里没有语音功能
x.com 的 premium$8 会员:一般如果想买会员,$8 就足够了
现在也有语音功能,限量不确定
grok.com 的 SuperGrok 会员 $30,x.com 的 premium + 会员 $40:限量相同,只比 $8 多一点,而 $8 限量都很少能用光,$30 性价比低
买会员网页买就行,不要在 appstore 里买,贵很多($11 和 $50),因为有苹果税
普通搜索:上下文 16k(另一说 128k),思考 4k,最终输出 4k,20 来源
深度搜索:50 来源
推理:上下文 100k,思考 + 最终输出 26k
API 版:还未上线,上下文 1m(现在开放 128k),最大输出不确定
显示剩余限量插件:https://chromewebstore.google.com/detail/grok-rate-limits/alfhaokdckjioipagadidpbldgfabgjp
Claude 限量
免费会员:3.7 每 4~5 小时整点重置,10 条左右,取决于长度
取消了 3.5 和 haiku,没有 thinking
上下文 32k,最大输出 8k。
$20 会员:每 45 小时整点重置,有 3050 次,有 3.7 和 thinking
除了次数,也考虑 token 消耗
所以经常重开新提问,把上下文清零,可以显著减少 token 消耗
上下文,最大输出暂不清楚
thinking 不能调,推测是 16~32k(不确定)
API:上下文 200k,最大输出(含思维链)128k,思维链和最大输出可以自己用参数设置
显示剩余限量插件 https://chromewebstore.google.com/detail/claude-usage-tracker/knemcdpkggnbhpoaaagmjiigenifejfo
Claude 的限量计算很复杂,根据佬友花白的留言,可以装这个 Chrome 扩展
Gemini 限量
Gemini 免费会员:无限量,有 2.0flash,2.0flash thinking,App 版有语音
上下文 32kt
有一个月 $20 会员试用,佬友巧克力雷轰说到期再给两个月的 $9.9 订阅优惠
不过 aistudio 免费模型齐全,一般没必要买会员
Gemini$20 会员:无限量,有 2.0pro 和 1.5 pro deep research
上下文 1mt,输出 8k
AIStudio 免费:2.0flash-thinking-exp/2.0flash/lite:1500 次 / 天
2.0pro-exp:50 次 / 天
1.5pro:50 次 / 天,32k / 分
embedding-03-07:100 次 / 天,新的嵌入模型,3072 维
有语音 + 屏幕识别,只能听中文不能讲中文,貌似不限量
上下文:同 API
AIStudio Tier1:要设置结算卡,填写税务信息等
NotebookLM 免费会员:限量多
NotebookLM $20 会员:限量是免费 5 倍,可以与播客男女主播对话
API:flash 上下文 1m,输出 8k
pro 上下文 2m,输出 8k
flash thinking 上下文 1m,思考 40k,最终输出 26k
Microsoft Copilot(不是 Github Copilot)
免费会员:貌似无限语音,非推理是 4o,无限 o3-mini-high
o3mini 在 copilot.microsoft.com 里有,在 edge 浏览器右上角点 copilot 里面没有
有一个月 $20 会员试用
$20 会员:
Deepseek 限量
免费会员:没有次数限制
貌似邮件注册用户限制联网,手机注册用户可以联网
上下文不确定,最终输出 4k
没有收费会员
API:官方上下文 64k 思考 24k,最终输出 8k
佬友巧克力雷轰说部分第三方(together.ai 等)128k,
豆包
免费会员:没有次数限制,没有语音限制
普通上下文不确定,最大输出 4k
推理:上下文 / 最大输出 4 不确定
豆包 PC 版:提问 / 沉浸式翻译等,用的 doubao-1.5-pro 或 lite,不限量
Cici 的 PC 版:自称用的是 gpt,估计是 4o-mini,不限量
要用新加坡 / 日本等 IP,不能用中国 / 香港 / 美国 IP
Cici 搜索可以搜索被墙网站,豆包不能
没有收费会员
API:上下文 256k,最大输出 12k
第三方应用的限量
Perplexity 限量
免费会员:无限普通搜索(10 来源)
每天 3 次高级搜索(20 来源),推理或深度研究(几分钟)
$20 会员:每天 300 次高级搜索,10 次 4.5
秘塔限量
免费会员:每天 100 次普通搜索(20 来源),研究次数不确定(100 来源)
¥39 会员:每天 500 次普通搜索,50 次研究
Genspark 限量
免费会员:无限普通搜索
每天 5 次高级模型:4o/o1/o3mh/3.7t/3.7/r1
每天 1 次深度研究:266 + 来源,10~20 分钟
没有深度搜索功能
$25 会员:无限高级模型 (o1/4o/3.7/flux/ideogram/recraft/dalle)
感谢佬友 PSP 说:
$25 限制是免费的 5 倍。
所以 PLUS 也就是
每天 25 次以上高级模型对话(如果上下文较短,则可以使用更多次数)
每天 5 次深度研究
更早一步体验新功能
Felo 限量
免费会员:无限普通搜索
每天 5 次专业搜索 (80 + 来源,r1/o3m/4o/3.7)
每天 3 次文件分析
2k 输出
佬友巧克力雷轰说:felo 订阅用户有一个 felo chat,那个每天于 search 共享 300 次数,上下文、输出等可以自由控制(跳转到一个自建的 nextchat 界面)
$20 会员:每天 300 次专业搜索 (加 o3m-high)
深度研究(即将上线)
Poe 限量
免费会员:每天送 3000 积分
$10 会员:每天 1w 积分
$20 会员:每月 100w 积分
还有 $50 和 $100 会员,每积分价格同 $20 没有额外优惠
积分消耗根据不同模型有两种方式,一种是按次消耗,另一种是按次 + xx 积分 /kt
You 限量
免费会员:3 次高级模型或研究(4o/1.5pro/2.0flash/4omini)
$20 会员:佬友 xinxinzi 说每周 500 次高级模型,4.5/o3mh/o1/3.7/3.7thinking/r1,64k 上下文
有深度研究
$30 会员:200k 上下文
minimax.io 限量
是海螺的海外版,很少有人提到,但确是比较少见的,完全免费不限量,又支持搜索被墙网站的 r1 第三方
免费会员:只有 r1 和 minimax-text-01,貌似不限量
没有收费版
abacus 限量
佬友巧克力雷轰说,上下文全系 16k
绑卡支付才能使用,其中首月免费,但首次支付必须订阅两个月来扣除 $10(即每个月 $10)
每个月默认 250w 积分,允许额外购买积分,$10 可购买 100w
Lmarena direct chat 限量
不需要注册,只有免费版,没有收费版,买 API 的资金来自于个人,大学和公司捐赠
有大多数模型,有 3.7,3.7thinking-32k,o3m,3opus,grok3,但没有 4.5,o3mh,o1
上下文限制严重,以 3.7 为例,输入限 8k,输出默认 2k,最大设置 4k
有时会有一些未上市的模型,以代号的形式出现
OpenRouter Chat room 或 API 限量
免费会员:可以用里面免费模型,例如 r1:free,2.0pro-exp,2.0flash-thinking 等,免费模型一般有单位时间限量
但是不管收费还是免费模型,联网都要单独收费,$0.004 / 次
方法:在 Chat room 勾选联网图标,或 API 手动填模型名后加:online,例如 anthropic/claude-3.7-sonnet:online
因为使用 API,官方 API 上下文和最大输出是多少,OpenRouter 的就是多少,不会截断
编程 IDE 的限量
Cursor 限量
免费会员:14 天会员试用,以前可以无限注销再重新开始试用,现在加入了机器码审核机制,要用软件更改机器码
试用期后每月 2000 次自动补完(Cursor Tab)
自己添加 API Key 不收钱,但 API Key 不能用于自动补完
$20 会员:每月 500 次高级快速提问 (包括 3.7/r1/ds3/4o)
慢速提问次数不限(排队长度取决于系统繁忙程度)
特级模型 4.5/o1/opus 要额外单买积分兑换,而且价格不菲
低级模型不限量:4omini/2.0flash
241208:Cursor Chat/Composer 上下文限制 40k,Ctrl+k 限 10k,Agent60~120k
参考 3.7API 上下文是 200k,就是 Cursor 只用到了 claude 上下文上限的 20% 或 5%
某种角度来说,上下文限制,限制了包月 IDE 的性能,导致对 codebase 的视野受限
这可能也是有些人不要用包月,而要用要用 Cline/Roo code+API 的原因之一,API 可以尽量用满大模型 API 的上下文极限,反正花你自己的钱,Cline/Roo code 没必要去限制你的上下文
来源:Cursor – Models
Windsurf 限量
免费会员:无限自动补完
5 次高级模型(4o/3.7/r1/o3m)
$15 会员:每月 500 次高级模型
超出购买 $10=300 次
$50 会员:不限次高级模型
Github Copilot
免费会员:每月 2000 次补全,50 次高级提问(3.7/2.0flash/o3mini)
30 天会员试用
$10 会员:1.5pro/o1
241206:4o 是 64k 上下文,VSC Insider 会员 128k。
claude 上下文不确定
来源:Copilot Chat now has a 64k context window with OpenAI GPT-4o - GitHub Changelog
学生可以免费
Trae
国际版免费会员:3.7/3.5/4o,3.7 经常排队
国内板免费会员:r1/ds3
暂时没有收费会员
Tavily 联网 API
CherryStudio 联网用,每月 1000 次免费
如果不够,可以多注册几个 Tavily 账号,获得多个 API Key,也就麻烦一次,以后只要保存好 API Key 就行,各账号可能永远也不用再登录 Tavily 了
中转站限量
以 OpenAI 的模型为例,不同中转站逆向,即便不被降智,中转站不参水,不故意截断上下文和输出的前提下,根据来源是ⒶCursor 等第三方 /Ⓑ官方免费 /Ⓒ官方 $20/Ⓓ官方 $200 会员,四种情况,上下文,思考长度,最终输出长度也是有差距的,首选只做 $200 会员的逆向
因为逆向是非官方的东西,并没有规范的命名,从逆向名字里并看不出来是哪种来源,通常站长也不会明说,甚至有的站长自己都不知道什么来源,因为是买的二手三手的 api