对话成本策略比较器

策略 A 视为整段对话始终命中上下文缓存的基准;策略 B 带摘要与窗口。下方曲线是简化估算,用于心里有数,不等于账单。
离线单页 · 保存即可用

趋势与结论

横轴为对话轮数 N,纵轴为累计花费(元)。绿色条带表示在本模型下 B 的总成本不高于 A 的轮次范围。

这是简化估算,用于心里有数;与真实账单可能因细则而异。建模边界见「模型在算什么」。

两条折线为策略 A 与 B 的累计成本,另有差值曲线。读屏:参数变化与探点读数统一在页面内的状态播报区朗读。可用「按轮次查看」输入轮数或上一/下一轮;焦点在图表区域、或在探点区(轮数输入框除外)时,可用左右方向键切换轮数。勿依赖图上不可见的悬停热点。更完整的键盘与读屏说明在探点区可展开的「键盘与读屏说明」里。

成本大致打平的轮次
模拟末尾谁更省
更多读数:摘要长度 S、B 更省占比
估算摘要长度(S)
B 更省的轮次占比

按轮次查看数字

输入轮次即可看该轮累计成本;图表区或「上一/下一轮」聚焦时,可用键盘左右键切换。

键盘与读屏说明
轮数输入框内:左右键移动光标。焦点在「上一/下一轮」按钮、或图表区域(可见焦点环)时:左右键切换轮次。鼠标可悬停曲线读数。读屏请听页面顶部状态播报区;勿依赖图上不可见的悬停热点。

轮数不超过侧栏中的「最大模拟轮数」。

正在计算…
策略 A(全程命中缓存,基准) 策略 B(当前所选摘要与窗口) 差值:B 减 A 成本打平附近
从第几轮 到第几轮 持续轮数 哪边更省
模型在算什么(点开)

策略 A 按「前缀一直能走缓存读」的理想情况估算。策略 B 在窗口变满后用偏保守的近似(缓存优势会弱一些)。批量裁剪模式下,非裁剪轮仍可走前缀缓存,裁剪或总结轮会重置。结果用于看趋势和数量级,请对照真实计费规则。