Gemini 3.1 Flash核心数据:首字延迟8ms、200万token/秒、$0.075/百万输入。

实测表现

  • 分类任务——准确率96%,延迟50ms
  • 提取任务——准确率94%,10倍于GPT-4o-mini的吞吐量
  • 翻译任务——8种语言平均BLEU 82

需要极致速度+低成本+可接受质量时,Flash是最佳选择。Free API额度慷慨。

编译来源:Android Police (2026)