谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%

5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。

该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。

注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

今日霍州(www.jrhz.info)©️

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。

谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

今日霍州(www.jrhz.info)©️

特别声明:[谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

王楚钦3-0横扫赵子豪 京沪大战焦点对决(王楚钦vs业余高手)

北京时间11月15日晚,全运会乒乓球团体赛继续进行,A组的京沪大战成为焦点。樊振东休战准备男单决赛,王楚钦作为一单重新出发,在第二盘零封直板名将赵子豪

王楚钦3-0横扫赵子豪 京沪大战焦点对决(王楚钦vs业余高手)

乌镇偶遇『宋轶』,穿大花奶奶裤子气质直接拉满,这身材脸蛋麻袋都美(杭州乌镇宋城旅游攻略)

我刷手机时无意中刷到一组『宋轶』在乌镇的路透照,整个人直接被惊艳到说不出话——她这身『打扮』简直美到犯规! 照片里『宋轶』只穿了件紫色『针织衫』配着大花裤子,可就是这么一身看似随性的搭配,却让她整个人散发出一种“松弛感美人”…

乌镇偶遇『宋轶』,穿大花奶奶裤子气质直接拉满,这身材脸蛋麻袋都美(杭州乌镇宋城旅游攻略)

卢伟冰不服,6K档最强小米17Pro Max,4K档最强K90ProMax(卢伟冰升职了)

国产四大旗舰方面,小米17系列截止11月9日达到211.8万,也是高居目前国产旗舰第一,然后红米K90系列,截止到45『周也』就是11月9日,K90系列销量是33.5万,K90Pro Max是16.6万,这样…

卢伟冰不服,6K档最强小米17Pro Max,4K档最强K90ProMax(卢伟冰升职了)

宁静的“直觉”真没错!现在才发现,原来『张柏芝』的面相早就变了

我记得那会儿网络上一片议论——“『张柏芝』的好日子也就到头了”“她就是自找的,活该”……谁还记得,她其实才20出头,就被生活逼成了一道防线。 她是那个凌晨三点,还在为孩子张罗早餐的人,是眉头带笑、却从不示弱的单…

宁静的“直觉”真没错!现在才发现,原来『张柏芝』的面相早就变了

他是『娱乐圈』️最惨影帝,科班出身却相貌平平,今靠《唐诡》二次翻红(『娱乐圈』️里他最甜小说)

但你可能不知道,这位在荧幕上带来欢笑的演员,现实中却有着一段颇为坎坷的演艺经历。 真正让他被观众记住的角色,是《宝莲灯》里的“哮天犬”。但颇具讽刺的是,由于电影受众有限,这个成就很少被人知晓,“最惨影帝”的称…

他是『娱乐圈』️最惨影帝,科班出身却相貌平平,今靠《<strong>唐诡</strong>》二次翻红(『娱乐圈』️里他最甜小说)