EntAI 雷达摘要
- 适合人群:AI 开发者、技术决策者、科技行业观察者
- 影响领域:人工智能、云计算与开发者工具
- 机会判断:机会判断:托管代理和后台执行能力的成熟,为开发者构建能处理数小时级复杂任务的 AI 应用提供了更稳定的基础设施,抢先适配可能获得代理工作流落地的时间差优势。
- 风险提醒:风险提醒:谷歌将前沿能力预期性锁定在单一新接口,可能导致旧版 API 生态的使用者被迫追赶升级,并面临与谷歌技术栈绑定加深的隐患。
- 推荐标签:谷歌、Google、Gemini、API、开发者、AI代理
- 推送优先级:3/5
谷歌又有新动作了。 💡 就在这两天,谷歌正式宣布,其 Interactions API 已经达到正式发布状态。简单来说,这个接口从现在起,就是你跟 Gemini 模型和各种 AI 代理打交道的主要通道了。 🚀 这个 API 其实去年 12 月就开始了公开测试。经过半年的打磨,正式版带来了几个实打实的更新:接口结构稳定了,不会再随便变来变去;新增了托管代理、后台执行这些硬核能力;还预告了个叫 Gemini Omni 的玩意,不过具体啥时候上还不知道。 📌 对搞技术的人来说,变化挺直接的。现在你去看谷歌所有的官方文档,默认教的都是用这个新接口。谷歌 AI Studio、Gemini API 这些核心工具也都已经切换过来了。如果你暂时不想动,文档里也留了个小开关,可以随时切回老版代码格式参考。 ⚡ 对普通打工人和开发者有什么用?
最实在的点是,这个新接口是为那些需要长期运行、有状态的复杂任务设计的。啥意思呢?就是以后让 AI 帮你干一个需要好几步、持续一会儿的活儿,比如花几小时做一份深度行业调研、自动帮你盯数据变化然后写周报,这种复杂的“代理”式工作,用新接口会更稳、更顺。老的那套 generateContent API 也没被抛弃,常见的模型还会继续支持,但在长线任务、前沿代理功能上,新接口会是主战场。 🤖 还有个有意思的细节。谷歌发现,现在大多数开发者都在用 AI 编码助手写代码了,于是专门做了个叫 gemini-interactions-api 的技能包。你把这个技能包丢给编码代理,它就能自动学会用新接口的极佳写法,怎么弄流式传输、怎么调用函数、怎么搞结构化输出,它全懂。 ✅ 生态合作这件事也没落下。合作伙伴 LiteLLM、Eigent 和 Agno 已经接入了 Interactions API,开发者现在就能在他们那边用上了。谷歌自己也发了详细的迁移指南,把新旧接口的每块字段都给你对应好了,想啥时候搬就啥时候搬。钥匙在哪?直接去 Google AI Studio 拿你的 API 密钥就行。
EntAI观察
这次升级表面是换个新接口,实际上意味着谷歌正在把“构建能干活儿的 AI 代理”这件事,从实验性质推向工程化标准。当一家巨头把某个接口定为默认,并暗示前沿功能将仅在其上发布时,这可能是在替开发者做一次重要的技术选型。未来,能够处理长周期、有状态的代理任务,或许会成为区分新老两代 AI 应用的一个分水岭。
觉得有用?点个赞