谷歌近日正式推出Gemini CLI Extensions框架,标志着其命令行AI工具进入开放生态建设阶段。该框架允许第三方开发者无需经过谷歌审核即可直接发布扩展程序,首批合作伙伴包括Figma、Stripe等知名企业,目前扩展库已涵盖支付API集成、基础设施自动化等50余种实用场景。
技术实现上,扩展开发基于模型上下文协议(MCP)服务器架构。开发者通过gemini-extension.json清单文件定义扩展属性,配合TOML格式的命令快捷方式,即可将复杂提示词转化为终端可调用的斜杠命令。谷歌高级工程师Taylor Mullen强调,这种开放生态设计是项目的核心价值,所有扩展均托管于GitHub公共存储库,支持开发者自主安装使用。
值得注意的是,谷歌自身已发布Nanobanana图像生成扩展,用户可直接在终端通过文本提示生成并编辑图像。扩展安装后,Gemini CLI会根据上下文智能判断是否调用相关工具,同时也支持通过/extension命令手动触发特定功能。
此次更新与Gemini CLI此前深度集成FastMCP的技术路线一脉相承。早前版本通过与FastMCP框架的整合,已实现MCP服务器开发时间从小时级到分钟级的效率跃升,包括自动处理依赖冲突、协议字段清理等复杂任务。新推出的扩展框架进一步强化了ReAct推理循环能力,可支持自动错误修复、新功能开发等高级场景。
市场观察人士指出,谷歌选择在OpenAI发布ChatGPT应用两天后推出该功能,凸显了命令行AI工具领域的竞争态势。与ChatGPT严格的应用审查机制不同,Gemini CLI采取完全开放的扩展策略,这种差异化的生态建设思路或将重塑开发者工具市场格局。
目前Gemini CLI已吸引超百万开发者用户,并逐步整合至Firebase Studio云IDE及Zed Editor等开发环境。个人用户通过Google账号登录可享受每分钟60次请求的免费额度,企业用户则可通过Google Cloud Run部署MCP服务以获得更高级别的安全性和扩展性保障。
© 版权声明
文章版权归作者所有,未经允许请勿转载。