分享好友 健康资讯首页 健康资讯分类 切换频道

谷歌开源“Agent Skill 超级工具箱”,云、库、引擎、AI全线打通,开发者狂喜

2026-04-27 18:052036kr

上周五,OpenAI 发布 GPT-5.5 与 DeepSeek 推出 V4 模型几乎同时上演,大模型市场的竞争正进入白热化阶段。

面对竞争对手的快速迭代,谷歌生态的技术从业者正在积极寻找应对之道——越来越多的人开始借助智能体 Agent 来构建和优化基于谷歌云平台的应用,从 Firebase、Gemini API 到 BigQuery 和 Google Kubernetes Engine(GKE)。

但值得注意的是,在竞争日益激烈、技术快速演进的背景下,一个关键问题变得尤为突出:如何确保模型掌握关于这些技术准确、最新的信息?

在实际开发中,这个问题的棘手程度远超想象。

开发者往往需要为每个云服务编写适配器,将 API 调用封装为智能体可调用的工具函数,然后反复调试模型是否正确调用了工具、传入了正确参数。更麻烦的是,一旦底层服务 API 发生变化,所有适配器都需要手动更新。这不仅是重复劳动,更是一种隐性的技术债。

为了解决这个问题,谷歌为开发者文档提供了 Model Context Protocol(MCP)服务器,让智能体能够连接到可靠的实时信息源。但随之而来的,是一个被称为 “上下文膨胀”(Context Inflation)的新挑战。

MCP 服务器的核心价值在于为模型提供即时的外部信息。

但它自身也有局限性:当智能体大规模使用 MCP 服务器时,大量上下文信息会被不加区分地加载到模型的上下文窗口中。这种做法带来两个严重后果:其一,过多的信息会使模型混乱,降低推理质量——这一问题在企业实践中已被反复验证,有团队发现智能体在每次调用时加载 1.5 万 个 tokens 的指令,几乎不给实际需要处理的内容留下任何上下文空间;其二,上下文窗口的每一次填充都会转化为实实在在的 Token 成本,随着调用量增长,开销曲线会变得难以忽视。

面对这一困境,业界迫切需要一种更精细的信息供给方式——既能让智能体获得所需的专业知识,又不至于被冗余信息淹没。

这正是 Agent Skills 应运而生的背景。

谷歌官方 Skill 仓库正式上线 

那么,究竟什么是 Agent 的 Skills?

根据官方定义,Skill 是一种 “简单开放的格式,用于赋予智能体新的能力和专业知识” 。我们可以将其理解为针对特定技术或任务的精简的、以智能体为中心的文档。

Skills 的设计哲学可以用两句话概括:用 Markdown 编写,保持轻量;按需加载,避免冗余。每一份 Skill 文件可以包含参考文档、代码片段和其他资源,智能体仅在需要时才加载相关信息,从而大大降低了上下文信息过载的风险。

从技术定位来看,Skills 占据了一个独特的位置。它在传统提示 Prompt 之上——因为 Skills 是可复用的、持久的;比微调(Fine-tuning)更轻——因为它能以业务逻辑的速度迭代;比 RAG(检索增强生成)更主动——它不是被动的信息检索,而是主动的专业知识注入;比普通工具(Tools)更丰富——因为它不仅编码了“做什么”,还编码了“怎么做”和“为什么这么做”。

在 Google Cloud Next 2026 大会的第一天,谷歌正式宣布推出 Google 官方 Agent Skills 仓库。

这一消息被认为是本届大会最具实用价值的发布之一。

项目地址为:github.com/google/skills 。

该代码库包含十三项技能,涵盖谷歌云最核心的服务:AlloyDB、BigQuery、Cloud Run、Cloud SQL、Firebase、Gemini API 和 Google Kubernetes Engine(GKE)。

这些技能帮助智能体理解如何创建、查询和管理云资源,是 Agent 操作谷歌云基础设施的能力基础。

还包括三大架构支柱技能。

这三大支柱技能的重点不在于教会智能体调用某个具体 API,而是让它理解云系统设计的原则与决策逻辑,从而在更高层面提升应用质量。

此外,仓库还提供了三项面向常见任务的流程指南:Google Cloud 入门(Onboarding to Google Cloud)、身份验证(Authenticating to Google Cloud)和网络可观测性(Google Cloud Network Observability) 。这些“秘诀”将日常操作拆解为可执行的步骤,让智能体能够按照既定流程完成特定工作。

Agent Skill 到底有什么用? 

要理解 Agent Skills 的真正价值,不妨回到真实开发场景。

在 2026 年的今天,构建 Agent 的实际情况与演示截然不同:开发者花费大量时间编写和维护工具适配器——一位构建文档处理智能体的开发者透露,她用于维护适配器的时间已经超过了构建智能体逻辑本身的时间。

Skills 仓库正是为了解决这一痛点而生。官方 Skills 经过针对实际模型的测试和优化,谷歌已验证其能在 Gemini 上可靠运行;同时,Skills 兼容 MCP 标准,可以跨平台使用,不限于 Vertex AI;当底层云 API 发生变化时,谷歌会负责更新相应技能,开发者无需自行维护;此外,Skills 直接使用开发者已有的 GCP 凭证,无需编写额外的认证代码。

在兼容性方面,Skills 展示出极强的跨平台能力。通过 npx skills install github.com/google/skills 命令,开发者可以将这些技能安装到多种智能体平台中,包括 Antigravity、Gemini CLI,以及 Claude Code、Cursor 等第三方智能体工具。

近期发布的 Antigravity 平台已经深度整合了 Skills 体系,支持通过规则(Rules)、技能(Skills)和工作流(Workflows)三个层级,将通用智能体转变为专业、稳健且高效的工作伙伴。同时,Gemini CLI 也通过更新内置了对 Skills 的原生支持,让开发者可以在命令行环境中直接调用专业化技能。

再来看个具体的例子,每个 Skill 都包含:

经过实际模型测试——不仅仅是“这里有一个函数”,而是经过优化的描述,这些描述已由谷歌验证,可与 Gemini 稳定兼容。兼容 MCP——符合模型上下文协议 (MCP) 标准,因此可跨平台运行,而不仅限于 Vertex AI。版本控制和维护——当底层云 API 发生变更时,谷歌会更新技能,无需用户亲自动手了。预认证——使用现有的 GCP 凭据,无需自定义授权码。

例如,BigQuery 技能在实践中看起来是这样的:

对比一下没使用该技能时要写的东西:

每个项目可能大概要写四到十个这样的工具代码。而技能库可以帮你省去所有这些代码。

事实上,早在谷歌发布这款官方 Agent Skill 库之前, 谷歌云 AI 总监、Gemini 工程负责人 Addy Osmani 在领英上宣布开源了一款 Agent Skills 库:为 AI 编码智能体打造的 19 项工程技能 + 7 条命令,灵感源自 Google 最佳实践。

项目地址:https://github.com/addyosmani/agent-skills

他在文章中写道:“我们知道 AI 编码智能体很强大。但如果任由它们自由发挥,它们就会走捷径——跳过规格说明、跳过测试、跳过安全审查。它们会更倾向于追求‘完成’而非‘正确’。这就是我构建 Agent Skills 的原因。每一项技能都编码了资深工程师实际使用的工作流、质量关卡和最佳实践:编码前先制定规格、合并前先进行测试、优化前先进行测量。这些内容被打包好,让你的智能体能够始终如一地遵循。

完整的生命周期覆盖:

→ Define(定义)——在写第一行代码之前,先打磨想法、撰写规格说明

→ Plan(规划)——分解为小而可验证的任务

→ Build(构建)——增量式实现、上下文工程、清晰的 API 设计、测试驱动开发(TDD)

→ Verify(验证)——使用 DevTools 进行浏览器测试、系统化调试

→ Review(审查)——代码质量、安全加固、性能优化

→ Ship(交付)——Git 工作流、CI/CD、架构决策记录(ADR)、发布前检查清单

这些技能兼容 Claude Code、Cursor、Antigravity,以及任何接受 Markdown 指令的智能体。

Addy Osmani 的这款 Agent Skills 代码库把谷歌资深工程师的工作习惯,拆成 20 个可组合的 Skill,约束 AI 每一步都按工程规范干活。

目前,Addy Osmani 的开源项目已经在 Github 上获得近 2.4 万 star。

那么,这两款都出自谷歌的 Agent Skills 代码库有何不同,分别解决什么问题?

Osmani 的项目解决的是“如何正确地构建”的问题——它是一套确保智能体编码行为符合专业标准的通用工程纪律框架。无论你使用哪个云平台、开发什么类型的软件,这套技能都能指导你的智能体遵循规格驱动开发、增量式实现、测试优先等专业实践。

谷歌官方开源的 Agent Skills 仓库解决的则是“构建什么以及如何操作”的问题——它提供的是针对特定技术栈(Google Cloud)的具体操作知识。当智能体需要创建 BigQuery 数据集、配置 GKE 集群或设计 Cloud Run 服务时,官方技能将提供准确的、经过验证的指令。

在实际使用中,两者可以并存于同一个智能体环境中:Osmani 的技能包用于规范智能体的整体开发行为,而 Google 官方技能库则在智能体需要与 Google Cloud 服务交互时提供精准的操作知识。

这两个项目的先后出现,印证了 Google 在 Skills 领域的独特布局策略:既拥抱个人驱动的开源创新,又通过官方仓库为整个生态提供标准化的知识基础设施。这种“个人 - 官方”的双轨模式,或许正是技能成为“智能体工作流公认抽象层”的关键一步。

对于开发者而言,这意味着你既可以借助 Osmani 的技能包让智能体像资深工程师一样严谨工作,又可以借助官方技能仓库让智能体准确无误地操作 Google Cloud 服务——两者协同,构成了一个既遵守工程纪律又掌握专业知识的人工智能“超级员工”。

参考链接:

https://dev.to/pooja_bhavani/googles-most-important-next-26-announcement-wasnt-gemini-25-ultra-27ff#comments

https://cloud.google.com/blog/topics/developers-practitioners/level-up-your-agents-announcing-googles-official-skills-repository

https://www.linkedin.com/posts/addyosmani_ai-softwareengineering-programming-activity-7446081634577309696-iT-5/

本文来自微信公众号“InfoQ”,作者:冬梅,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
民营银行:走到「拼爹」的尽头
如果民营银行始终抱着「靠爹吃饭」的心态,最终只会变成一家平庸的、没有特色的地方银行。——馨金融最近,又有民营银行大股东易主的消息传出。亿联银行,这家曾被视为行业「黑马」的东北民营银行,由于大股东深陷债务危机,控股权将被地方国资平台接手。如果交易落定,它将成为继安徽新安银行、江西裕民银行、无锡锡商银行之后,国内第四家被地方国资接盘控股的民营银行。这样的结局,并不让人意外。尽管民营银行 2025 年年

0评论2026-04-272

智能经济的内涵、特征和规模测算
智能经济是我国原创我们使用的专业术语,多是由外国人首先提出。主要有12个:数字经济、人工智能、大数据、工业互联网、云计算、物联网、电子商务、电子政务、平台经济、智慧城市、独角兽和元宇宙。智能经济不同,它是我国原创。其提出有三个关键点: 一是1990年,三名广西学者发表雄文《21世纪经济学创言——论智能经济》,前瞻性作出21世纪是智能经济时代的战略判断。这是最早的一篇文献。 二是2017年,人工智能

0评论2026-04-272

中国政法大学教授刘纪鹏:好的股市就是让大家都能挣到钱
市场人气与科技赛道热度同步攀升,资本市场正站在生态重塑的关键节点。在第20届中国投资年会上,中国政法大学教授刘纪鹏直言:“好的股市就是让大家都能挣到钱”,一语点破资本市场的核心价值,也为当前行情行稳致远指明方向。从3040点到4000点,本轮牛市的巩固离不开制度革新的支撑。刘纪鹏指出,“一股独大”已成为制约资本市场发展的大地雷,无论是国企还是民企,高比例控股带来的减持压力、治理失效,正成为市场循环

0评论2026-04-271

Anthropic、OpenAI、谷歌和微软都认为智能代理控制层是产品,但在定价上存在分歧
3 月 30 日,Sycamore宣布 了 6500 万美元的种子轮融资,用于构建其创始人所说的自主企业级 AI 操作系统。4 月 8 日,Anthropic 在公共测试版中推出了每会话小时八美分的 托管代理。七天后,OpenAI 将自己的模型原生控制层(harness)作为开源 Agents SDK 的更新 发布,除标准 API 和工具费用外,无需支付额外的第一方运行时费用。十六天内的三个动作,

0评论2026-04-271