最近AI越来越火了。
我发现里面有很多概念有些小伙伴有点分不清楚,比如:Prompt、Agent、Function Call、Skill、MCP等。
今天这篇文章专门跟大家一起聊聊这个话题,希望对你会有所帮助。
更多项目实战在项目实战网:java突击队
先上干货,这张图让你从整体上理解这五个概念是如何分层递进的:
一句话概括:
Prompt 是你跟AI说的“人话”
Function Call 让AI能“动手干活”
Agent 让AI会“思考规划”
Skill 是AI的“职业技能证书”
MCP 是AI世界的“USB接口”
下面我们一层一层拆开揉碎了讲,每层都有Java代码示例。
Prompt(提示词) 就是你输入给AI的文本指令。
它就像你去餐厅点菜时说的“来一份宫保鸡丁”,AI就是那个服务员,听懂你的话然后给你上菜。
在Java里,调用AI模型的第一步就是构造Prompt。
我用最简单的Spring AI示例来演示:
java体验AI代码助手代码解读复制代码import org.springframework.ai.chat.ChatClient; import org.springframework.ai.chat.prompt.Prompt; import org.springframework.ai.chat.prompt.SystemPrompt; import org.springframework.ai.chat.prompt.UserPrompt; @Service public class AIService { private final ChatClient chatClient; public AIService(ChatClient chatClient) { this.chatClient = chatClient; } public String askAI(String question) { // 构造Prompt:可以包含系统消息和用户消息 Prompt prompt = new Prompt( new SystemPrompt("你是一个Java架构师,擅长用通俗的语言解释技术概念。"), new UserPrompt(question) ); // 调用AI并返回结果 return chatClient.call(prompt).getResult().getOutput().getContent(); } }这里的SystemPrompt和UserPrompt就是最基础的Prompt形式。
它们决定了AI的身份和你要问的问题。
光有基础Prompt还不够,在实际应用中我们经常需要提示词工程来引导AI做出更好的回答。比如:
java体验AI代码助手代码解读复制代码public String generateJavaCode(String requirement) { String promptTemplate = """ 你是一个资深的Java开发工程师。 请根据以下需求生成Java代码,代码要包含必要的注释,并考虑异常处理: 需求:%s 请输出完整的Java类代码。 """; String prompt = String.format(promptTemplate, requirement); return chatClient.call(new Prompt(prompt)).getResult().getOutput().getContent(); }Prompt的本质:它是人类意图与AI能力之间的“翻译官”。
Prompt写得好,AI才能干得好。
Prompt只能让AI“说话”,但AI想干点实事(比如查数据库、发邮件、调用第三方API)时,就无能为力了。
Function Calling(函数调用) 就是来解决这个问题的。
Function Calling允许开发者在调用大模型时,注册一系列函数(工具),模型在生成回复时如果判断需要调用外部工具,就会返回一个结构化的请求,由开发者执行真实的函数,再把结果返回给模型生成最终答案。
原理图如下:
我用LangChain4j来演示,因为它对Java开发者很友好。首先定义工具函数:
java体验AI代码助手代码解读复制代码import dev.langchain4j.agent.tool.Tool; import java.time.LocalDateTime; import java.time.format.DateTimeFormatter; public class WeatherTool { @Tool("获取指定城市的实时天气") public String getWeather(String city) { // 这里应该是真实的API调用,为了演示我们模拟数据 if ("北京".equals(city)) { return "北京当前天气:晴,温度25℃,湿度40%"; } else if ("上海".equals(city)) { return "上海当前天气:小雨,温度22℃,湿度80%"; } else { return "抱歉,暂不支持该城市天气查询"; } } @Tool("获取当前时间") public String getCurrentTime() { return LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")); } }然后创建AI服务并绑定工具:
java体验AI代码助手代码解读复制代码import dev.langchain4j.model.chat.ChatLanguageModel; import dev.langchain4j.model.openai.OpenAiChatModel; import dev.langchain4j.service.AiServices; public class WeatherAssistant { interface Assistant { String chat(String userMessage); } public static void main(String[] args) { ChatLanguageModel model = OpenAiChatModel.builder() .apiKey(System.getenv("OPENAI_API_KEY")) .modelName("gpt-4") .build(); Assistant assistant = AiServices.builder(Assistant.class) .chatLanguageModel(model) .tools(new WeatherTool()) // 注册工具 .build(); // 用户提问 String response = assistant.chat("北京现在天气怎么样?"); System.out.println(response); response = assistant.chat("现在几点了?"); System.out.println(response); } }当用户问天气时,模型会判断需要调用getWeather函数,LangChain4j自动处理了函数调用的整个流程,最后把结果整合成自然语言返回。
让AI从“静态知识”变成“动态能力”。
没有Function Calling,AI只能回答训练数据里的内容;有了它,AI可以实时获取最新信息,甚至可以操作你的系统。
Function Calling让AI能调用工具,但它还是被动的一问一答。
如果遇到复杂任务,比如“帮我规划一次杭州三日游”,需要查天气、查景点、查酒店、算预算……这时候就需要Agent(智能体) 出场了。
Agent是一个能够感知环境、做出决策并执行动作的自主系统。
它不像Function Calling那样只是“单次工具调用”,而是具备完整的“思考-行动-观察”闭环能力。
通俗说,Function Calling是“会用手”,Agent是“有大脑”。
目前主流Agent都采用ReAct(Reasoning + Acting)框架。
它的工作流程是:
思考(Thought):分析当前状态,决定下一步要做什么
行动(Action):调用某个工具
观察(Observation):获取工具返回的结果
循环:直到任务完成
我们用LangChain4j的AiServices结合工具来实现Agent。
首先定义多个工具:
java体验AI代码助手代码解读复制代码import dev.langchain4j.agent.tool.Tool; public class TravelTools { @Tool("查询某城市未来一周的天气") public String queryWeather(String city) { // 模拟天气查询 return city + "未来一周天气:前三天晴,后四天多云,气温20-28℃"; } @Tool("查询某城市的知名景点") public String queryAttractions(String city) { // 模拟景点查询 if ("杭州".equals(city)) { return "杭州知名景点:西湖、灵隐寺、西溪湿地、宋城"; } else if ("上海".equals(city)) { return "上海知名景点:外滩、东方明珠、迪士尼乐园"; } return "暂无该城市景点信息"; } @Tool("计算预算") public String calculateBudget(String city, int days) { // 模拟预算计算 int base = 500; int total = base * days; return city + days + "天游预算约为:" + total + "元(不含大交通)"; } }然后创建Agent:
java体验AI代码助手代码解读复制代码import dev.langchain4j.model.chat.ChatLanguageModel; import dev.langchain4j.model.openai.OpenAiChatModel; import dev.langchain4j.service.AiServices; import dev.langchain4j.memory.chat.MessageWindowChatMemory; public class TravelAgent { interface TravelPlanner { String planTrip(String request); } public static void main(String[] args) { ChatLanguageModel model = OpenAiChatModel.builder() .apiKey(System.getenv("OPENAI_API_KEY")) .modelName("gpt-4") .build(); TravelPlanner agent = AiServices.builder(TravelPlanner.class) .chatLanguageModel(model) .tools(new TravelTools()) .chatMemory(MessageWindowChatMemory.withMaxMessages(20)) // 记忆,让Agent能记住上下文 .build(); String result = agent.planTrip("帮我规划一个3天的杭州游,包括天气、景点和预算"); System.out.println(result); } }这个Agent会自己决定先查天气、再查景点、再算预算,然后把所有信息整合成一份完整的旅行计划。整个过程是自主的,不需要我们写死流程。
Function Calling是Agent的“手”,Agent是拥有“大脑”的完整系统。
Agent通过Function Calling调用工具,但Agent多了“规划”和“记忆”能力,能处理更复杂的任务。
当Agent需要处理不同领域的任务时,如果让一个Agent掌握所有知识和工具,会变得臃肿且容易出错。
这时候就需要Skill(技能) 的概念。
Skill是一套封装了特定领域知识、最佳实践和工具组合的“技能包”。
它就像我们人类的职业资格证书——一个医生有“看病技能”,一个程序员有“写代码技能”。
Anthropic最早提出Skill概念,一个Skill通常包含:
领域专用的提示词模板
一组相关的工具函数
特定的工作流逻辑
我们可以把Skill定义为一个独立的模块,包含自己的工具类和提示模板。
例如,一个“前端开发Skill”:
java体验AI代码助手代码解读复制代码// 前端技能专属工具 public class FrontendTools { @Tool("生成React组件代码") public String generateReactComponent(String componentName, String props) { return """ import React from 'react'; const %s = (%s) => { return <div>Hello, {props.name}</div>; }; export default %s; """.formatted(componentName, props, componentName); } @Tool("检查CSS命名规范") public String checkCssNaming(String cssCode) { // 模拟CSS检查逻辑 return "CSS规范检查通过"; } } // 前端技能的提示词模板 public class FrontendPrompts { public static final String SYSTEM_PROMPT = """ 你是一个资深前端开发工程师,精通React、Vue、CSS等前端技术。 请严格按照前端最佳实践生成代码,确保代码可维护。 """; } // 创建前端专家Agent public class FrontendAgent { public static void main(String[] args) { ChatLanguageModel model = OpenAiChatModel.builder() .apiKey(System.getenv("OPENAI_API_KEY")) .modelName("gpt-4") .build(); Developer assistant = AiServices.builder(Developer.class) .chatLanguageModel(model) .tools(new FrontendTools()) .systemMessageProvider(ignored -> FrontendPrompts.SYSTEM_PROMPT) .build(); String code = assistant.generateCode("创建一个计数器组件,有加一减一按钮"); System.out.println(code); } }在大型系统中,我们通常会有多个Agent,每个Agent加载不同的Skill:
前端Agent:加载ReactSkill、CSSSkill
后端Agent:加载SpringSkill、DatabaseSkill
运维Agent:加载K8sSkill、MonitoringSkill
每个Agent只拥有完成自己领域任务所需的最小知识集,既提高了精准度,又保障了安全。
一句话说清本质:
Function Call 是一种能力:让AI能够调用外部函数(工具)
Skill 是一个模块:封装了特定领域的知识、最佳实践和一组相关的Function Call
用个比喻:
Function Call 像锤子、螺丝刀、扳手这些具体工具
Skill 像木工工具箱:里面有锤子、锯子、尺子,还附带一本《木工操作手册》
下面从代码看看它们的区别。
java体验AI代码助手代码解读复制代码public class WeatherTool { @Tool("获取天气") public String getWeather(String city) { // 调用天气API return callWeatherAPI(city); } }这个工具只能干一件事:查天气。
java体验AI代码助手代码解读复制代码// 前端开发Skill - 包含多个工具 + 专业知识 public class FrontendSkill { // 工具1:生成React组件 @Tool("生成React组件") public String generateComponent(String name) { return "React组件代码..."; } // 工具2:检查CSS规范 @Tool("检查CSS规范") public String checkCss(String css) { return "检查结果..."; } // 工具3:优化性能建议 @Tool("提供前端性能优化建议") public String performanceAdvice(String code) { return "优化建议..."; } // 还有领域知识(不是工具,而是提示词模板) public static final String SYSTEM_PROMPT = "你是一个资深前端专家,精通React、Vue、CSS优化..."; }这个Skill包含了多个工具,还带有领域知识。
核心区别对比表:
| 维度 | Function Call | Skill |
|---|---|---|
| 本质 | 单一能力 | 能力集合 + 知识 |
| 粒度 | 原子操作 | 业务模块 |
| 是否包含工具 | 本身就是工具 | 包含多个工具 |
| 是否包含知识 | 不包含 | 包含领域知识和最佳实践 |
| 类比 | 单个螺丝刀 | 电工工具箱 + 电工手册 |
| 应用场景 | 查天气、发邮件等单次操作 | 前端开发、运维管理、财务分析等专业领域 |
| 代码形式 | 单个@Tool方法 | 多个@Tool方法 + 系统提示词 |
为什么需要区分这两个概念?
设计层面的解耦:Function Call是底层能力,Skill是业务封装。底层能力稳定,上层业务可以灵活组合。
复用性:好的Skill可以跨项目复用,就像代码库里的工具包。
安全性:可以给不同的Agent分配不同的Skill,实现权限隔离(前端Agent不能调用后端数据库)。
总结:
Function Call:AI的“手”,能干活
Skill:AI的“职业培训证书”,让AI知道怎么干好某个领域的事
Function Call + 领域知识 + 最佳实践 = Skill
下次再有人问这个问题,你可以直接甩给他这张表,然后说:“锤子是Function Call,工具箱是Skill,懂了吗?”
随着Agent越来越多,每个Agent都要接入不同的工具,每个AI模型(OpenAI、Claude、文心一言)的Function Calling格式还不一样。
这就导致开发者要针对每个模型写一套工具适配代码,非常痛苦。
MCP(Model Context Protocol,模型上下文协议) 就是来解决这个问题的。
MCP是Anthropic提出的一个标准化协议,它定义了一套统一的接口,让AI模型可以像USB设备一样动态发现和调用工具。
核心思想:
工具以Server的形式暴露(MCP Server)
AI应用作为Client(MCP Client)连接Server
Server提供工具清单和调用接口
Client统一格式调用,无需关心底层工具具体实现
Spring AI 2.0已经原生支持MCP,可以非常方便地构建MCP客户端和服务器。
作者:苏三说技术
链接:https://juejin.cn/post/7614205951297732654
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。