没错,你可以把 MCP 看做是一个标准化的、解决不同领域问题的「集合工具包」,Ta 把某一领域需要用到的功能都打包在了一起,并且用标准化的协议来连接大模型。这样一来,不同的大模型都能够统一地使用工具包里的每一个工具.
MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司推出的开放标准协议,目前这个技术标准还在发展当中,更加复杂的技术概念就不在这里赘述了,感兴趣的朋友可以搜索更多资讯进一步了解。
二者对比

多模态:给AI嘴巴、眼睛和耳朵
除了传统的文本对话和工具调用之外,现代 AI 大模型正逐步具备强大的多模态能力。这意味着,AI 不仅能“说”,还能“看”图像、听语音,甚至处理视频内容,从而为产品带来更多维度的交互体验。
具体来说,多模态能力体现在以下方面: ※ 视觉识别与生成 能看图,也能画图。AI 可以看懂图片,也可以根据描述自动生成符合风格的图片素材。 ※ 语音识别与合成 听人话,说人话。AI 能听懂用户说的话,也能够通过语音回应用户。 ※ 视频内容解析 看视频,做视频。AI 能看懂视频的内容,并且有自己的理解。与此同时,AI 也在逐步具备生成视频的能力,仍在发展中。
通过多模态交互,你可以让 AI 大模型变得更加“全能”,不仅限于文字对话,而是通过视觉、听觉等多个感官渠道与用户互动,为产品创新提供更多可能。
AI Agent
最近到处都在讲的 AI Agent,就是把这些能力整合在一起,通过感知、决策和使用工具,成为一个能自主思考并完成任务的智能助手。
小结
你可以把你产品的各种能力按需包装成「工具」或者「工具包」,AI 不止会「说」,还能真正去「做」。 此外,可按需接入多模态能力,赋予 AI「看」、「听」、「说」的能力。 这样一来,AI 同你产品的结合度会更加紧密,也可以更好地满足用户的需求。
2.3 PUA大模型,教Ta做事
大模型什么都懂,但 Ta 不一定懂你。那怎么让大模型知你懂你、按照你想要的方式和答案去回答用户呢?
请掌握好两大「PUA」大法:模型微调(Fine-tuning)和检索增强生成(RAG)。
说人话就是:喂饭和给辞典。
给AI喂饭:模型微调(Fine-tuning)
俗话说,熟读唐诗三百首,不会作诗也会吟。如果你对 AI 针对某些问题的回答不够满意,就可以用填鸭式教学的方式不停地给 Ta 举例子,让 Ta 逐步变成你想要的模样。
通过「喂饭」,可以把一个通用大模型转化为「医疗问答专家」,或者一个「中二少年」。需要注意的是,虽然这里叫「微调」,但 AI 的「饭量」很大,你需要提供足够多的数据,Ta 才能够有更加稳定可靠、符合期望的表现。
给AI辞典:检索增强生成(RAG)
在不借助互联网的情况下,如果你要搞懂「樽俎折冲」这个成语的含义,你会怎么办?
查辞典是一个比较高效的办法。
同样的,如果想要 AI 专精一些冷门或专业性知识,譬如客服回复话术或产品使用说明。
那就可以丢给 Ta 一个知识库文档,AI 会自己去检索文档内容,结合文档的知识来回答用户问题。
值得一提的是,这里 AI 使用的不是我们传统的「关键词搜索」,而是「语义检索」。
平时我们搜索一个文档,「番茄」就是「番茄」,「西红柿」就是「西红柿」,你搜索「番茄」是找不到「西红柿」的。
而语义检索可以做到搜索「番茄」也找到「西红柿」。这让 AI 对知识库的检索能力变得比人更强大。
二者对比

小结
你可以把一些产品特有的知识教给 AI,这样 AI 就可以变成你期待的样子。
2.4 和AI对话,一场人格分裂的角色扮演
首先,众所周知,AI能对话。
除了在Ta们提供的聊天框内与他们对话,你还可以调用 API(开放接口)能力,与 Ta 对话。
# 每一次消息都要带上之前说过的话,不然AI不知道之前说了啥。
messages = [
{
“role”: “system”,
“name”: “唐诗专家”,
“content”: (
“你是一位唐朝诗人助手,能够根据上下文扮演不同的唐代诗人。”
“请确保所有回答都融合唐朝诗人的文风。”
“根据用户要求,分别模拟李白和杜甫的风格:”
“李白应表现豪迈奔放,而杜甫应表现沉稳细腻。”
)
},
{
“role”: “user”,
“name”: “王工”,
“content”: “李白,请你描绘一下秋天的景色。”
},
{
“role”: “assistant”,
“name”: “李白”,
“content”: (
“秋风萧瑟,落叶纷飞;云海苍茫中,激起我心中无限豪情。”
)
},
{
“role”: “user”,
“name”: “用户”,
“content”: “杜甫,请你点评李白的这段描写。”
},
{
“role”: “assistant”,
“name”: “杜甫”,
“content”: (
“李白兄之词,虽豪迈奔放,但略显轻佻;秋景虽美,情思更需沉稳细腻。”
)
},
{
“role”: “user”,
“name”: “刘总”,
“content”: “李商隐你来评价一下李白和杜甫。”
},
] # 调用接口,把包括新对话的聊天记录传过去
response = openai.ChatCompletion.create(
model=”gpt-3.5-turbo”,
messages=messages
) # 收到回复,打印出来看看
print(response.choices[0].message[‘content’])
看不懂没关系,也不需要太懂,我举个例子来逐一解释。
想象甲乙丙三方公司通过邮件进行沟通:
① role(角色)
角色即身份,有点类似邮箱@后的域名,你来自哪个公司一眼就看出来了。对于 AI 来说,主要有 3 种身份:
※ system(系统)
类似于第三方监管机构,邮箱地址:xxx@system.com。主要负责制定一些基本规则,教乙方做事,让乙方在甲方面前老实点,别放飞自我整幺蛾子。
※ user(用户) 至高无上、提出需求的甲方,邮箱地址:xxx@user.com。甲方说啥就是啥,有啥问题都随意提。甲方可以是一个人,也可以是多个人。
※ assistant(助手)
这里就是指 AI 大模型,兢兢业业满足需求的乙方,邮箱地址:xxx@assistant.com。甲方说啥就是啥,乙方必须有求必应。同样的,乙方也可以是一个「人」或多个「人」。
② name(名字)
有点类似邮箱@前面的账号名,你是甲方的谁谁谁或者乙方的谁谁谁就分得很清楚了:
※ 唐诗专家指导@system.com
※ 刘总@user.com、王工@user.com
※ AI李白@assistant.com
※ AI杜甫@assistant.com
※ AI李商隐@assistant.com
一般来说,我们不会默认使用 name,因为 role 的三种角色已经足够了。但如果你构思的产品需要有多用户和多角色的时候(譬如人机混战剧本*),那么 name 就能派上用场。
③ content(内容)
顾名思义,写邮件的时候肯定会包含邮件正文,甲乙丙三方都通过邮件正文传递信息。
④ forgetful(健忘)
每封邮件必须包含之前所有的对话历史。
很不幸,这个邮箱对话系统非常简陋,每次只能看当前收到的邮件内容,不存档之前说过什么,甲乙丙也都是「金鱼脑」,什么都不记得。
因此,为了让大家明白来龙和去脉,每一次发邮件的时候,都需要带上之前所有的对话。只有这样,AI 才能明白之前讨论过哪些问题,进而做出连贯、准确的回答。
但这样也带来两个硬伤:
※ AI 对话的记忆有限,迟早会失忆;
※ 对话轮次越多,消耗的 token(RMB
) 也呈指数级增长。
小结
了解以上的信息之后,结合不同的 system、user、assistant,相信你已经有了很多新的想法和创意。
2.5 更多小知识
作为甲方的你,除了可以和大模型对话,还可以提一些小要求。
我就简单说几个大家可能常用的:
stream:流式输出
可以控制 AI 的回答是全部就绪了一次性发给你,还是一个字一个字蹦给你。是的,我们平时看大模型回答一直在打字,就是用的流式传输。由于大模型输出完整答案的时间目前还比较长,流式输出可以有效减少用户的等待焦虑。
frequency_penalty:重复率
-2 到 2 的一个数字,减少重复内容,避免复读机。如果 frequency_penalty>0,AI 回答问题一旦出现已有文本中就会被扣工资。
temperature:温度
虽然叫温度,但其实代表着 AI 的随机性、创造性。温度低,AI 就比较稳扎稳打,对同样问题尽可能保持一致回答,反之思维则更加发散、回答的随机性更多。还有一个参数叫 top_p,作用类似就不赘述了,免得把你绕晕了。
3.AI的幻觉小结
如果你还想知道更多关于大模型的参数,你可以去查看各个大模型官网的 API 文档,里面有更加详细的说明。
AI 幻觉,简单来说就是 AI「一本正经地胡说八道」,Ta 有时候会给出看似逻辑通顺、有鼻子有眼,但实际上不符合事实、和你问题八竿子打不着的回答。
这是因为:
※ 瞎读书,读瞎书:
训练数据中包含了太多错误的、质量不高的信息,走火入魔、误入歧途了;
※ 想太多,太多想:
AI 会强行关联高频出现的词汇(比如:看到「加拿大」就想「多伦多」,但你的问题其实是加拿大首都在哪里);
※ 好面子,怕冷场:
现在的大模型更多被设计成“宁可死鸭子嘴硬瞎编也不承认自己不知道”,遇到拿不准的就会一本正经的胡说八道。
所以,除非你是专门做 AI 类的产品,否则最好让 AI 成为你产品功能的「拓展」,而不是「替代」。
毕竟,AI 不是随时都靠谱。
4.他们分别擅长什么?主流大模型就像武侠世界的各路高手,有的内力深厚适合硬刚代码,有的轻功了得擅长处理万字长文,有的暗器精妙专攻多模态花活。结合你的产品需求选对兵器,才能让 AI 真正成为你的「六脉神剑」。
以下是国内外部分主流大模型的对比(表格较大,PC查看效果更佳):


