探索Semantic Kernel内置插件:深入了解ConversationSummaryPlugin的应用

news/2024/9/22 7:32:42

前言

经过前几章的学习我们已经熟悉了Semantic Kernel 插件的概念,以及基于Prompts构造的Semantic Plugins和基于本地方法构建的Native Plugins。本章我们来讲解一下在Semantic Kernel 中内置的一些插件,让我们避免重复造轮子。

内置插件

Semantic Kernel 有非常多的预定义插件,作为解决通用业务的相关能力。Plugins 地址

image

这里面每一个类库都是一组相关功能的插件SDK,其中Plugins.Core 里面提供的使我们高频使用的插件集合。

Plugins.Core

image

可以看到Plugins.Core 内有以下几个插件:

  • ConversationSummaryPlugin: 对话总结插件
  • FileIOPlugin: 读写文件插件
  • HttpPluginHttp请求功能的插件
  • MathPluginMath 计算插件
  • TextPlugin:字符串操作插件
  • TimePlugin:获取当前时间和日期插件
  • WaitPluginWaitPlugin提供了一组函数,在进行其余操作之前等待。

实战

我们来对Semantic Kernel中提供的内置插件来做一个实战练习

第一步需要安装Nuget

NuGet\Install-Package Microsoft.SemanticKernel.Plugins.Core -Version 1.14.1-alpha

该包目前只有预览版本,如果用 VS 的包管理器安装,那需要勾选包括预览发行版

ConversationSummaryPlugin

这是一个对话总结插件,以提示词构造的Semantic Plugins,插件内定义了三个Kernel Function分别是:

  • SummarizeConversation :给定一段长的对话记录,总结谈话内容
  • GetConversationActionItems:给定一段长的对话记录,识别出其中的行动项。
  • GetConversationTopics:给定一段长的对话记录,识别出值得记住的主题
SummarizeConversation

我们先定义一个对话用户我们测试的对话数据


string chatTranscript = @"
A: 你好,最近工作很忙碌,我们需要安排下周的会议时间,你觉得周几比较合适?
B: 嗯,我明白,工作确实很忙。周三或周四应该比较合适,因为那时候大家的日程相对空闲一些。
A: 好的,周三或周四都可以,我们再确认一下其他同事的时间表。
B: 对,最好再和大家核实一下,免得出现时间冲突。
A: 我今天会发邮件询问大家的意见,然后我们再做最终决定。
B: 好的,我也会在群里提醒大家留意邮件。A: 大家好,关于下周的会议安排,我建议定在周四下午两点,在会议室A举行,大家觉得怎么样?
C: 周四下午两点可以,我在日历上已经标注了。
D: 对不起,周四下午我有其他安排,能否改到周三下午呢?
A: 好的,我们尽量照顾大家的时间,那就改到周三下午两点吧,地点仍然是会议室A。
B: 没问题,我会通知其他同事,让大家知道时间的变动。";

Kernel注册插件:

var conversationSummaryPlugin = kernel.ImportPluginFromType<ConversationSummaryPlugin>();

总结会话内容

Console.WriteLine("SamplePlugins - Conversation Summary Plugin - Summarize");
{FunctionResult summary = await kernel.InvokeAsync(conversationSummaryPlugin["SummarizeConversation"], new() { ["input"] = chatTranscript });Console.WriteLine($"Generated Summary:{summary.ToString()}");
}

OutPut:

Generated Summary:In the conversation, A and B discuss scheduling a meeting for the following week, considering Wednesday or Thursday as potential dates due to lighter schedules. A decides to send an email to confirm the availability of all colleagues. Later, A proposes holding the meeting on Thursday at 2 PM in Conference Room A, but D requests a change due to a scheduling conflict. A agrees to reschedule the meeting to Wednesday at 2 PM in the same room, and B confirms that they will inform the rest of the team about the change.

Semantic Kernel的这个插件我用了GPT-4oKimi都回复的是英文,我感觉这个内置的这个Semantic Kernel 插件还是不够完善。

我们可以看一下SummarizeConversation方法的Prompts定义

BEGIN CONTENT TO SUMMARIZE:
{{$INPUT}}END CONTENT TO SUMMARIZE.Summarize the conversation in 'CONTENT TO SUMMARIZE', identifying main points of discussion and any conclusions that were reached.
Do not incorporate other general knowledge.
Summary is in plain text, in complete sentences, with no markup or tags.BEGIN SUMMARY:

简要理解一下这个提示词:

  • 开始标记:BEGIN CONTENT TO SUMMARIZE: 这个标记清晰地指示了摘要内容的开始。

  • 输入占位符:{{$INPUT}} 这是一个占位符,用于插入需要被摘要的对话或文本内容。

  • 结束标记:END CONTENT TO SUMMARIZE. 这个标记同样清晰地指示了摘要内容的结束。

  • 摘要指导:提供了对摘要的具体要求,包括识别对话的主要讨论点和结论,并且强调不要包含外部的一般知识。

  • 格式要求:指出摘要应该是纯文本,用完整的句子表达,不包含任何标记或标签。

  • 摘要开始标记:BEGIN SUMMARY: 这个标记指示了摘要部分的开始。

针对上述我们发现的问题:会话摘要全部是中文的问题 我觉得可以进行提示词的优化

优化的第一点内容是:总结应选择最切合内容的语言in the language that best fits the content.

@"BEGIN CONTENT TO SUMMARIZE:
{{$INPUT}}END CONTENT TO SUMMARIZE.Please summarize the conversation, highlighting the main points and any conclusions reached, in the language that best fits the content. Do not incorporate any external general knowledge. The summary should be in plain text, in complete sentences, without any markup or tags.BEGIN SUMMARY:

我们自定义一个插件测试一下,创建一个CustomConversationSummaryPlugin的插件,这个和原生SummarizeConversation插件只有Prompts有区别

    private const int MaxTokens = 1024;private readonly KernelFunction _summarizeConversationFunction;public CustomConversationSummaryPlugin(){PromptExecutionSettings settings = new(){ExtensionData = new Dictionary<string, object>(){{ "Temperature", 0.1 },{ "TopP", 0.5 },{ "MaxTokens", MaxTokens }}};this._summarizeConversationFunction = KernelFunctionFactory.CreateFromPrompt(CustomConversationSummaryPlugin.SummarizeConversationDefinition,description: "Given a section of a conversation transcript, summarize the part of the conversation.",executionSettings: settings);}/// <summary>/// Given a long conversation transcript, summarize the conversation./// </summary>/// <param name="input">A long conversation transcript.</param>/// <param name="kernel">The <see cref="Kernel"/> containing services, plugins, and other state for use throughout the operation.</param>[KernelFunction, Description("Given a long conversation transcript, summarize the conversation.")]public Task<string> SummarizeConversationAsync([Description("A long conversation transcript.")] string input,Kernel kernel) =>ProcessAsync(this._summarizeConversationFunction, input, kernel);private static async Task<string> ProcessAsync(KernelFunction func, string input, Kernel kernel){List<string> lines = TextChunker.SplitPlainTextLines(input, MaxTokens);List<string> paragraphs = TextChunker.SplitPlainTextParagraphs(lines, MaxTokens);string[] results = new string[paragraphs.Count];for (int i = 0; i < results.Length; i++){// The first parameter is the input text.results[i] = (await func.InvokeAsync(kernel, new() { ["input"] = paragraphs[i] }).ConfigureAwait(false)).GetValue<string>() ?? string.Empty;}return string.Join("\n", results);}

Kernel对象注册自定义插件

var customCustomConversationSummaryPlugin = kernel.ImportPluginFromType<CustomConversationSummaryPlugin>();

新跑一边测试一下:

Generated Summary:在这段对话中,A和B讨论了安排下周会议的时间。B建议周三或周四比较合适,因为那时大家的日程相对空闲。A决定通过邮件询问其他同事的意见,然后做出最终决定 。在邮件中,A提议将会议安排在周四下午两点,地点是会议室A。然而,D表示周四下午有其他安排,请求将会议改到周三下午。A同意了D的请求,将会议时间调整为周三下午两点,地点仍然是会议室A。B表示会通知其他同事关于时间变动的情况。

可以看到满足我们的需求了,根据我们输入生成的摘要信息没有问题了。

这个插件对于我们的聊天会话也是十分有用,对话历史记录随着不断聊天,消息越来越多,那每次对话消耗的 token 也是不断增加,此时 ConversationSummaryPlugin 插件的就可以帮助我们对聊天记录进行摘要总结,提高聊天效率。

提取会话行动项

识别对话记录中的动作项(action items)是一种重要的沟通技巧,它有助于提高效率、确保任务的完成和促进团队协作。

使用场景包括:

  • 会议记录:在会议结束后,快速生成包含所有动作项的摘要,便于团队成员执行和跟踪。
  • 项目管理:在项目讨论中,识别和记录关键的里程碑和任务,确保项目按时进展。
  • 客户服务:在客户沟通中,记录客户的请求和需要采取的行动,以提供更好的服务和支持。
  • 团队协作工具:集成到团队协作平台中,帮助团队成员共享和协调任务。
  • 个人生产力:个人使用该插件来管理自己的任务和待办事项,提高个人效率。
  • 法律和合规性:在需要确保对话内容符合特定法规或标准的情况下,识别必要的行动以确保合规。

要完成这个需要用到ConversationSummaryPlugin插件的GetConversationActionItems方法

Console.WriteLine("======== SamplePlugins - Conversation Summary Plugin - Action Items ========");
{FunctionResult summary = await kernel.InvokeAsync(conversationSummaryPlugin["GetConversationActionItems"], new() { ["input"] = chatTranscript });Console.WriteLine($"Generated Action Items:{summary.ToString()}");Console.WriteLine(summary.GetValue<string>());}

输出:

{"actionItems": [{"owner": "A","actionItem": "发邮件询问大家的意见","dueDate": "","status": "Open","notes": "今天会发"},{"owner": "B","actionItem": "在群里提醒大家留意邮件","dueDate": "","status": "Open","notes": ""},{"owner": "B","actionItem": "通知其他同事时间的变动","dueDate": "","status": "Open","notes": "让大家知道时间的变动"}]
}

提取会话的主题

用于对话摘要的工具或插件,它的作用是帮助用户快速识别和总结对话中的主要话题。

使用场景可能包括但不限于:

  • 企业内部会议的快速摘要和信息整理。
  • 客户服务对话的分析,以识别服务改进点。
  • 社交媒体或论坛讨论的监控和摘要。
  • 教育环境中的课堂讨论摘要。
  • 法律咨询或案件讨论的记录和审查。

要完成这个功能需要用到ConversationSummaryPlugin插件的GetConversationTopics方法

使用:

    Console.WriteLine("======== SamplePlugins - Conversation Summary Plugin - Topics ========");FunctionResult summary = await kernel.InvokeAsync(conversationSummaryPlugin["GetConversationTopics"], new() { ["input"] = chatTranscript });Console.WriteLine($"Generated Topics:{summary.ToString()}");

输出:

Generated Topics:
{"topics": ["Work busy","Schedule meeting","Wednesday or Thursday","Confirm colleagues' availability","Email for opinions","Meeting reschedule","Thursday 2 PM","Change to Wednesday 2 PM","Notify colleagues"]
}

最后

剩下的插件我们后续章节在讲解吧,本章重点讲解了ConversationSummaryPlugin 会话总结插件的使用。

示例代码

本文源代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hjln.cn/news/46770.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇

继ICDE 17篇论文入选后,华为多篇论文再次入选SIGMOD 2024, 顶会入选论文已超过100篇。本文分享自华为云社区《攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇》,作者:GaussDB 数据库。 6月9日-14日,2024年数据管理国际会议SIGMOD(ACM SIGMOD/PODS Internati…

Rust性能分析之测试及火焰图,附(lru,lfu,arc)测试

好的测试用例及性能测试是对一个库的稳定及优秀的重要标准,尽量的覆盖全的单元测试,能及早的发现bug,使程序更稳定。性能测试,在编写代码后,单元测试及性能测试是重要的验收点,好的性能测试可以让我们提前发现程序中存在的问题。 测试用例 在Rust中,测试通常有两部分,一…

FreeRTOS简单内核实现7 阻塞链表

增加阻塞链表和溢出阻塞链表,完善 RTOS 内核调度流程0、思考与回答 0.1、思考一 如何处理进入阻塞状态的任务? 为了让 RTOS 支持多优先级,我们创建了多个就绪链表(数组形式),用每一个就绪链表表示一个优先级,对于阻塞状态的任务显然要从就绪链表中移除,但是阻塞状态的任…

危急值上报及闭环管理全解析

什么是危急值制度? 危急值制度是指对提示患者处于生命危急状态的检查、检验结果建立复核、报告、记录等管理机制,以保障患者安全的制度。 管理体系(组织体系+制度建设+管理要素+宣教培训) 针对管理体系中的组织体系、制度建设、管理要素、宣教培训多为线下的制度、流程建立。…

手术分级管理制度

01手术分级管理体系 ● 医院手术分级管理实行院、科两级负责制 ● 医院医疗技术临床应用管理委员会总体负责全院手术分级管理工作,日常工作由医务办公室负责组织、协调,主要职责包括: (一)制定手术分级管理制度规范,定期检查提出改进要求 (二)审定手术分级管理目录,定…

总体估计中的相关公式 | 高一使用

总体估计中的相关公式和相关性质前言 相关公式 【人教 2019 A 版 \(P_{215}\) 练习 2】 数据 \(x_1\),\(x_2\), \(\cdots\), \(x_n\) 的方差为 \(s_x^2\), 数据 \(y_1\), \(y_2\), \(\cdots\), \(y_n\) 的方差为 \(s_y^2\), \(a\)、 \(b\) 为常数. 证明: (1) . 如果 \(…

LangChain结合LLM做私有化文档搜索

我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对于新的知识或者私有化的数据LLM一般无法作答,此时LLM会出现“幻觉”。针对“幻觉”问题,一般的解决方案是采用RAG做检索增强。我们知道LLM(大语言模型)的底模是基于已经过期的公开数据训练出来的,对…