企业文化

通过使用 Amazon Transcribe、Amazon SageMaker 和 Hugging

利用亚马逊技术提升员工生产力:自动会议摘要

关键要点

在这篇文章中,我们探讨了如何通过亚马逊的会议录音和人工智能技术,自动生成会议摘要。这种方法不仅提高了会议效率,减轻了员工的负担,还能有效集成其他过往的会议内容。以下是文章的主要内容:

星空会议的增长:预计到2024年,41的商业会议将采用虚拟或混合形式;人工智能的应用:利用亚马逊转录服务Amazon Transcribe和亚马逊SageMaker生成自动会议摘要;架构概述:通过AWS云开发工具包AWS CDK实现基础设施的自动化配置;限制与清理资源的必要性。

自动生成会议摘要的解决方案

随着COVID19疫情以来,虚拟商业会议的普及,企业面临着频繁会议所带来的记录与跟进压力。根据2023年美国运通的调查,预计到2024年,41的业务会议将以混合或虚拟形式进行。这使得与会者很难管理多个会议及其相关内容,可能导致项目延误和客户信任流失。传统的会议摘要记录方法不仅耗时,而且容易分散与会者的注意力。

一种更高效的方法是通过生成型人工智能和语音转文本技术,在会议结束时自动创建摘要。这使得与会者可以专注于对话,而无需担心记录内容。

以下是实现自动摘要的工作流程:

用户将会议录音上传至项目的 亚马逊简单存储服务 (Amazon S3) 存储桶中的 /recordings 文件夹。每当新录音上传,该项目关联的 AWS Lambda 函数被触发,启动亚马逊转录服务,将会议录音转录为文本,并将其保存至项目的 S3 存储桶中 /transcriptions/TranscribeOutput/ 目录。触发推理 Lambda 函数,准备转录文件以供机器学习推理,结果保存在 S3 存储桶中的 /summaries/InvokeInput/processedTranscribeOutput/,并调用 SageMaker 端点。该 S3 事件触发通知 Lambda 函数,将摘要推送到 亚马逊简单通知服务 (Amazon SNS) 主题中。所有订阅 SNS 主题的用户如会议与会者都会收到总结内容的电子邮件。

在此示例中,我们将 Mistral 7B Instruct 这一预训练的大型语言模型LLM部署至 SageMaker 端点,进行摘要任务。该模型具有超过70亿个参数,能够基于用户指令处理和生成文本信息。

先决条件

为了顺利跟随本文,您需要具备以下条件:

Python版本需大于39;AWS CDK版本20。

部署解决方案

要在自己的 AWS 账户中部署这一解决方案,您可以在 GitHub 存储库 下载完整的源代码,运行以下命令:

bashgit clone https//githubcom/awssamples/audioconversationsummarywithhuggingfaceandtranscribegitcd audioconversationsummarywithhuggingfaceandtranscribe/infrastructurepip install r requirementstxt

如果您首次在 AWS 账户及指定的区域中部署 AWS CDK 资源,请先运行 bootstrap 命令,以设置必要的 AWS 资源和权限:

小熊加速器免费版

bashcdk bootstrap aws//ltACCOUNTIDgt/ltAWSREGIONgt

最后,运行以下命令以部署解决方案,并在参数中指定摘要接收者的电子邮件地址:

bashcdk deploy parameters SubscriberEmailAddress=ltSUBSCRIBERMAILADDRESSgt

测试解决方案

在项目仓库的 data 文件夹中,有一些示例会议录音供您测试。您可以将 testmp4 录音上传至项目的 S3 存储桶 /recordings 文件夹中。摘要将保存在 S3 中并发送给订阅者,整个过程大约只需2分钟的时间。

以下是输入对话和输出摘要的示意图。

限制

此解决方案有以下限制:

模型在英语上的表现优异,但对西班牙语、法语或葡萄牙语等其他语言的支持可能较差;模型的上下文长度限制约为8000个令牌,约合6000个单词;类似于其他 LLM,Mistral 7B Instruct 可能会生成不准确或虚假的内容;录音格式必须为 mp4、mp3 或 wav。

清理资源

要删除已部署的资源并停止产生费用,请运行以下命令:

bashcdk destroy

您也可以使用 AWS 管理控制台 完成以下步骤:

在 AWS CloudFormation 控制台中,选择Stacks。选择文本摘要基础设施栈,然后选择删除。

结论

在这篇文章中,我们提出了自动将会议录音转换为有洞察力的对话摘要的架构模式。这一工作流程展示了如何使用 AWS 云和 Hugging Face 加速您的生成型 AI 应用程序开发,通过整合亚马逊转录服务等托管的 AI 服务,以及来自 Hugging Face Hub 的外部 ML 模型,实现更高效的工作流程。

如果您想了解更多关于如何将对话摘要技术应用于呼叫中心,请查看我们的 实时通话分析 和 通话后分析 解决方案。

参考文献

Mistral 7B 发布公告,来自 Mistral AI

团队介绍

本文由 AWS 专业服务团队撰写,这是一个全球团队,能够在使用 AWS 云时帮助实现预期的商业成果。我们与您的团队及您选择的 AWS 合作伙伴网络 (APN) 成员一起合作,实施企业云计算计划。我们的团队提供帮助,通过一系列服务协助您实现与企业云采用相关的具体成果。

通过使用 Amazon Transcribe、Amazon SageMaker 和 Hugging

作者介绍

Gabriel Rodriguez Garcia 是 AWS 专业服务的机器学习工程师,工作地点在苏黎世。

Jahed Zadi 是 AWS 专业服务的人工智能与机器学习专家。

Mateusz Zaremba 是 AWS 专业服务的 DevOps 架构师。

Kemeng Zhang 是 AWS 专业服务的人工智能/机器学习专家,工作地点在苏黎世。

解锁机器学习的商业价值与组织学习 云企业战略博客

利用组织学习释放机器学习的商业价值关键要点我们常常低估新技术的长期影响,同时高估其短期效果,特别是在人工智能与机器学习AI/ML技术的应用中。没有任何“万能”算法可以直接提升客户满意度,实践中需要谨慎...