使用MiniMax大模型生成AI配音

大数据学习路线图

作者:厦门大学计算机系林子雨副教授
E-mail: ziyulin@xmu.edu.cn
备注:本实验与林子雨编著《数字素养通识教程》和《人工智能通识教程》教材配套

MiniMax简介

MiniMax 是中国本土重要的通用人工智能(AGI)公司,聚焦大模型技术研发与应用落地,致力于为用户和企业提供安全、高效、可定制的 AI 解决方案。
技术层面,MiniMax 深耕基础模型研发,推出过多个版本的大语言模型(如 MiniMax MoE 系列),具备多轮对话、逻辑推理、内容生成、多模态理解等核心能力,在代码生成、企业知识库问答、数字人交互等场景展现出较强适配性,同时重视模型的安全性与可控性,通过技术手段降低 AI 生成内容的风险。
应用领域,其业务覆盖 C 端与 B 端:C 端曾推出面向普通用户的对话式 AI 产品,提供日常助手、创意辅助等服务;B 端则针对金融、教育、媒体、企业服务等行业,输出定制化大模型能力,助力企业降本增效,推动 AI 技术在实际业务场景中的规模化落地,是中国 AI 大模型赛道的重要参与者之一。

使用MiniMax生成AI配音

通过百度搜索“MiniMax”,在搜索结果中,直接点击“语音大模型”(如下图所示),然后注册账号并登录。

登录以后,如下图所示,点击“音色设计”功能。

如下图所示,在“提示词”对话框中输入提示词“模仿肯德基广告风格的配音,年轻有活力的男生,富有激情,活力四射”。
在“试听文本”对话框中输入“厦门大学大数据教学团队是国内高校知名的大数据专业教学团队,在多项指标上引领国内高校大数据教学”。

大概需要15秒钟,系统会生成3种音色,你可以挑选一种自己喜欢的音色,然后,如下图所示,点击“确认选择”。

如下图所示,在界面中,给音色起一个名字,比如叫“活力男生”,标签为“男”和“中文普通话”,然后点击“保存音色”。

然后,如下图所示,点击“语音合成”。

在“文字转语音”对话框中输入文本内容,如下所示:

这里输入的文本内容如下:

2010年前后,大数据时代开启。随着“大数据战略”“数字中国”“中国制造2025”等一系列国家战略的出台,带动相关产业转型升级,大数据人才需求激增。然而,在2012年前后,全国高校普遍存在“三缺”问题,即缺课程、缺资源(教材、数字化教学内容、实验平台、实训环境)、缺师资。这些问题对高校大规模培养高层次大数据人才产生了严重的制约,必须及时得到解决,以满足社会对大数据人才的迫切需求。'<#0.5#>'
厦门大学大数据教学团队通过系列化课程和立体化教学资源建设以及创建可持续的教师教学能力提升新模式等措施,帮助全国500多所高校在很大程度上解决了“缺课程、缺资源、缺师资”问题。我们建设了9门优质大数据MOOC课程,2门获批国家级线上一流本科课程,1门获评国家精品在线开放课程;编写出版了以《大数据技术原理与应用》和《数据治理》为代表的16本高水平大数据系列教材,被国内1000多所高校采用;建成了以全方位一站式免费在线服务为特色的、访问量超2800万次的高校大数据课程公共服务平台;累计为500多所高校培训了900余名教师;举办7届大数据教学研讨会,共有3500余位教师到厦门大学参会;举办130余期线上大数据百家讲坛,累计超过100万人次观看直播;得到3个教育部和省级教改课题的支持。团队逐渐发展成为全国高校大数据教学领域的一支重要力量,在国内高校起到了重要的示范作用。

需要注意的是,'<#0.5#>'的作用是增加0.5秒的停顿,可以放在任何句子中间来增加停顿。
如下图所示,在右侧的“音色”界面下方点击,可以更改音色。

如下图所示,在“活力男生”音色上面,点击“选择”,选中这个音色。

如下图所示,在“输出情绪”中选择“惊讶”,然后,可以自己调整语速、声调和音量。

最后,如下图所示,点击界面底部的“生成音频”,开始生成音频。

如下图所示,点击“下载”图标,就可以把语音下载到本地计算机中。