AI文本转语音工具
Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模型,12月11日上线在线网页版本,用户可免费体验该模型的能力。Audiobox是Meta最新一代的音频生成模型,可以结合使用语音输入和自然语言文本提示来生成语音和音效,从而可以轻松地为各种用例创建逼真的自定义音频。
Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,频谱图是音频的视觉表示,显示不同频率随时间的振幅,而后再将高保真度的频谱图图像转换为音频。
Deep Fake文本转语音
超真实在线AI语音生成
通义听悟是阿里巴巴推出的智能AI会议转录和总结工具,支持实时双语翻译字幕,一键高亮要点,智能提炼总结,高效记录、整理和共享音视频内容。多种字幕形态随心切换,自动区分发言人,总结关键词、议程、摘要、待办事项和问题。支持一键导出和公开分享。
TME Studio是由腾讯音乐娱乐公司推出的一款在线音乐创作助手,由旗下银河音效、MUSE、天琴实验室、Tencent AI Lab共同打造,提供包括但不限于音乐分离、MIR计算、辅助写词、智能曲谱等创作工具。助力音乐爱好者,让创作更简单。