目前图像生成领域,以 Midjourney 和 Stability AI

发布时间:2024-03-22 16:05:58 浏览量:118次

目前,以MidJourney和stability Al为首的科技公司在图像生成领域展开激烈竞争,寻找新的业务增长点。稳定Al将目光投向音频生成领域,推出了一个名为stable Audio的文本转音频生成式人工智能平台。它能够在一秒内(现在太火、得几秒)生成九十秒的音频,而且是在一个庞大的数据集上训练出来的。

稳定Audio使用扩散模型和稳定Al的全套产品,也就是稳定扩散使用的相同AI模型。用户可以使用它来生成歌曲或任何项目的背景音频。音频扩散模型通常会生成固定长度的音频,因此在音乐制作方面会受到限制。但是,稳定Audio允许用户以不同的长度生成声音,并且需要在起始和结束时间周围添加文本元数据并进行了相关训练。值得注意的其他信息包括:

·稳定Audio使用了80万多个音频文件的数据集,以及来自股票音乐须可公司Audio Sparks的文本元数据进行训练。

·稳定Audio有三种定价层次免费版、专业版和企业版。

·稳定Audio的潜在用途之一将是为播客或视频制作背景音乐,用户可以使用它的user guide中的提示来生成音乐。

提示包括:

- 第一个是添加细节。

- 第二个是调整心情,选择悲伤、美丽、优美或有节奏的音乐。

- 第三个是选择乐器,例如吉他、合唱团或管弦乐器。

- 第四个是调整节拍数,也就是BPM,慢音乐BPM较小,快音乐BPM较大。

按照AI使用习惯,我将上述提示发给ChatGPT,并让它生成稳定Audio的提示。然后,我使用稳定Audio生成了一段音乐,供大家欣赏。

如果您对本期内容感兴趣,请在评论区与我交流。非常感谢您的观看。我是您的朋友leo,祝您生活愉快!再见,下次见。

热门课程推荐

热门资讯

请绑定手机号

x

同学您好!

您已成功报名0元试学活动,老师会在第一时间与您取得联系,请保持电话畅通!
确定