音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型启动邀测-技术分享

4 月 2 日，昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。

本轮邀测将开放 1000 个免费名额，面向行业媒体、专家、以及感兴趣的音乐从业者开放，用户可扫描文后二维码或通过网页填写申请，收到申请表后工作人员将第一时间联络回复。「天工 SkyMusic」正式版也将在 4 月 17 日随「天工 3.0」面向全社会免费开放。

申请网页：https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工 SkyMusic」基于昆仑万维「天工 3.0」超级大模型打造，是目前国内唯一公开可用的 AI 音乐生成大模型。

在通往 AGI 的道路上，多数团队都专注于模型智力的扩展和增强，几乎没有人关注 AI 如何帮助人们理解和更好地表达情感。智力固然重要，但情感是我们能够被称之为人的关键，于是，情感 AGI 成为昆仑天工探索研究的一个重要方向。

我们发现相比文本和图片，音频内容是理解人类情感最好的方式，而音乐又是人类情感表达最充沛、最不受地域和文化限制的内容载体，不论时代变幻，不论是战争还是灾祸，人们总是能通过音乐传递自己的感受并获得情感的慰藉。于是我们创造了音乐音频大模型「天工 SkyMusic」，并在公司内部测试中已经获得了非常好的反馈和表现，很高兴跟大家宣布：即日起天工音乐开放媒体与行业专家内测，来体验人声情感表达 SOTA 的音乐大模型产品。生成作品效果如下：

试听链接：https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

采用自研类 Sora 模型架构拥有五大优势

「天工 SkyMusic」采用音乐音频领域类 Sora 模型架构，Large-scale Transformer 负责谱曲，来学习 Music Patches 的上下文依赖关系，同时完成音乐可控性；Diffusion Transformer 负责演唱，通过 LDM 让 Music Patches 被还原成高质量音频，使得「天工 SkyMusic」能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力，让模型具备多模态的情感理解与表达能力。

「天工 SkyMusic」具有以下五大特点：

1. 高质量 AI 音乐

「天工 SkyMusic」能够生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲，并可根据用户输入的歌词风格生成对应歌曲风格。

2. 人声 “以假乱真”

人声合成是 AI 音乐生成中最重要、最能体现生成效果和品质的维度。「天工 SkyMusic」的 AI 人声合成能够达到业内顶尖的 SOTA 水平，中文水平极为优秀，发音清晰、无异响。其中文演唱效果更是显著好于国外产品，领先世界水平。

3. 歌词段落控制

「天工 SkyMusic」能够通过歌词来控制歌曲，让生成的歌曲可以明确分辨出不同歌词段落的情绪变化，体现出主歌和副歌、前奏和主歌的段落差异。

4. 多种音乐风格

「天工 SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格，用户在创作音乐时，可以通过参考音频制定想要的音乐风格。

试听链接：https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

5. 音乐智能表达 – 歌唱技巧学习

「天工 SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱，自动和声等多种歌唱技巧，让用户创作的歌曲得到更恰当的情感表达。

试听链接：https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

一直以来，AI 音乐生成大模型都是 AI 大模型行业最受关注的落地应用之一。早在 2022 年 12 月，昆仑万维就发布了「昆仑天工」AIGC 全系列开源算法与模型，其中就包括多模态音乐内容生成大模型。此后，昆仑万维更是通过 AI 音乐生成大模型为北京市东城区域文商旅融合品牌 “故宫以东” 打造了年度数字主题曲，将 AI 音乐前沿科技与东城区历史文化深度融合。

今天面向社会开启免费邀测的「天工 SkyMusic」更是国内首款、同时也是目前国内唯一公开可用的 AI 音乐生成大模型。

2023 年，昆仑万维在 “All in AGI 和 AIGC” 的战略推动下，在人工智能领域取得了许多进展，逐步形成了 AI 大模型、AI 搜索、AI 音乐、AI漫画、AI社交、AI 游戏等 AI 业务矩阵。

昆仑万维创始人周亚辉表示：“未来三十年，人类社会将从感知线，变成表达线，整个人类社会在自我表达侧要翻 1000 倍；创作和自我表达是未来 30 年在整个社交和文化领域增长最快的曲线，会有越来越多人表达自我，表达对世界的理解、对社会事物的态度，表达越来越艺术化和趣味化；这种表达在过去很困难，因为工具门槛高，而未来 30 年是自我表达的 30 年，我们要用 AI 把人类创作的门槛降得足够低，让人们更充分地实现自我表达。”

2024 年，昆仑万维发布全新公司使命：“实现通用人工智能，让每个人更好地塑造和表达自我”。

这一使命体现了技术创新与人文关怀的结合，旨在创造一个每个人都能够自由地发挥自己最大潜力的未来。通过通用人工智能，昆仑万维希望构建一个更加智能、更加互联、更加理解和尊重每个人个性的世界。

音乐，将会是其中的重要环节。

通过「天工 SkyMusic」，昆仑万维希望帮助每一个人更好地创作音乐，表达情感。

当前，昆仑万维已打造了集 AI 搜索、AI 写作、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力于一体的「天工 3.0」多模态 “超级模型”（Super Model），成为 AI 行业全新里程碑。

音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型启动邀测

UM新媒体

相关推荐

评论抢沙发

热门文章

切换注册登录

切换登录注册

UM新媒体

相关推荐

评论 抢沙发

热门文章

切换注册登录

切换登录注册

评论抢沙发