UM新媒体
自媒体短视频运营平台 UMXMT.COM!

音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型启动邀测

4 月 2 日,昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测

本轮邀测将开放 1000 个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,用户可扫描文后二维码或通过网页填写申请,收到申请表后工作人员将第一时间联络回复。「天工 SkyMusic」正式版也将在 4 月 17 日随「天工 3.0」面向全社会免费开放。

申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

「天工 SkyMusic」基于昆仑万维「天工 3.0」超级大模型打造,是目前国内唯一公开可用的 AI 音乐生成大模型

在通往 AGI 的道路上,多数团队都专注于模型智力的扩展和增强,几乎没有人关注 AI 如何帮助人们理解和更好地表达情感。智力固然重要,但情感是我们能够被称之为人的关键,于是,情感 AGI 成为昆仑天工探索研究的一个重要方向

我们发现相比文本和图片,音频内容是理解人类情感最好的方式,而音乐又是人类情感表达最充沛、最不受地域和文化限制的内容载体,不论时代变幻,不论是战争还是灾祸,人们总是能通过音乐传递自己的感受并获得情感的慰藉。于是我们创造了音乐音频大模型「天工 SkyMusic」,并在公司内部测试中已经获得了非常好的反馈和表现,很高兴跟大家宣布:即日起天工音乐开放媒体与行业专家内测,来体验人声情感表达 SOTA 的音乐大模型产品。生成作品效果如下:

试听链接:https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

采用自研类 Sora 模型架构 拥有五大优势

「天工 SkyMusic」采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使得「天工 SkyMusic」能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。

8b33196024ca354

「天工 SkyMusic」具有以下五大特点:

1. 高质量 AI 音乐

「天工 SkyMusic」能够生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。

2. 人声 “以假乱真”

人声合成是 AI 音乐生成中最重要、最能体现生成效果和品质的维度。「天工 SkyMusic」的 AI 人声合成能够达到业内顶尖的 SOTA 水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。

3. 歌词段落控制

「天工 SkyMusic」能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。

4. 多种音乐风格

「天工 SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。

试听链接:https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

5. 音乐智能表达 - 歌唱技巧学习

「天工 SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧,让用户创作的歌曲得到更恰当的情感表达。

试听链接:https://mp.weixin.qq.com/s/LFuZ0EIPkLrM342JB1EF_A

一直以来,AI 音乐生成大模型都是 AI 大模型行业最受关注的落地应用之一。早在 2022 年 12 月,昆仑万维就发布了「昆仑天工」AIGC 全系列开源算法与模型,其中就包括多模态音乐内容生成大模型。此后,昆仑万维更是通过 AI 音乐生成大模型为北京市东城区域文商旅融合品牌 “故宫以东” 打造了年度数字主题曲,将 AI 音乐前沿科技与东城区历史文化深度融合。

今天面向社会开启免费邀测的「天工 SkyMusic」更是国内首款、同时也是目前国内唯一公开可用的 AI 音乐生成大模型

2023 年,昆仑万维在 “All in AGI 和 AIGC” 的战略推动下,在人工智能领域取得了许多进展,逐步形成了 AI 大模型、AI 搜索、AI 音乐、AI漫画、AI社交、AI 游戏等 AI 业务矩阵。

昆仑万维创始人周亚辉表示:“未来三十年,人类社会将从感知线,变成表达线,整个人类社会在自我表达侧要翻 1000 倍;创作和自我表达是未来 30 年在整个社交和文化领域增长最快的曲线,会有越来越多人表达自我,表达对世界的理解、对社会事物的态度,表达越来越艺术化和趣味化;这种表达在过去很困难,因为工具门槛高,而未来 30 年是自我表达的 30 年,我们要用 AI 把人类创作的门槛降得足够低,让人们更充分地实现自我表达。”

2024 年,昆仑万维发布全新公司使命:“实现通用人工智能,让每个人更好地塑造和表达自我”。

这一使命体现了技术创新与人文关怀的结合,旨在创造一个每个人都能够自由地发挥自己最大潜力的未来。通过通用人工智能,昆仑万维希望构建一个更加智能、更加互联、更加理解和尊重每个人个性的世界。

音乐,将会是其中的重要环节。

通过「天工 SkyMusic」,昆仑万维希望帮助每一个人更好地创作音乐,表达情感。

当前,昆仑万维已打造了集 AI 搜索、AI 写作、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力于一体的「天工 3.0」多模态 “超级模型”(Super Model),成为 AI 行业全新里程碑。

赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《音乐ChatGPT时刻来临!「天工SkyMusic」音乐大模型启动邀测》
文章链接:https://www.umxmt.com/9236.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

登录

找回密码

注册