杏宇

你的位置：杏宇 > 最新动态 >

25 秒爆改热梗，把心情哼成歌，这个最新的音乐 AI 太上头了

发布日期：2024-08-11 19:51 点击次数：112

自从今年 3 月 Suno 火爆全网，音乐生成赛道便人才辈出。有才的不是各家的大模型，而是擅长整活的广大网友。

从「萨菲罗斯男人中的男人」到「你的钢门比较松弛」，初听痛苦，再听着迷，AI 以鬼畜、抽象的方式出道音乐界，征服了你我他的心。

我们也就此明白，AI 还不是来代替人类的，而是更像一个趁手的工具，让脑洞实现生产力的大解放。

8 月 8 日，字节旗下的豆包，表示也要加入这个家庭，网页和手机端都上线了音乐生成的功能。

豆包的音乐生成功能有什么不一样？能不能让更多人玩起来？体验了 2 天后，我们有了一些有趣的发现。

25 秒三段歌曲，接地气又懂艺术的国产音乐 AI 来了

目前，豆包能够生成 1 分钟以内的音乐，支持民谣、流行等 11 种曲风，驾驭快乐、忧郁等 9 种情绪，音色只能指定男声或者女声，歌词可以让 AI 生成，也可以自己上传。

如果你拿捏不准自己要什么曲风、情绪，可以直接听听输入框上面现成的模板，哪首歌曲听着顺耳，就可以一键「做同款」。

我一眼相中了《牙买加的偶遇》这个超 chill 的夏日风模板，那么就等于选定了「雷鬼」的音乐风格、「活力」的情绪、「男声」的音色。

▲ 豆包的网页端音乐生成界面

然后再让 AI 帮我写歌词，我从头到尾只需要打几个字，描述歌词要表达的主题。身为「紧人」的我，输入了「古希腊掌管松弛感的神」。

几乎无需等待，25 秒左右就出来了 3 段 1 分钟左右的音乐，歌名、封面、歌词、旋律，都由 AI 一手包办。

▲ 收听点这里

封面符合古希腊的主题，像幅油画，艺德充沛。歌词更是深得我心，报菜名似的，把神的名讳挨个说一遍。旋律还很容易上头，适合单曲循环。句句不提松弛感，句句都是松弛感。

至于 AI 演唱的水平，难得的是总体的中文演唱效果很好，吐字清晰度、演唱流畅性胜过海外的音乐生成 AI，甚至听出些北方人的调调。

再蹭一下奥运会的热点，输入「光靠干饭就获胜」，生成一首嘻哈音乐。

▲ 收听点这里

AI 不仅拥有清澈的男声，还懂得跟着伴奏变换唱腔，强有力地切入，抒情地收尾。我很喜欢歌词体现的生活态度，吃饱喝足，才能上场比赛。事已至此，先吃饭吧。

论表达感情，AI 这个风格百变的歌手，可以欢快而活泼，也可以细腻而深情。

▲ 收听点这里

让豆包以「奶奶的针线包」为主题唱一首民谣，朴实的歌词仿佛讲了一个故事，女声缓缓道来，没有复杂的技巧，没有过多的修饰，就足够打动听者的内心。

除了指定主题让 AI 生成歌词，我们也可以自定义歌词，但这个概念很宽泛，AI 的参与度可大可小，我们可以粘贴自己的歌词不做改动，或者再让 AI 优化，甚至完全让 AI 随机生成。

豆包对于版权比较严格，我上传了一段明代戏剧家汤显祖《牡丹亭》的曲词，但被豆包拒绝生成了，因为涉嫌侵权。

较真些挺好，总站在前人的肩膀上也很无聊，我上传了几句最近的热梗，「偷感很重、已读乱回、别吵我在思考、感觉尸体暖暖的、正是藏不住话的年纪」，随意排了序，让 AI 帮我优化歌词。

结果 AI 稍加改编之后，这个歌词看起来还真有些意义，像一个网速 5G 年轻人的自嘲。

▲ 收听点这里

就拿这段歌词，让豆包来段忧郁的、男声演唱的民谣，AI 这回不仅吐词清晰，唱腔还确实有些伤感，吉他这么一弹，仿佛云南哪个酒吧的长发忧郁男。

接下来我又上传了一段歌词，是之前让 Siri 给我写的诗，不用 AI 改编，直接用，表现一个赶 DDL 的创作者美好的精神状态。

▲ 收听点这里

爵士的风格、活力的情绪、女声的演唱，乐景衬哀情的化学反应果然很奇妙，一曲听罢，码字都变得更有精神了。

一番体验下来，我觉得豆包很适合我的中国宝宝体质。

普通话拿捏了，风格也更符合国内听众的喜好，擅长民谣、嘻哈、R&B 等曲风，旋律流畅，歌词通俗易懂、贴近生活，听着听着，人就跟着哼起来了，听了三遍，就会唱了。

▲ 豆包的手机端音乐生成界面

同时，初出茅庐的豆包也存在不足的地方，一个是时长短，一个是定制化功能欠缺。

豆包目前只能生成 1 分钟，Suno 已经可以生成 4 分钟。

Udio 最近的更新引入了调性控制，作为音乐爱好者，我也希望豆包后续能提供更多定制性选项，目前豆包暂时不支持生成男中音、高音等音色，不支持乐器，曲风还不够丰富。

最懂个性化的 AI 音乐，是属于所有人的表达工具

豆包的音乐生成虽然是一个新功能，但上手没什么压力。

「音乐生成」和「帮我写作」「图像生成」等功能一样，驻守在网页端的聊天框上方，等你点击，或者用「@」和「/」召唤，无缝融入豆包的生态里。

选择这个功能之后，豆包也很懂得照顾对音乐一窍不通的小白，连提示词的公式都帮着写好了，我们只需要在蓝色框里做选择题或者完形填空。

而且，其中一个选项是情绪，使用起来很直观，不通乐理的普通人，同样能下意识地判断，我们希望这首歌包含怎样的感情。

生成歌曲之后，豆包还会推荐一些相关问题，顺便让我们学点知识，相比垂直的音乐生成平台，时刻陪伴的聊天机器人不会让你觉得弱小孤独又无助。

即使不是专业的音乐人，也可以在这里贡献创意，拿到一首包含歌词、歌名、封面的完整音乐作品。

作者栏上面的名字，首先是你，其次是豆包，时刻提醒着，这份作品有你的贡献。

当 AI 生成的音乐日渐丰富，海外的 Suno、Udio，都在向音乐社区发展，它们的首页，以热度、题材、风格等标准，给歌曲列排行榜。

然而目前看来，它们取代 Spotify 为时尚早，这是因为，大多数 AI 生成的音乐离专业创作还是有距离的，不耐听，大白嗓，旋律简单，缺乏抑扬顿挫和起承转合。

豆包也存在这个问题，有些生成结果不如人意，比如拿「青梅竹马」作为主题，豆包写的歌词就有些敷衍了。这可以理解，要给 AI 一些成长时间，才能更好地捕捉人类「郎骑竹马来，绕床弄青梅」的意境。

不论国内海外，AI 生成音乐存在共同的难点，音乐的信息密度极高，每一秒都可能整合了多个节拍、音符、和声。同时，不同乐句之间还要保持流畅性，多种旋律和声音也需要协调。总之，生成音乐可比生成语言难得多了。

但这不影响我们可以用 AI 音乐，个性化地表达自我。那些难以为外人道的心绪、灵感，存在被 AI 接收并生成出来的可能性，这是目前 AI 赋予每个人的微观创作权利。

技术交给产品团队去攻克，作为用户，我们输入简单的提示词，就能让 AI 带给我们灵感和创造。

为午餐创作一首歌、创作一首关于月亮的歌…… 提示词只有一句话甚至一个词，但可能确实是我们当下的所思所想。

我常常在周日晚上陷入焦虑，玩也玩不好，工作也工作不了，只能通过晚睡的方式，延缓又一个周一的到来。

基于这种心情，我给豆包指定了一个主题：「周日恐慌」，音乐风格 R&B，情绪伤感，女声演唱。

▲ 收听点这里

AI 给出的作品，有些出乎我的意料，这些歌词，不就是我想说的话吗？AI 甚至还能把它们唱出来，押了韵。

更多情绪上头的时刻，我们都可以邀请 AI 共享和分担。最近广州的天气太热了，于是我让豆包基于「热得我拖鞋都快融化了」的主题写了一首放松的摇滚。

▲ 收听点这里

天气一热，人是想什么都不做，豆包很擅长写这种带点情绪的主题，甚至可以道出我们内心的潜台词，一口郁气也就跟着吐出来了。

曹操在《观沧海》里写，幸甚至哉，歌以咏志。

虽然这些歌是 AI 帮我完成的，但也只有我能够生成，并需要这样的歌曲。

豆包的音乐生成功能简介是：「把你的想象力变成音乐。」

AI 让我们的想象力，更容易具象化了。AI 创作离专业作品还有距离，但每个人都能参与其中，以更丰富的方式表达自己的感情。

点击播放键，听到歌曲，不管那一瞬间是被打动了，还是被逗得笑出声了，内心被击中的微妙感觉，就是技术给予人性的糖果。

上一篇：不再做“美丽小废物” 三星Galaxy Z Flip6好看好用更好玩
下一篇：人工合成的“垃圾食品”排行榜公布, 第一名很多人每天都在吃

Powered by 杏宇 @2013-2022 RSS地图 HTML地图