
出品|虎嗅科技组
作者|SnowyM
编辑|陈伊凡
头图|AI生成
“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「30」篇文章。
近日,OpenAI被曝正在着手开发生成音乐的人工智能。根据科技媒体The Information消息,OpenAI正在和朱丽亚德学院的学生合作,为乐谱注释。
这则消息,让另一家已经在AI音乐生成上形成数据飞轮的AI初创企业进入了大众视野,这就是Suno——被视为音乐界的“ChatGPT”。
2024年,Suno的横空出世,第一次实现了歌词、人声、伴奏等一系列音乐内容的一次性AI生成。
10月底,Suno被曝即将完成新一轮融资,融资额1亿美金,融资结束之后,Suno预计估值20亿美元,是上一轮估值的4倍。Suno也成为了增长最快的人工智能公司之一。
虎嗅和多位AI创业者、投资人聊过Suno这个项目。对许多音乐人来说,Suno是一个颠覆性的产品。Suno的成功,再次证明了产品品味和数据飞轮的重要性。
第三方数据公司Xsignal(奇异因子)创始人及CEO刘震表示,每一个赛道都需要精细化运营,且涉及到很多垂直know-how经验。例如对作曲的专业理解、AI音乐版权问题的把握。Suno已经经历过磨难,且积累了应对的经验和方法。
UpHonest Capital投研团队表示,Suno的社区氛围很好,有一点AI版本Spotify的样子,用户天然对自己创作的歌曲有好感。Suno还会推荐社区的创作者,分享他们的歌曲。
AI音乐生成的产品并不少,有Udio、Riffusion,不过使用过不同产品的音乐人表示,Suno的效果最好。
我们尝试通过对Suno这家公司的拆解,分析Suno是如何做出独特的产品以及经营用户社区,又如何在竞争环伺下,还能获得资本的持续关注。
在空白市场,做到20亿美元估值
Suno最核心的突破在于,它生成的不是零散的旋律或单调的节拍,而是包含人声、歌词、编曲和混音的完整歌曲,将音乐创作的门槛从“需要数年专业训练”降低到“只需要想象力”。
在Suno诞生之前,生成式AI的焦点主要集中在文本(如GPT系列)和图像领域。相比之下,“音频AI”的发展相对滞后,高质量的音频生成,尤其是包含复杂结构和情感元素的音乐生成,是一个尚未被充分开发的市场。

虎嗅曾与音潮CEO姜涛聊过,他是中国最早做音乐生成的一批人之一。他说,即使现在看来,音乐生成依然还是一个小众却好玩的赛道。在中国科技领域,做语音和音频生成的人并不多,音乐生成又是其中最小众的一批人,国内的专家一只手都数得过来。在这个领域的人,既是玩音乐的人中最懂算法的,也是做算法的人中最懂音乐的。
Suno的出现,正是为了填补这一市场。
作为一家AI原生应用公司,Suno 的增长非常迅猛,自2022年成立以来共融资 1.25 亿美元,其 2024 年 5 月的 B 轮融资由 Lightspeed Venture Partners(光速创投)领投,投后估值达到 5 亿美元。投资方还包括 Nat Friedman、Daniel Gross、Matrix Partners、Founder Collective 等知名机构和天使,在 AI 和科技领域具有深厚背景。
2025 年 10 月,有消息称 Suno 正在洽谈新一轮 1 亿美元 融资,估值预计将飙升至 20 亿美元,是上一轮估值的四倍。这反映了资本市场对 AI 音乐赛道的高度看好,即使在版权法律风险下,投资人依然愿意押注其成长潜力。
Suno 自 2023 年下半年推出首款产品以来用户增长惊人。上线短短 8 个月用户即破千万,相比之下,Spotify 达到 1,000 万用户用了整整 4 年。
截至 2024 年中,已有超过 1200 万 人尝试过 Suno 进行音乐创作。庞大的用户基础带来可观收入,甚至有报道称 Suno 当前年经常性收入(ARR)已超 1 亿美元。用户活跃度同样亮眼,平台上平均每秒就产生 10 首 新曲目。
这种增长模式并非传统软件公司所能比拟的,其估值在短短5个月内翻了两番,ARR在不到一年的时间里从几乎为零增长到过亿美元。
全民“音乐人”
从本质上讲,Suno是一个基于Web和移动App的文本到音乐(Text-to-Music)生成平台。它的核心交互逻辑极其简单:用户输入一段描述性的文本提示词,AI便能在几十秒内生成一首完整的歌曲。
这里的“完整”,指的是歌曲不仅包含旋律和伴奏,还包括由AI合成的人声和生成的歌词,这使得Suno与市面上大多数只能生成纯音乐的AI工具有了本质区别。
2024 年 7 月,Suno 推出了首款移动应用(iOS),将以上功能搬上手机,方便用户随时随地记录灵感、创作音乐。移动端还接入了手机麦克风,可录制环境声(如鸟鸣、谈话等)并自动融入创作,使现实声音素材也能转化为音乐元素。
用户还可上传或录制一段声音(哼唱、小样旋律、节奏敲击等),AI 将据此继续谱写歌曲,再基于这些声音创作旋律。这一功能让 “随手采样、即兴创作”成为可能。
Suno 同样提供“添加伴奏 ”和“添加人声”工具,用户生成初步曲段后,可进一步让 AI 自动加入额外的配器或和声人声。
例如,一段清唱旋律可以一键生成完整伴奏;或给无歌词的旋律添加 AI 演唱的人声线。这使普通用户也能完成复杂的编曲和制作过程。
Suno的模型迭代速度极快,每一次大版本更新都带来了体验上的质变。从最早被大众熟知的V3/3.5版本,到最新的V5(Beta)版本,Suno在音质和人声真实感上的提升是迅速的。
尤其是最新的V5模型,根据大量社区用户的反馈,其在音质、乐器清晰度和人声真实感上实现了“巨大提升”,人声的自然度被形容为“几乎与真人无异”。
几乎与V5模型发布的同时,2025 年 9 月,Suno 发布了桌面应用 Suno Studio,号称全球首个“生成式音频工作站”。

它集成了类似专业数字音频工作站(DAW)的多轨编辑功能。用户可以在Studio中分离出歌曲的各个乐器音轨,如人声、鼓、贝斯等,并进行独立的编辑和混音,这标志着Suno的专业性达到了一个全新的高度。
Suno Studio 将 AI 生成融入专业多轨工作流程,实现人机协同作曲。Studio 提供专业级的节奏 BPM 控制、音高与音量调整等功能,并支持将生成的每条音轨导出为音频或 MIDI 文件,以便在其他软件中继续制作。
Suno Studio 极大地拓展了创作自由度,被视为将来专业音乐制作与 AI 结合的重要探索。
Suno 当前主要通过 订阅增值模式(freemium),而只有最高档的 Premier 能独享最新最强大的模型版本(如 v5 引擎)以及 Suno Studio。
与许多音乐软件定位专业创作者不同,Suno 瞄准的是普罗大众,用户群体覆盖极广,其联合创始人明确表示:“我们想做的是面向所有人的创意工具,而非只服务于少数专业人士的技术。”
据官方博客透露,Suno 核心用户群包含:最庞大也最具活力的大众用户群体,他们使用Suno的目的多种多样,包括纯粹的娱乐、为社交媒体帖子制作独特的BGM、为家庭视频配乐、或者仅仅是把自己的想法和心情变成一首歌来与朋友分享。对他们而言,Suno是一个新奇的玩具,也是一个个人表达工具。
其次就是内容创作者或者是营销人员,这个群体包括视频博主、播客主、独立游戏开发者和广告营销人员。他们对高质量、无版权风险的定制音乐有着巨大的刚性需求。Suno为他们提供了一个极其高效的解决方案,可以在几分钟内生成符合特定情绪、风格和主题的背景音乐或广告歌曲,极大地降低了内容制作的成本和时间。
尽管Suno的目标是大众化,但它也吸引了越来越多的专业人士。对于这个群体,Suno主要扮演着灵感激发器和音乐原型验证的角色。
甚至连格莱美获奖制作人Timbaland也公开表示,他每天会花长达10个小时使用Suno进行创作探索。
虎嗅之前和一位AI创业者聊过,他的音乐人朋友在用Suno创作歌曲,他把一套提示词和歌词扔给ChatGPT,让ChatGPT解构音乐元素,并翻译成蒙语,让Suno生成一首蒙古歌曲。
一群金融公司出身的“音乐家”
任何一家现象级公司的背后,都离不开一个独特的创始团队,Suno的故事也不例外。
Suno 由四位既热爱音乐又精通技术的联合创始人于 2022 年在美国剑桥创立。四位创始人分别是 Mikey Shulman(首席执行官)、Georg Kucsko、Martin Camacho 和 Keenan Freyberg,他们曾一同就职于剑桥的一家金融AI公司 Kensho,在工作中结识。

团队中多人拥有哈佛大学物理学或计算机科学高学历背景,其中首席执行官 Mikey Shulman 是哈佛大学的博士。在 Kensho 共事期间,他们发现彼此都有音乐创作的业余激情,几乎称得上“终身音乐人+技术极客”的组合。
CEO Mikey Shulman 曾长期在纽约玩乐队、录音和驻唱,对普通人创作音乐的艰辛体会深刻。尽管他本人技术上已相当娴熟,却仍感到音乐创作的门槛极高:不仅需要训练有素或音乐天赋,还要投入大量时间和钱。
而且,在Kensho,团队的核心任务之一是处理金融领域的音频数据,例如充满口音、背景噪音和专业术语的财报电话会议录音。这项工作让他们深刻地认识到,当时的音频AI技术水平,相较于文本和图像AI,是多么的落后和不成熟。
据团队成员在采访和社区分享中透露,他们在开发用于处理金融录音的音频大语言模型时,经常在深夜“滥用”这个内部工具来“玩音乐”。
他们逐渐意识到了AI可以进行即兴创作,可以被用于充满无限可能的创造。
带着这个出发点,4位创始人于 2022 年底直接离开原公司,投入 Suno 的创立。他们在早期获得了 Matrix Partners 等风投的种子资金支持,于 2023 年 3 月完成了 A 轮融资(金额未公开)以开发核心技术。
在创立Suno之初,团队的第一个公开项目是一个名为Bark的开源文本转音频模型,于2023年发布。Bark可以生成非常自然的语音、音效甚至歌唱声,并在GitHub等开发者社区迅速走红,获得了数千星标。
在与社区的互动中,团队收到了大量反馈,其中一个声音越来越强烈,也越来越清晰:“这个工具很酷,但我们真正想用它来做音乐,而不仅仅是说话。”。
正是这个来自用户的直接、强烈的需求,最终点燃了团队,让他们将公司的战略重心从一个通用的音频工具,全面转向专注于音乐生成的Suno。
Suno创始团队在产品尚处早期就展现出大胆的一面。他们深知训练此类 AI 模型难免涉及版权音乐数据,可能招致传统音乐业的不满甚至诉讼。然而,早期投资人如 Matrix 合伙人 Antonio Rodriguez 表示理解创始人的选择,称“这是我们投资时就必须承担的风险”。
Rodriguez 甚至直言:“如果公司创业之初就去找唱片公司谈授权,我反而不会投资,他们需要在无约束的环境下把产品做出来”。在这种背书下,Suno 团队选择先专注打磨产品、跑马圈地用户,再逐步应对版权合规挑战。
逐渐激烈的音乐生成赛道
AI 生成音乐所处的市场正呈现爆发式增长态势。
一方面,全球数字音乐产业规模庞大且持续扩张,音乐流媒体市场 2023 年产值已超过 260 亿美元。另一方面,AI 音乐创作作为新兴细分领域,近两年增长曲线陡峭:据法国流媒体服务 Deezer 等平台统计,完全由 AI 生成的音乐现已占到每日上架曲目的 28%,且这一比例仍在迅速攀升。
Deezer 报告其每日收到的 AI 原创曲目从 2023 年初的 1 万首飙升至当年 10 月的 3 万首/日。可以预见,未来 AI 将贡献全球音乐作品相当可观的份额。Suno 当前超过千万的用户量和每秒 10 首曲目的产出率,某种程度上验证了这一增长神话。
值得注意的是,传统音乐科技(Music-Tech)领域在过去几年曾一度遇冷:2010–2018 年诞生了大批头部融资案例(多为流媒体平台和音乐硬件),但此后由于流媒体市场增速放缓、版权费用高企等因素,投资趋于平静。
Suno 于 2024 年拿到史无前例的大额融资,成为 2018 年以来极少数引发轰动效应的音乐科技创业公司之一,被视作行业进入新一轮创新周期的标志。资本的回暖表明,音乐产业正从“渠道为王”的流媒体红海,转向创作赋能等蓝海领域寻求突破。
一个最佳证明就是,10 月,环球音乐集团首席执行官 Lucian Grainge 曾在一份员工备忘录中,再次重申了公司愿意与 AI 公司合作开发产品,前提是它们尊重版权。
音乐产业长期存在两个痛点:其一,创作端门槛高,专业音乐人毕竟是少数,大量普通人的音乐创造力并未被激发;其二,内容端供需错配,受限于人力创作速度,音乐市场很难针对海量的个性化、长尾需求提供定制内容。生成式 AI 音乐的出现正好对症下药。
就竞争格局而言,当前 AI 音乐创作仍属早期阶段,整体上可视为“蓝海市场”,但正在快速变红。目前主流音乐产业的巨头(如唱片公司、流媒体)虽密切关注但自身尚未主导这一领域,给了创业公司先发机会。
科技巨头们纷纷有所行动但总体尚未成熟。谷歌早在 2023 年就展示了其音乐生成模型 MusicLM,并于同年底开放了限量体验版;Meta 的 AI 研究团队推出了开源的文本生成音乐模型(如 MusicGen,隶属 AudioCraft 项目)供开发者试用。OpenAI 作为生成式 AI 的领军者,至今尚未正式发布音乐产品,但据报道其内部正开发 AI 音乐平台。
这个情况在中国也同样发生,作为一个C端流量入口,音乐一定是科技巨头会切入的领域。不过虎嗅与AI音乐生成的创业者聊过,大厂切入的决心和他们做的深度,不及创业公司。这位创业者说,以字节为例,他们的音乐生成属于算法中台,算法中台是一个非盈利部门,但是大厂中,其产品是以生产工具为主。“这是个很矛盾的状态。”他说。
但Suno们的竞争对手并非只有大厂,更危险的是那些初创公司。随着 AI 技术门槛降低和商业前景显现,各路玩家正涌入,初创企业开始进入市场。
来自美国的 AI 音乐平台 Udio,与 Suno 并称业内双雄。Udio 专注于让用户生成个性化歌曲,与 Suno 类似也面临版权诉讼困扰。Udio 在 2024 年初获得了 1000万美元融资,虽金额不及 Suno,但同样引起关注。其最大特色是注重与独立音乐人合作,投资方和顾问包括歌手 will.i.am 等音乐界人士,在行业资源上稍有不同。
更早期的 AI 音乐平台 Boomy 允许用户通过简单选项组合生成背景音乐,并声称已创造数百万首歌曲。2023 年 Spotify 一度下架了 Boomy 用户上传的大量音乐,原因是怀疑存在“流量作弊”等问题。Boomy 已于 2021 年获得 500 万美元投资,在 Suno 出现前曾是该领域知名玩家之一。
来自印度的 AI 音乐初创 Beatoven,主打免版税配乐生成。用户可选择心情、风格,AI 生成用于视频、游戏的背景音乐。Beatoven 更像是 B2B 工具,为内容创作者提供低成本配乐方案。虽细分领域不同,但在技术原理上接近,也与 Suno 存在潜在竞争关系。
此外还有如 Splash、Bronze、AIVA、Soundful 等不同定位的 AI 音乐公司涌现。例如 Splash 将 AI 音乐融入电子游戏;Bronze 专注 AI 互动音乐体验,吸引了一些艺人投资;AIVA 较早提供 AI 配乐服务,被用于短片、广告等。
竞争之外,另一个风险是版权。
Suno最为典型,其正面临来自全球三大唱片公司,索尼音乐、环球音乐集团和华纳音乐集团的联合诉讼。诉讼的核心指控是,Suno在未经授权的情况下,大规模使用了受其版权保护的音乐录音来训练其AI模型。
唱片公司的指控非常具体,如果考虑到三大唱片公司拥有的曲库规模,这些诉讼可以让任何一家创业公司,包括Suno在内,瞬间原地破产。
这也是当下AI音乐生成公司普遍面临的问题。虎嗅曾于AI音乐创业者交流过,对他们来说,目前这件事全球没有参考,如果在做这件事的第一时间就考虑到版权,就束缚住手脚了。一些AI音乐生成公司的做法是,会拿一些版权授权,并抽取一些没有版权的要素。
Suno的事情出现有趣反转,尽管官司打得火热,但多家媒体同时报道称,Suno正在与包括环球和华纳在内的唱片公司进行授权协议的谈判。
据报道,谈判内容不仅包括未来的授权费用,甚至可能涉及让唱片公司以股权投资的方式入股Suno。这一事件甚至被认为是传统音乐公司向AI公司临阵倒戈。
这戏剧性的一幕,或许预示着AI原生应用公司Suno的“野蛮生长”与传统音乐产业的既有规则,在激烈的碰撞中走向一种全新的融合。
“看,Suno正在帮我们倘出一条路。”一位AI音乐生成创业者说。


本文来自虎嗅,原文链接:https://www.huxiu.com/article/4801409.html?f=wyxwapp
声明:包含AI生成内容
