4个金融男搞音乐，1年赚超1亿美元

%title插图%num

出品｜虎嗅科技组

作者｜SnowyM

编辑｜陈伊凡

头图｜AI生成

“AI原生100”是虎嗅科技组推出针对AI原生创新栏目，这是本系列的第「30」篇文章。

近日，OpenAI被曝正在着手开发生成音乐的人工智能。根据科技媒体The Information消息，OpenAI正在和朱丽亚德学院的学生合作，为乐谱注释。

这则消息，让另一家已经在AI音乐生成上形成数据飞轮的AI初创企业进入了大众视野，这就是Suno——被视为音乐界的“ChatGPT”。

2024年，Suno的横空出世，第一次实现了歌词、人声、伴奏等一系列音乐内容的一次性AI生成。

10月底，Suno被曝即将完成新一轮融资，融资额1亿美金，融资结束之后，Suno预计估值20亿美元，是上一轮估值的4倍。Suno也成为了增长最快的人工智能公司之一。

虎嗅和多位AI创业者、投资人聊过Suno这个项目。对许多音乐人来说，Suno是一个颠覆性的产品。Suno的成功，再次证明了产品品味和数据飞轮的重要性。

第三方数据公司Xsignal（奇异因子）创始人及CEO刘震表示，每一个赛道都需要精细化运营，且涉及到很多垂直know-how经验。例如对作曲的专业理解、AI音乐版权问题的把握。Suno已经经历过磨难，且积累了应对的经验和方法。

UpHonest Capital投研团队表示，Suno的社区氛围很好，有一点AI版本Spotify的样子，用户天然对自己创作的歌曲有好感。Suno还会推荐社区的创作者，分享他们的歌曲。

AI音乐生成的产品并不少，有Udio、Riffusion，不过使用过不同产品的音乐人表示，Suno的效果最好。

我们尝试通过对Suno这家公司的拆解，分析Suno是如何做出独特的产品以及经营用户社区，又如何在竞争环伺下，还能获得资本的持续关注。

在空白市场，做到20亿美元估值

Suno最核心的突破在于，它生成的不是零散的旋律或单调的节拍，而是包含人声、歌词、编曲和混音的完整歌曲，将音乐创作的门槛从“需要数年专业训练”降低到“只需要想象力”。

在Suno诞生之前，生成式AI的焦点主要集中在文本（如GPT系列）和图像领域。相比之下，“音频AI”的发展相对滞后，高质量的音频生成，尤其是包含复杂结构和情感元素的音乐生成，是一个尚未被充分开发的市场。

%title插图%num

虎嗅曾与音潮CEO姜涛聊过，他是中国最早做音乐生成的一批人之一。他说，即使现在看来，音乐生成依然还是一个小众却好玩的赛道。在中国科技领域，做语音和音频生成的人并不多，音乐生成又是其中最小众的一批人，国内的专家一只手都数得过来。在这个领域的人，既是玩音乐的人中最懂算法的，也是做算法的人中最懂音乐的。

Suno的出现，正是为了填补这一市场。

作为一家AI原生应用公司，Suno 的增长非常迅猛，自2022年成立以来共融资 1.25 亿美元，其 2024 年 5 月的 B 轮融资由 Lightspeed Venture Partners（光速创投）领投，投后估值达到 5 亿美元。投资方还包括 Nat Friedman、Daniel Gross、Matrix Partners、Founder Collective 等知名机构和天使，在 AI 和科技领域具有深厚背景。

2025 年 10 月，有消息称 Suno 正在洽谈新一轮 1 亿美元融资，估值预计将飙升至 20 亿美元，是上一轮估值的四倍。这反映了资本市场对 AI 音乐赛道的高度看好，即使在版权法律风险下，投资人依然愿意押注其成长潜力。

Suno 自 2023 年下半年推出首款产品以来用户增长惊人。上线短短 8 个月用户即破千万，相比之下，Spotify 达到 1,000 万用户用了整整 4 年。

截至 2024 年中，已有超过 1200 万人尝试过 Suno 进行音乐创作。庞大的用户基础带来可观收入，甚至有报道称 Suno 当前年经常性收入（ARR）已超 1 亿美元。用户活跃度同样亮眼，平台上平均每秒就产生 10 首新曲目。

这种增长模式并非传统软件公司所能比拟的，其估值在短短5个月内翻了两番，ARR在不到一年的时间里从几乎为零增长到过亿美元。

全民“音乐人”

从本质上讲，Suno是一个基于Web和移动App的文本到音乐（Text-to-Music）生成平台。它的核心交互逻辑极其简单：用户输入一段描述性的文本提示词，AI便能在几十秒内生成一首完整的歌曲。

这里的“完整”，指的是歌曲不仅包含旋律和伴奏，还包括由AI合成的人声和生成的歌词，这使得Suno与市面上大多数只能生成纯音乐的AI工具有了本质区别。

2024 年 7 月，Suno 推出了首款移动应用（iOS），将以上功能搬上手机，方便用户随时随地记录灵感、创作音乐。移动端还接入了手机麦克风，可录制环境声（如鸟鸣、谈话等）并自动融入创作，使现实声音素材也能转化为音乐元素。

用户还可上传或录制一段声音（哼唱、小样旋律、节奏敲击等），AI 将据此继续谱写歌曲，再基于这些声音创作旋律。这一功能让 “随手采样、即兴创作”成为可能。

Suno 同样提供“添加伴奏 ”和“添加人声”工具，用户生成初步曲段后，可进一步让 AI 自动加入额外的配器或和声人声。

例如，一段清唱旋律可以一键生成完整伴奏；或给无歌词的旋律添加 AI 演唱的人声线。这使普通用户也能完成复杂的编曲和制作过程。

Suno的模型迭代速度极快，每一次大版本更新都带来了体验上的质变。从最早被大众熟知的V3/3.5版本，到最新的V5（Beta）版本，Suno在音质和人声真实感上的提升是迅速的。

尤其是最新的V5模型，根据大量社区用户的反馈，其在音质、乐器清晰度和人声真实感上实现了“巨大提升”，人声的自然度被形容为“几乎与真人无异”。

几乎与V5模型发布的同时，2025 年 9 月，Suno 发布了桌面应用 Suno Studio，号称全球首个“生成式音频工作站”。

%title插图%num

它集成了类似专业数字音频工作站（DAW）的多轨编辑功能。用户可以在Studio中分离出歌曲的各个乐器音轨，如人声、鼓、贝斯等，并进行独立的编辑和混音，这标志着Suno的专业性达到了一个全新的高度。

Suno Studio 将 AI 生成融入专业多轨工作流程，实现人机协同作曲。Studio 提供专业级的节奏 BPM 控制、音高与音量调整等功能，并支持将生成的每条音轨导出为音频或 MIDI 文件，以便在其他软件中继续制作。

Suno Studio 极大地拓展了创作自由度，被视为将来专业音乐制作与 AI 结合的重要探索。

Suno 当前主要通过订阅增值模式（freemium），而只有最高档的 Premier 能独享最新最强大的模型版本（如 v5 引擎）以及 Suno Studio。

与许多音乐软件定位专业创作者不同，Suno 瞄准的是普罗大众，用户群体覆盖极广，其联合创始人明确表示：“我们想做的是面向所有人的创意工具，而非只服务于少数专业人士的技术。”

据官方博客透露，Suno 核心用户群包含：最庞大也最具活力的大众用户群体，他们使用Suno的目的多种多样，包括纯粹的娱乐、为社交媒体帖子制作独特的BGM、为家庭视频配乐、或者仅仅是把自己的想法和心情变成一首歌来与朋友分享。对他们而言，Suno是一个新奇的玩具，也是一个个人表达工具。

其次就是内容创作者或者是营销人员，这个群体包括视频博主、播客主、独立游戏开发者和广告营销人员。他们对高质量、无版权风险的定制音乐有着巨大的刚性需求。Suno为他们提供了一个极其高效的解决方案，可以在几分钟内生成符合特定情绪、风格和主题的背景音乐或广告歌曲，极大地降低了内容制作的成本和时间。

尽管Suno的目标是大众化，但它也吸引了越来越多的专业人士。对于这个群体，Suno主要扮演着灵感激发器和音乐原型验证的角色。

甚至连格莱美获奖制作人Timbaland也公开表示，他每天会花长达10个小时使用Suno进行创作探索。

虎嗅之前和一位AI创业者聊过，他的音乐人朋友在用Suno创作歌曲，他把一套提示词和歌词扔给ChatGPT，让ChatGPT解构音乐元素，并翻译成蒙语，让Suno生成一首蒙古歌曲。

一群金融公司出身的“音乐家”

任何一家现象级公司的背后，都离不开一个独特的创始团队，Suno的故事也不例外。

Suno 由四位既热爱音乐又精通技术的联合创始人于 2022 年在美国剑桥创立。四位创始人分别是 Mikey Shulman（首席执行官）、Georg Kucsko、Martin Camacho 和 Keenan Freyberg，他们曾一同就职于剑桥的一家金融AI公司 Kensho，在工作中结识。

%title插图%num

团队中多人拥有哈佛大学物理学或计算机科学高学历背景，其中首席执行官 Mikey Shulman 是哈佛大学的博士。在 Kensho 共事期间，他们发现彼此都有音乐创作的业余激情，几乎称得上“终身音乐人+技术极客”的组合。

CEO Mikey Shulman 曾长期在纽约玩乐队、录音和驻唱，对普通人创作音乐的艰辛体会深刻。尽管他本人技术上已相当娴熟，却仍感到音乐创作的门槛极高：不仅需要训练有素或音乐天赋，还要投入大量时间和钱。

而且，在Kensho，团队的核心任务之一是处理金融领域的音频数据，例如充满口音、背景噪音和专业术语的财报电话会议录音。这项工作让他们深刻地认识到，当时的音频AI技术水平，相较于文本和图像AI，是多么的落后和不成熟。

据团队成员在采访和社区分享中透露，他们在开发用于处理金融录音的音频大语言模型时，经常在深夜“滥用”这个内部工具来“玩音乐”。

他们逐渐意识到了AI可以进行即兴创作，可以被用于充满无限可能的创造。

带着这个出发点，4位创始人于 2022 年底直接离开原公司，投入 Suno 的创立。他们在早期获得了 Matrix Partners 等风投的种子资金支持，于 2023 年 3 月完成了 A 轮融资（金额未公开）以开发核心技术。

在创立Suno之初，团队的第一个公开项目是一个名为Bark的开源文本转音频模型，于2023年发布。Bark可以生成非常自然的语音、音效甚至歌唱声，并在GitHub等开发者社区迅速走红，获得了数千星标。

在与社区的互动中，团队收到了大量反馈，其中一个声音越来越强烈，也越来越清晰：“这个工具很酷，但我们真正想用它来做音乐，而不仅仅是说话。”。

正是这个来自用户的直接、强烈的需求，最终点燃了团队，让他们将公司的战略重心从一个通用的音频工具，全面转向专注于音乐生成的Suno。

Suno创始团队在产品尚处早期就展现出大胆的一面。他们深知训练此类 AI 模型难免涉及版权音乐数据，可能招致传统音乐业的不满甚至诉讼。然而，早期投资人如 Matrix 合伙人 Antonio Rodriguez 表示理解创始人的选择，称“这是我们投资时就必须承担的风险”。

Rodriguez 甚至直言：“如果公司创业之初就去找唱片公司谈授权，我反而不会投资，他们需要在无约束的环境下把产品做出来”。在这种背书下，Suno 团队选择先专注打磨产品、跑马圈地用户，再逐步应对版权合规挑战。

逐渐激烈的音乐生成赛道

AI 生成音乐所处的市场正呈现爆发式增长态势。

一方面，全球数字音乐产业规模庞大且持续扩张，音乐流媒体市场 2023 年产值已超过 260 亿美元。另一方面，AI 音乐创作作为新兴细分领域，近两年增长曲线陡峭：据法国流媒体服务 Deezer 等平台统计，完全由 AI 生成的音乐现已占到每日上架曲目的 28%，且这一比例仍在迅速攀升。

Deezer 报告其每日收到的 AI 原创曲目从 2023 年初的 1 万首飙升至当年 10 月的 3 万首/日。可以预见，未来 AI 将贡献全球音乐作品相当可观的份额。Suno 当前超过千万的用户量和每秒 10 首曲目的产出率，某种程度上验证了这一增长神话。

值得注意的是，传统音乐科技（Music-Tech）领域在过去几年曾一度遇冷：2010–2018 年诞生了大批头部融资案例（多为流媒体平台和音乐硬件），但此后由于流媒体市场增速放缓、版权费用高企等因素，投资趋于平静。

Suno 于 2024 年拿到史无前例的大额融资，成为 2018 年以来极少数引发轰动效应的音乐科技创业公司之一，被视作行业进入新一轮创新周期的标志。资本的回暖表明，音乐产业正从“渠道为王”的流媒体红海，转向创作赋能等蓝海领域寻求突破。

一个最佳证明就是，10 月，环球音乐集团首席执行官 Lucian Grainge 曾在一份员工备忘录中，再次重申了公司愿意与 AI 公司合作开发产品，前提是它们尊重版权。

音乐产业长期存在两个痛点：其一，创作端门槛高，专业音乐人毕竟是少数，大量普通人的音乐创造力并未被激发；其二，内容端供需错配，受限于人力创作速度，音乐市场很难针对海量的个性化、长尾需求提供定制内容。生成式 AI 音乐的出现正好对症下药。

就竞争格局而言，当前 AI 音乐创作仍属早期阶段，整体上可视为“蓝海市场”，但正在快速变红。目前主流音乐产业的巨头（如唱片公司、流媒体）虽密切关注但自身尚未主导这一领域，给了创业公司先发机会。

科技巨头们纷纷有所行动但总体尚未成熟。谷歌早在 2023 年就展示了其音乐生成模型 MusicLM，并于同年底开放了限量体验版；Meta 的 AI 研究团队推出了开源的文本生成音乐模型（如 MusicGen，隶属 AudioCraft 项目）供开发者试用。OpenAI 作为生成式 AI 的领军者，至今尚未正式发布音乐产品，但据报道其内部正开发 AI 音乐平台。

这个情况在中国也同样发生，作为一个C端流量入口，音乐一定是科技巨头会切入的领域。不过虎嗅与AI音乐生成的创业者聊过，大厂切入的决心和他们做的深度，不及创业公司。这位创业者说，以字节为例，他们的音乐生成属于算法中台，算法中台是一个非盈利部门，但是大厂中，其产品是以生产工具为主。“这是个很矛盾的状态。”他说。

但Suno们的竞争对手并非只有大厂，更危险的是那些初创公司。随着 AI 技术门槛降低和商业前景显现，各路玩家正涌入，初创企业开始进入市场。

来自美国的 AI 音乐平台 Udio，与 Suno 并称业内双雄。Udio 专注于让用户生成个性化歌曲，与 Suno 类似也面临版权诉讼困扰。Udio 在 2024 年初获得了 1000万美元融资，虽金额不及 Suno，但同样引起关注。其最大特色是注重与独立音乐人合作，投资方和顾问包括歌手 will.i.am 等音乐界人士，在行业资源上稍有不同。

更早期的 AI 音乐平台 Boomy 允许用户通过简单选项组合生成背景音乐，并声称已创造数百万首歌曲。2023 年 Spotify 一度下架了 Boomy 用户上传的大量音乐，原因是怀疑存在“流量作弊”等问题。Boomy 已于 2021 年获得 500 万美元投资，在 Suno 出现前曾是该领域知名玩家之一。

来自印度的 AI 音乐初创 Beatoven，主打免版税配乐生成。用户可选择心情、风格，AI 生成用于视频、游戏的背景音乐。Beatoven 更像是 B2B 工具，为内容创作者提供低成本配乐方案。虽细分领域不同，但在技术原理上接近，也与 Suno 存在潜在竞争关系。

此外还有如 Splash、Bronze、AIVA、Soundful 等不同定位的 AI 音乐公司涌现。例如 Splash 将 AI 音乐融入电子游戏；Bronze 专注 AI 互动音乐体验，吸引了一些艺人投资；AIVA 较早提供 AI 配乐服务，被用于短片、广告等。

竞争之外，另一个风险是版权。

Suno最为典型，其正面临来自全球三大唱片公司，索尼音乐、环球音乐集团和华纳音乐集团的联合诉讼。诉讼的核心指控是，Suno在未经授权的情况下，大规模使用了受其版权保护的音乐录音来训练其AI模型。

唱片公司的指控非常具体，如果考虑到三大唱片公司拥有的曲库规模，这些诉讼可以让任何一家创业公司，包括Suno在内，瞬间原地破产。

这也是当下AI音乐生成公司普遍面临的问题。虎嗅曾于AI音乐创业者交流过，对他们来说，目前这件事全球没有参考，如果在做这件事的第一时间就考虑到版权，就束缚住手脚了。一些AI音乐生成公司的做法是，会拿一些版权授权，并抽取一些没有版权的要素。

Suno的事情出现有趣反转，尽管官司打得火热，但多家媒体同时报道称，Suno正在与包括环球和华纳在内的唱片公司进行授权协议的谈判。

据报道，谈判内容不仅包括未来的授权费用，甚至可能涉及让唱片公司以股权投资的方式入股Suno。这一事件甚至被认为是传统音乐公司向AI公司临阵倒戈。

这戏剧性的一幕，或许预示着AI原生应用公司Suno的“野蛮生长”与传统音乐产业的既有规则，在激烈的碰撞中走向一种全新的融合。

“看，Suno正在帮我们倘出一条路。”一位AI音乐生成创业者说。

%title插图%num

本文来自虎嗅，原文链接：https://www.huxiu.com/article/4801409.html?f=wyxwapp

声明：包含AI生成内容

4个金融男搞音乐，1年赚超1亿美元

在空白市场，做到20亿美元估值

全民“音乐人”

一群金融公司出身的“音乐家”

逐渐激烈的音乐生成赛道

近期文章

标签

书签