内容编辑丨特工少女 特工炸炸
内容审核丨
特工小天
上周,我们在观猹平台上发现,有一个 AI 音乐创作产品突然收到了众多观猹员的一致好评,许多观猹员写的非常认真,并且截止到今天,没有任何一个差评。
它叫 Tunee,国内首个对话式音乐创作 Agent
,用户只需用自然语言或上传视频、图像、音频片段与之对话,就能生成专业级的原创音乐。
https://watcha.cn/products/tunee
更特别的是,Tunee 会记住你的风格偏好与创作习惯,可以从视频和图片里捕捉情绪变化,还能自动完成母带与混音,帮你省去繁琐的后期。生成的音轨不仅能直接发布,还能导出分轨,供进一步微调。
简单来说,它既能满足普通用户的即兴创作,也能成为专业音乐人的灵感伙伴。
我们也试着把「观猹」的介绍资料交给了 Tunee,想看看会写出怎样的主题曲。
没想到被效果惊艳到了:
主题曲 1:https://www.tunee.ai/music/GPrThm7oSNyweZRHK
主题曲 2:https://www.tunee.ai/music/rPbTdmWotNywewNRv
据我们了解,Tunee 这支团队从 2019 年就开始深耕音乐领域。
他们有一句始终坚持的 Slogan ——“人人都能玩点音乐”,这也很好地概括了团队的使命:降低音乐创作的门槛,让更多人能够以音乐表达自己。
作为国内最早探索 AI 音乐的团队之一,他们早在 2023 年就已在唱鸭 APP 上尝试过基于符号域的 AI 写歌功能。
几年间,他们不断迭代技术和产品:去年推出了 Tempolor 大模型,而在本周的云栖大会上,他们将发布全新的 Tempolor V4 大模型,以及全球首款生成式 AI 吉他,继续推动 AI 与音乐的融合边界。
我们很想知道好评如潮背后的原因是什么,于是联系到了主创团队,进行了一次深度专访。
💡 顺带一提,目前 Tunee 的体验需要邀请码,感兴趣的小伙伴可以去观猹上的「瓜棚」中进行领取~
特工少女:
咱们有提到“人人都能玩点音乐”,那怎么看待 Tunee 在专业性和大众化之间的平衡呢?
龚天翼:
我们的核心目标并不是要消除专业性,而是降低音乐表达的门槛。我们一直有个理念:每个人的内心都有音乐,就像人天生会说话一样。只是音乐创作的门槛特别高,大多数人注定没办法用音乐来表达。
比如说最近 Nano Banana 很火,为什么它能火?很大原因是它把门槛降得很低,大家都能玩,而且有种“言出法随”的效果——你说怎么改,它就能怎么出。
那音乐不也应该是这样的吗?所以我们希望普通人也能轻松表达他们的音乐想法。
从专业侧的角度看,我们内测群里有不少专业音乐人,还有老师和一些大神,他们也蛮喜欢 Tunee。为什么?因为他们能用 Tunee 快速探索创作方向。比如有些人直接把视频扔进去,有些人把自己的哼唱或者写好的音乐丢进去,Tunee 就能帮他们快速生成一个方案,让他们判断这个方向合不合适。
我们理解的“音乐民主化”,不是要每个人都掌握专业技能,而是让每个人都能借助像 Tunee 这样简单但专业级的工具来表达自己。
特工少女:
之前做过 Templor 和唱鸭,积累了这么多用户,这次推出的 Tunee 最主要的区别是什么?
龚天翼:
我想讲讲整个大概的心路历程。唱鸭最早的时候,我们做的也是“降门槛”的事情。在唱鸭之前,你想要用吉他自弹自唱,门槛其实很高。但唱鸭做到的就是——你不会乐器,也可以自弹自唱。
到了 Templor,我们是把它定义成一个 AI 音乐工具。那 AI 音乐工具我们做了一年多,后来发现产品还挺复杂的。如果有体验过,就知道那个产品形态其实蛮复杂,大量的参数、特别多的提示词,还需要学习。
所以我们觉得这和我们最初的理念——“人人都能玩点音乐”,稍微有点相违背。去年底的时候,我就在思考:
音乐创作能不能像聊天一样自然?
那个阶段时间和技术都有些瓶颈,但到今年大家能看到整个 Agent 应用的爆发,相关技术也快速成熟了,我们就觉得机会来了。
我们大概是从 5 月底开始思考做这个事情,到 8 月就内测,然后马上要公测了。这期间我们一直是连轴转的状态。
特工少女:
为什么不在天谱乐上重做,而是推出 Tunee?
龚天翼:
核心在定位。Templor(天谱乐)本质上还是“AI 音乐生成工具”,但 Tunee 我们希望它是“你的音乐伙伴”,能用自然语言和你对话创作。一个是工具,一个是伙伴,差别太大。如果强行绑在老品牌上,会背历史包袱,不如轻装上阵,给用户一个全新的心智。
特工少女:
这次和天谱乐相比,Tunee 更强调“对话式”,那在底层模型上有没有做一些迭代或者变化?
龚天翼:
其实模型发生了挺大的变化。我们现在有一个全新的版本叫 Templor V4,马上就要发布,到时候会有更详细的讲解。
我先简单说一下核心变化:
过去我们训练音乐模型的时候,更多是“喂”它更多的歌。说白了,有些知其然而不知其所以然,只会模仿生成音乐,但并不理解歌词的含义,或者用户输入想表达的意思。
这次我们把 Tunee 拆成两个部分
:
需求的理解 + 音乐的生成
。
Tunee 在设计时,它的定位是一个 Producer,核心逻辑其实和人类对话很像。
为了解决这个问题,我们在几个方面做了优化:
1. 生成逻辑升级:
过去是“一段式”,直接生成音乐;现在是“两段式”,先理解,再生成。第一步把用户需求转化成可理解的中间层,第二步再生成音乐。这样生成的结果更自然,也更符合预期。
2. 需求分析优化:
用户输入的可能是文字、音频、图片或视频,但背后需求完全不同,所以不能简单地丢给一个多模态模型。我们要先拆解出用户的真实意图,再生成更合适的方案。
3. 选择更清晰:
我们会把模糊想法转化为几个具体方向,用户不仅可以在选项里挑,还可以选择“我全都要”。这样大大提高了命中率。
4. 持续对话优化:
音乐创作往往需要多轮修改。我们在连续对话上做了很多努力,一方面要尽量减少 Token 消耗,另一方面要保证上下文记忆准确,让用户能不断修改,直到满意。
除此之外,我们还在做周边模块,比如很多人喜欢的智能母带,它能提升音乐的质感和动态效果。再比如分享场景,我们做了 MV 功能,下周版本还会推出“一镜到底”的新能力,能保持人物、风格一致,画面连贯,效果更好。
特工少女:
但我看到有用户反馈,说 Tunee 在歌词等部分效果不如天谱乐。
龚天翼:
对,这个情况我们也注意到了。天谱乐当时主要面向国内市场,我们在中文写词上做过优化,虽然迭代不多,但确实对中文效果会更好。而 Tunee 面向全球市场,要同时支持英文、日语等多语言,这会导致我们选择了一个相对中庸的路线。结果就是在中文上可能没有天谱乐那么精细。
不过我们计划在 10 月上线一个新功能:允许用户自定义歌词提示词,并针对不同语言和文化背景做差异化优化。这样会显著改善在中文等语境下的体验。
特工少女:
明白,也就是说这次训练集里没有专门为中文语境和国风语境做优化?
龚天翼:
可以这么理解。
我们的训练集其实超过了 700 万条,
非常庞大。其中英文数据占比最大,中文排第二,从数量级上看没有太大问题。但一些多音字、语调等问题,
本质还是数据平衡的问题,就像一个人在国外长大,哪怕会中文,发音也会受影响。
另外,
歌词对音乐整体效果影响特别大,所以一旦歌词优化到位,中文表达自然也会变好。
这是我们接下来要重点调整的方向。
特工少女:
其实我之前也用过一些别的音乐产品,但感觉出来的音乐比较千篇一律。在风格多样性上,咱们有没有做一些特别的优化?
龚天翼:
这个问题其实分两个层面。
第一个是
用户表达。
很多人写歌时会输入“我要一个流行音乐”、“我要洗脑的”、“要有『抖音』感”之类的提示。但模型并不真的理解这些词背后的意思,它可能只会给你一个很普通的流行乐方案,于是大家就觉得生成结果差不多。去年我们在这方面做了优化,让模型更好理解用户的意图。比如你说“『抖音』感”,它会去抓取当前『抖音』上正在流行的子风格、配器元素,然后生成的结果就会更贴近你心里的期待。
第二个是
技术层面。
早期的数据集风格分布很不均衡,比如 70–80% 都是流行音乐,其他风格占比极少。
这样模型自然就偏向主流风格,导致生成的音乐缺乏多样性。我们现在已经细分了超过 6000 种子风格,还把“流行乐”进一步拆分成 80s pop、city pop 等等,并在注意力机制上做了优化,这样模型不会过度偏向某一类风格,多样性就会更好。
说通俗一点:
过去用户输入“流行音乐”,脑海里想的可能是『周杰伦』或『林俊杰』,但对模型来说“流行音乐”是个非常宽泛的学术标签,结果两边对不上
。我们要做的就是降低提示词的门槛,让用户用更口语化的词,比如“『抖音』感”、“活人感”,模型就能理解并生成更接近需求的结果。
特工少女:
目前 Tunee 现在有带记忆功能,会不会去影响到用户的创造性?
龚天翼:
我理解你想说的,就是有点像“信息茧房”,大家听到的歌最后都差不多。
但我觉得这从个人层面来说不算问题。举个例子,『周杰伦』的歌风格特别鲜明,一听就知道是他的。甚至有时候我听他的新歌,如果味道不对,还会觉得不像他了。音乐的审美和风格,本来就是个性化的。
所以如果一个人通过使用产品,能逐渐“调教”出一种符合自己审美的风格,那就已经足够了
。至于多样性,本身是由不同的人带来的,而不是强行要求每个人的作品都要截然不同。
特工少女:
像刚才说的如果用户直接要求模仿某位歌手,或者上传已有的音乐,让 Tunee 改写歌词或再创作,这种情况下会不会有法律风险?
龚天翼:
与此同时,我们会给用户一个选择——是否要我们只去理解这种“风格”,然后创作一首新的、接近他脑海中感觉的音乐,但绝不会照搬那首歌。
特工少女:
那像 Tunee 生成的音乐,用户是否拥有完整的商业使用权?
龚天翼:
而对于免费用户,我们提供了大量免费额度,他们创作的音乐享有非商业使用权,可以用在个人项目或发布到『社交媒体』,但最好标注“来自于 Tunee ”。如果涉及商业用途,就需要升级到付费用户。
特工少女:
对于非专业用户来说,Tunee 的上手确实比 Templor 简单,但对普通用户来说使用场景还不算特别多。那咱们对定价策略是什么样的考虑?
龚天翼:
我觉得这可能跟我们现在的交互方式有关。因为现在就是一个对话框,缺少一些引导,所以大家会觉得功能看起来比较简单,好像能力不够强大。其实完全不是。
举个例子:前几天老罗的事,我想蹭一下热点,就直接让 Tunee 帮我找资料、写一首歌,还顺手做了一个 MV,整个过程几分钟就完成了。我发到小红书上,效果挺好。
这它能做的事很多,只是用户还没完全意识到
。
再比如有用户写了首歌让我评价,我直接把视频扔给 Tunee,Tunee 不仅认真点评,还给出了优化建议。用户照着改完再生成,发现确实比之前好很多。其实这类玩法非常多。
关于定价,我们内测时给了大量免费点数,全功能开放。但即便如此,仍有不少用户主动付费,而且数量在增加。这说明用户真切感受到了价值。
公测后我们会继续提供每日免费点数,还会在较长时间内开放全部会员功能。
我们的理念是:
让用户因为真的觉得有价值而选择付费,而不是靠“让你试一两次没明白,就强迫你付费”。
我们甚至把“退订”按钮做得特别显眼。
我们希望用户是真心觉得 Tunee 有用,才愿意长期支持。这样的付费才健康、可持续
,也更有可能让用户推荐朋友、在『社交媒体』分享。
特工少女:
也就是说咱们希望 Tunee 不是一次性使用的工具,而是能成为普通音乐爱好者的持续选择?
龚天翼:
我可以透露一个内测数据:
内测用户的次日留存超过50%,七天后留存接近30%。
这点让我们挺意外的,我们之前做Templor时发现,纯工具型产品的留存一般不会这么高,用户通常是有需求时来用一下,用完就走了。
但Tunee不太一样,现在的内测用户很有意思,他们把Tunee当成创作伙伴,没事就来聊聊、试试新想法,有些用户一天就能创作几十段音乐片段。虽然内测用户通常比普通用户更活跃,但这个数据还是给了我们信心,至少说明产品方向可能是对的。
特工少女:
像网易云、QQ 音乐这些平台有庞大的版权©️库和流量入口,如果它们也做 AI 音乐创作(比如“海绵🧽音乐”那类),那 Tunee 的核心壁垒会是什么?
龚天翼:
这个问题很有意思,也是我经常在思考、别人也常问的。先说个现状:
理论上这些音乐平台有歌、有用户,但为什么好的音乐模型几乎都不是它们做出来的?
(可能有,但没公开)
我觉得有几个关键原因:
1. 音乐平台的主要营收还是靠传统唱片公司的版权©️内容。
你有『周杰伦』那种大牌,大家就只能来你这儿听歌、开会员。如果平台大肆推广 AI 音乐,实际上是在培育一种可能替代传统音乐的新模式,这会威胁到合作方的利益。版权©️方对 AI 音乐上来就比较抵触,这是事实。
2.
他们要下决心 all in AI 音乐并不容易
,
平台要权衡太多既有利益、决策链长,所以在行动速度上通常不如一个轻量级的创业团队。我们没有太多包袱,能更快地试错、迭代,在 AI 时代速度非常关键。
3. 还有一点是用户习惯。
记忆不记忆不是核心,核心是情感连接这个事儿。举个例子,观猹员里有人评论说他们觉得 Tunee 很有“活人感”,那不是偶然,我们是刻意想通过构建这种“活人感”来建立更深层次的连接——不要让用户觉得 Tunee 只是个工具。我们设想的是把 Tunee 打造成能记住你音乐喜好、记住你们共同创作历史、记住你们的创作故事的伙伴。你用得越多,它就越懂你。一旦这种情感化链接建立起来,用户切换成本就会很高。
当然坦率讲,如果有一家大厂真正下定决心、全力投入(资源+意志),我们的护城河也不是不可穿透的。所以我们的策略就是:
在他们足够重视之前,跑得足够快,先把体验、社区、记忆连带等做深做厚。
特工少女:
挺有意思的,
之前我把 Tunee 当成一个音乐生成工具,但听你这么一说,感觉它更像是个擅长音乐的朋友了。
龚天翼:
对,这就是我们的想法。举个小细节,Tunee Logo 那个眼睛,会跟着鼠标移动,很可爱。既然不把它当工具,而是当伙伴,它就得有这个感觉。
我们在画布引入了 IP,用户会看到它动来动去,我们海外用户在 Discord 上说特别喜欢,给它做各种衣服,甚至希望通过创作让它“长大”——穿上衣服、变形象这些。还有个日本用户特别有意思,他写了一段系统提示词,把 Tunee 当角色来玩,要求它更严厉一点,那种角色扮演式的使用很有趣。既然用户愿意这样去使用、去建立情感,那为什么不把 Tunee 真正打造成每个人个性化的伙伴呢?
我们不只是记住你的偏好,而是希望记住你和 Tunee 共同创作的那些故事。比如你们第一次写歌的时间、那首歌背后的故事,有一天你还可以叫它“帮我们写一首关于我们的歌”。这时候
它就不再是个冷冰冰的工具,而是一个有共创记忆、有情感连接的伙伴。
特工少女:
现在给 Tunee 下一个定义的话,你会把她定义成什么?
龚天翼:
你的音乐伙伴
。
其实我们内部还讨论过一个挺有意思的 idea,和刚才说的情感化连接很相关:我们希望用户一进来就能感觉到,这里不是单纯的“音乐工具”,而是有一个“音乐伙伴”。
所以我们挺想把 Tunee 做成 IP 化的体验。比如你进来后像选宝可梦一样,可以挑一个你喜欢的形象或性格,还可以给她定义 MBTI、星座之类的属性,每个人都不一样;更重要的是,她会跟着你一起成长。你今天写了很多歌,未来这些作品在社区里获得反馈,Tunee 会和你一起吸收这些经验、不断进化。
最终的目标就是:
你会觉得一路上有个伙伴在陪着你创作,你们一起成长。
这就是我们想构建的独特体验。
特工少女:
你们认为,未来 AI 音乐和人类音乐人最大的分工边界会在哪?
龚天翼:
我觉得首先 AI 音乐肯定会改变音乐行业的结构。那些过去标准化、重复性高的基础制作工作,确实会被 AI 替代——这事已经在发生了。
但对真正有创意、有独特视角的音乐人来说,这是他们更好的时代,也会更有价值。因为当每个人都能随便做出一首还不错的歌时,那些能创造出震撼人心作品的人就会更稀缺、更珍贵。AI 把创作民主化,让普通人能表达,但它更多是满足基础表达需求;而人类音乐人应该去专注创造那些 AI 做不出来的、带有深度情感和独特体验的作品。
你看,AI 本身没有亲身经历,它没有那些强烈的人生体验——比如老师常说“多谈恋爱、多分手”能帮你写出好歌,因为恋爱、失恋是强烈的情感体验,AI 是没有的。它可以学习技巧、模仿风格,但要激起那种深刻共鸣,就很难完全由 AI 来替代。
所以我觉得未来的分工大概就是:
AI 负责大量的、技术层面的创作与工具化生产,帮更多人表达;人类音乐人聚焦于审美、情感深度和那些 AI 永远难以复制的独特表达。
以下问题均来自于观猹上的 Tunee 真实用户反馈与疑问:
特工少女:
Tunee 为什么选择画布式的内容展示?
龚天翼:
这个问题很多人问过我,包括我在小红书上收到的私信,还有在观猹员平台上的提问。
我觉得画布式的设计能让创作过程变得更直观,你能看到完整的创作路径。
列表式的缺点是它只管理了时间线上的所有作品,但在一个 Project 里,画布能展现和当前创作主题相关的所有作品,以及它们之间的关联。
目前上线的画布功能是个“残血版”,所以有些人会觉得作用不大。接下来我们会在画布里加入用户上传的音频、视频、MV 等更多元素,它会变成一个真正的 MAP。这样你能轻易看到:今天这首歌词、这个需求生成了什么作品,作品又带来了哪些衍生。它体现的就是我们“对话式创作”的理念 ——
创作不是一次性的,而是一个持续的对话过程。
就像我最近玩 Nano Banana,一直反复修改,觉得特别上头。
特工少女:
用户反馈
歌词部分有时咬字不清晰,尤其是中文,甚至会混杂粤语 / 国语。团队接下来会怎么解决多语言演唱的准确性?
龚天翼:
核心是数据标注的精细度问题。目前很多中文歌曲在数据集中可能只是简单标注为'中文',没有进一步区分是粤语还是国语,甚至可能存在一些标注错误。这导致模型在学习时把它们混在一起处理,生成时就容易出现语言混杂。
我们正在重新梳理和标注中文数据集,把粤语、国语、以及其他方言都精确区分开,这样模型就能学到更准确的语言-音乐对应关系。
特工少女:
有些用户很喜欢 Smart Mastering 的效果,但希望在编曲层面更灵活,比如支持分段修改,或者开放专家模式。这方面有计划吗?
龚天翼:
会有的,但这是个阶段性的问题。我们现在的优先级是降低门槛,让普通人快速创作出脑海中的音乐,所以偏专业的调整功能暂时会靠后。
其实如果用过 Templor 就知道,我们早就有分段调整、修改风格和乐器的能力,只是暂时没有放到 Tunee 上。后续我们计划逐步提升上限,在自然语言交互降低门槛的基础上,再逐渐开放更专业的能力。
特工少女:
未来会不会打造专属 Tunee 的社区?
龚天翼:
我们接下来一定会做社区,因为现在能看到大家有很强的分享欲。音乐创作这件事很神奇,有的人愿意把作品发出来给别人看,但也有人不想让身边的人知道,更希望在网上找到一个合适的地方去分享和交流。所以 Tunee 会提供这样一个空间。
但它和网易云那种听歌平台还是不一样。听歌这种行为肯定会存在,但我觉得不会是主流。毕竟这个世界上从来不缺好的歌,缺的是交流与创作氛围。Tunee 社区更像是一个创作者社区,每个创作者都希望自己的作品被看到,也希望能和别人交流技巧与想法。
当然,如果未来平台上有大量的创作者不断产出好的音乐,那听歌这件事也会自然而然发生,也会吸引更多人来这里听歌。但在此之前,我们更看重的是让更多人参与到创作中来。
一些有趣的小故事
特工少女:
能不能先聊聊咱们的团队?比如大家的年龄、背景,还有一些有意思的故事?
龚天翼:
我们团队整体挺年轻的,我 93 年的算是最大的。产品和设计这边很多是 00 后,最年轻的马上是 03 年的。研发同学年龄会稍大一点,但整体氛围还是很年轻、很有活力。
有不少伙伴其实并不是典型的'『互联网』产品人',而是从音乐背景转过来的。比如我们有个产品同学,本科在中传,硕士在 NYU,学的是“音乐技术”,音乐制作、后期制作都很熟练,但几乎没有产品经验,第一次聊的时候我就决定要她,因为我觉得技能是可以培养的,但对音乐的热爱很难培养。她是真的喜欢音乐,
这种眼里有光的人,是我们一直想招的
。
我们还有一些挺传奇的经历。比如之前一个模型同学,港大的博士,原来在阿里做算法,后来 gap 了两年跑到杭州的爵士酒馆,天天弹吉他、演出。他经济条件不错,还买了不少『英伟达』的股票,来我们团队不是为了钱,而是真的喜欢音乐,他总是喜欢中午抱着电吉他弹~
还有 Boki,本科学计算机但不爱写代码,大学时自学电子乐,靠接点小活维持生活。非科班音乐人日子一般都挺难,但他就是坚持。后来加入我们,早期在唱鸭主要负责弹唱内容。再到后来 AI 音乐刚起步,他的工作变成了人工去打磨 Demo,提升模型效果。等到我们做大模型后,他又转型去定义音乐审美——比如你说要 K-pop,他就要规定什么是“好的 K-pop”,什么风格要多一些,什么要干掉。现在我们都叫他“音乐总监”。最近因为太忙,他甚至用 Cursor 写了两个小应用,写得还挺好,成了妥妥的斜杠青年。
我们自己平时也用 Tunee 创作,甚至写了一首「Tunee 之歌」,超级洗脑。整体来说,
大家是真的因为喜欢音乐才走到一起,也愿意 all in AI,所以团队氛围特别纯粹。
特工少女:
从唱鸭到天谱乐,再到 Tunee,整个的过程是怎样的?
龚天翼:
这个过程其实挺曲折的。最早是 18、19 年的时候,短视频刚火,我们判断短音乐可能也会火,就做了唱鸭的“弹唱”功能——不会乐器也能自弹自唱。本来项目都快关了,等五一准备解散,结果这个功能一上线直接起飞,DAU 从几万冲到近 200 万、月活超 1000 万,真·绝地翻盘。也因此我们定下了那句一直坚持到现在的 Slogan:
“人人都能玩点音乐。”
这期间也踩过坑。比如我们把简化版 DAW 编曲搬到手机上,工程巨大
,但门槛太高,普通人不买单。反过来,“让普通人更简单地玩,还能玩出好效果”的东西,社会价值和产品结果都更好。所以我们一直坚持“人人都能玩”。你看现在很多生成类产品越做越复杂,教程、卖课满天飞;但像 Nano Banana 这种之所以能火,就是降低门槛、上手轻松。
Tunee 要做的,也是持续把创作门槛降下来。
再后来我们发现一个趋势:『抖音』特别火,而『抖音』和版权©️公司会收很多歌,一首歌 2000~5000 元不等。我们当时就想,如果能做出很多流行歌,卖歌也能养活团队。可问题是,那时候还没有大模型,ChatGPT 也没火,我们只能用符号域方案,把“作词—编曲—人声合成—母带”拆开再拼成一首歌,有点类似洛天依那种合成音的感觉。虽然粗糙,但在当时算国内最早一批做 AI 音乐的团队。
很快我们注意到海外有人开始端到端用大模型做音乐,比如
Suno
。一开始他们在人声清晰度、音乐性等方面确实不如我们,我们也有点轻敌。但半年后他们的收敛速度和迭代速度非常快,我们意识到必须转向。于是 2023 年底我们走上了Transformer 路线,做自己的音乐模型。第一个版本现在看挺粗糙,但在当时能“唱出像样的旋律”已经不容易了。
接下来是应用场景的选择。一开始专业音乐人看不上 AI,说做出来的都是垃圾。但视频博主很兴奋,因为他们需要免版税的 BGM,否则 YouTube 的一检测,视频就被下架。这个痛点特别刚需,所以我们做了 Templor ,核心定位就是给内容创作者提供免版税音乐。为了避免版权©️纠纷,我们还接入了专业的版权©️检测公司,每首歌先检测再放出来,用户就不用担心版权©️问题,这套流程在当时几乎没人做,Templor 因此在海外拿到了不错的口碑和一批稳定用户。
至于天谱乐和 Templor 的时间顺序:严格说,天谱乐(国内)比 Templor(海外)早一点点。当时模型出来要找地方展示,我们先做了国内的品牌和 WEB 端
;“Templor”这个发音也和“天谱乐”有关联。只是后来国内版本迭代较少。我们计划在10 月做一次国内与海外品牌的统一升级,同时更新到最新模型版本,效果会比现在好很多。
最后再说一句理念层面的小结:
从唱鸭的“弹唱”,到 Templor 的“免版税 BGM”,再到今天 Tunee 的“你的音乐伙伴”,路线在变、技术在变,但“人人都能玩点音乐”这件事我们没变。
我们更愿意把门槛一直往下压,让普通人也能用音乐表达自己;专业人群也可以把我们当作一个快速探索的工具。
只要大家能更轻松地创作、更开心地分享,方向就对了。
特工少女
:Tunee 最近在观察员和社群里的反馈都挺热烈的,咱们怎么看这些反馈?
龚天翼
:
其实这个产品严格来说才刚刚上线三周,算是“双引号的上线”,真正进入内测也就是最近一个月。上线之后在观猹中获得了不少反馈,尤其是你们猹友们的评论和建议,给了我们很大信心。我们自己还建了一个内测社群,虽然大家都知道社群很耗精力和人力,但我们整个团队,包括我自己,都每天泡在里面,和用户打成一片,聊很多。
我们之前的产品也都有不错的用户基础,但Tunee这次的反响确实超出了预期,整个团队都特别兴奋,大家对每个细节的打磨都更加投入了。
再说到为什么这次国内和国外我们是一起做的,其实背后有几个很重要的原因:
第一点,海外用户的反应还不错,比如经常有用户在X上分享自己的作品,还有很多YouTuber自发做视频反馈。但由于平台和文化差异,海外用户的反馈方式往往更偏向于分享成果和整体感受。而国内用户,特别是在观猹和微信社群里,更习惯提供具体的功能建议和问题反馈,这种详细的反馈对我们快速迭代很有帮助。当然,两种反馈都很宝贵,只是类型不同。
第二点,如果离用户太远,就容易慢慢脱节。
你会发现自己最后只盯着那些冷冰冰的数字增长,而忽略了背后都是一个个活生生的人。哪怕 Discord 社区很活跃,但跟微信相比,那种实时、直接的交流还是差很多。所以我们觉得,既然想做一个长期的产品,那就必须真正和用户待在一起,听到他们的声音,感受到他们遇到的问题。
第三点,我个人也觉得特别重要的,就是
国内的影响力反过来对团队本身有很大帮助
。
比如你在国内做出一些影响力,能更容易吸引到好的人才。就拿我来说,我最近经常在小红书发内容,结果招到了一些挺不错的人才。有些人面试聊着聊着,突然说“上次你写的那个东西我看过”,才发现是粉丝。这会让大家对团队更有信任感,甚至有些顶尖的人才就是因为认同我们产品和理念,直接从在职状态被我聊过来。就像谈恋爱一样,好男人好女人都不太流通,好的人才也是这样,你必须靠真正的认可和吸引力。
特工少女
:那可以说咱们是在用户反馈中成长的么?
龚天翼
:对的,我们也一直强调跟用户共创。比如我们把更新日志从“What’s new”改成了“Tunee 有话说”,
每次更新都会写清楚是谁提的建议,并感谢他们
,还会送奖励。真的不是随便写的,很多功能就是用户提了,我们觉得有道理,就立刻加进来了。
我个人的心态也经历了转变。
5 月底的时候,我特别急,觉得一定要做 Agent,一定要做,而且要抢在前面,做全球第一个 Music Agent。
当时还在迭代 Templor 的一个大版本,大家都很累,但我还是觉得要抓住机会,哪怕硬着头皮也要上。那时候的想法特别简单:觉得这是个巨大的流量口子,一定会爆。
可后来慢慢地,尤其是因为我开始自己做社媒,和用户直接打交道,心态变了。我发现现在很多产品营销太重了,甚至吹得没边,反而缺少真诚。我在小红书上就公开说过:我不会花很多钱去搞那种虚假的营销,也不会去买通稿,更不会搞什么假自来水。
所以现在,
我已经不再执着是不是“全球第一个”,也不会过分纠结是不是一定要火。
我反而变得更佛系一些。我更在意的是能不能持续把产品做好,把音乐生成的能力、用户理解这些基础环节打磨到位。虽然这些是最基础的,但其实也是最难的。我们团队现在花了大量的时间和精力在这些地方。
我觉得,一个产品真正重要的不是靠一波流量爆发,而是能不能持续地让团队保持热情,让用户持续愿意留下来。
只要有一批人愿意长期使用、真心喜欢我们的产品,那我们就踏踏实实把它做成一个长期的事情,这就够了。
这是我个人最真实的想法。