创始人徐卓(前 Snap 工程师)。SMB 友好定价,多语言对口型真的能用——把 CEO 翻译成 30 种语言、嘴形对上。分发是 X 上著名的病毒 demo 循环。
HeyGen $100M ARR,Captions $11M,Submagic 3 个人零融资 $4M。单人能切到哪里?
如果说 AI Eval 是这张地图里最企业级的品类,营销 / 数字人就是现金流最猛的品类。HeyGen 2025 年底跑到 ~$100M ARR,Benchmark 给它打了 $500M-1B 估值。Synthesia 在 $1B+ 估值上做到 ~$70M ARR。Captions(iPhone 优先的创作者 app)做到 $11M ARR。但真正有意思的是长尾——Submagic,"短视频自动加花式字幕"这一个单点功能,3 人团队、零 VC、法国创始人住巴厘岛,做到了 ~$4M ARR 纯利。Pictory、Opus Clip、Descript、Eleven Labs 都坐在 $20-100M ARR 这一档,靠 $30-300/月的 prosumer 定价跑五年期变现。2026 这波热点是数字人代言规模化(一个创始人、一张脸、一个 persona,一个月 200 条视频)以及给 5000 万在 TikTok / Reels / Shorts 上卖货的人做的短视频工具。带审美 + 死磕一个渠道的单兵,18 个月能跑到 $300K-2M ARR。不能做的是:又一个 text-to-image,又一个图片放大。
创始人徐卓(前 Snap 工程师)。SMB 友好定价,多语言对口型真的能用——把 CEO 翻译成 30 种语言、嘴形对上。分发是 X 上著名的病毒 demo 循环。
Fortune 500 培训视频的默认选项。UCL 实验室出来的(Niessner / Cohen / Theobalt 团队)。企业销售 + 全套合规套件。通过 Workday、SAP、Coursera 集成守住 ACV。
iPhone 优先的创作者 app。创始人 Gaurav Misra(前 Snap 产品)。切口是给 TikTok 创作者做自动字幕 + AI 眼神矫正。靠 Submagic 同款"水印传播"在创作者圈病毒式安装。
创始人 David Zitoun,巴黎人现住巴厘岛。单一功能:短视频动效字幕。分发:免费试用 + TikTok 上看得见的 Submagic 字幕风格。干净的独立打法——没 AE、没 SDR、没 A 轮。
创始人 Zhao Young(前字节)。切口是把长 YouTube 自动剪成爆款短视频。所有播客和长视频创作者的对手。靠创作者联盟分销。
这张表上其他工具都在跑它的语音 API。波兰创始人 Piotr Dabkowski / Mati Staniszewski。靠 API 质量、语音库、平台合作(Spotify、Audible 有声书)守住。
给 SMB 内容营销人做文字转视频。不像 HeyGen 那么病毒,但安静盈利。VC 宠儿烧钱的时候,它在闷声做生意。
字处理器式的视频剪辑。创始人 Andrew Mason(前 Groupon)。播客圈的标配。现在向 AI 数字人扩,在创作者 + 中型 B2B 上和 HeyGen 撞。
这个赛道的护城河就是分发。如果你在 TikTok / X / YouTube / IG 已经有 5K-50K 真粉、有人回你私信,Synthesia 要花 $10M 才能买到的东西你已经有了。这条赛道靠"有听众的操盘手"赢。
房产短视频今天是 Canva → ChatGPT → ElevenLabs → 剪映 → Descript。把这 5 个拼成一个产品、$200/月卖给房产中介——横向工具不会做。挑一个垂直,把它整条 stack 吞掉。
Submagic、Captions、Opus Clip 都靠视觉审美赢。如果你的参考是真实创作者产品(每天用、知道哪种字幕"烧屏"),你能和 C 轮团队竞争。如果你的参考是"做个 AI 版 Adobe",不行。
Midjourney、Ideogram、Flux、Recraft、OpenAI 的 image API、Meta AI、Google 的 image gen 现在全免费或接近免费。文字转图比赛已彻底打完。如果你的卖点是"我们 Stable Diffusion 调得更好",停。
如果 Sora 2 免费上线那天你的产品就消失,你不是在做公司,你是在做功能。护城河是工作流 + 品牌 + 分发,不是单点生成质量。
剪映是字节的、免费、8 亿用户。Adobe AI 收入过 $2.5 亿、还在每个产品里加。和 $5B+ R&D 的巨头正面打——这不是独立开发者赢的方式。
单人操盘手 + 轻量工程协助
有创作者粉丝的单人创始人
有创作者网络的操盘手