分享

鏖战!国产数据库

Viviany 发表于 2022-9-28 17:28:47 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 274
本帖最后由 Viviany 于 2022-9-28 17:30 编辑

盐碱地起风
2016年,前“码农”王玟刚入投资行业,就错过了一个200倍回报的投资机会。

那时坐到他眼前的这个男人已经遭遇过无数次拒绝。按照一些初创公司的标准,这个团队背景确实一般——在人均清北复交的技术圈,两个创始人分别毕业于长江大学和东北大学;履历一般——没有做数据库的经验;产品也还只处于小样阶段。但他说自己要做OLTP数据库——这个赛道上有雄霸全球三十余年的Oracle(甲骨文)。最终,王玟也给了他一个No。后来王玟又见过这个项目很多次,这家公司的FA每次办路演都会拉上三位创始人,这种待遇通常属于“那些卖不出去的项目”。

六年后的秋天,这个项目以180亿元的估值完成了它的新一轮融资。据36氪获悉的信息,此轮融资时其收入水平在亿元左右,也就是说PS(市销率)达到了惊人的180倍。反观同属企服领域的应用SaaS,2021年的明星项目也不过是30倍PS。“这种项目算倍数已经没有意义了。”一位投资人向36氪感叹。

但投资人们甘之如饴。站在它背后的是红杉、GGV、五源、GIC、明势等一线美元基金,路演中再也见不到创始人的身影。一位投资人对36氪表示,为了挤进一点份额,顶级机构争相为创始团队介绍国内“比柳传志还大佬的大佬”、海外科技巨头“非常关键的人物”。甚至有入局的投资人表示,候选机构要先把能提供的资源列个清单,再准备至少3000万美金,才上得了谈判桌。

这家把冷板凳坐热的公司叫PingCAP,一家分布式关系型数据库公司。2021年7月,PingCAP完成D轮后的新一轮融资,至此红杉、明势、GIC尽数入局,GGV、BAI、云启和五源等也完成多轮追投。这在二十余年的中国数据库发展史中是罕见的——在PingCAP之外,还没有任何一家新型数据库公司走到如此后期的同时,集齐了如此多的头部基金。

在很长一段时间里,数据库并不是投资人们热衷的方向。这种对数据进行存储、修改和分析的软件,由于艰涩难懂、且缺乏二级市场标的,素来被视作创投盐碱地。一位2014年开始关注软件的FA回忆,愿意在这里花时间的投资人“两只手就数得过来,还不是专职看”,这“甚至不算个话题”。

然而,PingCAP的明星效应迅速发酵。就在它宣布D轮融资的2020年,一场数据库投资热紧跟其后。

36氪根据天眼查数据统计,过去两年间得到融资的国产数据库公司超过37家,仅2021年获得新一轮融资的企业就多达20家,这也是国产数据库诞生以来一级市场最活跃的一年。数据库投资热潮还呈现出极化的头部特征:红杉、高瓴、腾讯在过往分别都至少投资了3家,经纬、云启、明势等关注科技的机构甚至更多,留给二线机构的寥寥无几。

几乎每家主流机构都设置了关注数据库的人员。有科技FA告诉36氪,一些“成名已久、不怎么露面的大佬”,会在第一次约见创业者时就亲自出面,并推动IC(投资决策委员会)花时间研究数据库所在的infra领域。短短7、8个月,数据库赛道已拥挤不堪。

过去两年,缺乏投资主题早已是一级市场的长期话题。而以数据库为代表的infra投资,却是其中少有的蓝海。在国内投资全面强调硬核的语境下,数据库已经成了机构科技转向的标识之一。“甚至你即使不看,也不能说出口。”一位科技FA告诉36氪。



下一个PingCAP
2020年农历春节前的倒数第三个工作日,一家在infra领域深耕多年的投资机构终于把紧赶慢赶出来的TS交到了一位数据库创业者手上,但创始人还是犹豫:“想等等另一家top级的美元基金。”

这家机构的一把手何禾坐不住了。这家公司虽然还只是天使轮,吸引的却都是主流基金,如果后者叫出翻倍估值,他们会变得非常被动。他立即放下手中的工作,“我自己过去一趟”。而那家“top级”基金的一把手一听说何禾已经在路上,也随即打车,要创始人一定等他面谈。

最终,那位一把手没打到车,何禾率先踏进了门。当着他的面,创始人给那位投资人去了电话:“不用过来了。”何禾最终拿下了这家分析型数据库公司,该公司在一年内已经完成了三轮融资。

争夺被凝练到一趟滴滴的时间,足可见数据库投资的血雨腥风。何禾告诉36氪,花2周时间“扒”被投的代码一直是数据库投资人的基本操作,但如今许多新杀入这个战场的机构在开枪前“连客户访谈都可以不做”。他相熟的一位资深投资人在过去一年中只投出了一个数据库项目:“像他这种真正懂的人还要去验证下代码,反倒吃亏了,完全被pass。”

对投资人而言,此时不仅是时间战,也是价格战。一位PingCAP早期投资人告诉36氪,他在2021年初投资的数据库项目,在短短半年内估值暴涨了8倍。事实上,他给出种子轮2500万美金的估值已经算相当看好,但下一轮公司直接报价投前1亿美金。结果在红杉、高瓴、源码的争抢中,腾讯直接翻倍,2亿美金一锤定音。此时据他签完上一轮的SPA,才过了两周。

在软件项目中,1.5亿美元估值通常是公司发展到中期才可能达到的水平,但在2021年,这已经是许多数据库明星项目的起点。

据36氪了解,仅仅是从阿里离职的数据库创业者中,就有三位以接近1.5亿美金的价格进行融资。去年,一家国际数据库公司的亚太区负责人确认离职创业。接近他的信源告诉36氪,这是另一家互联网巨头反复争取的成果,并在团队尚未组完时就给出了接近10亿元的估值,因为觉得“只有一个CEO做不成事,多出些钱给他招人”。

在基金如此的热情下,大厂IT部门的高潜人才们悄然掀起了一股创业潮。上述已经喊出估值的项目仅仅是水上的信息,还有PingCAP的早期投资人告诉36氪,有意创业的大厂人中,仅仅是阿里的高P人员他就接触过十个;而投资人们整个夏天集体“趴”在杭州挖创业者,在业内早就是公开的秘密。

“大家都怕错过下一个PingCAP。”一位近年投进PingCAP的投资人向36氪感叹。他所在的基金此前较多集中于早期,为了投进PingCAP特地成立了一支专项基金。

投资人与其说是追逐PingCAP,不如说在瞄准下一个Oracle,因为时代正在呼唤新一代数据库巨头。以中国为例,随着直播、游戏、线上支付、闪电贷等场景井喷,“互联网+”的浪潮在各行业催生出庞大的数据库迭代需求。至澄资本合伙人王暄表述,由于Oracle诞生于30多年前,许多设计渐渐显得不合时宜。更重要的是,这种底层设计几乎无法迭代,“所有的数据库归根结底都是数学,如果你想对它的框架进行修改,就要从最底层修改,就像要动一棵树的根。”

如果有机会切走Oracle等大巨头的市场,数据库市场其实是非常令人垂涎的。指数资本董事总经理韦炜告诉36氪,数据库是整个基础软件领域最有机会做大的领域:它是刚性需求、所有系统必备的组件,也是业务层最可感的——连社区团购的团长都能感受到产品好不好用;自带产品黏性——用户一旦使用就不会轻易更迭技术栈;产品通用性强——意味着低边际成本和全球化市场;强技术壁垒——通常意味着更高的市场集中度。尤其是Oracle所做的OLTP产品,是客户最重视的主数据库,银行、电信巨头过往一年花在这上面的钱就在十亿元量级。“以终为始地看,如果有一家能成,那么它一定是一家伟大的公司。”韦炜说。

PingCAP看起来最像能成的那一家。六年前它被嫌弃的“不自量力”如今成了最大优势:在关系型数据库的赛道里,它用新技术解决了不少过去的问题。云岫资本董事总经理宋旭文分析道:“PingCAP非常早就主攻OLTP这种主赛道,当时国内很少有创业公司这么选择;而且分布式的技术路径也确实解决了新的问题。这就是为什么它能有这么高的估值。”

不仅国内有PingCAP,全球都在掀起一股数据库迭代潮。2020年9月,云数仓公司Snowflake在纽交所上市,当日市值即达700亿美元,这个数字相当于Oracle近20年的市值成绩,而此时Snowflake才成立了8年。

即使云数仓和数据库在产品上有不小的差别,但不妨碍Snowflake成为中国的数据库市场的完美对标。有科技FA告诉36氪,当时接到的软件项目许多要求他们将自己包装成“中国的Snowflake”。这确实也是投资人们的追求,有美元基金投资人告诉36氪,他们的目标“大的是下一个Oracle,小的是下一个Snowflake。”



金手指
但现实可能是,想找到下一个PingCAP,步履维艰。

投资圈的一个共识是,PingCAP之所以能从OLTP这种盐碱地里跑出,“很大程度上是吃了开源的红利”。因此2020年前者一炮而红后,开源被解读为PingCAP的“成功真经”。

开源,即开发者开放源代码,允许用户在社区中一起修改代码、共创产品。PingCAP的数据库产品TiDB就是这样被共创而成。PingCAP创始人刘奇曾在2020年接受36氪采访时提到,TiDB最初只有一些构思,连产品“毛胚”都是跟社区里的专家级爱好者联合打磨;之所以能快速搭建模块,也跟社区运营得好、贡献者多分不开。“我们真正高速跑起来不过两年。”刘奇表示,是开源社区帮助了他们厚积薄发。同时,开源也是PingCAP获得第一批客户的核心渠道。由于早期开源爱好者往往就职于互联网公司,PingCAP最早打开了广大互联网公司的市场。

精准触达客户,是不少科技创业公司突围大厂垄断的第一步,因为只有客户的反馈才能帮助产品快速迭代。这也是许多资深投资人看重开源的核心原因——用社区最低成本地撬动用户、获得即时反馈,本质上是个go to market的方式。韦炜表示:“开源带来的代码贡献是一个结果,这背后的核心逻辑是,开源的模式让“产品力”成为用户的核心考量,一旦用户开始使用,提出的反馈就会帮助产品改进。”

因此,开源也成了一级市场寻找下一个PingCAP的金手指。一位关注科技领域五年的FA告诉36氪:“如果你不谈开源,似乎就很难进入主流创投语境。”而在此之前,非IT背景的他“从未听说过这个词”。

能被当作金手指,也因为“开源”是PingCAP所有特质中最容易被理解的。先免费,再用社区运营做漏斗转化,最终用增值服务盈利。这条神似TMT的发展路径对机构里的IC(投资决策委员会)来说清晰又熟悉,他们可以用互联网的思路来理解数据库项目。一位曾供职于大厂IT岗的投资人发现,许多同行会“像当年互联网看DAU一样看GitHub上的星星数”,一些美元基金的投资人“连数据库是操作型还是决策型都分不清楚”,就比照着星星数在投资。

然而,PingCAP最初不被看好的原因之一也是开源。王玟告诉36氪,国内开源公司想从免费走到收费是非常难的,“今天开源,明天就有人把你的框架改改拿去卖了,不像闭源的公司,一开始就向客户收费。”即使在国外,被狂热追捧的Snowflake也是闭源公司,HashiCorp、MongoDB等开源上市公司市值不过百亿美金左右,是Snowflake巅峰的十分之一。

但只看开源并不牢靠。早期投中PingCAP的云启资本合伙人陈昱曾在采访中提到,开源项目投资的最根本方法“还是得直接看代码”——如果是早期,项目不会有太多star数;如果是B、C轮,star数作为一种公开指标“总会有人去刷数据”。而他之所以能在早期选中PingCAP,是因为PingCAP所基于的谷歌的Spanner论文,第三作者就是陈昱在谷歌做工程师时期的同事,所以对分布式存储很了解,直接去看了PingCAP的代码。

对star数的迷信已经造成了荒诞的偏差。何禾亲眼目睹过一些中间件走红,原因竟然是——“这个(产品)的星星涨得真快,比当年的PingCAP还猛!”但其实,中间件和PingCAP所做的数据库,根本是完全不同的产品。他无奈地告诉36氪,这些产品之所以star多是因为产品简单,不像数据库一样有很高的客户试用门槛;但这种创造不了价值的小工具,后期是很难拉动客户付费的。

同时,谁能真正做成开源公司,对投资人来说也是雾里看花的问题。韦炜认为,这个问题值得被非常细致地拆解:“Star数能不能真正映射这个产品在社区中实际影响力和商业潜力?中国真正意义上有过开源公司运营经验的创始人是少的,更多的人是作为社区主导者的角色。但当作为CEO时,如何最有效率的兼顾社区繁荣和公司发展?怎么定义资源分配的权重?以及如何带领公司扩展海外影响力?”这都将成为开源公司面临的关键问题。

或许我们该回到故事的一开始,PingCAP真是遵循着某个单一标准而投中的吗?一位PingCAP后期投资人告诉36氪,其早期股东有些将其误解成了应用SaaS软件,到了2020年估值涨到15亿美金时,有部分早期股东卖出了不少老股,“很多人觉得15亿已经超乎认知了,赚得足够了。”因此每当听说有机构复盘对PingCAP投资思路,他都觉得有点好笑:“这挺难复盘的。当年靠啥投中的?几个不那么光鲜亮丽的人,干一个他看不懂的事儿。”

无论有多少根金手指,数据库这种底层软件对投资人的技术要求都是一样高。陈昱2014年进入云启时投了一个图数据库项目,跟同行探讨这种将数据关系构建为图形的管理方式时,对方问他:“图数据库,是拿来存图片的吗?”他向36氪感叹道:“如果你不是学计算机出身、没修过离散数学,怎么会懂?”

一位看了4年数据库的投资人依然不敢说自己非常“懂”。今年有家被投公司的CEO送了他一本日历,每页一个数据库语句,他翻到二、三十页,后面的几乎全看不懂。“技术方面,别说投资人,不在这行的真正做过多年的创业者都没几个完全能懂的。很多人之前做的都是外围插件、用户交互,真正做过数据库内核的屈指可数。”



鏖战
经过两年的高估值争抢,数据库的许多赛道狩猎基本完毕,没入局的要么不看好,要么不再有机会。

一位投资了PingCAP的美元基金合伙人告诉36氪,无论是明星项目还是水下优质创业者,都在被一线基金围绕,小基金“见都见不到”,只能在巨头掠食过的市场里退而求其次。这些二线项目要么赛道规模有限,要么融到的钱不够请一流人才,一开始就已经掉队。去年有早期基金投资了一家对标PingCAP的公司,用一千万人民币占股10%。相比之下,大基金往往单笔就投出几千万美金。

不过,即使投中了PingCAP这样的明星项目,大基金们面临的鏖战却依然漫长。

在这个复杂的科技赛道上,接下来的路怎么走,谁都没有确定的答案。投资人们争论不同类型数据库的未来:图数据库被质疑商业落地鸡肋,时序数据库常被怀疑落地场景太少,一些技术路线更新的数据库会被指责”只是噱头”;而在确定性强的大赛道上,PingCAP在持续迭代产品的同时,仍需在销售上证明自己挑战诸多竞品的能力;另外,关于开源是否能商业化的争论从未停止。

种种质疑声中,让开源数据库”出海”,被许多人视为打破天花板的解药。而这个众多大基金付出高溢价的关键一笔,也是困难重重。

陈昱告诉36氪,之所以数据库能出海,是因为关系型等产品由于底层语言的通用性而自带全球化基因——全世界的数据库程序员都能看得懂SQL语句。使用习惯全球统一,产品也就能标准化地出海到对To B产品付费习惯更好的海外。

因此,美元基金们倾向选择那些一开始就剑指出海的项目。在不少美元基金对开源的执着里,有一层就指向全球化的想象力——他们希望公司通过开源打造出全球程序员都喜欢用的产品,从而打开海外市场。

欧美的确是付费习惯最好、最肥沃的市场,但也是黄皮肤难以吃得开的地方。一位美元基金投资人告诉36氪,他投资的一个数据库在欧美签单时,会遇到“以年为时间单位的拖延”:“说白了,黄种的面貌、中国的背景,你需要把产品做到90分,才能跟欧美本土六七十分的产品竞争。”

这也是PingCAP们需要面对的现实。资本付出高溢价的意思很明显——想抓到出海成功的那一个。而PingCAP还有很多课要补。其在美国的强大竞品CockroachDB,两者业务非常相似,后者的创始团队是Google前员工,有接近PingCAP的投资人告诉36氪,二者曾在一些客户上产生过“较为激烈的竞争”。

即使在看似最信奉产品力的欧美,中国产品头上依然有一块透明天花板。这种情况下,有美元基金甚至会这样设计数据库的出海路:在国内磨炼产品、去欧美拿下标杆客户建立声名,最终在付费能力强一点、竞争对手少一点的日韩做变现。

这条路的曲折是显而易见的——如果真能收割欧美,谁还愿意收割日韩?一些人民币基金投资人也对此表达了极大的不理解,其中一人听完这个路径哑然失笑道:“如果一个公司要这么曲折才能赚钱,那它可能不算个好标的。”

投中PingCAP难、PingCAP式公司想做成也难。因此也有人选择鏖战外的第二条道路。

一个公认的事实是,国产数据库的市场可以被分成三类:海外商业市场、国内商业市场、和国内公务机关市场。第一类是美元基金的目标,第三类是人民币基金的天下,两者在第二类市场中有所交叉。在第三块市场里,人民币基金们的玩法既不艰难也不曲折——找到一家背景“清白”、资质齐全、能摸清国内大客户需求的公司,主攻国产替代市场,踏踏实实做变现,几年后登陆A股市场,退出。

这种选择看起来远不像美元基金的玩法这么“有理想”,但在云岫资本董事总经理宋旭文看来,两者并没有谁高谁低。征战全球的愿景虽然性感,但不确定性未免太强,何况这本身也不是这类公司的初心:“就像你不能要求一个人既内向又外向,也不能要求公司在同一时间把钱既投进研发又投入销售,这是比较本质的基因差别。”

许多人民币基金主动放弃了这样的big dream。一家腰部人民币基金的投资总监告诉36氪,他在2020年就放弃过一家后来走红的数据库公司,但不是因为不看好技术创新,而是“创始人对国内的商业化几乎毫无了解。”他所在的基金认为技术和商业化同样重要,甚至有些时候后者比前者重要得多。如今在他们积极布局的国产替代市场,infra的其他领域已经出现了估值超过PingCAP的标的。

美元基金中,即使是陈昱这样的极客型投资人也不是没有彷徨过。他曾经pitch过一个上述投资人喜欢的项目——主打Oracle一体机替代,基本没有太多技术创新,也谈不上产品想象力。但陈昱的确心动过:“一个亿收入,三个亿估值,真的不贵”。徘徊半年后,他最终放弃了那个项目。“就是看你要不要坚持理想”。

在庞大的基础软件领域,投资人们会持续面对这样的分野。一片树林里分出两条路,你要走哪一条?

文中王玟、何禾、孟浩为化名。感谢北极光创投、至澄资本、3E资本刘明伟、晨山资本吴文超、跃为资本王哲&王辰的支持。感谢天眼查的数据支持。


本文来自36氪,本文观点不代表信创中国立场,若有侵权请联系删除。

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则