“奇点云,客户的数据云。”
2022年5月20日的StartDT Day发布会上,奇点云公开了全新品牌主张。
奇点云是一家独立第三方的数据中台服务商,无论从营收、估值、产品、客户复购率哪个维度来看,都称得上业内大型企业。而现在,它更希望被称为数据云科技服务商。
从数据中台到数据云,从“是技术更是业务概念”到“数据技术的集大成者”,当奇点云迎来创立六年的首次品牌升级,“新”在何处?谁又构成了变化背后的驱动力?
“从技术到业务”
创始人的基因决定了这家企业天生适合做什么。
回溯创始人行在履历,在创立奇点云之前,他创建了原阿里云“数加”(现阿里数据中台DataWorks),拥有ID-Mapping、数据交换等20多项大数据方面专利;曾建立阿里第一个数据仓库,也是阿里巴巴第一任数据安全小组组长;时间再回滚到2004年入职阿里前,他是中国第一代DBA,在一家大型集团的计算机部,从ERP编写的入门者成长为数据仓库搭建和管理的主导者。
“大数据”,或更具体地说“数据技术”,是行在数十年来的兴趣和特长,也烙在了其团队的基因里。
而2016年创业时,这个技术老兵决定向前多走一步:往行业去,离业务更近一点。
很大程度上,这个决定来自阿里“数加”时期行在的切身体会。他常举“鸡同鸭讲”、“大炮打蚊子”的例子,前者,是你跟客户讲技术,客户跟你讲业务;后者,则是你的平台功能大而全,而客户想解决的问题很具体、很细节。
最本质的,阿里内部的数据能力和对数据的理解与需求,无法代表商业世界里的千万家企业。
站在客户的视角,2017-2019年,互联网大厂之外的中台成功案例也并不多见。
“我部门的数据,为什么要打通到中台?”“IT取数费时,应该自己去提效,和业务有什么关系?”“凭什么说这几百万花得值?”企业在权衡上数据中台这个庞然大物的利弊时,观望是合情合理的选择。
还得回到业务价值。
“这符合经济学上的一个定律,‘先有需求,后有供给’,而后再谈‘供给创造新的需求’。”奇点云首席战略官、阿里首个大数据业务架构师才言谈到,“企业需要知道业务可以数字化,知道业务提升的瓶颈,感受到痛,然后知道他需要什么数据来解决问题时,数据对他而言才会开始发挥价值。”
因此,奇点云彼时的任务是拉近客户与数据价值的距离,不仅要能存下数据、清洗数据,还要用数据创造业务价值——看到业务问题的背后是数据问题,“痛”起来。
“不可技术自嗨,敬畏行业,做出价值”成为了行在对奇点云所有员工的要求。进一步,奇点云广纳各领域的行业专家,其重点KPI就是深耕行业,聚焦行业场景和业务需要,带团队沉淀行业模型,练就贴合客户需求的产品。
与奇点云合作2年后,国内一家鞋服企业的CIO这样评价:“奇点云喜欢‘收藏’有行业Know-how的老专家,和我们聊得来,能抓重点,同时满足业务条线和技术条线的需求。”
奇点云合伙人追风回忆,“鞋服时尚,商超百购,商业地产,数字政府…这个发展路线让我们在每个行业都收获了许多客户。”数据产品在实践中成长。2020年,除了数据中台产品DataSimba,消费者运营平台DataNuza等具有鲜明行业特征的产品也逐步得到了客户认可。
时至2020年冬,这家独立第三方的数据中台服务商经历了疫情时期“绝地求生”,逆势拿下了亮眼的成绩:连续3个季度盈利,数据中台项目100%成功,2019客户首年留存金额达近200%,累计为近50%的泛零售业头部客户提供数智化转型服务,并在制造、运营商、金融等行业取得突破,也证明了行在这个技术老兵的“行业探险”是正确的选择。
行在介绍,一家国内女鞋的领军企业依托奇点云的数据中台和消费者运营平台,构建了全域会员标签体系,实现会员数字化精细运营闭环,仅2个月时间,票券营销触达转化就从1%提升至6%-8%。一家国际知名的羽绒服企业,在库存一体化基础上,奇点云与其共创沉淀出商渠匹配、销量预测、库存一体化、产销协同等业务模型,打通商品智能管理全链路,实现调补货100%自动化,拉补效率提升了60%,库存售罄率提升了10%,首铺准确率提升了79%。
相比解读奇点云的年终成绩单,行在谈起这些数字时,显得更有成就感:“技术只有通过赋能商业才能实现价值。数据中台本身就不是一个单纯的技术工具,而是一个业务概念,是要给客户创造业务价值的。”
“从上云到云上”
“海量数据重塑商业”,这个论断早在2012年就被阿里巴巴的实践验证。而对于更广阔的商业社会和绝大多数商业主体来说,直至2020年以后,数据的意义才不再成为需要反复论证的事情。
行在介绍,尤其是2020下半年开始,客户提出“数据中台能为我带来多少GMV”相关问题的比例有所降低,而转变为更技术、更底层的讨论,例如“怎样减少数据开发的重复劳动”、“数据实时性能不能提高”,以及“如何建设数据团队”。
“这就像不仅挖到了一处油藏,建了个小型的化工厂,而且发现,这下面还有非常壮观的特大油田。”一家传统服装企业的数据中台项目二期启动会上,客户的信息总监这样对行在说。
企业对数据价值的判定,从业务价值的单一维度,拓展到了技术价值乃至组织价值。其背后,是数据作为重要的生产要素之一,开始进入部分企业,并影响其商业模型。
而特大油田的开发和原油加工,并没有那么容易。才言谈到:“把数据作为生产要素,是有成本的,而且一定程度上成本高昂,跟以往大家认识的‘数据几乎零成本复制’完全不同。”
企业数据量的指数级增长,必然伴随存算成本高涨,同时,存算框架越来越复杂,异构数据运维成本越来越高。存还是不存?存到什么程度?未来才有用的数据,现在的存储成本能不能低一些?还需要招多少运维工程师才能应对?…数据技术的成本与效率问题直观地摆在企业面前,亟待专业服务商解决。
在客户需求的另一边,也在2020年,数据基础设施发展迎来“云原生落地”新阶段。
Gartner认为,云数仓(Cloud DataWarehouse)充分利用云的特性,让企业不仅仅能免除采购、维护昂贵基础设施的过程,更具有“按需采购按使用付费”、“支持数据分享的安全能力”、“作为服务交付”等特征。
相比把数仓搬到云上,具备云原生特性的云数仓能实现近乎无限的可扩容性和升级空间,但同时又降低了存算成本和运维成本,并降低数据管理和数据使用的难度。最早于2010年前后诞生的云数仓,经过持续技术进化,于2020年开始得到广泛应用,Snowflake在当年度完成史上规模最大的软件IPO,就是标志性事件之一。
同时,“多云”也成为了趋势。IDG的2020云计算调研报告(2020 Cloud Computing Survey)显示,当组织利用多个公共云时,49%的受访者提到的主要目标是利用“最好的平台和服务选项”,其次“节省成本/优化成本”占41%。如果仅放大企业目标,“避免供应商锁定”是第二目标,占比达40%。
在客户需求与技术演进的双轮驱动下,2020年起奇点云开始投入云原生数据中台的研发,并自当年9月起陆续开启容器化编排、CI/CD、微服务体系、存算分离等功能的内测;10月,“多workspace(工作空间)”在奇点云核心产品DataSimba上完成了第一个版本,为真正实现跨云多域打下基础。半年后,DataSimba3.0版正式以“跨平台、云原生、自主可控的数据中台”的形态面世,支持海内外9大主流云厂商的云原生,并可横跨多云,统一账号、权限、审计的多workspace的兼容管理。
没有客户认可,不允许上发布会。听起来有些刁难,而这正是奇点云内部对新产品发布的要求。2021年5月20日的StartDT Day数据技术大会上,奇点云对DataSimba3.0做了公开发布,行在颇有底气地说:“这个版本的迭代,源自我们选择和客户站在一起。”
2021年5月 StartDT Day现场
“到云上去”的战略让奇点云自然而然加入了“云数仓”的战局,开始接受资本市场“中国版Snowflake”的审视,同时,也为其赢得了更多客户青睐。
据奇点云统计,自2021年5月发布以来的一年时间,在DataSimba上开设的workspace数增长了33倍。一家产品全球下载量超10亿、出海业务占大头的互联网企业表示,奇点云“跨云多域”的能力解决了困扰他们8年的问题,现在可以使用统一的权限和账号体系来管理部署在全球的多个云平台数据,云原生特性也助其存储成本降低至原来的1/3以下。
这让行在坚定了一件事:数据技术,更进一步。数据之于客户,已从“价值认知”走向“切身体会”,奇点云只有继续啃下数据技术的更多硬骨头,才能帮助客户真正“掌握数据能力”,构建客户自己的数据生产力。
“从数据中台到数据云”
2021年11月,秋季发布会前夕,行在反复审视奇点云的数据产品矩阵。
在最核心的平台层(DataSimba)之下,是以“CDH国产替代”为目标、兼容信创体系的数据存算引擎DataKun;平台层之上,则是得益于广泛的客户实践和“老专家”引领,孵化出的行业应用和工具产品,包括消费者运营平台DataNuza、数据可视化开发平台DataMaleon、企业数据门户DataHubble、数据智能产品套件等。其中,国内许多知名的泛零售企业都因为DataNuza具备业内CDP罕见的数据驱动能力,而选择奇点云。
奇点云C1轮融资的领投方、泰康资产股权投委会评价:“在目前独立第三方数据智能厂商中,这个由‘平台+应用’构成的矩阵,确实是业内公认完成度与实用度最高的。”
而泰康的投资人代表也曾问过行在一个问题:“认同你们的深耕行业,理解你们的‘端到端’,但需要你回答我,你们的边界在哪里?”
或许还是那句话,创始人的基因决定了这家企业天生适合做什么。
行在划定了奇点云的边界,“数据云”。
放眼国际,随着公有云日益占据市场主导地位,海外各大厂商都推出了云数仓、云数据平台等产品,并进而用“数据云”统称。时至2021,数据云已成为海外数据界炙手可热的概念。
Snowflake认为,数据云消除了数据孤岛,支持企业无缝地统一、分析、共享数据,甚至将数据货币化。进一步,数据云最终是一个由数千家企业和组织组成的生态系统,企业不仅连接自己的数据,还通过共享和消费,将数据、数据服务连接起来。
Google则认为,利用 Google Cloud 构建数据云是一种统一、开放的数据驱动型的转型方法,内建 AI 能力,在速度、规模和安全性方面拥有无与伦比的优势。此外,Google 会为希望构建数据云的各种规模的企业提供数据和软件。
Cloudera介绍,企业数据云提供企业级安全和治理、多功能数据分析和弹性的云计算体验,保证无孤岛,无锁定;混合数据云则注重为企业在混合云和多云环境中提供服务。
《数据云趋势报告(2022)》表明,各大厂商尽管有其各自不同的产品描述,但统一、开放、中立、安全是他们对数据云“不约而同”的定义。而在行在看来,数据云并不是新一轮的buzzword,它与上一代大数据平台有显著不同,其背后是更深的数据技术与架构升级。
2021年的秋季发布会上,行在首次公开表达了对数据云的理解:“要不断降低客户使用数据的门槛,像使用云计算资源一样简单方便。我们包装复杂的数据技术,客户自己就可以简便地把数据用起来。”“十年前,我们必须要用专业的视频剪辑软件来处理视频,现在人人都可以用手机上的APP快速剪出vlog。‘数据普惠化’,也是类似的道理。”
2021年11月 StartDT Day现场
除了封装复杂技术、化繁为简,行在还作了一个朴素的比喻,来解释“云”之所在:客户数据可以在他们的数据云里自由流动,实现“业务—数据”的循环驱动,就像自然界的水循环。
而今年,奇点云“数据云”的版图在产品层面变得愈加简明清晰。
5月20日的StartDT Day上,奇点云发布数据云产品矩阵StartDT Data Cloud,分为三层:
资源层,坚持独立第三方定位,支持客户对底层资源掌握选择权;
基础层,数据存算引擎DataKun帮助客户实现自主可控,技术上不被卡脖子,数据安全引擎DataBlack则做到全链路智能安全,这是数据要素发挥价值的基本保障;
平台层,也就是DataSimba,封装复杂技术,消解多云多引擎带来的管理复杂、运维成本高、资源效率低等问题,降低客户使用数据的门槛,实现体验统一、简单易用。
StartDT产品矩阵“数据云+分析云”
总结来说,跨平台、云原生、自主可控、数据安全构成了奇点云数据云的技术核心;而从建设目标上看,奇点云的数据云力求成为企业数据要素的价值引擎,构建企业内部的数据生态,让客户数据要素的生产、流动更简单,更高效。
同样,哪怕是行在本人提出的“数据云”,上奇点云的发布会之前也需要满足“有真实需求、有客户认可”这个硬性条件。据悉,今年4月,数据云底层的数据安全引擎帮助一家车企客户成功拦截了违规行为——这名企业员工持有权限,但在凌晨试图批量下载订单数据,引发智能告警。一家老牌的大型快消企业则依托数据云完成了集团统一数据资产建设,通过分离数据所有权和使用权,避免对子公司数据资产所有权及业务正常开展产生影响,并与奇点云共创,开始构建集团内部第一个数据共享机制。当然,以往通过开源组件自建数仓的低时效等性能问题也得到改变,按需升级为实时的秒级计算,为数据生产加工提效。
以前常有客户问起“为什么叫奇点云”,“卖云资源的吗”,“‘云’有什么寓意”,行在笑称,伴随这场发布,现在终于可以公开答案。
数据作为生产要素,终局是进入市场,以数据交换乃至交易激发价值,找到增长新奇点。
2020年,中共中央、国务院《关于构建更加完善的要素市场化配置体制机制的意见》第一次把数据提到生产要素的高度上来,提出“加快培育数据要素市场”,并进一步明确要加强数据资源整合和安全保护。同年5月,国务院《政府工作报告》中提出“培育技术和数据市场,激活各类要素潜能”。
距离数据要素市场真正培育完成,或许还有数年时间。在此之前,企业不妨先试水内部数据交换。而为迎战“终局”的到来,奇点云的数据云也正在做准备。