在新冠疫情期间出现的数据目录和数据治理公司Atlan在本周公布的最新C轮融资中获得1.05亿美元,该公司的估值达到7.5亿美元。联合创始人Prukalpa Sankar表示,坚持不懈地追踪元数据,同时与更广泛的数据生态系统合作是核心秘诀。
Atlan开发了数据目录和数据治理工具,使组织能够了解拥有什么数据、数据位于哪里、谁可以访问这些数据、他们可以用这些数据做什么,以及这些数据是否符合质量标准。该公司采用了一种元数据驱动的方法,在组织的“数据堆栈”之上建立了一个控制面板,该控制面板可以方便的融入各种岗位(包括数据分析师、数据科学家和业务人员)使用的日常工具(PowerBI、Slack等)中。
早在2020年,该公司就被高德纳(Gartner)评为数据运营领域的“酷供应商”。2022年,在弗雷斯特(Forrester)的2022年数据运营企业数据目录中,该公司的得分超过了所有更大的竞争对手。对于这家位于加州旧金山的公司来说,这似乎是一夜之间的成功。但实际上,如果没有大量的试验和错误,Atlan永远不会有今天的成就,Sankar说。
Atlan的起源可以追溯到SocialCops,这是Sankar和她的同事Varun Banka在2012年共同创立的印度“社会公益数据”组织。虽然SocialCops取得了许多引人注目的成功,例如开发了印度总理使用的大数据平台,但该组织在管理数据方面却举步维艰。
它试图开发自己的工具,但无济于事。也尝试过购买数据目录和数据治理工具来处理数据,但都没有成功。Sankar和Banka坚持了下来,最终找到了可行的方法。“第四次,我们成功了,”她说。
她说:“我们的方法最大的不同之处在于激活元数据,并把它带回到人们工作的方式中。”
传统的方法是让每组用户选择他们自己的工具。因此,数据科学家选择他们自己的数据目录,业务人员使用其他工具进行数据治理,分析师则使用另一种工具进行数据管理。这行不通。
她说:“这导致了工具的激增,从根本上说,所有这些人在工作方式上都有自己的DNA。这就导致了我们所说的组织内部的混乱。”
随着不同的数据管理工具的激增,回答一些基本问题变得越来越困难,比如“这个数字到底是什么意思?”由于需要将许多人使用的无数工具拼凑在一起,试图追踪仪表板上出现的数字的血统几乎是不可能的。
她说:“我们认为自己是位于数据堆栈顶部的协作控制平面,为整个堆栈构建了一个统一的生态系统。”“我们在元数据控制面板上投入了大量资金。我们的设计基本上是开放的,在整个生态系统的自动化谱系上投入了大量资金。”
在SocialCops使用该工具完成了大约200个数据项目后,Sankar和Banka决定将该工具独立出来,成立自己的公司。
如今,该公司拥有各种数据工具的连接器,包括数据仓库、数据湖、数据库、BI工具、ETL和ELT工具、数据编排工具、数据质量工具、消息总线。企业用户可以用Atlan扫描他们的环境,软件会检测到哪些系统到位,并相应地配置。
Sankar说:“我们有一个客户,他在整个生态系统中拥有1亿资产,我们自动将其连接起来。我们把它称为代码治理,我们只是嵌入到他们使用自己的工具进行工作的方式中。”
在过去的几年里,Atlan的势头已经大大增强,自2022年以来,其收入增长了7倍。该公司拥有许多垂直行业的顶级公司,包括Autodesk、思科、纳斯达克、联合利华和Zoominfo等公司。
Meritech Capital联合创始人Rob Ward在一份新闻稿中表示:“Atlan正在为现代数据治理设定一个新标准,尤其是对那些奉行云优先数据战略的企业而言。”“它越来越被视为人工智能准备和数据民主化等重大业务计划的基本数据控制平台。数据社区对Atlan的热情是非凡的,让人想起最具变革性的公司。”
虽然Atlan主要专注于管理结构化数据,但在过去的18个月里,它对其产品进行了调整,使其能够管理某些类型的非结构化数据,它还管理人工智能模型。
Atlan正在帮助客户使用GenAI模型执行数据治理策略。一个客户有多个聊天机器人用于不同的用例,比如人力资源或销售,并且需要确保聊天机器人没有违反数据访问策略。
“客户的数据资产,可能从领英购买数据。但有相关的条款和条件。比如工资数据,人力资源聊天机器人可以使用它,而其他的聊天机器人绝对不会用它。那么现在需要考虑应该使用什么,连接到数据资产,连接到哪个AI模型正在使用它,或者哪个LLM正在使用。
随着企业加大对人工智能的投资,他们发现自己的数据还没有为人工智能做好准备。这为Atlan提供了一个机会,它热衷于帮助他们整理自己的数据。
Sankar说:“这个生态系统在不断发展,我们的客户正处于这个新世界的最前沿。人工智能可能将是企业内部最优先考虑的事情,那么我们需要认真思考如何让它们影响未来。”