对话Denodo创始人叶苏斯:AI降低数据管理使用门槛 数据编织应用迎“黄金期”

2024年03月28日 05:00   21世纪经济报道   杨坪

以生成式AI为代表的人工智能新技术,正引领全球新一轮生产力革命,对企业数据管理及数据价值开发的质量与效率提出新的挑战。

21世纪经济报道记者注意到,数据编织(Data Fabric)作为解决数据质量难题、释放生成式AI潜力的重要技术趋势,正受到越来越多企业的关注。

所谓数据编织,是一种分布式数据管理架构,集成来自不同数据源的数据,安全提供不同数据对象的“集成视图”,将“集成数据”用于分析和操作。数据编织相关技术的应用能提供值得信赖的数据基础,提高生成模型的相关性和准确性,成为解决企业AI部署难题的重要路径。

去年7月,阿里云曾宣布与数据管理领域的领导者Denodo达成技术合作,后者以逻辑数据集成和管理能力而闻名。

近日,Denodo(Angel Viña)创始人叶苏斯与21世纪经济报道记者展开对话,探讨了AI浪潮下中国企业数字化转型的数据管理新范式。

叶苏斯认为,传统数据管理方式产生的数据孤岛,会导致寻找业务的时间过长,从而导致实现价值的时间也会更长;同时,混合多元的数据生态,导致了数据资产不能够得到充分利用,数据治理异常复杂。

“逻辑数据管理作为新的管理方式,可以打破数据孤岛,让用户轻松获得访问的权限,同时通过简化和格式转换提高数据的时效性,帮助用户提高决策效率,建立更加突出的竞争优势。”叶苏斯说道,同时,生成式AI降低了数据管理的使用门槛,大大拓展了数据编织的应用规模。生成式AI与数据编织互利共进,正为数据管理市场带来更大的发展机遇。

叶苏斯。资料图

挖掘数据生产力

《21世纪》:Denodo数据编辑的核心优势是什么?有哪些实际应用空间?

叶苏斯:首先我们既注重客户的信息保护,从不一样的语义层对信息进行处理和保护,涉及的领域很多,包括航空、交通运输、医药等各个对信息需求巨大的行业,通过技术使数据可以更加透明,并且正确传输给客户。

以医药行业为例,医药公司在进行药物的生产、商品化、零售运营的过程中,会用到大量数据,比如说赛诺菲(Sanofi),需要海量的数据支持各个流程监管,以及后期处理等环节。后续生产的产品要进入到医院端,还得去病床前做各种临床数据验证,不同的阶段比如临床应用的这些治疗有没有应答等。在这个过程中,首先要获取各种健康相关的数据,然后在每一个垂类中,针对不同行业面临同样的难点、痛点,获得高质量并且不违规、不会涉及隐私侵犯的数据。

再如IT相关领域,我们可以支持数据迁移、相关数据的合规使用、建模过程等。我们还有这些数据的提取过程、抽象过程,这个过程能够符合公司数据现代化、架构现代化需求。同时我们还有一些关键用例,支持用户体验提升,因为收集了海量的终端客户数据之后,我们可以在客户体验管理上做得更好、更上一层楼。我们还有一些后勤运输提高的案例,因为数据(量)提高之后,我们在运营安排上可以进行实时调整等。

在风险管理方面,我们也做得很棒,在数据提取的过程中,你得确保它是合规的,数据的交换也得符合当地法律法规要求。

还有一点就是我们创造额外价值,也叫数据民主,就是数据要开放给新的用户,大家是平等的,这些数据你可以用你所需要的格式去提取。而当前很多情况中,当消费者和用户使用数据时,他们无法在IT层看到这些数据。

《21世纪》:数据编织如何保障数据安全?

叶苏斯:Denodo平台提供的是能力、工具,不是一个负责实施或者是做数据安全的企业,客户会用我们提供的能力,但他们得为自己的安全负责,举个例子,如果说数据市场是一个机场,我们就属于给它提供传送带或者其他类型产品的厂家,这个传送带怎么安装,装在哪里,是机场负责的;旅客的行李当中是否有危险品、违禁品,也是由机场负责检查,我们提供的只是一个传送带而已。

再看数据编织,数据编织有非常多的优秀能力可以提供给顾客,让它在应用之后提高安全水平。有些客户对安全性要求较高,我们会基于这方面的需求,提供更好的管理工具,比如帮助他们找到更可靠的数据或资源。

总的来说,我们作为信息传送带,任务是通过语言处理、信息构架等,在合法合规的框架下去传输信息,并且传输更快的信息给到客户。

《21世纪》:数据编织效果如何衡量?你们的企业用户会关心哪些指标?

叶苏斯:我们认为最关键、最核心的问题就是如何将数据更好传输给我们的客户,特别是将数据中心的各个环节进行连接。很多公司有大量的核心数据,如何获取并连接这些数据非常关键。对于我们来讲,信息数据中心要做的事情就是要统一进行升级,将获取和连接的过程简化,高效率地将核心数据传递到客户当中。

在当前的时代,客户更关注的是时效性和成本问题,这也是数据编织能够完成的目标——将所有有用的信息编织到一块,以一个合规、安全的方式提供给我们的客户。

因为不同的客户,使用的技术不一样,格式不一样,最终所呈现出来的效果也是不一样的。对于生产制造业企业来说,他们希望以不同的形式去革新他们的产品,以便从各个维度满足他们客户的需求。我们会结合他们过往的分析报告,帮助他们进行数据分析,去找到他们的客户最感兴趣的点,帮助他们满足客户的需求。

数据编织应用处于“黄金期”

《21世纪》:人工智能对于数据编织应用市场会带来何种影响?

叶苏斯:无AI不数据,AI在学习训练的过程中需要大量的数据。当前市场上有各种各样的大模型,大模型需要有上下文、需要结构数据帮助其构建各种场景、了解各种业务和功能,而Denodo在这个过程中是非常好的桥梁。

Denodo能够做的是,我们拥抱人工智能基础设施,将AI与我们Denodo的功能性进行了结合。当然我们现在还处在发展过程中,部分技术还没有特别成熟,但AI作为很好的赋能机制,我们有些客户已经在尝试将AI与Denodo进行结合,实现应用,在这过程中相关机制会不断完善。

《21世纪》:当前生成式AI面临算力不足等问题,这是否会影响到数据编织的运用?当前数据编织应用到了爆发式的“黄金时间”了吗?

叶苏斯:现在,我们所拥有的信息,需要传输的信息,远远比平台获取的信息更大。比如在中国,有一些生产领域,企业已经有了一些积累,在后续不断发展壮大的过程中,需要专注于不同客户的需求,进行更针对性的持续突破,还要将这些成功的案例、成功的模式去移植到其他国家,把生意做到全球化,我想这个过程都需要数据,需要真实的数据。

因为在全球的模式之下,不同国家、地区的数据是完全不一样的,供应链也完全不一样,所以我们必须要去进行优化、革新,将数据放进信息池当中。

在这样的愿景之下,我们完全有理由相信,我们处于一个黄金时期,特别是对于信息管理来说,信息的体量非常大,我们会看到不一样的信息,不一样的功能影响我们所从事的行业和生意,其中就包括客户信息、供应链信息和技术信息等。

刚刚我们也提到了我们在系统中用了语义层的方式进行信息监管、筛选和更新,类似的语义语境下的大模型,会涉及很多信息的传输和更新,并且还得针对不一样的客户群体进行实时信息传输。信息大爆炸给数据编织带来发展黄金期。

《21世纪》:当前数字化转型正在成为发展新质生产力的重要抓手,在推进数字化转型方面,你认为现阶段广大企业的信息技术架构还存在哪些痛点?

叶苏斯:数据加速业务成长意味着能够让数据的转化和传输都更加高效,关键就是把数据部署在业务所需要的维度,就是需要什么数据就给他导出什么数据,只有这样才能够哺育后期的创新。当然数字转型是一个很大的词,我们关注的数字转型的含义,是如何跟我们产生联系。

对于我们来说,可能就是把更好的数据开放给终端用户,提升用户体验,特别是在进行用户交互和供应商沟通时,我们希望在数据处理的过程中更加有性价比,通过低成本、降本增效,让更多设备终端体验更好,你可以理解为供应链优化或者是能力提升,以便我们在数据源利用、数据源转化上,提供给客户,可以辅助用于明智决策的数据。

在目前的过程中,我们确实通过数据代理终端获取了更多的数据,每一个公司都会用到一定的数据化或者数字化方式,帮助我们构建数字底座,同时支持公司的多个数据系统。

关注我们