报告编委
报告指导人
黄勇 爱分析 首席分析师
报告执笔人
洪逸群 爱分析 分析师
莫业林 爱分析 分析师
目录
1. 研究范围定义
2. 全场景地图
3. 场景定义与厂商解读
4. 入选厂商列表
1.研究范围定义
研究范围
数据智能,是指以数据为生产要素,通过融合数据处理、数据分析与挖掘、数据可视化、机器学习等大数据和人工智能技术,实现数据驱动的智能分析与决策。
爱分析将数据智能划分为平台层和应用层。其中,平台层是指支撑企业实现数据智能应用的通用基础设施,包括大数据平台、商业智能平台、机器学习平台等;应用层涵盖的是各垂直行业和业务场景的数据智能应用,如智能营销、智能风控、智能运营等。本报告的研究范围聚焦于数据智能的平台层。
根据企业进行数据管理的关键流程,结合爱分析对现阶段企业数据基础设施建设需求的调研,在本报告中,爱分析选取了数据存储与处理、数据治理、数据分析与可视化、图分析、机器学习模型开发、隐私计算、数据库管理等7个场景,进行重点研究。
本报告面向企业决策层以及数据部门、业务部门负责人,通过对各场景的需求定义和代表厂商的能力解读,为企业的数据智能平台建设规划与厂商选型提供参考。
厂商入选标准
本次入选报告的厂商需同时符合以下条件:
厂商的产品服务满足各应用场景定义的厂商能力要求;
厂商具备一定数量以上的客户服务案例(参考第3章各场景定义部分)。
2.全场景地图
爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在数据智能平台场景中具备成熟解决方案和落地能力的代表厂商,如下图所示。
(注:以下所有场景中的厂商均按音序排序)
3.场景定义与厂商解读
爱分析对数据智能平台各场景的定义如下。同时,针对参与了此次报告调研的部分代表厂商,爱分析撰写了厂商能力解读。
3.1. 数据存储与处理
终端用户:
数据部门
核心需求:
数据存储与处理包括了数据集成、存储、资源调度、建模、计算、查询等能力,是支撑数据应用的基座,代表了数据平台的基础能力。
随着数据来源越来越广,数据分散在企业不同业务系统、数据库中。企业需要将复杂的多源异构数据集成,让数据得到充分应用;同时,为了解决海量异构数据的存储问题,企业需要更加完备的数据存储方案存储多种类型和格式的数据,并考虑数据存储的可扩展性、可靠性等要求。
数据量的指数级增长,导致数据查询响应时间过长、交互体验差,与此同时,企业对数据处理的实时性要求也不断提高。企业因此需要通过资源优化、数据预计算等方式获得数据查询与分析的高性能。
传统数据处理大量依赖人工操作,费时费力;同时随着数据类型的增多,对开发人员的技术能力也提出更高要求,需要在数据处理中应用AI增强技术,以提高数据处理效率,并降低技术门槛。
随着云计算的逐渐普及,企业大量大量数据的产生、采集和应用都发生在云端,因此需要数据平台在架构和功能设计上考虑云的运行环境,从而能够利用云的弹性伸缩、敏捷性等方面的优势。
厂商能力要求:
厂商需要能够提供数据库、大数据平台、数据集成工具、数据开发工具等产品和解决方案之一,并具备以下相应能力:
能够支持多源异构数据的采集、并高效完成数据清洗、转换、加载等处理。
能够支持海量异构数据的存储,提供关系型数据库,以及HDFS、Hive、键值存储、文档数据库、图数据库、对象存储等多种存储系统,并保证数据的可扩展性、可靠性。
能够通过产品设计和技术优化,实现高性能、高并发地数据查询和数据分析。
能够在数据清洗、数据建模、数据分析等环节应用AI增强技术,提高数据处理效率,并提高数据平台产品的易用性,加快数据应用落地。
能够提供云原生架构的解决方案,满足企业在云端应用数据分析的需求,并充分利用云平台的优势。
代表厂商:
(入选标准:客户服务案例在5家及以上)
百分点科技
厂商介绍:
百分点科技成立于2009年,拥有全栈的大数据和人工智能技术产品,包括大数据操作系统(BD-OS)和标签管理系统等基础引擎产品,以及智能审校系统等应用产品,涉及数字城市、应急管理、公共安全、生态环境、媒体出版、零售快消等多个领域。
产品服务介绍:
百分点大数据操作系统(BD-OS)是一款以大数据技术栈为基础,提供异构数据的接入、融合处理和管理能力的一站式数据平台。其存储与处理部分包含数据集成、数据建模、数据处理等模块,通过可视化、拖拽式的交互方式,实现离线数据及实时数据快速融合处理,大幅提高数据开发效率并降低开发成本。
能力解读:
在数据处理方面,BD-OS是由百分点科技自研的数据集成引擎、调度系统引擎、数据融合引擎和任务提交的执行引擎作为支撑,在功能层面保证整个数据处理流程的完整性;在性能层面,实现高稳定性。如针对大任务量的情况,BD-OS调度系统引擎通过任务编排、执行和调度,可实现资源的统一调度和数据的统一管理。
BD-OS内置可视化ETL工具,可有效降低数据开发的门槛。BD-OS平台内置大量数据关联算法,基于这一平台,用户无需自己写脚本,通过拖拉拽等可视化形式即可进行数据读取、数据关联和数据输出等数据处理工作。
BD-OS具备良好的兼容性和适配性。BD-OS适配各种底层存储计算平台,包括HDP、CDH、华为FI以及MPP数据库Guass200、Greenplum等;同时,BD-OS广泛兼容信创生态,能够兼容多种国产化软硬件,覆盖芯片、整机、操作系统和数据库等。
典型客户:
深圳市应急管理局、丽江市人民政府、国家广播电视总局无线电台管理局
滴普科技
厂商介绍:
滴普科技成立于2018年,是领先的全场景数据智能服务商。滴普科技打造了DataFacts数据智能服务产品平台,FastData云原生多模实时数仓产品,和Deepexi DXP企业数字化场景落地产品体系,支撑企业从战略到技术落地,实现全维度的数字化转型。
产品服务介绍:
滴普科技的数据中台解决方案由FastData云原生多模实时数仓和DataFacts数据智能服务平台构成,具备数据集成、开发、建模、存储、计算、数据服务、数据分析等能力,以支撑上层全场景的数据智能应用。
能力解读:
滴普科技的数据集成工具DCT集数据迁移、数据订阅及数据实时同步等功能于一体,支持20多种多源异构数据的汇集,可以支持离线、实时的数据接入,支持以插件化、热插拔的方式对数据源进行扩充,降低数据建设成本。
滴普科技的FastData云原生多模实时数仓能够支持多种结构化与非结构化数据的存储与处理,并且通过底层的时序时空数据库、云原生实时数仓、实时计算处理和分析引擎等产品,支持实时的流式数据导入和实时的数据分析,满足企业对大规模数据处理的实时性要求;通过底层的云管控平台产品DBaaS实现数据库的备份、迁移、实例管理、监控、运维、链路分析等企业对数据库的可靠性、可维护性的要求。同时,FastData在架构上实现了存储和计算的全面分离,能够灵活伸缩,大幅度降低客户的使用成本。
滴普科技的数据开发套件DaaS简单易用且功能全面,覆盖了从开发、调试、发布到监控运维的全链路数据开发能力,并以可视化的流程图和自定义数据处理逻辑的方式来进行各种数据处理任务;同时,其内置ETL具备丰富的算子,将各种复杂的数据开发场景做了业务化抽象封装,使业务人员也能够胜任较复杂的数据开发工作。
滴普科技平台产品的云原生、云中立特性在充分利用云的弹性伸缩、敏捷性等方面的优势的同时,也兼容多种公有云平台,提供一致的使用体验,并给用户提供了安全可靠的云端使用环境。
典型客户:
佛山市顺德区政务服务数据管理局、远盟康健
客户案例:
佛山市顺德区政务服务数据管理局为了给各部门政务应用提供高质量政务数据资源,实现高效的智慧政务服务,需要梳理全区各委办局政务资源数据,并构建数据共享及服务体系。其面临的主要痛点是区内数据量庞大且复杂,涉及50多个区属部门20多亿条政务数据,数据资源目录3000余个,数据的集成、开发、存储、计算等存在较大挑战。
滴普科技依据相关政务数据处理标准,采用微服务架构、分布式云原生等技术,为顺德政数局搭建了从底层基础设施、大数据平台、应用支撑系统,到数据展示的全面解决方案。
解决方案落地后,顺德政数局完成了全区政务数据资源编目,梳理了3000余个数据资源目录;为全区政务大数据应用体系建设提供了科学、规范且可持续的数据资源服务和支撑;基于个人数据账户和企业数据账户模型,面向全区提供高质量可信赖的数据资源,使其具备从数据到应用的创新能力。
海致科技、海致星图
厂商介绍:
海致科技集团,专注数据智能技术创新,依托与清华大学共研的高性能图计算技术,为政府、企业级用户的数字化建设提供大数据分析、图计算、图数据库等产品和技术。
海致星图专注于提供企业级知识图谱产品和服务,深耕金融、能源互联网、工业互联网等垂直行业,自研的知识图谱、图数据库等产品和服务已覆盖金融领域全业务场景。
产品服务介绍:
海致科技的DMC大数据一站式建模分析平台,提供了从数据接入,到数据清洗、治理、建模、计算分析、数据服务、AI模型应用等数据全流程的管理和处理能力。
能力解读:
针对不同行业数据形态的差异,DMC平台支持上百种多源异构跨网数据的接入,包括各种数据库数据、实时数据、云端数据等。
DMC平台在架构上是Hadoop,底层计算引擎采用Spark,存储采用HDFS,也可以对接常见云平台如华为云、阿里云的存储。针对公安、金融等行业客户的业务场景特点,海致科技对Spark计算引擎做了源码级别的改造,实现了数据查询和分析的高性能,以及对数据的实时处理能力。此外,平台一键化的数据清洗能力也提高了数据计算的效率。
为了使业务人员能够自助构建多维图表实现业务洞察,DMC平台用SQL封装的模式运行数据处理逻辑,业务人员不用写SQL代码,只需拖拉拽即可自助进行数据建模。支撑DMC平台自助数据建模的包括了平台沉淀的数百个警务算子,以及一些适用各行业的通用基础算子。DMC平台也支持技术人员直接写SQL实现更复杂的数据建模。
为了实现数据到应用的闭环,快速实现业务价值,除了数百个警务业务算子,DMC平台也提供了大量行业模型、业务应用、机器学习算法、数据挖掘模型、知识图谱模型等,能够开箱即用。
典型客户:
广东省公安厅、武汉市公安局、上海市公安局
九章云极DataCanvas
厂商介绍:
九章云极成立于2013年,专注于自动化数据科学平台的持续开发与建设,提供自动化机器学习分析和实时计算能力,包括DataCanvas APS机器学习平台和DataCanvas RT实时决策中心等系列产品,着重为数据科学家、AI从业者提供一整套开发平台。
产品服务介绍:
DataCanvas RT是企业分布式流数据实时处理、分析和决策的中心,能够将多种数据流接入实时处理并分析,将ETL、业务模型、机器学习、人工智能、可视化扩展到实时数据分析。
能力解读:
DataCanvas RT实时决策中心稳定性和可用性良好,以开源架构作为支撑,保证了系统的高吞吐量。同时,DataCanvas RT具备流数据梳理能力,在数据采集与接入、数据存储与查询、数据分析与计算和数据服务全过程中,通过流作业的统一管理、调度等,确保即便在超大数据量、宕机等异常情况下,系统能够具备一致性和稳定性。
DataCanvas RT提供在线模型训练和模型预测能力。DataCanvas RT内置了机器学习模型训练模块,能够对针对应用系统反馈的实时数据进行在线训练,实时进行模型调整,及时反映线上变化,提高预测准确率。
DataCanvas RT服务了大量金融行业客户,将相关的业务知识沉淀于DataCanvas RT平台,打造了指标引擎、规则引擎和模型引擎等模块。基于可配置的能力设计,DataCanvas RT能够针对客户具体应用场景,调用平台中的指标库、规则库和模型库等组件,提供在线数据分析服务。
目前DataCanvas RT能够支撑的业务场景包括实时指标、实时授信、实时风控、实时监控和精准营销等。
典型客户:
山东城商行合作联盟、日照银行、五矿证券
客户案例:
该股份制银行此前经过多年IT建设,依托主流互联网大数据生态圈,引入开源社区软件框架,完成了大数据分析平台、数据湖的搭建,建立了体系化的批量数据分析能力。然而该银行依然面临多方面挑战。首先,批量式、准实时数据效率无法满足所有的业务场景,无法覆盖实时营销推荐、实时风控、反洗钱等业务领域;其次,传统数据交付方式复杂,无法满足快速变化的业务需求。
该银行客户与九章云极DataCanvas合作,基于DataCanvas RT实时决策中心,搭建了全行级大数据应用支撑平台。通过引入九章云极DataCanvas RT实时决策中心,该银行建立了全行实时数据处理服务能力。
同时通过建立秒级数据加工、服务能力,成功支撑手机银行足迹营销、营销管理、资金流向监控、大额资金变动、大额交易实时监控等近数十个实时场景。
Kyligence
厂商介绍:
Kyligence成立于2016年,由Apache Kylin创始团队创建,专注于打造下一代智能数据云平台,为企业提供自动化的数据服务和管理。基于机器学习和 AI 技术,Kyligence 从多云的数据存储中识别和管理最有价值数据,并提供高性能、高并发的数据服务以支撑各种数据分析与应用,同时不断降低 TCO。
产品服务介绍:
Kyligence的数据服务与管理平台,提供了基于统一语义层的数据治理、智能建模、数据计算、分析、数据服务等能力。其产品主要有本地部署的Kyligence Enterprise和云原生产品Kyligence Cloud,并且平台能够无缝对接各种数据源以及主流的BI工具。
能力解读:
Kyligence的产品可以帮助企业在数据存储和数据应用之间构建统一的语义层,并且能够应对海量数据与复杂业务场景的需求。同时,其语义层把数据表转换成了对业务用户更加友好的语义模型,便于业务人员快速获取口径一致的数据。
为了实现大规模数据查询和分析的高性能,Kyligence通过预计算技术,为用户预先构建好数据模型中的维度以及维度组合,因此可以在PB级以上数据规模达到亚秒级的查询性能,同时降低计算资源成本。
基于机器学习技术,Kyligence的AI增强引擎能够从SQL历史记录、分析师行为、数据采样及运行时的指标中自动发现和查找重要和关键的数据资产,并推荐对存储和计算的优化建议。同时,AI增强引擎也可以根据用户定义的业务指标,智能地推荐适用该指标的数据模型。这不仅加速了应用的落地,也降低了人工建模的成本,从而更好地支撑企业自助式分析的需求。
Kyligence的云原生版本产品Kyligence Cloud能够在各主流云平台快速部署,充分利用云的资源弹性伸缩、低成本和敏捷性的优势,简化和加速云上的数据分析。
典型客户:
太平洋保险、招商银行
客户案例:
某国有大行采用Kyligence的大数据解决方案建成了下一代云化数据仓库,解决了分析入口多、交互式查询性能不理想、难以随着业务规模弹性伸缩和交付周期长等诸多困难,目前已取得良好效果:1)统一的数据服务入口;2)每天数十万查询,90%以上的查询响应时间少于1秒;3)弹性伸缩,可调动数千个节点;4)应用交付最短只需2周。
某头部券商经多年的数据平台建设,逐渐沉淀了大量数据组件,不同组件特征给数据的管理和使用带来了极大的挑战。通过建设以Kyligence为核心的智能数据服务平台,接入各类数据源,完成了统一的管理,实现了:1)数据服务化:接入不同数据组件的10个数据源共1000余张数据表,提供API、SQL等数据服务;2)数据资产化:数据服务沉淀80余个模型资产,更加聚焦管理有价值数据;3)数据智能化:AI增强引擎智能优化,累计推荐10000余个聚合索引,提升数据分析体验。
明略科技
厂商介绍:
明略科技目前形成了数据中台和知识图谱平台两大产品体系,向包括公安、工业、政府、金融等行业客户提供大数据和人工智能产品和解决方案。
产品服务介绍:
明略科技的数据中台提供包括数据接入和数据开发等数据处理模块。数据接入方面,包括低代码和模板化配置以及可视化ETL等功能组件;数据开发工具则包括建模规划、数据建模、流程编排和工作流开发等。
能力解读:
明略科技的数据开发平台具备很好的协同性。具体来看,该平台通过构建不同职能、不同职级数据从业人员流水线式数据协作空间,使大数据开发过程流程化、组件化、可视化,从而做到协同有效,提高效率。对常规数仓建模、数据智能建模进行设计-开发-测试-上线的全生命周期管理。工作环境和上线环境隔离,实现持续开发,持续交付的一体化开发流程管理。
明略科技的数据中台具备云原生的支撑能力,能够与不同的厂商云体系适配,包括腾讯云、阿里云和亚马逊云等。基于明略科技的数据中台,采用了多个云产品的企业可实现不同云平台数据拉通。此外,云原生可支撑数据中台虚拟化。这对于大型的政府超脑项目客户具备重要意义:明略科技的数据中台使得不同层级的部门能够基于统一平台实现数据共享,而虚拟化则使得每个层级的政府部门保持独立及拥有完整的数据体系。
典型客户:
某城市超脑
同盾科技
厂商介绍:
同盾科技以人工智能、云计算、大数据三大核心技术体系为基础,基于对数据的探索洞察和理解,将机器学习、联邦学习、知识图谱等领先技术与业务场景融合,为金融、保险、互联网、政务、零售、物流等行业提供智能分析与决策服务。
产品服务介绍:
同盾科技的星河-大数据平台提供数据采集、数据开发和数据加工等数据处理模块。该平台支持SQL代码、Spark代码、PySpark代码进行查询和分析;代码可以进行周期性调度,调度的任务间通过指定依赖关系形成任务流,完成复杂的数据加工工作。
能力解读:
星河-大数据平台具备高可靠性。在该平台数据总量30PB,每天增量100TB的情况下,实时计算接口响应时间在200ms内。此外,星河-大数据平台计算引擎底层以Spark为主,在Spark开源基础上,补充升级Catalyst计算引擎的优化自主开发,能够快速实现对于PB级数据的高效处理。
星河大数据平台具备良好的兼容性和适配性。该平台可兼容客户已经建设的大数据集群,包括CDH、华为FI、星环TDH等,在原有平台的数据不需要迁移的情况下实现快速对接。
典型客户:
沪杭甬高速
元年科技
厂商介绍:
元年科技是一家具有丰富的财务管理、业务运营和行业经验的企业数字化转型软件商和服务商,提供技术中台、业务中台、数据中台的规划咨询、软件平台和实施运营服务,服务过上千家大型企业集团。
产品服务介绍:
元年科技的数据中台提供完整的从数据采集、数据存储、数据处理到数据服务以及平台运营的全流程解决方案,支持离线、实时处理以及人工智能算法模型的开发和应用。
能力解读:
元年科技的多维数据库基于IBM Cognos(于2016年从IBM收购)进行开发搭建,提供面向多维分析的较强性能。基于元年科技自身在财务领域积累的经验,该数据库能够实现基于业务逻辑进行建模,形成财务模型、风险模型、审计模型和内控模型,为企业的业务多维分析提供及时的数据服务。元年科技在金融、地产、制造、零售快消、能源化工、交通物流等行业有丰富的服务经验,积累了以财务为基础的业务理解能力,可以结合较完整的工具产品,在数据开发环节协助企业进行数据模型体系设计。
新数科技
厂商介绍:
ShinData新数科技成立于2014年,是一家数据库管理软件创新企业,产品体系包括dbPaaS数据库云管理平台、数据迁移传输、数据库安全管控以及分布式数据库等多种产品及解决方案。服务于金融、制造、能源、零售和通信等行业客户。
产品服务介绍:
新数科技基于成熟开源数据库核心,为用户提供涵盖分布式与集中式场景的整体数据库解决方案产品ShinDB。
能力解读:
ShinDB分布式数据库解决方案基于成熟开源数据库MySQL核心,结合数据库分库分表中间件(sharding)等技术,可将数据运算压力分布于不同节点,同时有效支持高可用和负载均衡功能。同时提供统一的SQL操作接口,以及管理、监控和运维变更系统,有效降低减少客户部署和使用开源分布式数据库的难度和周期,提升数据库管理质量和实施效率。
ShinDB集中式数据库解决方案是新数科技推出的一款以华为OpenGauss为内核的数据库解决方案,支持从数据库快速安装部署、指标全面监控、异常主动探测、一键健康巡检、标准运维变更、高可用自动切换到备份管理等一系列数据库相关核心功能,构建了完备、健全的集中式数据库管理系统及其统一管控闭环管理方案。
ShinDB容器云平台,基于云原生技术,提供了容器化运行环境下多种SQL/NoSQL数据库部署和管理服务,从而建立起数据库私有资源云体系。用户可以通过可视化管理系统,实现数据库的快速交付、资源管理和自动化批量化变更运维操作等。
典型客户:
民生银行
3.2. 数据治理
终端用户:
数据部门,业务部门
核心需求:
数据治理是指企业为实现数据资产价值最大化而开展的一系列持续工作过程。具体来看,数据治理包括数据质量管理、元数据管理、数据标准管理、主数据管理和数据资产管理等。在这一系列过程中,能够通过相关规范并结合工具应用,实现确保数据质量、数据标准和数据的一致性等目标。
随着数字化转型加快以及预测性分析等智能化应用的发展,企业需通过数据治理提升数据质量等,从而为上层数据的应用打好基础,更好地挖掘数据价值。当前企业对数据治理的需求正从以往监管要求驱动转向企业内需驱动,核心需求包括两个方面:
首先,数据治理工作包括数据质量管理、元数据管理、数据标准管理和主数据管理等,涉及的工作繁多而且复杂,企业普遍缺乏一套完善的数据治理机制,同时尚未设立专职负责数据治理,数据治理建设工作呈现零散、碎片化的状态。企业需要通过建立数据认责机制和设立数据治理专职等措施,完善数据治理机制,推进数据治理工作。
其次,大量数据治理工具类应用,包括元数据管理、数据质量管理和数据资产管理等工具等,主要是针对IT人员而设计,使用门槛高,业务人员难以使用。企业需要更适合业务人员使用的易用性较好的数据治理工具应用。
厂商能力要求:
厂商需要能够提供包括工具和咨询服务在内的整套数据治理解决方案。
在工具层面,厂商需要能够提供数据标准管理、数据质量管理和数据资产管理等关键模块产品。具体来看,在数据标准管理方面,厂商需能够配置特定行业规则模板,基于这些标准模板,推进数据治理工作;在数据质量管理方面,需能够具备数据检核与分析、数据质量报告输出、数据质量规则设定和数据认责管理等;在数据资产管理方面,需具备元数据管理和主数据管理等核心模块,除了元数据血缘分析和数据资产视图等基本功能外,还需要能够使用AI技术实现包括数据接入、资产目录分类等一系列数据管理活动的自动化。
在咨询服务方面,厂商需要具备丰富的服务经验。针对特定的行业,厂商应该具备业务梳理能力,基于自身在该行业的经验积累,帮助企业制定数据治理的战略规划,并在数据治理落地的过程中,通过培训和落地数据认责机制等方式,推进企业的数据治理工作。
代表厂商:
(入选标准:客户服务案例在5家及以上)
爱数
厂商介绍:
爱数成立于2006年,是一家大数据基础设施提供商,提供的服务涵盖结构化数据、非结构化数据、机器数据、知识图谱数据等全域数据的构建能力,主要应用于政府、企业、金融、教育、医疗等行业。
产品服务介绍:
爱数的非结构化数据中台解决方案基于其数据架构底座,融合了人工智能技术,能够对文档、图片等各类非结构化数据进行整合、治理、洞察,并形成数字资产,构建了文档管理体系、内容赋能体系、知识创新体系,应用于文档管理、内容赋能、知识创新等业务场景。产品包括了企业内容管理平台AnyShare,以及一站式知识网络平台AnyDATA 。
能力解读:
AnyShare平台采用创新的五层体系架构,即多文档域、内容数据湖、云原生架构、内容总线、全终端一致的用户体验。独创的多文档域模式能够支持每个文档域独立部署和管理,实现具有多网络,多子业务单位的大型集团将不同来源的数据独立管理和跨组织共享。
内容数据湖包括了对象存储池、元数据池、索引数据池三部分,能够为海量非结构化数据提供存储、编目、标签、摘要和检索能力;全集群与高性能即时分析架构能够为数据分析提升效率、节省时间。
文档管理体系能够对所有结果性文档统一管理,实现文档从创建到使用到归档销毁的全生命周期管理。在数字资产安全方面,能够建立数据级、访问级、信息级的立体安全机制,满足业务合规要求。
内容赋能体系基于内容总线架构,融和自身内容服务能力,集成OCR等大量第三方生态的技术及应用能力,将内容服务普及到业务系统和场景中,覆盖业务内容统一管理、业务流程自动化以及内容应用开发三大内容赋能场景。
知识创新体系基于内容平台+知识网络+知识中心,通过NLP、知识图谱、迁移学习等AI技术,为企业构建私域数据知识网络,结合企业知识战略,应用智能知识运营方案以及知识咨询服务,搭建完整的知识创新体系,从而赋能业务运营、创新及决策。
典型客户:
天津生态城、金诚同达律所、晶盛机电、筑森设计、金地集团
客户案例:
某国家级化工勘察设计单位,在采用传统文件管理系统进行工程项目文件管理中,随着文件持续积累,面临着以下挑战:1)在文档数据采集方面,文档数据采集量不足10%,系统速度慢,安全合规管理混乱;无法对接新业务系统;对非文档数据认识不足。2)在文档数据使用方面,文件检索效率低,缺少复杂搜索能力;缺少自动化的内容理解能力;
该企业采用了爱数非结构化数据中台AnyShare采集结果型文件、过程型文件以及关键业务系统数据,基于内容数据湖、内容集成开放框架等实现海量非结构化数据存储、智能内容搜索以及内容安全合规。
通过采用爱数的解决方案,该企业实现了:1)文件的跨系统调用时间缩短至原来的十分之一;2)将数字TB图纸、报告、说明等非结构化数据统一管理,实现文档全生命周期的保护,满足了合规性要求;3)实现了全平台搜索能力和在线预览服务;4)促进了知识积累、留存和复用。
百分点科技
厂商介绍:
百分点科技成立于2009年,拥有全栈的大数据和人工智能技术产品,包括大数据操作系统(BD-OS)和标签管理系统等基础引擎产品,以及智能审校系统等应用产品,涉及数字城市、应急管理、公共安全、生态环境、媒体出版、零售快消等多个领域。
产品服务介绍:
百分点科技通过咨询加产品的模式向客户提供数据治理服务。百分点科技的大数据操作系统(BD-OS)提供完整的数据治理产品模块,包括数据标准管理、数据质量管理、元数据管理和数据资产管理等。通过结合咨询和工具应用,百分点科技能够为客户提供完整的数据治理解决方案。
能力解读:
百分点科技服务了大量包括政府、应急、环保和公安等领域客户。在服务这些客户的过程中,百分点科技积累了大量行业知识和业务理解能力,尤其针对应急管理场景,百分点科技形成了较强的数据治理方法论。
以完整的数据治理方法论作为支撑,百分点科技在数据汇聚、数据处理以及数据服务等环节中,能够基于一套完整的工序有条不紊地推进数据治理工作。例如,在数据汇聚环节,能够通过数据调研表、接入方案等进行数据盘点和接入方案设计;在数据处理的环节,通过标准规范文档、数据字典进行标准制定;在数据服务环节,通过数据分级分类等进行运营规范制定,通过资源数据目录梳理进行资源目录设计等。
在咨询的基础上,百分点科技能够很好地结合工具应用助力企业推进数据治理工作,如BD-OS平台能够实现数据的汇聚和数据处理等;低代码开发组件应用于元数据开发、数据资产目录构建等工作,加快数据治理工作的部署实施。
在实施服务方面,百分点科技的实施团队规模较大,分布覆盖全国大部分地区。此外,项目实施工作完全由百分点科技自己承担,不依赖第三方交付,可以很好地保证交付质量。
典型客户:
广东省应急管理厅、北京市石景山区人民政府、新华社
客户案例:
百分点科技为广东省应急管理厅构建了全省“大应急”数据中台,整合安全生产、消防、海事、交通、环保、民政、水利等24个相关厅局的数据资源,实现应急数据接入、处理、存储、应用等全生命周期治理,构建数据全域覆盖、分级汇聚、纵向联通、统一管控的大数据体系,形成应急数据地图,使应急数据资源“看得清、管得住、控得牢、处置快、损害低”,并通过数据共享交换平台支撑多个业务应用,提升应急管理业务能力。
全面融合感知数据、社会和互联网数据、应急管理内部数据及其他政府部门数据,实现跨部门、跨区域、跨行业的信息共享和资源统筹,并在此基础上进行数据建模分析,构建灾害链、防汛、森防等知识图谱,实现应急一盘棋管理,针对台风、危化品、火灾等突发事件的不同类型进行分类管理,提升灾害应急处置效率。
滴普科技
厂商介绍:
滴普科技成立于2018年,是领先的全场景数据智能服务商。滴普科技打造了DataFacts数据智能服务产品平台,FastData云原生多模实时数仓产品,和Deepexi DXP企业数字化场景落地产品体系,支撑企业从战略到技术落地,实现全维度的数字化转型。
产品服务介绍:
滴普科技通过数据集成工具DCT和数据开发和管理套件DaaS等工具产品、业务和数据咨询服务以及实施服务,为客户提供完整的数据治理能力,覆盖数据建模、数据开发、数据服务、元数据管理、数据血缘、数据质量管理等数据治理过程的各个环节。
能力解读:
滴普科技的数据治理服务能够集成散落在企业各方的数据,并对异常数据进行清洗,完成海量数据的集成、存储、计算、资产化过程,从而有效消除数据孤岛,实现实时的数据信息共享。
滴普科技具备完善的数据治理机制,通过数据建模、数据标准的建立、数据质量的监控和流程的优化等,保证数据标准可落地、数据开发可管理、数据质量可稽核。同时,通过多重的异常处理机制,确保企业数据资产的完整性和一致性。
滴普科技的资产地图能够对全域数据汇集和全链路数据追踪,展示用户的指标、模型等数据资产。用户可以全面掌握数据中台的资产状况,快速地查找、定位需要的数据。
在数据治理的易用性方面,滴普科技面向管理人员提供元数据、数据质量、数据地图、指标管理等功能,实现全程可视化操作,能够很好地协助数据部门进行配置和监控。
滴普科技积累了大量数据治理的咨询经验,能够针对不同行业的行业特性,从客户的业务出发设计相应的数据模型和完善的数据治理机制。
典型客户:
百丽国际、滔搏运动、中外运物流、九洲电器、科伦药业
观远数据
厂商介绍:
观远数据成立于2016年,公司为泛零售、消费以及互联网领域客户提供智能数据分析与决策(AI+BI)解决方案。提出一整套从敏捷分析(BI)到智能决策(AI)的完整“5A”落地路径方法论,为企业实现从传统BI到智能分析与决策的转型。
产品服务介绍:
观远数据的数据开发平台Universe以服务AI和BI数据应用为核心,由开发平台提供底层数据处理能力的支撑,同时向上拓展轻量级的数据治理和数据服务能力,提供与业务应用紧密结合的一站式解决方案。
能力解读:
数据开发平台以数据开发为核心,提供数据源对接、任务开发、调度管理、插件扩展、数据存储与服务能力。
任务开发可进行ETL等数据任务的开发,进行可视化的数据集成与处理;调度管理支持复杂灵活的流程编排、调度与监控,实例化的运行机制支持复杂的运维操作;插件体系提供了简单易用的SDK以及插件API,方便开发人员自定义特殊算法来处理数据。
数据开发平台能够无缝对接观远BI平台,可以进行SmartETL的平滑迁移和数据集存储共享,为BI平台提供了一个强大的底层数据处理能力的支撑,便于流畅的管理从数据开发到数据应用的整个流程。
通过数据开发平台,可以支持表级别的数据血缘,便于分析数据的血缘来源及影响范围;同时,基于数据集进行校验规则设置,平台支持定时检测及产出数据质量报告。
典型客户:
丸美,珀莱雅,蜜雪冰城,新华书店,红豆
海致科技、海致星图
厂商介绍:
海致科技集团,专注数据智能技术创新,依托与清华大学共研的高性能图计算技术,为政府、企业级用户的数字化建设提供大数据分析、图计算、图数据库等产品和技术。
海致星图专注于提供企业级知识图谱产品和服务,深耕金融、能源互联网、工业互联网等垂直行业,自研的知识图谱、图数据库等产品和服务已覆盖金融领域全业务场景。
产品服务介绍:
在数据治理场景,DMC平台能够提供完整的数据治理工具,核心能力体现在数据标准、数据血缘管理等方面。同时,海致科技在警务数据治理上能够提供专业和体系化的咨询服务。
能力解读:
DMC平台支持对不同行业类型的数据进行清洗并达到数据标准。同时,针对警务数据的特点,DMC平台内嵌公安标准库、主题库等公安数据标准体系,具备库表标准、元数据、血缘、质量等数据资产管理能力,支持公安业务属性的事件库、要素库、标签库等数据知识一键式构建能力。
DMC平台的数据血缘管理能够支持客户追溯数据从接入、到清洗、处理加工的所有过程,了解数据的来龙去脉。因此,公安客户出于业务和合规需求,可以通过平台的数据血缘关系模块了解数据被不同平台的使用情况,包括所有的操作和产生的结果,具备很大的业务价值。
在咨询服务方面,海致科技具备大量公安客户的服务经验,能够根据公安客户数据环境和数据情况的不同,为不同的数据治理项目提供定制化解决方案。
此外,针对不同级别警务数据彼此独立的现状,海致科技在业内率先在与相关部门合作探索为省厅和地市间,跨警种间解决了跨省市及警种的数据协同治理和协同服务的问题。
典型客户:
公安部第一研究所、山东省公安厅、北京市公安局公安交通管理局
Kyligence
厂商介绍:
Kyligence成立于2016年,由Apache Kylin创始团队创建,专注于打造下一代智能数据云平台,为企业提供自动化的数据服务和管理。基于机器学习和AI技术,Kyligence从多云的数据存储中识别和管理最有价值数据,并提供高性能、高并发的数据服务以支撑各种数据分析与应用,同时不断降低TCO。
产品服务介绍
Kyligence的产品通过对接各类数据源,并提供标准的MDX接口,为用户构建统一的语义层,用户可以通过管理数据模型的方式来实现对数据的治理。
能力解读:
Kyligence将数据表转换为维度、度量、层级结构等业务人员熟悉的语义模型,并构建出一个可以在不同的BI工具中实现复用的统一的语义层,有效解决了数据孤岛的问题,方便业务人员的使用。
针对IT负责人对数据用量无法完全掌握的现状,Kyligence的统一语义层能够支持用户查看数据模型对存储资源的使用情况、数据模型支持的分析场景的数量、以及使用了该模型的分析师的数量等信息,这对数据治理团队衡量数据模型的价值和收益有很大帮助。
Kyligence通过统一语义层将割裂的BI分析负载集中到数据平台,让用户和数据访问的管理可以统一配置在数据平台的数据资产层,并作用到所有上层业务应用,IT无需对下游系统配置额外的访问控制,因此降低了用户的数据分散在不同业务系统带来的数据安全风险。
典型客户:
Costa,UBS,YUM
明略科技
厂商介绍:
明略科技目前形成了数据中台和知识图谱平台两大产品体系,向包括公安、工业、政府、金融等行业客户提供大数据和人工智能产品和解决方案。
产品服务介绍:
明略科技以产品加咨询的方式向客户提供服务。明略科技数据中台以云原生和数据资产图谱平台两大支撑能力为支撑,提供的数据治理工具组件包括元数据管理、数据标准管理、数据质量管理和数据共享工具等。
能力解读:
明略科技长期服务于政府、工业、金融以及零售等行业和领域,尤其在政府和工业领域,具备成熟的数据治理建设和落地经验。基于这些经验,同时结合数据治理工具,明略科技能够针对客户面临的痛点提供解决方案。例如,针对政府客户,数据中台建设往往涉及不同委办局之间的数据共享和数据管理,明略科技积累的大量政府行业落地经验,包括数据标准体系和数据标签体系等,使得其能够快速推进相关工作。
在产品方面,明略科技的数据资产图谱平台能够实现业务元数据体系和IT元数据体系的打通,能够支撑业务人员和技术团队以在线化的方式实现协作,很好的解决企业数据管理领域多年存在的难点。具体来看,相比传统的库表结构,明略科技以网状关系为核心的图模型技术为支撑,在数据接入、加工到消费等数据全生命周期中,对元数据进行管理,将业务和IT两个部门相关的数据连接成“一张网”,实现元数据的共享、统一管理和数据应用。
典型客户:
某城市超脑、湖南国网
客户案例:
某市推出了城市超级大脑项目,目标是建设市数据大脑,基于数据大脑提升数据治理能力和大数据分析能力,搭建起“一网通办”、“一屏通享”等数据应用体系。
明略科技联合腾讯云为该城市超级大脑数据中台建设提供了一整套解决方案,包括软件产品和咨询服务两部分。软件产品方面,包括数据汇聚平台、数据标准化平台和元数据管理平台等;咨询方面,明略科技提供的服务包括:帮助该市数据资源管理局建立了数据治理的组织保障和工作流程;制定数据管理和治理、数据开发运维、数据运营等方面的管理标准、技术标准及数据标准等。
效果层面,城市超级大脑项目取得了阶段性的成效,包括资源目录、数据归集以及数据共享三个方面。其中,在数据共享方面,接口累计调用130亿次;库表交换累计40亿条,为35家委办局提供服务。
米雅科技
厂商介绍:
米雅科技成立于2014年,从聚合支付开始助力企业与消费群体建立连接,为零售商、品牌商提供“Data+AI+Solution”的SaaS平台,帮助企业发挥数据资产的价值,用数据为消费者创造价值,最终实现业务增长。
产品服务介绍:
米雅科技数据中台数据治理核心模块One ID数据引擎,能够结合元数据管理、数据质量管理、数据资产管理和数据安全管理等工具,通过数据资产视图等方式输出数据服务。
能力解读:
米雅科技主要服务零售企业客户,其数据中台专注于消费者运营场景的应用。米雅科技的数据中台内置了消费者运营领域的各类算法模型,包括销售预测模型以及忠诚度预测模型等。客户能够调用这些模型,运用于会员洞察与管理、客户忠诚度分析以及营销自动化等场景中。
米雅科技数据中台的核心模块One ID数据引擎采用实时和离线计算技术作为支撑,能够保证在大数据量和数据多维度的情况,保持稳定性。One ID模块配置了元数据管理、数据质量管理等工具,能够及时打通用户数据,整合用户在多渠道的数据并进行画像,翔实的描述用户的偏好以及特性。
米雅科技重视数据安全体系的搭建,注重消费者隐私保护。米雅科技擅长基于消费者数据进行区域性或者具体群体的消费者行为分析。其可通过技术手段,做到不暴露消费者个人数据,消除零售客户对于数据共享和数据安全等方面的担忧。米雅科技目前跟华为达成合作,加强数据安全的研发投入。针对SAAS到私有化部分等不同场景中提供了多种不同安全级别的设计、部署方案。识别存在的风险并进行规避和加固。同时米雅系统遵循数据权限分级管理制度,对账号权限进行了详细切分。并设计了审计等功能。
典型客户:
华东某知名服饰品牌、东北某大型商企集团
客户案例:
某知名服饰品牌通过新零售渠道、智慧门店、小程序等数字化建设积累了可观的会员资产,然而依旧存在诸多问题:购物者在不同渠道的身份未打通,无法享受统一的权益;不同业务线缺乏统一规范,管理者很难以全局的角度审视运营活动效果等。
米雅科技帮助该品牌搭建数据中台,实现数据治理。帮助该品牌建立统一的数据处理流程,整合线上线下各渠道的会员、订单等数据,实现购物者身份的统一识别;和客户的数据团队一起,梳理了其业务模型,实现元数据的收集和数据血缘系统的搭建。此外,通过建立数据质量视图,让管理者能够直观的度量各业务的数据质量情况。
进行数据治理之后,该品牌实现了不同业务线指标命名以及计算口径的统一,将原来总计3000多个业务指标合并到100个左右,指标整合后,颗粒更加清晰;基于统一的数据服务层、设计并建立了会员资产视图,购物者在多渠道的积分、权益实现统一。
同盾科技
厂商介绍:
同盾科技以人工智能、云计算、大数据三大核心技术体系为基础,基于对数据的探索洞察和理解,将机器学习、联邦学习、知识图谱等领先技术与业务场景融合,为金融、保险、互联网、政务、零售、物流等行业提供智能分析与决策服务。
产品服务介绍:
同盾科技为客户提供咨询和产品结合的数据治理解决方案。星河大数据平台数据治理相关的核心模块包括元数据管理、数据质量监控和资产目录等。
能力解读:
同盾科技长期服务于金融和政企行业,积累了深厚的行业知识以及相应的数据治理方法论。针对金融和政企行业客户,同盾科技基于自身积累的大量行业标准知识,通过输出咨询服务,同时结合星河-大数据平台的工具模块,能够帮助客户推进数据治理工作。
同盾科技的数据治理模块是与数据开发平台同时向客户提供服务,基于的星河大数据平台,可同时实现数据开发和数据治理的工作,保证了数据资产平台与数据处理的过程实现无缝对接,如元数据信息的自动对接等,助力企业降低成本。
典型客户:
沪杭甬高速
客户案例:
在全国建设智慧高速公路的浪潮下,沪杭甬高速展开了智慧高速大数据平台建设项目,希望通过搭建统一的数据中台实现数据的汇聚,构建数据资产,实现数据的共享和高效管控,支撑起智慧高速的各类应用场景。
以星河-大数据平台为支撑,同盾科技为沪杭甬高速运营商搭建了智慧高速云控平台。智慧高速云控平台融合星河大数据平台的数据开发、数据治理以及统一数据服务等功能模块,以数据资产大屏的方式支撑业务人员使用。在数据治理方面,同盾科技通过输出咨询服务,梳理客户各类业务数据,结合高速公路行业数据规范制定数据统一规范,并构建统一数据公共层。
在应用效果方面,智慧高速云控平台集成了运行监测、应急指挥、养护管理、收费管理、重点车辆跟踪、营运分析等各项功能,提供智慧高速、智慧隧道、智慧桥梁、智慧枢纽、智慧服务区等场景应用。
御数坊
厂商介绍:
御数坊是一家专注于数据治理领域的企业。御数坊以“咨询服务+软件产品”的一体化交付模式服务客户,行业覆盖银行、证券、能源、地产、汽车、通信、制造和政府等领域。
产品服务介绍:
御数坊以数据治理咨询起家,目前形成了咨询和产品一体化的服务模式,其拳头产品“DGOffice”协同数据治理咨询,实现对企业客户全域数据管理。基于DGOffice,用户可完成对数据资产的盘点梳理,实现数据质量管理数据认责管理、数据标准管理和数据资产管理等工作。
能力解读:
御数坊服务了50余家500强企业,行业覆盖能源、通信、金融、汽车、政府、房地产等众多领域,形成了自身的经验和数据治理方法论。御数坊是全国信标委大数据标准工作组成员,参加DCMM、数据质量评价、数据治理规范国家标准编写。
御数坊采用咨询和产品一体化的服务模式,可面向跨行业的业务场景,通过输出数据治理方法论,如方法论流程模板库和行业标准数据库等,并结合DGOffice工具应用组件,以在线化和协同化的思路,帮助客户推进数据治理工作。
咨询方面,在服务模式上,御数坊采取微咨询的服务模式。在这一模式下,御数坊会围绕着客户反馈的业务场景和数据问题,如营销指标治理以及客户数据治理等,提供咨询服务。这种面向场景的微咨询能够围绕具体痛点,快速解决客户问题,具备见效快和效率高的特点。
在产品方面,DGOffice具体低代码和组件化的技术能力,能够快速的支撑起客户个性化的管理场景,提高实施与交付的速度。此外,DGOffice还内置了大量智能化组件,包括NLP和知识图谱等,提升了产品平台的易用性,让数据治理更简单高效。如DGOffice可基于业务规范建立业务知识图谱,构建数据与业务语义关联,还原数据资产的业务背景知识,提高用户数据使用体验。
典型客户:
国家电网、南方电网、中国移动、中国联通、申万宏源证券
客户案例:
某省级能源企业此前已展开了由公司IT管理部门牵头的年度性的数据质量专项治理提升工作。这虽然取得了一定的成效,不过问题依然艰深,主要表现为:同时充当“裁判”和“运动员”的IT部门难以有效推动业务部门深度参与,由业务定义和管理要求引起的数据问题成为顽疾。
在这一背景下,御数坊首先为该企业设计了一套数据认责的机制,让业务管理部门成为数据治理工作的主体,并明确了各方的责任。在这一套机制的框架下,御数坊以问题为导向,选取核心问题数据,小范围试点实施。随后,结合重点指标需求,分批次在全省推广,全面落实数据认责机制。
在工具层面,御数坊还部署到客户DGOffice数据认责工具及数据指标溯源管理工具,全面保障认责关系的可视化、可管控、可追踪,数据治理工作效率大幅提升。
效果层面,2019年,全省完成数据认责推广,99%关联到责任人,覆盖7个重点任务25个业务指标,数据质量提高2倍,平均节约成本156万/年/供电局。机制层面,形成了数据认责推动数据质量提升的有效工作机制。
元年科技
厂商介绍:
元年科技是一家具有丰富的财务管理、业务运营和行业经验的企业数字化转型软件商和服务商,提供技术中台、业务中台、数据中台的规划咨询、软件平台和实施运营服务,服务过上千家大型企业集团。
产品服务介绍:
在数据治理场景,元年科技的数据中台解决方案能够提供完整的数据治理产品和服务,覆盖从数据采集、形成数据资产到数据服务的全生命周期,包括数据标准管理、数据质量管理、数据资产管理等核心功能。
能力解读:
产品层面,元年科技的数据中台具备完整的数据治理功能,涵盖数据生命周期管理、主数据管理、数据质量管理、数据标准管理、数据安全、数据标准管理、元数据管理、数据标签管理、数据资产管理等,其中数据资产管理具备完善的数据资产分类和权限管理功能。
元年科技具备数据治理咨询服务能力,通过专门的咨询团队和方法论,将数据治理咨询融入数据平台建设过程中,输出数据治理理念,协助企业搭建配套的组织架构,建立流程和规范,并通过数据治理产品工具进行落地,实现持续运营。
元年科技在管理会计、财务管理和管理咨询领域有21年积累,服务了近千家大型企业集团,在服务大型企业的数据治理方面有较强能力储备。尤其面向以财务为核心的经营分析主题数据治理,元年科技积累了丰富的数据管理体系设计、数据标准体系设计等方法论。
典型客户:
三诺生物
云徙科技
厂商介绍:
云徙科技成立于2017年,是专注于消费者数字体验的中台解决方案提供商。云徙科技的产品体系包括针对中大型企业客户进行私有化部署的“数舰”及SaaS营销产品“数盈”,服务于快消、家电、汽车和地产等行业。
产品服务介绍:
云徙科技通过咨询加产品的方式为客户提供数据治理解决方案。云徙科技数据中台数据治理能力和模块包括数据资产管理平台(如数据血缘追溯、标签体系管理等)以及数据资产运营平台(包括标签模型和算法模型等)。
能力解读:
云徙科技专注服务于零售、地产和汽车等行业的数字营销场景,积累了丰富的针对营销场景的数据治理经验。在长期服务客户的过程中,云徙科技针对客户数据治理的难点进行提炼总结,形成了自身的方法论并固化成产品沉淀在数据中台,形成了针对营销域的完整数据治理体系。
针对营销域的数据治理,云徙科技的数据中台具备良好的模型设计和指标管理体系能力。在典型的数据中台项目中,云徙科技能够结合客户具体业务情况和应用场景,事先梳理出一套标准(如命名规范、数据血缘关联关系等),基于统一规范和流程为后期的数据采集、数据融通、数据加工和数据服务等工作打下良好的基础。
另外,云徙科技的数据中台内置了丰富的业务模型体系,包括主题域模型、标签模型和算法模型等,这些模型结合底层数据处理能力,能够形成与具体业务场景高度耦合的数字资产,通过数据资产目录平台进行分发,实现数据的共享和复用。
典型客户:
海尔集团
客户案例:
海尔集团近年来业务快速扩张,业务从原来的家电扩展至目前的金融和地产等各个领域。不同的业务部门都建设了自身的数据系统,烟囱建设问题严重,集团希望通过建设数据中台和业务中台,将不同的系统数据拉通,并构建统一的数据资产平台,使得数据资产能够共享和复用。
云徙科技为海尔集团部署上线了数据中台,搭建了统一的标签平台。通过该平台,业务标签可输送给不同部门人员进行使用。目前,该标签平台主要是针对经销商体系的标签建设,随着项目的推进,未来将扩展至消费者体系搭建。
在数据治理方面,由于海尔集团IT建设历史较久,内部存在3000多套业务系统,并且仍在不断扩展。由于历史建设原因,很多数据无法被调用和使用,阻碍了数据价值的发挥。云徙科技以咨询和产品的方式,通过流程规范建设等为海尔集团解决这一问题。
3.3. 数据分析与可视化
终端用户:
业务部门、企业管理人员、数据分析师
核心需求:
数据分析与可视化是指基于一整套平台和工具实现对数据的分析和洞察,具体包括数据准备、数据探索和数据展示等一系列过程。
传统上,关联关系挖掘等数据分析工作主要依赖人工进行,效率低下,并且容易受到个人主观判断影响。随着数据量的增大,以及数据类型变得越来越复杂,影响数据之间关联性的因子剧增,这对传统的依赖人工进行数据分析的模式构成巨大挑战。企业需要通过AI技术实现数据分析过程的自动化,从而提升效率。同时,需要融合机器学习等AI技术进行自动数据探寻,提升数据分析深度,弥补人工分析的不足。
随着企业数字化转型的深入,企业各个层级的人员需能够获取数据,利用数据驱动业务决策,数据分析服务需要实现平民化。首先,数据分析师等分析人员需要一个低门槛的自助式的数据分析平台,可基于这一平台快速实现数据的洞察和分析;其次,终端用户(从高层管理人员到基层员工)也需要能够获取到数据服务,可通过自然语言交互等方式随时随地、低门槛地获取数据分析服务。
厂商能力要求:
平台需要具备从数据接入、处理到分析的完整数据处理流程,并具备接入多个来源数据的能力。具体而言,平台需要具备的关键模块包括数据查询、数据可视化、仪表板、数据探寻分析和可视化报表等。在可视化方面,平台需要能够使用多样的方式、图表展示分析结果。同时,可视化视图能够具备多维数据展示的能力。
以AI应用为核心的增强分析能力正在成为数据分析与可视化场景的重要能力要求。增强分析能力包括三个方面:基于AI算法,能够在数据准备和数据探寻等数据分析环节中实现流程的自动化,提升效率;通过AI技术自动进行关联网络分析,通过智能化的数据探寻,实现脱离人为经验的数据洞察;基于内置的自然语言识别能力,用户通过文字和语音的形式即可查询数据分析结果,同时,平台还能够通过智能预警的方式将数据分析结果推送至相关人员。
代表厂商:
(入选标准:客户服务案例在5家及以上)
百分点科技
厂商介绍:
百分点科技成立于2009年,拥有全栈的大数据和人工智能技术产品,包括大数据操作系统(BD-OS)和标签管理系统等基础引擎产品,以及智能审校系统等应用产品,涉及数字城市、应急管理、公共安全、生态环境、媒体出版、零售快消等多个领域。
产品服务介绍:
百分点科技的商业智能系统Clever BI是一款数据可视化分析产品,涵盖数据接入、整合、管理到输出的完整解决方案,具备自然语言交互式分析的功能。
能力解读:
Clever BI易用性良好。系统具备自然语言查询的能力,基于该平台,用户通过语音或者自然语言的方式即可与系统互动,获取数据分析服务,大大降低数据分析的使用门槛。
Clever BI具备较强的可视化展示能力。系统基于图形语法学理念,将数据映射到几何对象的视觉通道中,避免出现图表类型无法穷举、分类冲突的弊端。并且能够生成精美的数据看板、可视化大屏、数据门户,充分满足政企客户对于大屏展示及对报表的需求。
Clever BI具备嵌入式分析能力。系统内的前端核心渲染能力已封装成SDK,支持以SDK形式深度调用,供开发者简单高效地集成进自己的业务生态。
典型客户:
中国文化传媒集团、常州市生态环境局、龙湖集团
滴普科技
厂商介绍:
滴普科技成立于2018年,是领先的全场景数据智能服务商。滴普科技打造了DataFacts数据智能服务产品平台,FastData云原生多模实时数仓产品,和Deepexi DXP企业数字化场景落地产品体系,支撑企业从战略到技术落地,实现全维度的数字化转型。
产品服务介绍:
滴普科技的DataSense产品通过自动化数据科学、机器学习和AI赋能企业用户,以进行探索式的BI分析,具备数据准备、搜索分析、标签服务、算法服务、数据可视化和分享、嵌入式分析的能力。
能力解读:
DataSense能够支撑多种数据源的接入和管理,并提供轻量化的数据接入服务;同时通过算法识别表之间的关系,从而快速生成表关联关系。用户因此能够快速方便地访问数据资产,解决用户查找数据时间过长,不能有效使用数据的问题。
为了降低数据分析的门槛,增强数据分析的可用性。DataSense 将数据分析的能力工具化,以SaaS服务、API 和SDK为主要形式支撑企业业务对于数据价值的挖掘。从应用的角度出发,尽可能减少业务开发对于下层大数据平台技术的依赖。同时,DataSense充分利用智能技术,在数据准备到数据管理到数据探索等各个阶段都接入机器学习和AI能力,让整个数据分析自动化和智能化。如,DataSense可以实现对话式自助BI功能,基于NLP模型,用户通过键入自然语言的形式,即可获得自己想要的数据报表;也可以基于用户需求,进行热搜推荐、分词联想、个性化推荐等。
DataSense具备丰富的样式库,提供多种多样的图表样式,以支撑各种分析维度的可视化展示;同时,自定义的仪表盘支撑拖拉拽生成经营面板,直观展示各类监控指标。
此外,滴普科技能够为用户提供从数据接入、到数据治理、数据管理、复杂分析模型、前端可视化分析、分析报告和增强分析整个过程,为用户实现端到端的自助分析能力。
典型客户:
中外运物流、科伦药业、百丽集团
观远数据
厂商介绍:
观远数据成立于2016年,公司为泛零售、消费以及互联网领域客户提供智能数据分析与决策(AI+BI)解决方案。提出一整套从敏捷分析(BI)到智能决策(AI)的完整“5A”落地路径方法论,为企业实现从传统BI到智能分析与决策的转型。
产品服务介绍:
观远数据的一站式智能分析平台,面向企业提供数据分析可视化与智能决策服务,打通了数据采集-接入-管理-开发-分析-AI建模-AI模型运行-数据应用全流程,提升了企业决策的准确性与时效性,并提供可落地的经验预测和智能决策洞察。
能力解读:
观远数据的“5A”战略将数据分析能力的构建从基础到高阶依次分为Agile敏捷化、Accurate场景化、Automated自动化、Augmented增强化和Actionable行动化。对数字化能力偏弱的成长型企业,观远数据主要为其提供极简部署、拖拽式分析、以及各类可视化指标的敏捷化能力,并为用户提供多种场景化的分析模版;对数据基础能力较成熟的大型企业,观远数据侧重为其提供数据分析流程的自动化,以及销售预测、需求预测等AI增强的分析能力,并形成智能化的业务决策。
为了加快和简化数据分析和应用。观远数据能够以低代码的方式让业务用户通过拖拉拽的方式生成BI应用,并发布至钉钉、企微等终端,快速实现数据在不同部门的分享和应用;同时,针对消费和零售行业用户,观远数据借鉴领先企业的数字化实践,为用户梳理和定义了包含上百个业务主题,每个业务主题下有数百上千指标的指标库体系,以及近百个行业分析模版,为用户提供行业最佳实践的解决方案。
观远数据为用户提供了一站式的轻型数据中台解决方案,提供轻型ETL、数据接入、数据开发、数仓、巡检、管控工具或产品,从而满足一些用户对业务敏捷性的需求。
此外,观远数据顺应企业数字基础设施往云原生方向发展的趋势,推出了SaaS版本的产品观远分析云,使企业能够以更低门槛快速部署,并以更低成本使用数据分析服务。
典型客户:
Bilibili 、小红书、新东方、特步、元气森林、
客户案例:
蜜雪冰城在业务快速扩张过程中,面临传统手工统计方式逐层反馈效率低下,导致内部信息传递不及时;同时,传统轻量级数仓跨库多表取数、运行慢,缺乏分层建模,运维麻烦,复用性、可扩展性低、难交接、难梳理等问题逐渐显露。
观远数据为蜜雪冰城开发了一套完整的数仓+BI平台,并配套建设了完善的数据管理体系,引入了成熟的分层建模方法。该平台包括了营运贸易、采购仓储、财务管理、渠道监控、招商分析、商品分析7个核心模块,梳理调研了7个业务流程,设置了基于各业务分析场景的自动化看板和报表。
该方案落地后,蜜雪冰城建立了完整的企业级数据仓库,实现多个业务系统的数据接入,打破了数据孤岛,并实现了科学分层;帮助营运部门建立起从总部级到门店级的数据运营体系,也为高管提供核心指标解读,随时掌握重点业务经营情况;数仓+BI方式实现了所有部门数据口径统一,满足对上支撑战略实现,对下监控绩效指标执行的需求。
海致科技、海致星图
厂商介绍:
海致科技集团,专注数据智能技术创新,依托与清华大学共研的高性能图计算技术,为政府、企业级用户的数字化建设提供大数据分析、图计算、图数据库等产品和技术。
海致星图专注于提供企业级知识图谱产品和服务,深耕金融、能源互联网、工业互联网等垂直行业,自研的知识图谱、图数据库等产品和服务已覆盖金融领域全业务场景。
产品服务介绍:
海致星图BDP可视化数据分析平台是一个一站式的数据分析平台,提供从数据接入、数据加工、再到数据分析的全链路能力,为用户提供企业级报表、可视化展示、自助探索分析、数据挖掘建模、机器学习等大数据分析服务。
能力解读:
针对客户将企业数据集中化的需求,BDP平台支持多源异构的汇聚,同时兼容用户已有的大数据集群,包括CDH、华为FI、星环TDH等。
BDP平台利用海致星图底层平台的OLAP引擎,以及相关的技术优化,能够实现数据分析的高性能,做到亿级数据、秒级响应,千亿规模数据的查询响应时间在10秒内。
BDP平台支持拖拉拽的使用方式,支持在数据建模、数据分析等环节使用AI算法实现自动化;同时,针对不同业务场景,平台内积累了众多金融行业的分析模版;因此BDP平台具有较低的使用门槛,能够让业务人员快速使用数据分析功能。
BDP平台同时支持本地部署和SaaS版本的使用。SaaS版本的产品能够快速部署和对接各种数据源,并且能够在充分利用云平台的弹性计算能力的基础上,支持多租户的线上数据分析需求。对银行类客户而言,SaaS版的BDP平台可以实现全行数据的统一,分行以云租赁的方式使用该平台,不用关注底层数据能力的建设,而是专注于业务创新。同时,BDP平台支持全行用户在平台内共享和复用分析模型和分析结果,从而推动数据赋能业务。
典型客户:
招商银行、广发银行、中国人寿
Kyligence
厂商介绍:
Kyligence成立于2016年,由Apache Kylin创始团队创建,专注于打造下一代智能数据云平台,为企业提供自动化的数据服务和管理。基于机器学习和 AI 技术,Kyligence从多云的数据存储中识别和管理最有价值数据,并提供高性能、高并发的数据服务以支撑各种数据分析与应用,同时不断降低TCO。
产品服务介绍:
Kyligence产品作为支持数据分析场景的数据平台可无缝对接主流商业BI如Tableau、Power BI、帆软、Smartb等,作为后台的核心数据引擎支撑业务人员和分析师进行可视化和多维数据分析;业务人员和分析师也可通过Kyligence内置的敏捷性自助式分析工具Kyligence Insight实现自助式分析。
能力解读:
数据开发人员可在Kyligence中定义统一的数据业务模型,通过Kyligence的语义层能力将统一定义的数据业务模型同步到BI中,方便业务人员和分析师直接使用商业BI进行自助式分析,实现快速的数据洞察,这极大地提升了业务人员和分析师的分析效率和自主性。同时,通过Kyligence的语义层,数据开发人员开发一套业务数据模型可以服务上千业务人员的分析诉求,这样的数据服务模式可以帮助企业实现降本增效的目标。
另一方面,Kyligence Insight通过与Kyligence Enterprise无缝集成,自动同步了来自Kyligence Enterprise的数据模型,并在其上灵活地构建业务指标。同时,Kyligence Insight所有查询都由后台的AI增强引擎提供支持,具备自动化的能力。
针对一些特定的海量数据的复杂分析场景,比如银行卡账号这类高基数场景,或者标签分析、用户行为分析场景,Kyligence Insight在产品和技术上进行了高度优化,解决了传统BI在这些业务场景中的性能问题。
在数据展示和数据共享方面,Kyligence Insight提供丰富的数据可视化能力;支持报表和仪表盘的共享以及在应用嵌入,并能自主设置权限;支持用户通过拖放界面定义模板、安排定期,导出用户需要的数据;支持用户通过微信小程序随时随地查看和使用数据。
典型客户:
招商银行,建设银行,光大银行
元年科技
厂商介绍:
元年科技是一家具有丰富的财务管理、业务运营和行业经验的企业数字化转型软件商和服务商,提供技术中台、业务中台、数据中台的规划咨询、软件平台和实施运营服务,服务过上千家大型企业集团。
产品服务介绍:
元年科技提供可视化分析平台“智答”,该平台功能完整,覆盖从数据接入、数据分析、数据预警、可视化报表输出到企业内部数据分享等数据处理和分析的全流程。“智答”具备增强分析的能力,用户可通过问答的方式获取数据分析服务,并内置算法引擎提供全自动的数据洞察服务。
能力解读:
智答是一款简单易用、使用门槛低的可视化分析产品。相比传统可视化分析通过IT部门进行报表开发的流程,智答内置自然语言处理的能力模块,用户通过对话的方式即可与系统进行交互,获取数据服务,提升了效率,同时降低了企业数据分析和数据应用的门槛。
智答具备深层次的增强型分析能力。智答内置智能化分析平台,基于这一平台,包括业务人员、数据分析师等用户可通过拖拉拽、无代码等形式进行自动化建模,构建各类常见的分析模型,如归因分析模型等。同时,该平台也提供基于AutoML的算法模型,7*24H的对数据进行自动分析,输出数据洞察报告,增强业务人员的分析能力,发现隐藏在数据中高价值的信息。这些模型能够实现对不同数据之间关联关系的分析挖掘,发现数据间的隐秘关系。
智答具备一定的开放能力,支持引入企业已有数据智能服务与能力,并可以将自身能力化打散对企业进行输出。元年多年服务大型企业客户,涉及的行业包括制造业、房地产和金融等,积累了大量行业知识并沉淀了大量基于场景的分析指标和模型。智答内置了这些分析指标和模型,能够助力用户快速搭建智能化应用,应用场景包括销量预测、店铺选址等。
典型客户:
通威股份
客户案例:
通威集团是一家集“农业+新能源”双主业发展的大型科技型集团,该企业在持续推进数字化转型。不过这一过程中,其也面临一些突出挑战,尤其体现在数据获取和使用方面。具体来看,主要体现在两方面。首先,当领导和业务人员提出新的BI需求时,IT响应周期过长,无法第一时间获取所需数据。其次,BI应用门槛高,业务人员无法做到随时随地获取数据并依据数据做出生产经营决策。
在这一情况下,元年科技为通威集团部署上线了“智答”平台。基于这一平台,用户通过语音或文本的方式就可随时随地获取数据,提高了用户对数据的利用效率。同时,“智答”平台快速运算数据能力节省了管理人员对数据进行解读的难度,提高了数据应用的便捷性,提升了决策的效率和准确性。
3.4. 图分析
终端用户:
数据部门,业务部门
核心需求:
图分析是基于图的数据关系为数据提供存储、处理、分析以及结果展示的全流程。图通过点和边的方式描述数据间的关系,为大规模数据的查询和分析提供了一种高效的解决方案。
企业积累了越来越多的多源异构数据,大量多维数据间的关系有待挖掘并在业务中产生价值。如果基于传统的数据结构来存储和处理这些数据,企业将需要编写复杂的代码,花费大量时间从数据中获得洞察。企业需要一种新的基于图的数据结构的数据存储、挖掘和分析方案,来简化数据分析过程,加快获得分析结果;与此同时,随着AI/ML应用变得更加广泛,企业需要基于图的数据关系提供模型中的上下文背景,提高模型可解释性,实现智能分析应用。
企业应用图分析需要重点解决的问题包括:以图的数据结构存储数据,实现高性能的数据查询和加载;基于图算法挖掘和分析数据,降低图分析的使用门槛等。
厂商能力要求:
能够提供图数据库产品,将数据以及数据间的关系存储在图的数据结构中。
能够提供图计算引擎实现基于图的数据查询与分析,并实现高性能,尤其是多跳遍历的高性能。
能够提供丰富的图算法,实现智能分析应用。
能提供易于学习和使用的查询语言、图形化操作界面,以及在分析流程中应用AI技术实现自动化,降低图分析的使用门槛。
代表厂商:
(入选标准:客户服务案例在3家及以上)
海致星图
厂商介绍:
海致星图专注于提供企业级知识图谱产品和服务,深耕金融、能源互联网、工业互联网等垂直行业,自研的知识图谱、图数据库等产品和服务已覆盖金融领域全业务场景。
产品服务介绍:
海致星图的图分析平台底层由AtlasGraph自研图数据库、知识图谱数据仓库和关系图谱挖掘平台构成,具备图数据存储、数据治理、知识图谱本体设计、数据资产管理、图挖掘、可视化图分析等全流程能力。在底层平台之上,海致星图沉淀了大量智能金融业务场景,提供面向应用的金融知识图谱平台。
能力解读:
海致星图的AtlasGraph分布式图数据库产品,基于Rust开发具有优异的数据读写性能,从而满足了用户图分析的业务量越来越多,且对时效性要求也越来越高的需求。同时,AtlasGraph作为自研图数据库,符合部分金融客户对国产化产品的采购要求。
针对银行类客户构建的包含数千亿点边关系的大型图谱,海致星图通过子图切分、属性索引、分布式计算等设计,在图查询和图挖掘等方面实现了高性能,支持实时决策。千亿规模的六度查询可以达到毫秒级响应。
在平台的易用性方面,海致星图通过一键式部署脚本、Cypher封装、WEB界面等方式简化了图结构数据的构建过程;在图挖掘模块把常用业务场景以算法包的形式封装成业务算子;通过“拖拉拽”的图形化界面完成图查询和图分析操作,从而降低了业务人员的使用门槛。
为了实现知识图谱应用的快速落地,海致星图在平台内置了多种典型图挖掘算法,同时也沉淀了大量场景化解决方案,包括集团派系、异常担保形态、信贷资金挪用、信用卡套现、客户贡献度评价、贷后失联修复等。
海致星图在图分析领域具有大量金融业的客户案例和实施经验,能为用户在图谱构建、业务场景的图指标分析、数据权限体系等方面提供专业的咨询服务。
典型客户:
工商银行、建设银行、招商银行、华泰证券、上交所
客户案例:
随着国内零售业务规模的迅速扩大、海量数据分析需求的增加,招商银行信用卡中心慧联项目旨在构建支持卡中心级,多场景应用的图分析平台,支持项目级、部门级、群组级的机构在图平台上自主导入各自的图数据,创建图模型,并在此基础上做图查询、特征指标创建、权限管控等业务操作。
海致星图为招商银行提供的图平台功能包括:用户管理、角色管理、名单管理、数据资源管理、自定义指标、一键发布、图服务发布、可视化查询、离线图查询等功能,并保障用户一站式图信息查询服务。
基于招行卡中心业务系统数据,图平台构建的图谱本体中包含23类实体、17类基础关系、23类明细关系、21类挖掘关系及23类汇总关系。截止2020年12月实体总数40多亿,关系总数500多亿,较2020年数据量提升300%。
明略科技
厂商介绍:
明略科技目前形成了数据中台和知识图谱平台两大产品体系,向包括公安、工业、政府、金融等行业客户提供大数据和人工智能产品和解决方案。
产品服务介绍:
明略科技的知识图谱平台SCOPA是一个一站式的知识图谱平台,覆盖从数据提取、数据建模、图存储到应用等全流程。
能力解读:
SCOPA平台敏捷的产品形态能够简化图分析技术的落地。具体来看,该平台的数据感知层首先通过语音识别、视频提取和图像识别等对企业的业务数据进行初步分析,通过自研的知识数据库“蜂巢”NEST实现数据的存储,再经过图计算挖掘工具(如增强计算等)进行深入分析,最终支撑起搜索服务和预测服务等应用场景。
明略科技的SCOPA平台与应用场景深度结合。明略科技服务过的客户行业分布广泛,包括金融、工业、公安以及电力等,形成了针对这些行业平台搭建的方法论,在数据接入、数据模型搭建、图数据库搭建以及应用场景选择等流程中,能够针对具体的行业给出相应的建设方案。
典型客户:
湖南国网、光大银行等
3.5. 机器学习模型开发
终端用户:
数据科学家,业务人员
核心需求:
机器学习模型开发是指利用机器学习/深度学习算法建立预测性模型,并将模型应用到业务流程中,具体包括数据准备、模型开发、模型管理和模型部署上线等流程。
传统上,企业的机器学习模型主要依赖人工进行,同时在开发流程上是烟囱式开发模式。随着企业智能化应用场景增加与前端业务的快速变化,企业建模需求激增,需要敏捷响应业务需求。为了实现这一目标,企业面临以下两个突出挑战:
机器学习模型构建通常由问题定义、数据收集、特征工程、模型选择、模型训练、模型评估等多个环节组成,每个环节又包含多种路径,以及多组可选参数,依赖人工进行耗时费力,模型从开发到部署上线的周期十分漫长,无法及时响应前端业务的快速变化;
传统的AI模型构建难度大,技术门槛高,通常需要具备专业知识的数据科学家来完成,但大部分企业往往不具备完善的数据团队,因此需要可低门槛使用的数据科学与机器学习平台,面向平民数据科学家和业务人员使用,实现一站式的自助AI建模,降低成本。
厂商能力要求:
能够提供机器学习模型开发平台。该平台需要具备大数据接入能力,并同时具备数据准备、模型开发、模型管理和模型部署上线等完整功能模块;此外,该平台需要具备良好的性能,包括数据计算能力和模型计算能力。
平台的易用性方面,机器学习平台需要能够满足业务人员即非专业平民数据科学家的使用需求,通过拖拉拽的方式即可实现模型开发。针对专业的数据科学家,平台需具备AI增强的能力,能够利用AI技术在数据准备和特征工程等环节中,实现相关流程的自动化。
此外,平台需具备模型快速部署上线的能力。模型快速部署上线即建模人员将模型从开发环境部署到生产环境的便捷程度和速度。机器学习平台需具备API接口,降低模型上线操作难度,实现模型快速上线。开发者能够利用API接口,快速把模型从开发环境部署到生产环境/业务中。
目前大部分机器学习平台仍以本地化部署为主,厂商因此需要具备一定的实施和运维能力。同时,由于模型开发和应用与行业场景的高度结合,厂商提供的机器学习模型平台需内置针对特定行业的模板和特征库。
代表厂商:
(入选标准:客户服务案例在3家及以上)
百分点科技
厂商介绍:
百分点科技成立于2009年,拥有全栈的大数据和人工智能技术产品,包括大数据操作系统(BD-OS)和标签管理系统等基础引擎产品,以及智能审校系统等应用产品,涉及数字城市、应急管理、公共安全、生态环境、媒体出版、零售快消等多个领域。
产品服务介绍:
百分点科技的大数据操作系统(BD-OS)提供机器学习模型开发模块,涉及包括模型开发、模型管理和模型部署等完整的流程,BD-OS能够同时提供针对算法人员和业务人员的AI建模服务。
能力解读:
百分点科技的机器学习模型开发平台与BD-OS的其他模块(如数据标准管理、数据资产管理等)深度耦合,以一站式的思路为客户提供服务。在模型开发的整个环节中,百分点科技的机器学习模型平台一般是利用资产化的数据进行模型开发,在后期的模型管理和部署上线方面能力突出,强调与应用场景深度结合。
百分点科技的机器学习模型开发平台内置了大量封装好的算法模型。基于这些算法模型,同时结合平台提供的自动化建模工具,业务人员可通过拖拉拽的方式,自定义地进行模型开发。
典型客户:
国家市场监管总局、中国铁道科学研究院
观远数据
厂商介绍:
观远数据成立于2016年,公司为泛零售、消费以及互联网领域客户提供智能数据分析与决策(AI+BI)解决方案。提出一整套从敏捷分析(BI)到智能决策(AI)的完整“5A”落地路径方法论,为企业实现从传统BI到智能分析与决策的转型。
产品服务介绍:
观远数据的AI模型实验室Universe-Lab,面向企业提供高效、易用的机器学习与数据挖掘解决方案与技术服务,帮助数据科学家快速创建准确的AI模型,并实现AI模型从训练实验到应用决策的落地,以此解决企业面临的各种商业挑战和发展瓶颈。
能力解读:
观远数据的AI模型实验室提供了针对消费、零售等行业的垂直型机器学习与数据挖掘解决方案,平台内置了销售预测、财务预测、客户流失预测、门店智能诊断、渠道异常诊断、商品关联挖掘等预测模型。同时,AI模型实验室根据业务经验封装特征库、模型库,并通过行业模版沉淀项目经验,加速预测分析的落地。
AI模型实验室将整体工作流可视化,用户可以用拖拉拽的方式处理数据流,并且能实时预览、查看任意数据集内容,从而降低用了户的使用门槛,提高了模型应用效率。
为了使AI模型更加准确和可用,AI模型实验室内置了误差分析看板,能够展示预测精度、溯源误差分析,并导出预测明细;可以追踪过程数据,保留每一次预测过程的全量数据,加速问题排查和定位;为方便数据科学家的使用,集成Notebook,以快速排查线上问题;能够灵活配置数据质量检查规则,有效监控数据质量。
典型客户:
联合利华、百威亚太、沃尔玛、Today、LVMH
海致科技、海致星图
厂商介绍:
海致科技集团,专注数据智能技术创新,依托与清华大学共研的高性能图计算技术,为政府、企业级用户的数字化建设提供大数据分析、图计算、图数据库等产品和技术。
海致星图专注于提供企业级知识图谱产品和服务,深耕金融、能源互联网、工业互联网等垂直行业,自研的知识图谱、图数据库等产品和服务已覆盖金融领域全业务场景。
产品服务介绍:
海致星图的图机器学习平台是一款基于图的一站式机器学习产品,提供了数据加工、特征工程、机器学习模型训练和预测的能力,以及丰富的图网络分析算法。同时,平台内置了丰富的金融、公安领域场景模板,提供一键式的场景构建能力。
能力解读:
图机器学习平台通过可视化的操作界面,把图计算算法和机器学习算法封装成算子,通过拖拉拽方式将若干算子组合形成算法应用场景,实现零代码可视化建模。即便对算法了解不多的用户,也能轻松建模。
图机器学习平台内提供了丰富的特征工程算子、机器学习算子、以及图计算算子等基础类算子,数量达到60多个,其中图计算相关包括节点特征分析、路径分析、子图识别、社区发现、以及图神经网络算子,数量达到30多个;与此同时,平台针对金融行业提供了与业务高度结合的业务算法,如异常担保识别算子、集团派系挖掘算子、实际控制人识别算子、以及资金异常挖掘算子等数十个业务算子。
平台提供了一套完善的自定义算子管理体系,包括算子上传发布、版本管理、算子共享、算子下线、以及算子导入导出等功能。用户可根据业务需求定制化开发算子,通过上传,、发布成自定义算子,同时也可以直接使用他人共享的算子。
为了实现算法应用场景快速搭建,图机器学习平台内置了数十个金融、公安领域算法场景模板,包括风险传导模板、资金圈挖掘模板、欺诈团伙识别模板、潜在客户挖掘模板、涉毒团伙挖掘模板等。用户只需要选择模版、修改输入输出即可完成算法场景搭建工作。
典型客户:
建设银行,招商银行信用卡中心,台州银行
九章云极DataCanvas
厂商介绍:
九章云极成立于2013年,专注于自动化数据科学平台的持续开发与建设,提供自动化机器学习分析和实时计算能力,包括DataCanvas APS机器学习平台和DataCanvas RT实时决策中心等系列产品,着重为数据科学家、AI从业者提供一整套开发平台。
产品服务介绍:
DataCanvas APS是一个机器学习建模平台,面向数据科学家、应用程序开发人员和业务专家,提供一套工具,使不同角色的人员可以相互协作,轻松地处理数据并使用这些数据来大规模构建、训练和部署模型。
能力解读:
DataCanvas APS是一个端到端的机器学习平台,为数据科学家、应用程序开发人员和业务专家提供一站式模型开发服务。DataCanvas APS提供“四库”加速行业应用,包括特征仓库、算子仓库、场景仓库和AutoML仓库。特征仓库提供统一的特征工程能力;算字仓库提供机器学习、深度学习的算法;场景仓库解决场景化、知识迁移问题;AutoML仓库则沉淀行业知识,降低对数据科学知识和技术的依赖。DataCanvas APS机器学习平台由主流开源机器学习框架整合集成,算子代码对用户开源,允许用户进行优化和自定义,并开放产品功能接口,能够赋能企业客户搭建起自主的AI能力。
DataCanvas APS强化了模型管理和运维的能力设计。针对当前企业不同类型业务模型大量产生管理和运维困难的情况,DataCanvas APS能够提供统一标准的模型生产化能力,包括模型上线、模型下线、模型部署以及模型监控等。
九章云极DataCanvas长期服务于金融行业,尤其在银行领域积累了大量的行业和项目经验,DataCanvas APS服务客户覆盖大型国有商业银行、股份制银行、城市商业银行和农村商业银行。凭借着多年积累的产品和平台能力,DataCanvas APS目前正全力拓展非金融领域客户,包括运营商、能源和制造业等。
典型客户:
浦发银行、中国工商银行、青岛检察院、中原银行、海信集团等
力维智联
厂商介绍:
力维智联成立于2005年,是一家AIoT产品与解决方案提供商,专注于泛在连接与数据智能技术创新与产品研发,聚焦“新基建”和“企业与城市的数字化转型”,通过AIoT科技产品和5G智能运维、智能城市、智慧能源解决方案赋能电信、城市、能源、大企业等行业客户的数字化转型。
产品服务介绍:
力维智联Sentosa零代码数据建模与分析平台,向下封装了人工智能、大数据、知识图谱等近200种算子,可以实现零代码拖拽式建模与分析,将大数据机器学习模型开发周期压缩80%以上。同时,该平台还具备协同开发、项目管理、数据与服务共享、机器学习应用搭建的功能,能够面向团队开发者提供一站式AI开发能力。
能力解读:
Sentosa封装了人工智能、知识图谱和数理统计等近200种算子,该平台内置的自动化组件能够将特征工程、模型选择和模型调参等工作算子化、自动化。基于该平台,业务人员或者行业专家通过拖拉拽的形式即可实现模型搭建,无需通过写代码实现,大大降低了数据挖掘和机器学习应用的门槛。
Sentosa平台不仅加速了企业数据智能产品和服务的开发迭代,也可助力传统企业开展数据分析与决策,提升企业经营效率。目前已在南方电网电力系统仿真模拟科研云平台、上海辞书出版社智能识别系统等项目中落地应用。
此外,力维智联基于Sentosa平台向其深耕的电信、能源和城市等行业用户提供针对具体场景的Al服务。在这一过程中,力维智联积累了大量行业规则和算法模板,并沉淀于Sentosa。
Sentosa部署方式灵活,支持本地部署,以及私有云、公有云和混合云三种云端部署模式。作为一种创新的部署模式,混合云的部署模式能为客户提供更好的安全性,针对业务涉及的敏感内容,可通过由企业完全控制的私有云系统来处理,而模型精度的提升、数据应用的发布共享则通过公有云实现。
典型客户:
上海辞书出版社
客户案例:
作为上海辞书出版社的数字化合作伙伴,力维智联通过Sentosa零代码数据建模与分析平台的一站式机器学习建模服务、NLP(自然语言处理技术)、文本挖掘和深度学习等技术,助力《辞海》网络版百科条目等版块的知识编纂模式,从人工到人机协同生产方式转变,整合形成了《人物志》、《地方志》、《万国志》等知识专题,并为所有的百科条目增加“推荐阅读”和“延伸阅读”,便于读者更全面地了解条目相关知识。同时,根据推荐词条和延伸词条智能生成的“知识导图”,立体化呈现词条间关系,方便用户进行内容拓展和知识发现。
作为出版行业数字化转型的赋能者,力维智联积极助力探索我国辞书信息化的发展路径,助推传统辞书向融媒辞书方向发展,为提升国家文化软实力、建设社会主义文化强国作出贡献。
同盾科技
厂商介绍:
同盾科技以人工智能、云计算、大数据三大核心技术体系为基础,基于对数据的探索洞察和理解,将机器学习、联邦学习、知识图谱等领先技术与业务场景融合,为金融、保险、互联网、政务、零售、物流等行业提供智能分析与决策服务。
产品服务介绍:
同盾科技的明模平台是一个功能齐全的模型开发和管理平台,覆盖从模型开发、模型部署上线以及模型管理和模型监控等模型全生命周期。
能力解读:
同盾科技长期服务于金融行业(尤其是银行业),沉淀了大量关于该行业的建模方法论,能够基于开源算法,通过模型开发、模型管理和模型部署等过程,快速将算法应用于实际的工作场景中。明模平台支持的典型的应用模型包括评分卡模型、基于规则的决策树模型等。
明模平台易用性较好。针对平民数据科学家(如银行风险部门分析师),该平台提供通过可视化自动化建模工具,通过拖拉拽的形式即可实现模型快速搭建;针对专业的数据分析师,明模平台支持写代码为主的专业建模方式。在模型部署上线方面,相比传统API方式下,实时预测和批量预测分开进行导致部署上线过程复杂,明模平台同时支持实时预测和批量预测,能够实现模型的快速部署上线。
针对银行客户,同盾科技的明模平台具备较好的模型管理能力。明模平台的模型管理包括三大核心模块:模型资产管理、模型标准管理和模型监控体系。明模平台能够通过文档化管理实现模型集中管理;通过工作流模块实现模型标准化;能够基于成熟的方法论持续对模型进行监控,帮助银行规避系统性风险。
典型客户:
建设银行、中银消金
元年科技
厂商介绍:
元年科技是一家具有丰富的财务管理、业务运营和行业经验的企业数字化转型软件商和服务商,提供技术中台、业务中台、数据中台的规划咨询、软件平台和实施运营服务,服务过上千家大型企业集团。
产品服务介绍:
元年科技的AI中台是一个功能完整的机器学习建模平台,涉及模型开发、模型管理和模型部署上线等模型全生命周期过程。元年AI中台提供同时面向业务人员和算法专业人员的建模服务:无代码建模和Jupyter建模。
能力解读:
元年的AI中台易用性良好。面向业务人员提供无代码建模服务时,元年的AI中台将数据预处理、特征编码、模型发布和API注册等工作自动化,基于这一平台,业务人员通过选定平台中配置好的数据集,以“向导“的方式就能够自动化的进行建模,大大降低企业模型开发的门槛。同时,元年的AI中台配置大量专门的解释模型算法,通过将模型结果与这些解释模型算法结合,可展示生成算法结果的过程,为算法决策提供依据。
元年多年在业财税和管理会计领域积累了丰富的行业知识和经验,沉淀了大量行业的方法论。基于这些知识和方法论,元年在AI中台封装了大量的组件,如文本分类和情感分析等基础组件、商品名提取和商品规则提取等领域组件。用户在使用元年的AI中台进行建模的过程中可调用这些封装好的组件,应用于BI商业智能和销量预测等应用场景。
典型客户:
科大讯飞
3.6. 隐私计算
终端用户:
业务部门,数据部门
核心需求:
隐私计算是指通过多种技术手段实现数据“可用不可见”,即原始数据不暴露,数据使用方只得到数据计算结果,从而实现数据隐私保护。
企业越来越多的业务场景需要多方数据流通和共享,才能释放数据更大的价值。然而各类数据源往往非常分散,数据的获取、存储、传输、共享等环节缺乏交互标准;与此同时,数据互通互联的成本通常比较高,数据可信度较低。数据使用者需要经济且可靠的方式将分散的数据协同起来并应用。
数据往往包含数据所有者内部的隐私数据等敏感信息,出于数据资产保护和监管合规等诉求,需要在数据使用过程中保护数据的隐私,做到只输出数据价值,不输出数据本身。
厂商能力要求:
厂商需要能够基于联邦学习、多方安全计算MPC、同态加密、安全沙箱计算/TEE等多种技术,满足数据查询、联合计算、联合建模等场景的隐私计算需求,保证数据隐私不被泄露的安全性。
厂商需要能够提供企业级的隐私计算平台产品,具备一定的易用性,并能够结合具体业务场景,为企业提供隐私计算解决方案的设计和运营落地能力。
代表厂商:
(入选标准:客户服务案例在1家及以上)
富数科技
厂商介绍:
富数科技成立于2016年,专注于联邦学习、安全多方计算、匿踪查询等加密计算科技领域,自主研发了安全计算平台 Avatar,已合作50多家企业,包括金融、政府、运营商、电力等行业。
产品服务介绍:
富数科技的安全计算平台Avatar是一个一站式企业级多方安全计算平台,集成隐私集合求交、多方安全计算、联邦学习、隐私信息检索等技术,提供企业级的数据安全匹配、安全联合计算、安全联合建模、安全查询等跨机构间可信数据协作能力。
能力解读:
富数科技在隐私计算领域具备较强的自主技术研发能力,例如,技术能力覆盖MPC、联邦学习和TEE可信执行环境等;能通过底层算法自研优化计算性能;支持无可信第三方的安全算法,安全性高;支持与其他隐私计算平台的异构互联互通。富数科技深度参与IEEE、中国信通院、信安标委、央行金标委、北京金融科技产业联盟等隐私计算领域众多标准与协议制定。
富数科技的安全计算平台Avatar满足企业级应用要求,集成了多种隐私计算技术,可以通过本地化部署交付,支持联合建模、联合计算等多种应用场景。易用性方面,Avatar支持拖拉拽方式建模,降低用户使用门槛,并提供可视化的安全驾驶舱,提升用户运营能力。
在隐私计算的应用落地方面,富数科技在金融、运营商、政务等行业已有头部客户案例,已合作超过50家企业,通过与头部企业用户的标杆项目探索验证,积累了在智能风控、安全合规营销等隐私计算场景化解决方案的落地能力。
典型客户:
交通银行、中国移动、中国电信、广州金控
同盾科技
厂商介绍:
同盾科技以人工智能、云计算、大数据三大核心技术体系为基础,基于对数据的探索洞察和理解,将机器学习、联邦学习、知识图谱等领先技术与业务场景融合,为金融、保险、互联网、政务、零售、物流等行业提供智能分析与决策服务。
产品服务介绍:
同盾科技的知识联邦技术体系支持从信息层、模型层、认知层和知识层四个层级进行联邦,将散落在不同机构或个人的数据联合起来转换成有价值的知识,同时在联合过程中采用安全协议来保护数据隐私,以实现数据可用不可见。
能力解读:
知识联邦技术从信息层、模型层、认知层、知识层四个层面来实现知识共创和共享。信息层通过安全多方计算在密文空间上直接进行计算或学习,进而提取或发现知识;模型层联邦与传统的联邦学习相似,基于模型加密交互共创知识,并实现知识共享;认知层对同/异构数据进行认知学习之后进行集成或多模态融合,进而生成复杂的知识网络;知识层对分布的知识进一步学习提炼,实现基于知识的表达推理及智能决策。目前同盾知识联邦技术已经在多家金融机构开始试点,包括多头共贷、智能风控、反欺诈、企业征信等。
同盾打造了一套全新的轻量级联邦通信框架——离子键。离子键作为联邦通信框架,是联邦参与方之间相互同连通的唯一出入口,负责所有数据的发送和接收,具备云原生的架构设计、轻量级和高性能以及开发者友好等特性。离子键联邦通信框架技术可以大大提升联邦算法的性能,与开源框架比较,联邦模型训练时间可压缩至原来的六分之一,并能大幅减少服务器资源需求,降低联邦平台部署时间,进而提升联邦平台的交付速度。
典型客户:
国寿财险
3.7. 数据库管理
终端用户:
数据库管理员
核心需求:
数据库管理是指通过平台化的产品和工具整合多种类型数据库资源,将数据库的管理、运维、审核、安全管控等工作从传统的手工分散模式,转变为对数据库资源统一和精细化地管理模式。
随着企业数字化的深入,越来越多的开源和国产数据被部署在企业的生产环境中。一方面,企业IT系统中的数据库数量变得繁多,增加了数据库管理、运维等工作的复杂性;另一方面,由于开源和国产数据库周边的工具和服务相对缺失,企业的数据库管理需求不能得到很好地满足。
IT体系的变化,如分布式数据库的广泛采用使得企业数据存储和计算的节点数迅速增加;同时,云计算的普及使得数据库的运行环境从物理主机转变为各种虚拟化、私有云、公有云甚至容器,带来了数据库管理的复杂性。这些变化也为数据库的管理带来了新的挑战。
数字化转型背景下,企业对数据处理的敏捷性、安全性和可用性提出了更高的要求,这些要求需要更完善的数据库管理和运维能力来支撑。
厂商能力要求:
厂商需要能够提供平台化、一体化的数据库管理平台产品和解决方案,并满足以下要求:
能够提供多基础设施的整合能力,将多种类型的数据库纳入管理的范围,并将所有零散的数据库工具整合起来为企业提供统一服务,从而降低系统复杂性,避免重复实施建设、提高运行效率。
能够提供平台化的工具覆盖数据库全生命周期,提供监控、性能分析、巡检、审核、运维、安装部署、变更、SQL执行、数据迁移、安全管控等众多功能模块。
能够将数据库的运维流程、运维规范等流程制度标准化,并为企业建立完善的数据库管理体系,从而可以让数据库运维更加精细、风险更低、效率更高。
能够通过AI技术将部署、巡检、数据采集、审核等流程自动化或半自动化,减少重复的人力劳动;同时在问题分析、监控预警等方面实现智能化,让机器能够在海量的监控指标中发现人力难以发现的深层次问题,并实现自动故障诊断和一键故障处理等能力。
代表厂商:
(入选标准:客户服务案例在3家及以上)
新数科技
厂商介绍:
ShinData新数科技成立于2014年,是一家数据库管理软件创新企业,产品体系包括dbPaaS数据库云管理平台、数据迁移传输、数据库安全管控以及分布式数据库等多种产品及解决方案。服务于金融、制造、能源、零售和通信等行业客户。
产品服务介绍:
新数科技为用户提供统一和平台化的数据库管理解决方案,产品系列包括由包含资源交付DBaaS、性能容量分析和监测、智能运维AIOps等构成的统一数据库云管理平台DMP,以及数据传输平台DTS和数据库安全管控平台DSC。产品支持云上类SaaS化和私有化两种部署模式。
能力解读:
新数科技的数据库云管理平台DMP软件对多种类数据库提供了从安装部署、监控告警、性能分析、智能巡检到智能运维的全生命周期的管理能力,帮企业建立起完整的数据库管理平台,使得用户能够通过平台来规范操作,并提升运维效率,建立起数据库层面自动化、智能化运维的框架基础。同时,其产品体系采用微服务架构,能够将所有功能模块化,支持用户灵活使用。
数据传输平台DTS能够实现从多种数据库不同平台之间的异构迁移和数据传输,包括数据库对象迁移、数据迁移、数据同步以及辅助应用迁移的功能,解决了数据库多样化共存和更迭期的用户痛点。
数据库安全管控平台DSC覆盖权限管理、SQL执行、审核审计、加密脱敏份等多种安全管控需求,提升了数据运行的安全性,防范误操作和道德风险。
新数科技给用户提供了一个PaaS平台级的成熟开发框架,具有很强的扩展性,用户可以在平台上根据需要自行添加定制监测指标、取数逻辑、运维流程和可视化页面展现等;AI和大数据分析技术的深度应用,实现了数据库变更运维、巡检报表等方面的自动化,以及性能容量分析、问题诊断和故障自愈等方面的智能化。
典型客户:
招商银行、泰康人寿、广汽本田
客户案例:
某大型股份制商业银行在生产环境运行着数千套数据库,数据库种类从成熟的商业数据库产品逐步转向开源数据库、国产数据库。数据库运行环境和架构也越来越丰富,从物理服务器加共享存储转变为各种虚拟化甚至容器化环境;从基于共享存储的双机互备高可用架构,发展为双活数据中心、两地三中心、读写分离、分库分表等架构方式。数据库运维的挑战越来越大。
新数科技与该银行合作,经过近3年的持续建设,为其搭建了一套标准化、自动化、集中化、智能化的统一数据库管理平台。
通过搭建和运营数据库管理平台,该银行建立了完善的数据库性能容量分析和问题管理体系,发现和跟踪解决各类问题;建立起面向开发、测试和运维人员的自助式平台,有效提升数据库相关代码开发质量;提高了软硬件资源的利用效率,加快交付,同时降低了无效占用;与企业内部整体IT管理运维和安全管控系统整合,让数据库不再成为孤岛。
4.入选厂商列表
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )