技术需求
2024-10-18
技术需求简介:
1. 重点描述企业需要解决的问题及主要技术指标、配套条件: l 需要解决的问题: 设计一种基于数据湖的数字对象存储的研究与开发。 主要技术指标: 面向数据的体系结构DOA系统其包括:数据资源池,包括多个数据管理模块,用于对数据进行存储;管理中心,包括接口管理模块和多个数据接口,每个数据接口对应一个数据管理模块;接口管理模块用于面向数据管理模块配置相应的数据接口,并且根据数据请求信息得到被请求数据的路由信息;数据请求信息中包括发起数据请求信息的应用的属性信息;数据接口用于,根据路由信息获取存储在数据管理模块中的被请求数据,并根据属性信息对被请求数据进行编译处理,得到应用支持的数据结构的数据;DOA资源总线,通过数据接口与数据管理模块相连接,用于将所述编译处理得到的数据传输到应用。 1):组织DOA架构,DOA架构包括信息资源以及抽象封装后的数字对象DO,其中数字对象DO通过协议与核心构件连接; 2):引入数据湖,将数据湖作为DOA架构的数字对象仓库;在上述的一种基于数据湖的数字对象存储方法中,在上述的一种基于数据湖的数字对象存储方法中,中的数字对象DO包括标识ID、元数据MetaData以及数据本体DATA; 3):输出基于数据湖的DOA架构, 通过在DOA架构内引入数据湖的概念,将其作为架构中的数字对象仓库,为横跨多个系统的数据应用提供一种可能,从而提高大数据治理的能力; 4):数字对象在数据湖内进行抽象封装、CRUD以及元数据管理,在上述的一种基于数据湖的数字对象存储方法中的核心构件包括标识解析系统IRS、数字对象仓库系统Repository以及数字对象注册表系统Registry。 5):将数据湖作为架构中的数字对象仓库,为横跨多个系统的数据应用提供一种可能,提高大数据治理的能力;集中化存储数字对象仓库内海量的、多来源,多种类的数字对象,包括结构化或者非结构化;面向大数据方向,并支持对数字对象数据进行快速加工和分析,提供ACID事务能力,兼容Spark等上层业务,可以借助各种分析引擎做进一步的商业报表分析、流式计算以及AI分析。 需求应用范围及应用场景: 基于数据湖的数字对象存储场景
联系人:范老师