根据业务发展需要,按照宁波银行股份有限公司采购相关管理办法,我行拟对《大数据血缘工具项目》面向社会公开征集供应商,诚邀符合条件的供应商参与方案洽谈。
一、资质要求
1、注册资金人民币200万元(含)以上,财务状况良好;
2、公司经营正常并存续2年(含)以上;
3、企业或者其法人近两年内无行贿犯罪记录,未被列入失信执行人名单,无限制高消费、限制出入境等行为;
4、公司具备完善的组织架构和制度规范,拥有充足的技术、人员和设备资源;
5、同一法定代表人的两个及两个以上法人、母公司、全资子公司及其控股公司不得在同一次项目中参加报名;
6、参与报名的供应商能作为签约主体参与后期的商务流程;
7、设备和产品应满足《网络安全法》等法律法规要求;
8、报名供应商应符合宁波银行供应商管理相关要求;
9、如报名供应商为首次与我行合作供应商,请按附件格式提供“供应商尽职调查报告”。
二、技术要求
1、产品有合作案例或项目经验(仅限原厂,有银行或金融行业案例更优),并提供项目合同等证明材料(开具发票证明)。
2、平台能够提供非结构化数据从数据接入、预处理、数据存储、数据管理等能力,并提供安全保障。
3、需适配行内技术平台,满足我行非功能性需求(高可用、高性能、安全性等)。
4、产品软件的性能、响应和异常等指标符合用户体验基础要求。
5、提供软件原厂标准服务(支持内网私有化部署);
6、提供原厂7X24小时(含节假日)电话支持和相关技术咨询服务(项目实施、售后服务等);
7、提供软件补丁安装及版本升级服务。
8、产品需参与我行现场POC 测试。
三、报名方式及起始时间
请符合条件的供应商在 2026 年 3 月 21 日之前,通过报名链接“点击报名”方式进行报名,报名链接如下:https://cpms.nbcb.com.cn/cpms/ananymous/cms/,并按要求填写相关报名材料。
四、联系方式
联系人: 张学辉0574-83050673 (采购部)
聂煊赫 0574-87270603 (业务部)
范志毅 0574-81851614 (业务部)
大数据血缘工具 项目主要需求概述
⼀、项⽬⽬标
1. ⾎缘覆盖⽬标:建⽴全链路数据⾎缘管理能⼒,覆盖Hive、Spark、Impala、Hetu(presto)等主流⼤数据组件,重点⽀撑华为MRS信创环境,兼容现有CDP平台。
2. ⾎缘精度⽬标:达到字段级⾎缘解析能⼒,⽀持复杂SQL逻辑解析,准确识别字段级别的数据流向与变换关系。
3. 应⽤能⼒⽬标:基于⾎缘关系构建数据地图、影响分析、故障溯源等核⼼应⽤场景,实现数据链路清晰可查、数据资产有效盘活。
4. 平台能⼒⽬标:具备⾼可⽤、可扩展的架构设计,能够⽀撑企业级⾎缘管理规模,确保⾎缘采集、解析、查询各环节稳定⾼效。
⼆、核⼼需求
(⼀)⾎缘采集与解析需求
1. 多源数据接⼊能⼒
重点⽀持MRS信创环境下各组件⾎缘采集:
计算引擎:Spark SQL、Hive SQL、Hetu SQL(华为版presto)
调度⼯具:按⾏内实际调度⼯具适配
兼容⽀持CDP平台⾎缘采集(Hive SQL、Impala SQL)
⽀持被动采集与主动解析两种模式:
被动采集:通过监听⽇志、解析任务历史获取⾎缘
主动解析:⽀持SQL语句、执⾏⽇志、脚本等解析⽣成⾎缘
2. 全链路⾎缘识别能⼒
⽀持跨任务、跨组件的数据流向串联,形成完整⾎缘图谱
识别ETL过程、数据复制、数据加⼯等各类数据流动场景
⽀持⾃定义⾎缘关系补充:对于⽆法通过⾃动解析获取的⾎缘关系(如存储过程、⼈⼯数据同步、离线脚本等),提供⼿动配置和补充录⼊功能,⽀持通过可视化界⾯或API⽅式⾃定义添加上下游⾎缘关系,确保⾎缘图谱的完整性
3. 字段级与算⼦级⾎缘解析能⼒
⽀持复杂SQL语法解析,包括但不限于:
l 多级⼦查询、Join关联、Union合并
l 窗⼝函数、UDF⾃定义函数
l 临时表识别
l 表达式计算、类型转换、条件分⽀
l 识别字段级别的数据映射与变换规则,精确到每个字段的加⼯逻辑
l ⽀持算⼦级⾎缘解析:能够解析SQL执⾏计划中的算⼦级别数据流向,提供⽐传统⾎缘⼯具更⾼的解析精度
4. 批量处理与历史回溯能⼒
⽀持批量SQL解析,满⾜⼤批量任务的⾎缘采集需求
⽀持历史任务回溯解析,可对指定时间范围内的历史任务批量补采⾎缘
⾎缘解析引擎具备⾼吞吐处理能⼒,能够⽀撑企业级任务规模
5. ⾎缘解析质量监控
提供⾎缘解析报告:每次批量解析任务完成后,⾃动⽣成解析质量报告,清晰展⽰:
l 解析成功率、失败SQL数量及列表
l 解析失败的SQL⽚段及失败原因(如语法不兼容、UDF⽆法识别等)
l 部分解析成功的SQL及缺失的⾎缘关系说明
l ⽀持解析失败告警:当解析失败率超过设定阈值时,⾃动触发告警通知
l 提供解析⽇志详情:⽀持查看每条SQL的解析过程⽇志,便于定位解析问题
l ⽀持⼈⼯标记与⼲预:对解析失败的SQL,⽀持⼈⼯标记⾎缘关系或补充解析规则,逐步提升解析覆盖率
(⼆)⾎缘存储与展⽰需求
1. ⾎缘数据模型
建⽴标准的⾎缘元数据模型,⽀持节点(表/字段/任务)与边(数据流向)的灵活存储
⽀持版本管理:记录数据表结构变更、任务逻辑变更对⾎缘的影响
⽀持多维度标签:对任务/表/字段打标(如:核⼼资产、敏感数据、冗余数据等)
2. ⾎缘可视化展⽰
提供交互式⾎缘图谱:
l ⽀持表级、字段级⾎缘⼀键切换展⽰
l ⽀持上下游展开/收起、路径⾼亮、节点搜索定位
l ⽀持直接/间接⾎缘关系切换、⾎缘裁剪
l ⽀持⾎缘链路导出为图⽚/JSON格式
提供数据地图视图:
l 按业务域、数据分层(ODS/DWD/DWS/ADS)展⽰数据资产及⾎缘关系
l ⽀持查看表的字段详情、产出任务、依赖关系
l ⽀持按定制模板导出⾎缘影响关系:可根据⽤⼾⾃定义的模板格式,批量导出⾎缘链路及影响范围数据,便于线下分析、归档或报送
(三)⾎缘应⽤需求
1. 数据影响分析
上游影响分析:某表/字段变更,可快速追踪下游受影响任务、报表、应⽤接⼝
下游溯源分析:某数据异常,可追溯其上游来源及加⼯链路
⽀持⼆次开发扩展:提供标准API及扩展接⼝,⽀持⾏内根据实际业务需求进⾏⼆次开发,如将⾎缘影响关系嵌⼊到现有数据研发平台、调度系统或变更管理流程中,实现变更影响⾃检、发布前影响评估等定制化功能
2. 故障定位与诊断
能⼒维度 具体要求:
l ⾎缘解析能⼒:⽀持字段级+算⼦级⾎缘解析,复杂SQL解析准确率⾼,提供解析质量报告
l ⾎缘采集能⼒:⽀持主流⼤数据组件,采集延迟低,不影响业务正常运⾏
l ⾎缘查询能⼒:⾎缘图谱查询响应快速,⽀持⼤规模节点下的流畅交互
l 平台扩展能⼒:⽀持⽔平扩展,能够随业务增⻓平滑扩容
l 平台可⽤性:⽀持⾼可⽤部署,具备故障⾃动恢复能⼒
l 信创适配能⼒:全⾯适配MRS信创环境,通过信创兼容性测试
l ⼆次开发能⼒:提供标准API及扩展接⼝,⽀持⾏内根据需求进⾏⼆次开发
l 结合任务运⾏⽇志与⾎缘关系,⽀持数据质量问题快速溯源
l 识别断链⾎缘:数据链路中断、任务未正常产出等情况⾃动告警
l ⽀持异常传播分析:某上游表数据延迟,可⾃动分析影响的下游任务范围
3. 开放集成能⼒
l 提供标准REST API,供外部系统(数据地图、数据质量平台、数据治理平台、调度系统等)调⽤⾎缘数据
l ⽀持Webhook回调:⾎缘变更、断链检测等事件可推送给第三⽅系统
l ⽀持⾎缘数据批量导出,便于与其他数据研发管控平台对接,⽀撑更上层的数据治理应⽤
l 具备良好的可扩展性,能够为数据治理、开发辅助等场景提供基础能⼒⽀持
(四)平台管理与集成需求
1. 权限管理
对接⾏内统⼀认证与权限体系(LDAP/AD)
⽀持多级权限控制:功能权限、数据权限(按业务域/项⽬组隔离)
2. 监控与告警
监控⾎缘采集任务运⾏状态,采集失败⾃动告警
⽀持⾎缘链路健康度监控:识别⻓期⽆更新的表、⽆下游依赖的孤⽴节点
对接⾏内告警平台,⽀持⾎缘异常事件推送
3. 平台可维护性
提供可视化的平台管理界⾯,⽀持⾎缘采集任务配置、监控、运维
⽀持集群化部署,具备⾼可⽤能⼒
提供完善的⽇志体系,便于问题排查
三、项⽬实施要求
1. 交付成果
完整的数据⾎缘管理平台(包含采集、解析、存储、展⽰、应⽤模块)
与MRS平台(含信创环境)的完整对接⽅案与实施⽂档
与CDP平台的兼容对接⽅案(作为辅助)
⾎缘数据模型设计⽂档、API接⼝⽂档
信创适配性测试报告
2. 服务要求
提供源码级技术⽀持,⽀持⼆次开发与定制需求
提供⾎缘规则梳理服务:协助梳理核⼼业务链路、配置⾎缘采集规则
提供知识转移与培训:⾯向开发、数据治理⼈员开展⾎缘平台使⽤培训
提供原⼚质保服务,质保期内免费升级与技术⽀持
3. 信创适配要求
全⾯适配MRS信创环境
⽀持信创环境下各⼤数据组件版本
提供信创适配性测试报告,确保在信创环境下稳定运⾏
四、验收标准
1. 功能验收
⽀持MRS平台主流组件⾎缘采集,字段级⾎缘解析能⼒达标
⽀持影响分析、故障溯源等核⼼应⽤场景
⽀持⾃定义⾎缘关系补充功能
⽀持⾎缘解析质量报告及解析失败告警
⽀持定制模板导出⾎缘影响关系
可视化展⽰满⾜交互式⾎缘图谱、数据地图要求
2. 能⼒验收
⾎缘解析准确率、采集延迟、查询响应等满⾜企业级使⽤要求
平台具备良好的扩展性与可⽤性
API接⼝满⾜⼆次开发需求
3. ⽂档验收
提供完整的部署、配置、使⽤、⼆次开发⽂档
提供信创适配测试报告、验收测试报告
五、项⽬预期收益
1. 数据资产可视化:将原本⿊盒的数据加⼯链路清晰呈现,使数据流向可查、可追溯,盘活沉睡的数据资产。
2. 链路清晰可管理:建⽴完整的数据⾎缘图谱,让数据开发、运维、治理⼈员对数据链路⼀⽬了然。
3. 变更⻛险可控:数据表或任务变更前,可快速评估影响范围,降低变更引发的⽣产⻛险。
4. 问题溯源有依据:数据出现异常时,可沿着⾎缘链路快速定位问题源头,减少排查时间。
5. 信创能⼒补全:填补MRS信创环境下的⾎缘管理空⽩,确保信创改造过程中数据链路不中断、⾎缘不断链。
6. 数据治理基础夯实:为后续数据治理、数据质量、数据合规等场景提供基础的⾎缘能⼒⽀撑。
7. ⾎缘质量可⻅:通过解析质量报告,清晰掌握⾎缘覆盖盲区,持续优化解析能⼒,提升⾎缘数据可信度。
附件:
宁波银行信息科技服务提供商尽职调查报告
一、基本信息
1.1服务提供商基本信息
服务提供商全称 |
|
成立日期 |
| 法人代表 |
|
公司类型 |
| 注册资本&币种 |
|
统一社会信用代码 |
|
公司地址 |
|
联系人 |
| 联系人电话 |
|
公司主营业务 |
|
1.2监管评价
(是否出现在监管机构的黑名单中)
(最近二年在政府或金融同业合作过程中是否受到处罚)
(是否存在未决诉讼)
1.3关联公司或附属机构信息
(关联公司或附属机构是否存在经营危机,该危机是否危及该服务提供商的正常经营)
1.4主要客户清单列表
(主要客户群体)
二、服务提供商持续经营能力
2.1财务情况
(近三年经审计的财务报表)
三、服务提供商内部控制和管理能力
3.1服务提供商内控评估报告
(评估报告内容如覆盖以下3.2-3.6内容,则将评估报告内容对应填写至各个部分)
3.2服务提供商的组织结构
(内部控制部门,如是否建立了内部的使用工具的安全测试部门、内控部门、审计部门)
3.3 IT制度体系建设
(是否对其公司及项目的安全管理及流程管理建立了相应的制度)
(项目过程中的项目管理(PMO)体系,包括例会、沟通渠道等)
(服务质量控制方法)
3.4培训体系建设
(是否对其员工定期开展技术技能以及安全防范相关的培训,提供培训计划或培训材料)
3.5服务提供商人员离职率
(了解公司技术人员的离职率)
3.6IT风险管控
(包括对公司本身的IT风险管控及所承接外包项目的IT风险管控情况)
四、服务提供商信息技术能力
4.1服务能力和支持技术
(服务提供商的技术能力资质证明,专业认证等)
(描述使用的工作方法、应用软件、技术文档、评估模型、评估工具等使用情况、知识产权等)
4.2服务经验与市场评价
(服务提供商主要的服务行业、主营业务、服务客户)
(类似的服务项目经验及项目合同证明材料)
五、服务提供商的网络和信息安全保障能力
(该项评估内容用于非驻场信息科技外包)
(描述内容可包括网络与信息安全管理体系建设情况、网络与信息安全技术防护体系建设情况、安全事件响应和恢复能力、实践经验等)