数据分析安全 数据本身其实并不具备任何价值,但是数据的价值大小完全取决于数据挖掘的投入,或者说数据的分析,如果投入越大那么所发现的价值也就越大,与此同时暴露出来的安
数据分析安全
- 数据本身其实并不具备任何价值,但是数据的价值大小完全取决于数据挖掘的投入,或者说数据的分析,如果投入越大那么所发现的价值也就越大,与此同时暴露出来的安全风险也在增大,所以为了防止在数据分析过程中可能会出现的数据泄露和数据篡改等安全问题,就需要对数据分析的过程进行安全管理。
建立负责数据分析安全的职能部门
- 为公司提供必要的数据分析技术支持。
- 为公司制定整体的数据分析安全方案和相关制度。
- 数据分析安全管理部门为公司定义数据的获取方式,授权机制,数据使用等内容。
- 明确使用哪些数据分析工具,以及相应工具的规范使用方法。
- 数据分析安全管理部门针对数据分析结果建立审核机制,针对数据分析过程中的审计机制,确保数据分析结果的可用性和数据分析事件的可追溯性。
明确数据分析安全岗位的能力要求
- 具备良好的数据安全风险意识。
- 熟悉国家网络安全和数据安全法法律法规以及组织机构所属行业的政策和监管要求。
- 相关的管理人员还需要具备一定的数据分析安全管理经验。
- 具备良好的数据分析专业知识基础。
- 熟悉常见的数据分析流程和主流的数据分析工具。
- 结合业界标准和合规要求,对在进行大数据分析中可能引发的数据聚合的安全风险进行有效的评估和预防,并制定相应的数据分析安全解决方案。
- 数据分析安全岗位的技术人员
- 具备良好的数据分析安全风险意识。
- 熟悉相关的法律法规及政策要求。
- 熟悉主流厂商的典型数据分析方案。
- 熟悉主流数据分析工具的使用方法。
- 熟练掌握至少一门编程语言,至少拥有一年以上的数据分析实践经验。
- 熟悉公司内部应用场景和外部业务需求,能够快速有效地执行由数据分析安全部门输出的定制化数据分析方案,并保障数据质量。
- 数据分析安全技术人员应具备一定的日志分析能力和应急响应能力。
- 防止突发或意外情况,能够根据日志记录对分析结果进行及时溯源,以保障分析结果的完整性和可用性。
数据分析安全岗位的建设与人员能力的评估方法
- 通过内部审计和外部审计等形式以调研访谈,问卷调查,流程观察,文件调阅,技术检测等多种方式实现。
- 1.调研访谈
- 主要包含对数据分析安全部门管理人员和技术人员的访谈两部分。
- 数据分析安全部门管理人员
- 确认其在制定数据分析安全原则。
- 规定标准的数据分析工具。
- 限制数据分析工具的使用范围。
- 制定数据分析结果的审核机制。
- 对数据分析过程中所涉及的活动进行风险评估等方面确认其是否符合相关法律规定。
- 是否具备足够的能力以胜任该职业。
- 确认管理人员是否明确定义了数据分析过程中的重要指标,如:数据获取方式,访问接口,授权机制等。
- 是否明确了数据分析工具中所使用的算法。
- 是否对算法的变更提供了必要的风险评估支持。
- 是否采取了必要的技术手段和管控措施以保证分析结果不会泄露敏感信息。
- 是否明确规定了数据分析实施人员不能将分析的结果数据用于授权范围之外的任何情境中。
- 数据分析安全部门技术人员
- 确认其是否拥有一年以上的数据分析经验。
- 是否熟悉数据分析的标准工作流程
- 对需要进行数据分析的数据是否明确。
- 是否熟悉数据分析工具的标准使用方法。
- 是否明确数据分析工具的使用范围。
- 是否能够根据最小够用原则获取到业务所需的最小数据集。
- 是否可以根据数据分析过程的日志记录对分析结果的质量和真实性进行溯源。
- 是否具备良好的职业素质,在不同的场景下是否能够胜任数据分析的工作。
- 2.问卷调查
- 数据分析安全部门管理人员
- 是否制定了针对公司的,有效的数据分析原则和制度。
- 是否能够根据不同的的分析场景制定基于合规性要求和业界标准的数据分析方案和对安全风险的评估方案。
- 是否规定了标准的数据分析工具及其所使用的算法,以及算法可以使用的数据范围等。
- 是否明确了数据分析工具的输出结果不会涉及用户个人隐私和企业敏感信息。
- 是否明确了数据分析工具可以被哪些数据分析实施人员所使用。
- 管理人员是否制定了针对数据分析结果的审核机制。
- 是否采取了某些必要的技术手段或管控措施,如:二次评估,以评估分析结果与使用者所申报的使用范围是否一致。
- 3.流程观察
- 主要观察数据分析安全部门的管理团队和技术团队两方的工作流程,并从中寻找可能的问题点和改善点。
- 以中立的视角观察公司数据分析安全部门管理团队的工作流程,确认一下行为:
- 为公司制定整体的数据分析安全原则和制度
- 为公司定义不同的数据分析场景,流程和方法。
- 为实施人员制定数据分析工具的标准操作方案。
- 为不同的业务场景提供风险评估支持。
- 为数据分析结果制定审核机制。
- 是否能够贴合公司各方面的需求。
- 是否可以识别出其中可能存在的安全风险。
- 方法流程是否符合标准规范。
- 进行数据分析的过程中是否对权限进行了限制。
- 是否去除了分析结果中的敏感信息。
- 以中立视角观察公司数据分析安全部门技术团队的工作流程,确认一下行为:
- 在真实业务场景下实施数据分析服务。
- 在记录数据分析过程中的日志。
- 在对分析结果的质量和真实性进行溯源。
- 是否可以识别出其中可能存在的安全风险。
- 方法流程是否符合标准流程。
- 是否依据了管理人员定义的标准使用方法。
- 4.技术检测
- 使用技术工具检测在数据分析过程中是否存在敏感信息泄露的风险。
- 检测数据分析后的数据是否正确和正常。
- 数据质量和真实性是否过关。
- 检测数据分析过程中的操作日志是否被正确记录。
- 数据分析结果的审核结果是否正常。
- 利用技术工具检测经过数据分析算法变更后的数据分析工具是否存在未被发现的安全风险。
明确数据分析安全管理的目的
- 在大数据环境下,企业对多来源,多类型数据集进行关联分析和深度挖掘,可以复原匿名化数据,进而能够识别出特定个人,获取有价值的个人信息或敏感数据。数据分析安全管理主要用于规范数据分析的行为,通过在数据分析过程中采取适当的安全控制措施,防止在数据挖掘和分析过程中,出现有价值的信息和个人隐私泄露的安全问题。
数据分析安全管理的内容
- 一般情况下一个完整的数据分析流程包括明确数据分析需求,收集数据,建立数据分析模型,评估数据分析模型,实施数据分析,评估数据分析结果等步骤,并由数据分析安全管理部门负责整个数据分析流程的执行与监督。
- 明确分析需求-收集数据-建立模型-评估模型-数据分析-评估分析结果
明确数据分析需求
- 明确数据分析的需求是确保数据分析过程有效性的首要条件,可以为数据的收集和分析提供清晰的目标,数据分析安全管理部门需根据实际情况,充分理解业务规则和用户需求,明确提出对信息的需求。
收集数据
- 收集数据的过程具体包括收集原始数据,清洗数据,构造数据,整合数据和格式化数据。在刚获取到数据时,数据信息可能是杂乱无章的,难以看出其中的规律,此时,数据分析安全管理部门就需要对收集数据的内容,渠道,方法和频次等进行策划,策划时需要考虑以下内容:
- 将识别的需求转化为具体的要求。
- 明确数据收集的对象,渠道和方法。
- 采取有效措施,防止因数据丢失而对系统造成干扰。
建立数据分析模型
- 根据数据分析需求和收集到的数据,提出一类或几类可能的模型,然后对选定模型的可靠程度和精确程度做出推断。建立数据分析模型的过程具体包括选择合适的建模技术,参数调优,生成测试计划和构建模型。数据分析安全管理部门的建立模型的过程中,需要考虑以下内容:
- 明确算法具体如何使用数据,使用哪些数据,并对算法本身进行风险评估,以确定该算法输出的分析结果不会涉及用户的个人隐私和组织的敏感信息。
- 制定测试计划,对建立的模型进行风险评估。
评估数据分析模型
- 数据分析模型的评估由数据分析安全管理部门负责,在模型评估过程中,需要考虑以下内容:
- 数据分析管理部门需要对模型进行较为全面的评价,并将模型提交至上级领导部门审核,上级领导部门审核通过后,该模型方可投入使用。
- 对于分析算法的变更,需要重新进行风险评估,以确保算法的变更不会导致敏感信息和个人隐私的泄露。
实施数据分析
- 数据分析是将收集到的数据,按照分析模型进行加工,整理和分析,使其转化为信息。数据分析安全管理部门在实施数据分析的过程中,需要考虑以下内容:
- 明确数据分析过程中使用的技术工具,选择合适的分析工具做分析,要求选择具有个人信息去标识化的数据分析工具,确保能够断开这些信息与个人信息主体的关联。
- 明确数据分析的方法是否合理,是否能将风险控制在可接受的范围之内。
- 数据分析安全管理部门需要明确规定哪些人员可以使用数据分析工具,应开展哪些分析业务,根据最小够用原则,允许其获取完成业务所需的最小数据集。
- 应对数据分析过程进行日志记录,以备对分析结果的质量和真实性进行溯源,确保数据分析事件可被审计和溯源。
评估数据分析结果
- 数据分析安全管理部门需要建立数据分析结果审核机制,明确数据分析结果输出和使用的安全审核,合规评估和授权流程,防止由于数据分析结果的输出而造成的安全风险。
- 数据分析的结果需要经过二次评估后才允许导出,应重点评估分析结果是否与使用者所申报的使用范围一致。此外,数据分析者不能将数据分析结果用于授权范围之外的其他业务。
使用技术工具
- 技术工具需要能够对个人信息实现去标识化操作,即对个人信息进行技术处理,在不借助额外信息的情况下,使人无法识别特定的个人信息,同时还要对各类敏感数据的分析操作进行日志记录,目前主流的数据分析安全技术有:语法隐私保护技术和语义隐私保护技术
语法隐私保护技术
- 语法隐私保护的操作通常是在统计数据库中进行的,数据通常是以表格的形式发布,表格中包含了不同的属性。
- 标识属性
- 半标识属性
- 敏感属性
- 非敏感属性
- 身份泄露
- 属性泄露
- 表格泄露
- K匿名技术
语义隐私保护技术
- 语义隐私保护技术是为了保护个体的隐私数据,无论其是否在公开发布的数据集中。
- 非交互环境
- 交互环境
- 差分隐私保护技术
- 拉普拉斯机制
- 指数机制
技术工具的使用目标和工作流程
- 生成发布数据库
- 基于语法或语义隐私保护技术涉及的技术手法生成发布数据库
- 生成日志记录
- 记录数据分析者提交的查询任务及返回的结果,生成日志并保存。
迷茫的人生,需要不断努力,才能看清远方模糊的志向!