可视化工具和管理
成功实现数据科学的方法离不开合适的可视化工具。数据可视化工具是通过多维表示技术表达复杂信息,实现海量数据的三维体现。可视化技术借鉴人脑的视觉显示能力,通过挖掘重要数据之间的关系,揭示数据隐藏的关联和发展趋势,从而提高数据的使用效率。可视化工具和平台使人们不再局限于传统的关系数据表来分析数据信息,而是以更直观的方式从可视化的角度来观察数据信息。
根据组织的规模和性质,许多不同的可视化工具可以应用于不同的过程。需要针对组织中不同的用户确定可视化工具的相对复杂度,有经验的用户会有越来越复杂的需求。
企业架构、项目组合管理和运维团队之间的协调对于控制项目组合内和整个项目组合中的可视化通道是必要的。请注意,更改数据提供者或选择标准可能会对可用于可视化的元素产生下游影响,从而影响可视化工具的有效性。
数据科学和可视化标准
Z佳实践是建立一个社区来定义和发布可视化的标准和指导方针,并以规定的交付方法来评审工件,这对于面向客户和监管的内容尤其重要。标准可能包括:
1)用于分析示例、用户群和主题领域的工具标准。
2)请求新数据。(独立于可视化工具,仅与业务和数据分析需求相关)
3)数据集处理标准。(由于业务需求和数据治理规范的要求)
4)采用中立和专业的演示流程,以避免有偏见的结果,并确保以公平和一致的方式完成所有要素,包括:
①资料的纳入和排除。
②模型中的假设。
③结果的统计有效性。
(4)结果解释的有效性。
⑤采用适当的方法。
学习材料:DAMA数据知识