2021 年,企业大数据领导者将寻求提高数据质量和大数据项目的周转率,以及实现业务目标的绩效。 虽然 2020 年对任何人来说都不是正常的一年,但你仍然必须为未来做好计划,并为可能发生的事情做好准备。 以下是 2021 年七个重点关注的大数据领域。
1. 更好地管理数据
大数据继续以迅猛的速度进入企业网络,企业获取或使用的不良数据每年给美国经济造成约 3.1 万亿美元的损失。 需要付出更多努力来筛选传入的数据,并在将数据添加到企业数据存储库之前正确清理和准备数据。
在 IBM 瑞士研究院,人工智能 (AI) 和机器学习帮助研究人员翻阅大量科学论文和期刊,寻找与分子药物设计相关的相关信息。 研究人员认识到,人工智能将审查的大部分全球信息与他们试图解决的问题无关。 该公司决定预先消除从不相关来源导入数据。 这节省了数小时的人工智能时间,为研究人员提供了一组高度相关的数据,并消除了数据存储浪费。
一旦数据通过传入标准,在上传到数据存储库之前还应该对其进行清理和适当准备。 这意味着检查不完整、重复和不准确的数据,并对数据进行规范化,以便将其与其他源数据混合进行分析。
2. 加速并监控流程
到目前为止,大多数组织都在采用迭代式、DevOps 式的大数据和分析开发方法。 现在是时候将流程正式化,以便用户和 IT/数据科学知道大数据分析模型何时足够成熟,可以投入生产并在生产中维护。
企业准备就绪的基准是大数据分析结果必须达到 95% 的准确率阈值,并且必须始终如一地提供此水平的性能。 由于业务和外部条件会随着时间的推移而变化,生产中的大数据应用程序的准确度可能会开始低于 95%。
IT 和数据科学应制定维护策略,每年重新测量应用程序的准确性,以确保应用程序仍能提供准确的结果。
3. 正式化大数据和分析的混合架构
IT、数据科学和最终用户都已为大数据和分析应用程序制定了预算并独立开发。 其中一些系统在本地运行,而其他系统则在公共和私有云平台上运行。
随着从不同来源收集更多数据的需求不断增长,包括云和本地平台的总体混合云架构应正式化,并且应在整个过程中统一应用企业安全和治理。 很少有组织将这种大数据混合架构正式化。 2021 年是这样做的一年。
4. 在 IT、数据科学和用户之间架起桥梁
随着越来越多的供应商简化人工智能解决方案,公民人工智能不断增长,其中业务部门开发自己的人工智能和大数据应用程序。 稍后,当用户想要训练这些应用程序并将其与其他公司数据和平台集成时,他们需要 IT 和数据科学部门来帮助他们。
如果 IT 和数据科学专业人员在应用程序流程的早期与业务用户积极协作,则可以避免许多后续集成困难。 与整个公司的业务部门建立富有成效的关系应该是 IT 的主要大数据和分析目标。
5. 提高安全性,尤其是物联网
许多物联网 (IoT) 设备具有专有操作系统和安全预设,无法满足公司安全和治理标准。
由于每天都会发生安全入侵尝试,因此检查这些设备、与供应商合作并确保进行的设置符合公司安全和治理标准,这些都是至关重要的。
6. 查看仪表板并报告结果
从技术角度来看,您的分析生成的仪表板和下拉报告可能完美无缺,但它们仍然具有相关性吗? IT 部门应每年拜访最终用户,审查报告使用情况,并确定是否需要修改甚至更换仪表板和报告。
7. 改善与管理层的沟通
尽管管理层很清楚大数据、人工智能和物联网的重要性,但定期向他们介绍项目和新进展也没什么坏处。 这可以让管理层随时了解情况,并有助于确保持续的支持。
用简单的英语定期与管理层进行项目沟通应该是 2021 年每个 IT 计划中粗体字的目标。