news 2026/6/25 13:23:17

2026年非结构化数据管理五大预测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2026年非结构化数据管理五大预测

各行业的企业正在存储比以往更多的数据。超过5拍字节(PB)已成为新常态,超过10 PB也越来越普遍。2026年非结构化数据管理的主题是"更多":更多数据、更多投资、更多痛点以及更多AI安全和风险担忧。非结构化数据的增长源于AI采用的加速、数字排放的激增以及富媒体和传感器数据的大量增加。然而,更多的数据也意味着更多潜在机遇,前提是企业能够高效地识别、过滤和分类数据以用于正确的应用场景,同时降低AI带来的风险。明年,我们预测随着AI推理应用的增长,组织将认识到非结构化数据管理在AI投资回报率中所扮演的关键角色。

以下是我们预见的未来一年五大主要趋势:

失控的数据增长为巨变创造完美风暴

今年,企业中的非结构化数据增长已达到临界点。根据Komprise 2026年非结构化数据管理状况报告,大多数企业存储超过5 PB的数据,40%的企业存储超过10 PB。使用5到10年前的方法管理这些数据已不再可行,因为管理和保护数据的成本高昂,而且AI数据准备、管理和审计的新需求不断涌现且难以预测。能够让IT基础设施和运营团队在存储和备份孤岛之间查看、理解、清理、过滤、分类和移动数据的能力,将成为管理风险、提高各部门数据可见性和访问性的关键。

IT预算在艰难的一年中幸存并将支持AI的新技术和人员配置

尽管全球经济动荡不定,IT领导者仍看好对未来的投资。随着AI技术从试点转向生产,高管们对AI对利润影响的期望很高。金融和技术分析师预测,2026年IT预算将增长4%至10%。这些资金不会全面分散使用,而是集中在优化的关键领域,包括数据、AI和基础设施,如存储、安全和数据管理。根据Komprise调查,64%的IT领导者表示,许多IT组织需要升级数据存储和数据管理平台。除技术之外,IT和业务高管还将寻求具有AI基础设施专业知识的IT领导者,以及能够设计、实施和管理智能体和数据工作流的技术人员。根据我们的研究,近一半的IT团队将增加员工,55%将进行重组和AI技能培训。

IT领导者将采用非结构化数据分类以提高数据安全性和AI投资回报率

非结构化数据是当今组织中最有价值的资产之一,但由于其增长过快且分散在众多系统和存储边界中,大部分仍处于未知状态。如果没有系统的方法来分类和过滤非结构化数据,例如识别过时版本、基于内容和相对价值进行搜索,IT部门将无法保护数据,也无法向利益相关者提供精确的AI数据集。然而,通过使用自动化文件扫描和标记工具丰富文件元数据,IT团队可以将敏感、无关和过时的数据排除在AI工作流之外。这也使员工更容易搜索项目所需的准确数据。为AI准备和分类数据将成为2026年数据管理的首要任务,仅次于存储成本优化。

生成式AI风险成为领导者的终极平衡艺术

消费者和员工已经跳上AI的快车,发现将这些新工具集成到日常任务中可以大幅节省时间。然而,高级IT和领导者不会容忍敏感数据泄露或勒索软件风险增加。与此同时,目前存在一些限制。Komprise调查发现,只有14%的组织在员工队伍中限制使用AI。同时,我们的研究和无数其他研究表明,敏感数据泄露、幻觉和数据来源不明确是IT和业务领导者最关心的问题。IT高管需要在提供尖端技术访问和鼓励员工试验之间取得适当平衡,同时警惕保护企业和客户数据。审计进出工具的数据并密切监控应用使用风险的能力,将成为IT、法律和安全团队共同开发的日益增长的最佳实践。

IT基础设施优先事项转向AI就绪的数据管理

随着AI从消费者原型成熟为现实世界的企业计划,IT运营团队感受到构建高性能基础设施的压力,包括支持GPU的存储。这对于处理AI的海量数据至关重要,但企业AI主要使用现有的组织数据。性能虽然重要,但不如制定正确的非结构化数据管理策略以提供良好的治理、数据清洁和AI数据分类来得关键。AI的数据管理需要超越存储优化,为不同受众提供全面管理的数据服务。这些服务包括数据使用和支出报告与分析、经济高效的归档和迁移、精细的数据搜索和分类、AI数据工作流和摄入服务,以及网络安全,如勒索软件保护和敏感数据管理。

Q&A

Q1:为什么非结构化数据增长在2026年会成为企业面临的重大挑战?

A:根据Komprise 2026年调查,大多数企业现在存储超过5 PB数据,40%的企业存储超过10 PB。使用传统方法管理这些数据已不可行,因为管理和保护成本高昂,同时AI数据准备、管理和审计的新需求不断涌现。企业需要能够跨存储和备份系统查看、理解、清理、过滤、分类和移动数据的新能力来管理风险。

Q2:企业在2026年的IT预算会如何分配?

A:尽管全球经济动荡,IT预算预计将增长4%至10%。这些资金将集中在关键优化领域,包括数据、AI和基础设施(如存储、安全和数据管理)。64%的IT领导者表示需要升级数据存储和管理平台。此外,近一半的IT团队将增加人员,55%将进行重组和AI技能培训,特别是招聘具有AI基础设施专业知识的人才。

Q3:非结构化数据分类对AI应用有什么作用?

A:通过自动化文件扫描和标记工具丰富文件元数据,IT团队可以将敏感、无关和过时的数据排除在AI工作流之外,这样能提高数据安全性并确保AI获得精确的数据集。同时也让员工更容易搜索到项目所需的准确数据。为AI准备和分类数据将成为2026年仅次于存储成本优化的首要数据管理任务。



版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/25 0:42:46

Amazon重组AI部门:27年老将统领AGI组织

在今天的"亚马逊克里姆林宫学"一集中,AWS发布了一份新闻稿,显示其最具传奇色彩的领导人之一发生了重大变动。在AWS re:Invent大会上宣布Nova 2模型两周后,AWS实用计算高级副总裁Peter DeSantis将把他的两个团队从AWS中调出&#xf…

作者头像 李华
网站建设 2026/6/24 7:08:19

思科自研AI模型正式应用于产品,首先赋能身份安全服务

思科宣布其自主研发的AI模型已准备就绪,并开始为其产品提供支持,首个应用是Duo身份智能服务。思科使用的模型名为"Foundation-Sec-1.1-8B-Instruct"。根据Hugging Face模型市场的描述,这是一个开放权重、拥有80亿参数的指令调优自回…

作者头像 李华
网站建设 2026/6/24 17:15:42

用GCNN增强EEG神经疾病诊断:源码数据集背后的探索

DL00507-使用领域引导图卷积神经网络GCNN增强基于脑电图EEG的神经疾病诊断源码数据集 一种基于图卷积神经网络(GCNN)的新方法,用于改进使用头皮脑电图(EEG)进行神经系统疾病诊断。 尽管脑电图是神经系统疾病诊断中主要…

作者头像 李华
网站建设 2026/6/24 16:49:23

pgconf_asia_2017_logical_replication_us_20171204-1

Logical Replication Internals Agenda What is Logical Replication?Let’s try!ArchitectureRestrictionsTrouble shooting What is Logical Replication? What is Logical Replication? Is PostgreSQL 10 new featuresReplicate per tableReplicate per transaction…

作者头像 李华
网站建设 2026/6/20 13:41:11

leetcode 762. 二进制表示中质数个计算置位

Problem: 762. 二进制表示中质数个计算置位 解题过程 log2计算二进制长度,然后统计1个数,查看集合是否是素数,计算是否是素数,若是则放入集合 Code class Solution { public:int countPrimeSetBits(int left, int right) {int le…

作者头像 李华
网站建设 2026/6/24 17:53:04

为啥yyyy-MM-dd HH:mm:ss的MM和HH设计为大写

yyyy-MM-dd HH:mm:ss 中的大写 MM 和 HH 是 Java 日期格式化中的约定,原因如下: 1. 区分不同的时间单位(主要目的) 月份 (Month) vs 分钟 (Minute) // 大写的 M 表示月份 (Month) // 小写的 m 表示分钟 (minute)SimpleDateForm…

作者头像 李华