您现在的位置是:网站首页>技术百科技术百科
什么是大数据?不仅仅是数量、速度和种类
小大寒2024-01-01[技术百科]博学多闻
大数据大数据不仅是海量数据,它真正关注的是从这些数据中提取的“意义”。由于数据量、速度和种类的快速增长,传统技术无法满足需求,大数据依赖云计算、机器学习和深度学习等技术,形成一个协调的技术生态系统,帮助从数据中提取商业价值。
什么是大数据?不仅仅是数量、速度和种类
你听说过大数据,对吧?我们都应该说是的,大数据是那些我以为自己了解的话题之一,直到我尝试解释它。我意识到我需要从高层次上理解它。如果你和我一样,那么这篇博文就是为你准备的。
问题:任何技术只有解决一个(或多个)问题才有用。那么大数据解决了什么问题呢?
众所周知,数据无处不在:既有历史数据,也有社交媒体应用生成的新数据、网络应用的点击流数据、物联网传感器数据等等。数据量比以往任何时候都大,而且以越来越快的速度涌入,格式也多种多样。
数据中的商业价值来自于我们可以从中获取的意义。而从所有这些数据中获取商业价值是一个大问题。为什么?让我们来分析一下。
数据量:人们之间的联系比以往任何时候都更加紧密,这种联系导致越来越多的数据源,从而产生比以往更大的数据量(并且还在不断增长)。数据量的增加需要不断提高的计算能力才能从数据中获取价值(意义)。传统的计算方法根本无法处理当今积累的数据量!
数据速度:由于互联互通和网络技术的进步,数据进入企业的速度和方向不断增加,因此数据进入的速度比我们能够理解的速度要快。数据进入的速度越快,来源越多样化,从数据中获取价值(含义)就越困难。传统的计算方法无法处理以当今速度进入的数据!
数据种类:更多的数据源意味着更多不同格式的数据:从传统的文档和数据库,到点击流、GPS位置数据、社交媒体应用和物联网等半结构化和非结构化数据。不同的数据格式意味着从数据中获取价值(含义)更加困难,因为必须以不同的方式提取所有数据进行处理。传统的计算方法不适用于所有这些不同类型的数据!
大数据不是什么:
- 文档和数据库等传统数据:确实,世界上有大量的文档和数据库,虽然这些来源对大数据有所贡献,但它们本身并不是大数据。
- 只是“大量数据”的同义词:大数据绝不仅仅是“大量数据”。大量数据推动着大数据的发展,但将数据量与大数据这一术语联系起来并止步于此则是错误的。
- 这与数据无关:大数据并不只关乎数据,就像哲学并不关乎文字一样。大数据关乎的是可以从数据中提取的价值,或者数据所蕴含的意义。
单一技术——更确切地说是整个技术生态系统:大数据是一种从多个不同的数据源收集原始数据、存储数据以供分析程序使用以及使用原始数据以全新方式从数据中获取价值(含义)的方法。
一种趋势:大数据是应对当今应用程序中海量、类型和容量数据的方式的自然演变。当今企业中数据的数量、速度和种类意味着这些问题只能通过同样有机且能够持续发展的解决方案来解决。
解决方案:大数据其实是一个误称。大数据是关于从数据中得出的意义。也许我们应该称之为“大意义”。
那么大数据如何解决数据量、速度和多样性的问题呢?
- 体积:数据必须存储在某个地方,因为如果没有地方存储数据,就无法进行分析。
- 速度:我们首先需要应对数据输入的速度,全天候运行的自动化智能系统有助于从数据中挖掘出通过人工分析无法检测到的模式。
- 种类:随着数据源种类的不断增加,复杂性也随之增加。深度学习等技术可以帮助我们理解数据的各种输入格式,并将其输入到其他网络中,以从数据中获取意义。
结论:大数据的真正含义是“从数据中获取意义”,数据以前所未有的速度、从更多来源、以更多样的形式涌入。我们或许应该称之为“大意义”。大数据真正关注的是数据的价值(意义),而不是数据本身。
大数据不是一种单一的技术,而是一个由协调的技术和工艺组成的生态系统,它从当今世界产生的海量数据中获取商业价值。
阅读完毕,很棒哦!