发布时间:2023-02-21 点击量:
本文摘要:为什么叫大数据?
为什么叫大数据? 卷(VOLUMES )是指大型数据集,通常为10TB规模左右。但是在实际应用中,许多企业用户将多个数据集合并在一起,已经构成了PB级的数据量。将来的智能家居领域也有很多这样的企业。
目前,国内智能家居领域的数据总量已经超过100TB以上,非结构化数据的规模以更慢的速度迅速增加。数据类别大(variety )数据来自多种数据源,数据类别和格式越来越丰富,突破了以前限定版本的结构化数据范畴,涵盖了半结构化和非结构化数据。
也就是说,大数据最重要的变化是销毁对象从结构化数据扩展到半结构化数据和非结构化数据,每年非结构化数据存储的总量比结构化数据增加10~50倍。非结构化数据可以被视为非常不容易转换成结构化关系数据库的所有数据,如企业邮件和其他形式的电子通信记录。
网站上的资料还包括点击量和社交媒体相关的内容。有些数据是由设备生成的,如RFID、GPS传感器生成的数据和日志文件。即使数据处理速度快(Velocity )数据量足够大,也需要数据的实时处理。
随着数据真实性低的(Veracity )社会数据、企业内容、交易和数据等新数据源的发展,传统数据源的限制被超越,企业必须用越来越有效的信息力量保证其真实性和安全性。小标签TB是计算机存储容量的单位,等于2的40次方,或类似于1兆字节,即1千千兆字节。
PB是数据存储容量的单位,等于2的50次方字节或数值上约等于1000。数据单位从小到大: B.KB.MB.GB.TB.PB。1PB=1024TB,这样依次类推。
TB,PB依然很难破解,所以推荐几个例子。美国国会图书馆到2011年4月为止共计收集了235TB的数据。手机播放的MP3的编码速度平均值为每分钟1MB,一首歌的平均时间为4分钟的话,1PB的曲子可以倒计时播放到2000年。
如果用智能手机照相机拍摄的照片的平均尺寸是3MB,打印机照片的平均尺寸是8.5英寸,则合计1PB的照片两侧排列顺序的长度超过48000英里,可以绕地球大约两周。人的功能记忆容量预计为1.25。
这意味着著,800个人的记忆等于1PB。1PB充分储存了美国整个人口的DNA,还可以克隆两倍。如果以每秒1比特的速度计算1PB中包含的比特数,一个人需要2.85亿年。
每秒数一个字节,一个人需要357万年。谷歌为用户获取了最多20PB(215亿MB )的地图图像。还包括卫星图像、航空照片和360度街景图像。
即使在2008年,谷歌也每天处理超过20PB的数据,每年7300PB。
本文来源:米乐M6官方网站注册登录入口-www.yuscy.com