大数据的4个“V”,或者说特点有四个层面:第一,数据体量极大。从TB级别,跃居到PB级别;第二,数据类型多样。前文提及的网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。以视频为例,倒数不间断监控过程中,有可能简单的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术具有本质的有所不同。业界将其概括为4个“V”——Volume,Variety,Value,Velocity。
如果用非常简单的大白话说就是:现在硬件的发展速度赶不上数据的增长速度,必须通过所谓的“大数据”软件技术来解决问题。
另外引荐下国内的大数据分析工具:永洪科技的Z-Suite
用MPP架构的列存储技术,解决问题了大数据的实时高性能计算出来问题。