盘点:满怀信心拥抱大数据时代的到来(3)
跟传统数据库相比,大数据有很重要的一些特点:首先是数量大;其次是跟原来数据库不一样。过去我们做数据库都是要进行清洗之后再进行加载。但是大数据不是这样,它有噪声、冗余,往往是非结构化的,所以更重视交互。因为它往往不是银行生产性交易数据,所以说它更有特点。
我们面临的大数据时代至少有三个方面的挑战:一个是规模的挑战。由于大,很难给出一个绝对的数据标准确定大小。有时候也并不是数量绝对大,但是由于数据复杂、用处非常多,所以仍然属于大数据;第二个是数据结构的复杂;第三个是数据关联度更高。因为交互而来的数据都是你应我答、甚至是互相PK的数据。前不久还发生了微博“约架”的问题,那都是交互出来的,所以它的关联性很高。由于它不再是传统数据库,所以用传统的SQL语言无法解决这种实时读写性需求以及复杂多表关联的查询等问题。以前我们用甲骨文数据库查询做表的时候,一旦表和表之间关联多了之后,查询的速度是非常慢,导致做出来一个表非常慢,一般来说都要建一个甚至好几个索引,通过它来解决关联的问题。而大数据不可能用关联、建索引的办法解决,正是因为这样,百度、Google都在推进非SQL的普及,通过大数据影像、压缩处理来解决好这个问题,同时也更依赖于将来要有支撑大数据新型的操作系统。
国外一些学者认为,目前面临大数据平台还有很多问题,正是因为这样国内也有很多机遇。大数据研究商业目标是最终为了更好的支撑Web服务,更加流畅实现交互、更加快速获取资讯、更加方便我们的生活和工作,同时使我们在物联网或者泛在网络实现人、机和物更好地融合。 (编辑:ASP站长网) |