大数据的特点
Hadoop与Spark Hadoop 是一种分布式计算平台,用Java编写,可运行在Linux、Windows以及类Unix系统上。包括两个核心技术,HDFS和Mapreduce。HDFS实现数据的分布式存储,MapReduce实现数据的分布式计算(通过Map和reduce两个函数实现)。
Spark 比 MapReduce 快,前者使用内存存储中间结果,后者使用HDFS。
数据库类型
关系型数据库是根据表间的索引建立关系,因此叫关系型数据库。代表产品有Oracle、MySQL、DB2。
NoSQL非关系型数据库,四种存储类型:
1、键值;
2、文档(JSON格式);
3、列存储;
4、图数据库。
代表产品有:Redis;CouchDB、Mongodb;HBase;Neo4J。
本文由 biezhi 创作,采用 知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名
最后编辑时间为:
2024/05/09 00:45