架构师训练营第十二周总结

大数据的特点

Hadoop与Spark Hadoop 是一种分布式计算平台，用Java编写，可运行在Linux、Windows以及类Unix系统上。包括两个核心技术，HDFS和Mapreduce。HDFS实现数据的分布式存储，MapReduce实现数据的分布式计算（通过Map和reduce两个函数实现）。

Spark 比 MapReduce 快，前者使用内存存储中间结果，后者使用HDFS。

数据库类型

关系型数据库是根据表间的索引建立关系，因此叫关系型数据库。代表产品有Oracle、MySQL、DB2。
NoSQL非关系型数据库，四种存储类型：
1、键值；
2、文档（JSON格式）；
3、列存储；
4、图数据库。
代表产品有：Redis；CouchDB、Mongodb；HBase；Neo4J。

本文由 biezhi 创作，采用知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外，均为本站原创或翻译，转载前请务必署名
最后编辑时间为: 2024/05/09 00:45