主流NoSQL数据库的分析与选择

Python81

一因为新的数据项目的数据量级较大,因此考虑将mysql替换更高性能的数据库。

介绍一下NoSQL(不仅仅是关系型数据库)的不同种类和其擅长的业务。

NoSQL的一个比较明显的特点是适用于现代大数据的存储.(支持hadoop,保证了数据量级的同时对读写性能有一定要求)

目前市面上主流的开源NoSQL有以下几类:

MongoDB, Cassandra, CouchDB, Hypertable, Redis, Riak, Neo4j, HBASE, Couchbase, MemcacheDB, RevenDB and Voldemort

以上均免费且开源。作者选了几种国内比较通用的进行分析。

NoSQL 优点 缺点 适用场景与备注 应用场景 Hbase

支持数十亿行X上百万列
堪比MySQL的随机访问性能

维护开发复杂,需要手工MapReduce

1.简单数据写入(如"消息类"应用)
2.海量、结构简单的分布,并发数据的查询(如"详单类"应用)
适用于偏好BigTable,并且需要对大数据进行随机、实时访问的场合

1.Facebook的消息类应用,包括Messages、Chats、Emails和SMS系统
2.淘宝的WEB版阿里旺旺,后台是Hbas
3.小米的米聊用的也是Hbase
4.移动某省公司的手机详单查询系统

Mangodb 功能丰富,数据类型灵活,各个性能特性都比较平衡 性能在同类中比较低

1.二级索引,支持相比于HBase更复杂的集合查找
2.处理文档型数据更为直接。支持复杂的数据结构
适用于需要动态查询支持;需要使用索引而不是 map/reduce功能;需要对大数据库有性能要求

例如:你本打算采用 MySQL或 PostgreSQL,但因为它们本身自带的预定义栏让你望而却步。 Redis 速度快,简单,容易维护,支持多种数据结构 数据可靠性无保障,功能较少。

1.处理数据量小于以上两种的极高速读写
2.支持集合set,有序集合zset和哈希hash格式
适用于数据变化快且数据库大小可遇见(适合内存容量)的应用程序

Cassandra 对大型表格和Dynamo支持得最好,高写入性能 臃肿和复杂,java配置异常频出 适用于写入较多于读取操作(记录日志).快速开发应用程序,大量写入、统计和分析,需要扩展的部署结构 例如:银行业,金融业(虽然对于金融交易不是必须的,但这些产业对数据库的要求会比它们更大)写比读更快,所以一个自然的特性就是实时数据分Neo4j析 Neo4j 图形类数据 非图形数据不适用 适用于图形一类数据。这是Neo4j与其他nosql数据库的最显著区别 例如:社会关系,公共交通网络,地图及网络拓谱

综合以上特征,如果想要对用户出行的数据进行统计,不同用户单日的行程数目与充电次数均不相同,mangodb的不同结构的文件存储更适用于当前场景。

参考文章:

https://blog.csdn.net/renyi_blog/article/details/23285977

https://bbs.csdn.net/topics/390826073

https://blog.csdn.net/aikumei/article/details/77671891

Original: https://www.cnblogs.com/techs-wenzhe/p/11120656.html
Author: 冻雨冷雾
Title: 主流NoSQL数据库的分析与选择