今天小编就要说说大数据。根据,大数据是数据集的 个广义的术语,并且该数据集是如此庞大和复杂,以致于传统的数据处理应用程序无法胜任。
在许多情况下,使用SQL数据库用于存储/检索数据就足够了。但在另 些情况下,要么SQL数据库规模不够,要么还有更好的工具。这 切都取决于使用情况。
现在让我们来讨论 下存储/处理数据用的不同的非SQL工具NoSQL数据库,内存缓存,全文搜索引擎,实时流,图形数据库,等等。
Cassandra 个开源的分布式数据库管理系统,较初由Facebook开发,被设计用来处理横跨多个商用服务器的大量数据,提供了无单点故障的高度可用性。
Redis 个开源的(BSD许可),内存数据结构存储,作为数据库、缓存和消息代理使用。
hadoop用Java编写的 个开源软件框架,用于分布式存储和对在计算机集群上的超大型数据集的分布式处理。
Akka 个工具包和运行时,用于在JVM上构建高度并行的、分布式的、有弹性的消息驱动的应用程序。
CouchBase 个开源的、面向文档的分布式NoSQL数据库,特别为了交互式应用而优化。
Oracle Coherence 个内存的数据网格解决方案,通过提供快速访问常用数据的渠道,使得企业可预测地扩展关键任务应用程序。
Titan 个可扩展的图形数据库,优化的目的在于存储和查询包含数千亿顶点和边的图形,测试你的前世今生分布在多机集群。
Amazon DynamoDB 个快速、灵活、完全管理的NoSQL数据库服务,用于在任何规模需要 致的、个位数毫秒延迟的所有应用程序。
本文由来源于财鼎国际(www.hengpunai.cn)
网友评论 ()条 查看