前沿拓展:
大数据领域按照计算引擎和存储引擎,可以做如图所示的分类。
(1) Clickhouse
Clickhouse是一个很牛的工具,追求毫秒级响应,这也和Yandex(**最大的搜索公司,CK的开源者)的应用场景有关。
当然,CK的问题就是受限于单机的物理内存,一旦query的mem消耗过大,将被kill。
编程语言:C++
(2) Palo (Doris)
该项目已经由百度Palo团队贡献给Apache,更名为Doris。
随着开源,Doris已经在京东、美团、搜狐、小米等公司的生产环境中正式使用,也有越来越多的Contributor加入到Doris大家庭中。
编程语言:C++(存储引擎Mesa) & Java(计算引擎Impala)
(3) Greenplum
Greenplum是与早期Hadoop生态圈争锋的翘楚,也是MPP架构的早期践行者。
GP是老牌的大数据工具,诞生于1996年。数仓特性丰富且成熟稳定,传统企业中使用非常广泛。同时GPDB这2年来正在向一个数据平台转化,社区和生态也非常强大,各方面比较均衡。缺点是技术架构上相对陈旧,TP性能不佳。
编程语言:C++
(4) Druid
Druid是一个分布式的列式数据存储,能够提供高效的数据查询。Druid主要解决的是对于大量的基于时序的数据进行聚合查询,它结合了OLAP、时序数据库、搜索系统等多方面的特性。
Druid在国外的应用比较多,特别是在大型流量分析的场景。Druid的快也基于自己部分预聚合的能力。
编程语言:Java
拓展知识:
olap
1、适用人员不同:OLTP主要供基层人员使用,进行一线业务**作。OLAP则是探索并挖掘数据价值,作为企业高层进行决策的参考。
2、面向内容不同:OLTP面向应用,OLAP面向主题;
4、数据特点不同:OLTP的数据特点是当前的、最新的、细节的, 二维的、分立的;而OLTP则是历史的, 聚集的, **的,集成的, 统一的;
5、存取能力不同:OLTP可以读/写数十条记录,而OLAP则可以读上百万条记录;
6、工作**的复杂度不同:OLTP执行的是简单的事务,而OLAP执行的是复杂任务;
7、可承载用户数量不同:OLTP的可承载用户数量为上千个,而OLAP则是上百万个;
8、DB大小不同:OLTP的DB 大小为100GB,而OLAP则可以达到100TB;
9、执行时间要求不同:OLTP具有实时性,OLAP对时间的要求不严格。
OLTP-百度百科 OLAP-百度百科
本回答被网友采纳
olap
OLTP即联机事务处理,就是我们经常说的关系数据库,意即记录即时的增、删、改、查,就是我们经常应用的东西,这是数据库的基础;
OLAP即联机分析处理,是数据仓库的核心部心,所谓数据仓库是对于大量已经由OLTP形成的数据的一种分析型的数据库,用于处理商业智能、决策支持等重要的决策信息;数据仓库是在数据库应用到一定程序之后而对历史数据的加工与分析;是处理两种不同用途的工具而已。
本人从事通信行业数据库与数据仓库的开发多年,如有需要可与我多多沟通。
本回答被提问者采纳
原创文章,作者:九贤生活小编,如若转载,请注明出处:http://www.wangguangwei.com/13648.html