mpp是什么文件怎么打开

OLAP的分类及实践应用
前文所提及的《企业数字化:OLAP的核心概念与操作准则》详细描述了OLAP系统的构成。OLAP系统按数据存储格式主要可以分为MOLAP、ROLAP以及HOLAP三种类型。
关于MOLAP(OLAP)
MOLAP是以数组模型存储数据,作为OLAP的初始形态。它的特点是进行数据预计算,将预计算的结果存储于数组中,形成一个“cube”。
MOLAP架构的优势在于,由于cube包含了所有维度的聚合结果,因此查询速度非常快。其缺点在于更新cube的时间与计算的维度紧密相关,随着维度的增加,计算时间也会大幅度增长。查询的灵活性相对较低,需要提前设计维度模型,查询分析的内容局限于指定的维度,增加维度需要重新进行计算。
关于ROLAP(关系OLAP)
ROLAP基于关系模型存储数据,要求事实表和维度表按照关系模型设计。不同于MOLAP的预计算,ROLAP采用即时查询的方式,使用标准的SQL语句可以灵活查询不同维度的数据。
ROLAP架构的优点在于其强大的扩展性,尤其适用于维度数量多的模型。它也更容易进行权限管理。由于采用即时计算,查询响应时间较MOLAP会长一些。
关于HOLAP(混合OLAP)
HOLAP是MOLAP和ROLAP的有机结合。细节数据以ROLAP的方式存储,以满足数据查询的灵活性;高度聚合的数据则以MOLAP的方式展现,更有利于高效的分析处理。
在实际应用中,可供选择HOLAP产品相对较少。为满足不同场景的数据分析需求,很多企业往往会同时使用MOLAP和ROLAP产品。在数据仓库构建中,不论是业务生产系统还是日志系统,大多基于Hadoop/Spark分布式大数据技术生态进行构建。对于数据应用交互层面,由于时效性的要求,数据的最终展现查询仍然需要依赖DBMS和OLAP引擎进行支撑。
以互联网公司为例,其OLAP架构通常包括数仓、数据集市和BI三个层次。在美团平台中,主要使用Kylin作为MOLAP引擎。Kylin的核心思想就是预计算,通过牺牲部分存储空间来换取更快的查询速度。为了满足不同应用场景的需求,美团还引入了基于MPP引擎驱动的ROLAP产品Doris,并通过MOLAP+ROLAP双引擎模式进行适配。Apache Doris是基于MPP架构的OLAP引擎,它整合了Google Mesa的数据模型技术、Apache Impala的MPP Query Engine技术以及Apache ORCFile的存储格式技术。在美团的实践中发现,Doris引擎能够很好地处理多种场景下的数据分析需求,而Kylin则更擅长处理增量业务分析和固化维度场景下的预计算任务。“双引擎模式”能更灵活高效地应对各种复杂的数据分析场景需求。
