-
通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖Hadoop与Spark生态系统平台的应用开发与运维实践。强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目全过程沙盘模拟实战。
2022-06-07
-
课程涉及Redis安装、配置和生产环境部署方案;Redis安装、配置和生产环境部署方案;Mycat数据库分库分表实战;Mycat生产环境下高可用方案等内容。
2022-04-27
-
Spark作为UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,其基于mapreduce算法实现的分布式计算,有HadoopMapReduce所具有的优点;但不同于MapReduce的
2017-01-20
-
Spark是一个分布式的内存计算框架,其特点是能处理大规模数据,计算速度快。Spark延续了Hadoop的MapReduce计算模型,相比之下Spark的计算过程保持在内存中,减少了硬盘读写,能够将多个操作进行合并后计算,因此提升了计算速度
2017-01-20
-
Spark是一种快速、通用的计算集群系统,Spark提出的最主要抽象概念是弹性分布式数据集(RDD),它是一个元素集合,划分到集群的各个节点上,可以被并行操作。用户也可以让Spark保留一个RDD在内存中,使其能在并行操作中被有效的重复使用
2017-01-19
-
任何新技术的引入都会历经陌生到熟悉,从最初新技术带来的惊喜,到后来遇到困难时的一筹莫展和惆怅,再到问题解决后的愉悦,大数据新贵Spark同样不能免俗。大数据Hadoop与Spark架构应用实战》专家钟老师介绍了Spark过程中常见的一些问题
2016-08-11
-
目前,Spark作为一种高效的分布式计算系统,其价值已经在国内业界获得了广泛的认可和尊重。2013年中期,随着业务高速发展,越来越多的移动设备侧数据被各个不同的业务平台收集。那么这些数据除了提供不同业务所需要的业务指标,是否还蕴藏着更多的价
2016-06-24