资讯 小学 初中 高中 语言 会计职称 学历提升 法考 计算机考试 医护考试 建工考试 教育百科
栏目分类:
子分类:
返回
空麓网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
空麓网 > 计算机考试 > 前沿技术 > 大数据 > 大数据系统

MapReduce学习

大数据系统 更新时间: 发布时间: 计算机考试归档 最新发布

MapReduce学习

一.初识MapReduce

        MapReduce是分布式计算框架,他和HDFS一样也是hadoop的重要组成部分

        它的产生背景是在web2.0时代,在数据量的指数级增长下,单机扩内存的方式已经不能满足计算需求,所以诞生了MapReduce

二.特点

        分布可靠,对数据集的操作分发给多个节点实现可靠性,每个节点周期性返回完成的任务和最新状态

        封装了实现的细节,基于api编程

        提供跨语言的编程能力

三.运行流程         1.主要任务                 3.1.1数据划分和计算任务调度

                        将数据划分为多个数据块,每个数据块对应一个任务,自动调度节点来处理数据块

                3.1.2数据/代码相互定位(一般是代码找数据)

                        本地化数据处理,当无法进行本地化数据处理时,才会将数据发送有代码的服务器                            上进行处理

                3.1.3系统优化

                        为了减少通信开销,中间数据进入reduce节点前会进行一定的合并处理,一个                                     reduce节点所处理的数据可能来自多个map节点

        2.运行流程

                提交代码,对数据进行切片

                master调度worker执行map任务

                workker读取切片

                worker执行任务,将输出结果保存到本地

                master调度worker执行reduce任务,reduce worker读取输出文件

                执行reduce任务,将任务输出到HDFS上

        3.MapReduce  api开发流程

                搭建环境

                基于MapReduce框架编写代码,由Map,Reduce,Driver三部分组成

                编译打包

                上传至本地

                yarn  jar命令执行

转载请注明:文章转载自 http://www.konglu.com/
本文地址:http://www.konglu.com/it/280023.html
免责声明:

我们致力于保护作者版权,注重分享,被刊用文章【MapReduce学习】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2023 成都空麓科技有限公司

ICP备案号:蜀ICP备2023000828号-2