博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
map-reduce流程图
阅读量:7019 次
发布时间:2019-06-28

本文共 382 字,大约阅读时间需要 1 分钟。

map、shuffle、reduce包含的流程如下:

map:split->map->buffer in memory

partition:partition/sort/spill

shuffle:copy->sort->merge

reduce:shuffle result->reduce->output

partition与shuffle区别:

partition 是指把同一个map中的数据分给不同的reduce

shuffle是指在分区过程中把相同的key分到同一个reduce

sort与combine次数:

map端两次sort;reduce端一次sort;每次sort都可以用combine优化。

转载于:https://www.cnblogs.com/cloudma/archive/2012/11/05/map-reduce-flow.html

你可能感兴趣的文章
Windows Docker 安装
查看>>
CallableStatement调用Oracle存储过程返回结果集
查看>>
Multi-Model多模数据库引擎设计与实现
查看>>
新建VLAN并启用该VLAN的DHCP功能
查看>>
Python编程进阶
查看>>
python 面向对象反射以及内置方法
查看>>
关于fix shake以及compute命令的应用问题
查看>>
[Interview] string permutation
查看>>
无心准备组会,唯画画能缓解焦虑
查看>>
python列表之修改、添加、删除、查询(四)
查看>>
java23种设计模式之一: 策略模式
查看>>
express学习点滴- 永远不要忘记异步
查看>>
《编程珠玑》推荐的计算机书籍很全面很基础
查看>>
背包问题解法集合
查看>>
git学习中....(1)
查看>>
玩转 SSH(七):使用 dubbo + zookeeper 实现服务模块化
查看>>
python发送邮件
查看>>
修改故障转移群集心跳时间
查看>>
eclipse中is missing required source folder问题的解决
查看>>
计算机基础
查看>>