谷歌MapReduce经典论文翻译(中英对照)

Java31

MapReduce: Simplified Data Processing on Large Clusters(MapReduce: 简化大型集群下的数据处理)

作者:Jeffrey Dean and Sanjay Ghemawat

Abstract(摘要)

MapReduce is a programming model and an associated implementation for processing and generating large data sets.

Users specify a map function that processes a key/value pair to generate a set of intermediate key/value pairs,
and a reduce function that merges all intermediate values associated with the same intermediate key.

Many real world tasks are expressible in this model, as shown in the paper.

MapReduce是一个关于实施大型数据集处理和生成的编程模型。
用户指定一个用于处理 k/v对并生成 中间态k/v对集合的映射(map)函数,以及一个用于合并所有具有相同中间态key的中间态value值的归约(reduce)函数。
正如本篇论文所展示的那样,很多现实世界中的任务都可以通过该模型(MapReduce)表达。

Programs written in this functional style are automatically parallelized and executed on a large cluster of commodity machines.

The run-time system takes care of the details of partitioning the input data,scheduling the program's execution across a set of machines, handling machine failures,

输入验证码查看隐藏内容

扫描二维码关注本站微信公众号 Johngo学长
或者在微信里搜索 Johngo学长
回复 svip 获取验证码
wechat Johngo学长

相关文章
Java

设计模式之迭代器模式

本文介绍设计模式中的迭代器模式,首先通俗的解释迭代器模式的基本概念和对应的四个角色,并根据四个角色举一个典型的实例,为了加强知识的连贯性,我们以Jdk源码集合中使用迭代器模式的应用进一步说明,最后说明...
Java

零基础半天做出物体检测

零基础半天做出物体检测 声明:此项目是本人应对学校的课程设计(大四,学校突然开展此课设并且他不授课,就去实验室去做这个东西。重点是啥也不教,让10天做出来!吐槽一下,拜托,时间很宝贵的,基本都要考研的...
Java

Spring、SpringBoot面试题总结

开发框架面试题总结 1.spring是什么? 轻量级的开源的J2EE框架。它是⼀个容器框架,⽤来装javabean(java对象),中间层框架(万能胶) 可以起⼀个连接作⽤,⽐如说把Struts和hi...
Java

浅谈一下流式处理平台Flink

大数据框架听过很多,比如 Hadoop,HDFS...不过自己的项目都没有上过 为什么突然提到 Flink,因为最近一个项目需要用到,所以学习最好的方式就是 项目驱动 我过去认为我必须在做之前学习一些...
Java

【每日算法】二分查找法

模板 例题 367. 有效的完全平方数 描述 示例1 示例2 提示 思路 代码 69.x的平方根 描述 示例1 示例2 提示 代码 模板 ``` left,right=1,n
Java

github学生认证——申请学生开发包

写在前面 申请学生认证的好处: GitHub学生的免费AWS Educate入门帐户,价值100美元。 专业的桌面IDE:IntelliJ IDEA,PyCharm等。学生的免费订阅,每年更新一次。 ...
Java

sql开发规范

SQL编写规约 SQL编写总原则 声明: 在没有把握或者根本没意识时,遵守规约可以保障你的程序不会"越界"。 所以规约并不代表一种最优方案或者某种教条。 当你相当有把握,明确知道自己在做什么的时候,请...
Java

ICMP 介绍

简介 ICMP(Internet 控制报文协议,Internet Control Message Protocol , RFC 792)。主要用于在IP主机与路由器之间传递控制消息,用于报告主机是否可...
Java

自己动手实现一个阻塞队列

1. 阻塞队列介绍 顾名思义,阻塞队列是一个具备先进先出特性的队列结构,从队列末尾插入数据,从队列头部取出数据。而阻塞队列与普通队列的最大不同在于阻塞队列提供了阻塞式的同步插入、取出数据的功能(阻塞入...
Java

哈夫曼树的构建与最小带权路径长度

注意:哈夫曼树并不唯一,但带权路径长度一定是相同的。 二叉树:每个结点最多含有两个子树的树称为二叉树。 定理:对于具有n个叶子结点的哈夫曼树,共有2n-1个结点。 哈夫曼树介绍 1哈夫曼树的定义 哈夫...
Java

垃圾收集器

垃圾收集器 Serial:单线程收集器、在进行垃圾收集的时候需要暂停其他线程。优点:简单高效。适用于新生代。复制算法 SerialOld:是Serial收集器的l老年代版本,,也是一个单线程收集器,不...
Java

JavaFX Metro UI 和 开发库

这是一个Windows设计风格的UI库,使用非常简单,只要一行代码就可以实现整体UI风格的替换! <span class="hljs-selector-tag">new...