刚学 hadoop,第一个作业是求两地的温度相似程度。
输入文件是:
地点 ID 年份 最高平均温度
相似度的计算是:两个地点的各年温度差求和 /总年数
看到一个博客给的思路。但是不太明白具体的步骤。有没有大神帮忙解释一下:
输入:
1 f(1)
2 f(2)
3 f(3)
4 f(4)
mapper:
1,2 f(1)
1,3 f(1)
1,4 f(1)
1,2 f(2)
2,3 f(2)
2,4 f(2)
1,3 f(3)
2,3 f(3)
3,4 f(3)
1,4 f(4)
2,4 f(4)
3,4 f(4)
reducer:
1,2 f(1) f(2)
1,3 f(1) f(3)
1,4 f(1) f(4)
2,3 f(2) f(3)
2,4 f(2) f(4)
3,4 f(3) f(4)
本文作者:linger
本文链接: http://blog.csdn.net/lingerlanlan/article/details/46289661
我不太明白的是 MAPPER 如何把不同的两行联合作为 key
输入文件是:
地点 ID 年份 最高平均温度
相似度的计算是:两个地点的各年温度差求和 /总年数
看到一个博客给的思路。但是不太明白具体的步骤。有没有大神帮忙解释一下:
输入:
1 f(1)
2 f(2)
3 f(3)
4 f(4)
mapper:
1,2 f(1)
1,3 f(1)
1,4 f(1)
1,2 f(2)
2,3 f(2)
2,4 f(2)
1,3 f(3)
2,3 f(3)
3,4 f(3)
1,4 f(4)
2,4 f(4)
3,4 f(4)
reducer:
1,2 f(1) f(2)
1,3 f(1) f(3)
1,4 f(1) f(4)
2,3 f(2) f(3)
2,4 f(2) f(4)
3,4 f(3) f(4)
本文作者:linger
本文链接: http://blog.csdn.net/lingerlanlan/article/details/46289661
我不太明白的是 MAPPER 如何把不同的两行联合作为 key