<strong><span style="font-size:18px;">/**** @author YangXin* @info K-Means算法会对向量元素进行多次顺序的遍历,上次表示最适合于这样的訪问模式。* 利用Mapper输出的部分向量。Reducer通过简单的拼接得到一个完整的向量。

*/ package unitTwelve; import java.io.IOException; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Reducer; import org.apache.mahout.math.NamedVector; import org.apache.mahout.math.Vector; import org.apache.mahout.math.VectorWritable; public class VectorReducer extends Reducer<Text, VectorWritable, Text, VectorWritable>{ private VectorWritable writer = new VectorWritable(); protected void reduce(Text tag, Iterable<VectorWritable> values, Context context) throws IOException, InterruptedException{ Vector vector = null; for(VectorWritable partialVector : values){ if(vector == null){ vector = partialVector.get().like(); } partialVector.get().addTo(vector); } NamedVector namedVector = new NamedVector(vector, tag.toString()); writer.set(namedVector); context.write(tag, writer); } } </span></strong>


转载于:https://www.cnblogs.com/jhcelue/p/7136553.html

组合部分标签向量并累加成完整向量相关推荐

  1. pandas将dataframe中的年、月、日数据列合并成完整日期字符串、并使用to_datetime将字符串格式转化为日期格式

    pandas将dataframe中的年.月.日数据列合并成完整日期字符串.并使用to_datetime将字符串格式转化为日期格式 目录

  2. R语言unlist函数将复杂数据(list列表、dataframe、字符串String)对象处理成简单向量vector形式:将包含dataframe和字符串的向量列表转换为单个向量(删除数据名称)

    R语言unlist函数将复杂数据(list列表.dataframe.字符串String)对象处理成简单向量vector形式:将包含dataframe和字符串的向量列表转换为单个向量(删除数据名称) 目 ...

  3. 使用bert将中文文本转化成词向量的方法

    使用bert将中文文本转化成词向量的方法 https://blog.csdn.net/qq_29660957/article/details/88683823

  4. 使用pytorch获取bert词向量 将字符转换成词向量

    转载保存: 使用pytorch获取bert词向量_海蓝时见鲸_的博客-CSDN博客_获取bert词向量 pytorch-pretrained-bert简单使用_风吹草地现牛羊的马的博客-CSDN博客_ ...

  5. c#拼图碎片形状_将碎片拼成完整的拼图

    将碎片拼成完整的拼图 时间: 2017-12-18 12:24:15 | 作者:学霸 在这个日新月异的时代,随着移动互联网的迅速发展,各类信息传播或是用于 社交的媒体快速地不断更替.为了满足不同人群个 ...

  6. 如何设置火狐主页及将火狐新建的标签页也设置成主页

    [1]如何设置火狐主页 1.先打开firefox的"选项",然后进入到"常规"这一页,将"启动firefox时"这一选项设置成"显 ...

  7. 网络数据包片段拼合(连续h264片段拼接成完整h264帧)--纠正下,是h264 slice,不是图像帧

    最近项目用的网络摄像头,从网络层获取到连续的h264片段数据,于是写了一个将连续输入数据按 指定字符串分割成一个slice数据的 class, 稍作改动,也可以用来处理 文本文件中查找 替换等等功能, ...

  8. cad连接不同线段的端点_【CAD图形】】为什么CAD连续的图形无法连接成完整的多段线...

    为什么 CAD 连续的图形无法连接成完整的多段线 在使用 CAD 软件绘图的时候, 有时候出于绘图需要, 设计师需要将连续的 CAD 图形连接成 完整的额多段线, 但是很多人总是无法成功操作, 这是怎 ...

  9. bert获得词向量_NLP中的词向量对比:word2vec/glove/fastText/elmo/GPT/bert

    作者:JayLou,NLP算法工程师 知乎专栏:高能NLP之路 https://zhuanlan.zhihu.com/p/56382372 本文以QA形式对自然语言处理中的词向量进行总结:包含word ...

最新文章

  1. Javascript中的Callback方法浅析
  2. oel6mysql_Linux7(CentOS,RHEL,OEL)和 Oracle RAC环境系列4:target(图形
  3. 类的sizeof大小和C语言中各种数据类型的长度
  4. excel只对筛选后的结果单独用公式
  5. 汽车新零售转型之路怎么走?你需要知道这些
  6. shiro的简单入门使用
  7. jdk 安装_Jdk 安装使用教程
  8. c#爬虫-解决ChromeDriver 版本问题
  9. Linux加密框架 crypto 算法模板 CBC模板举例
  10. 抽象工厂模式_设计模式——抽象工厂模式
  11. 基础编程题目集 6-3 简单求和 (10 分)
  12. apache的日志切割
  13. PHP里 date() 函数与 strtotime() 函数笔记
  14. 计算机网络—4运输层(TCP连接管理、流量控制、拥塞控制)
  15. 15个最流行的GitHub机器学习项目
  16. Bzoj4556: [Tjoi2016Heoi2016]字符串
  17. 页面视觉稳定性之优化CLS
  18. 家庭局域网_第二篇如何让电信IPTV与路由器同时上网(组建自己家庭局域网专题)...
  19. 心、肝、脾、肺、肾的毒藏在哪,你知道吗?
  20. 【Alpha】Scrum Meeting 5

热门文章

  1. mybatis应用(二)注解的实现
  2. 实验5_JPEG解码
  3. 【机器视觉】 gen_measure_rectangle2算子
  4. 【STM32】ESP8266 AT指令
  5. 【Linux系统编程】Linux 线程浅析
  6. lua执行shell命令6_tolua_runtime 集成 lua-protobuf 第三方pb3解析库
  7. 广东省计算机大赛设计什么时候,2017年广东省大学生计算机设计大赛
  8. css a标签去掉下划线_CSS入门知识汇总
  9. vue实现接受后端传过来的zip数据,axios实现
  10. 关于m_pMainWnd = dlg的错误