项目实训工作记录(二)赵乐乐 201800301115

词向量搜索分析与算法设计

  • 项目实训工作记录(二)赵乐乐 201800301115
  • 1.词向量搜索
  • 2.搜索过程中的问题分析
  • 3.基于效率的算法设计
    • 3.1概要
    • 3.2聚类算法的具体设计

1.词向量搜索

对于最基础的基于腾讯800万词向量寻找同义词,其核心在于搜索匹配,乃是输入一个同义词后,通过词向量匹配,从800万词向量库中找到正确的同义词,其比较方式为求余弦值,因为同义词之间词向量相差小,夹角小,利用余弦值来衡量夹角大小。

2.搜索过程中的问题分析

因为词向量库太大,如果挨个查询与输入词进行余弦值比较,那么需要很大的计算量,使得查询的效率很低,无法满足用户的查询要求。

3.基于效率的算法设计

3.1概要

为了提升效率,显然要改变最基础的查询方式,设计一种提升效率的查询算法。
两位小组成员进行了过滤处理,以过滤掉没有同义词的那些词向量。
我提出了聚类的想法,与另一位小组成员进行了沟通与商讨,并决定分别用代码实现,其中,我负责用Python语言完成代码工作。

3.2聚类算法的具体设计

1.使用聚类的方式将800万词向量存入数据库
2.具体工作流程如下:
2.1设置聚类阈值角度a,对应余弦值
2.2按序读词向量,每一个词向量与之前的词向量类的中心向量比较,若满足阈值条件加入该类,否则以该向量为中心向量建立新类。
3.从数据库搜索同义词
4…具体工作流程如下:
4.1搜索时以2a对应的余弦值为搜索范围,找到所有对应范围内的中心向量对应的类,并依次检索,找到满足条件b范围的所有词向量作为同义词输出。

项目实训工作记录(二)相关推荐

  1. 项目实训工作总结(2)

    尝试利用决策树进行分类以及成绩预测 任务是回归,组长大佬在用各种模型做回归,于是我想先进行分类(后来老师指导说可以先尝试进行分类),通过之前机器学习课的学习,对于这种多属性的数据进行分类,我的第一尝试 ...

  2. 项目实训(十二)FPS游戏之角色移动的脚步声

    文章目录 前言 一.存放脚步声音 二.设置脚步声 1.角色发出声音的必备条件 2.如何检测角色是否有移动 3.如何实现角色踩踏位置的对应材质的声音 三.修复下蹲移动时没有脚步声音 前言 FPS游戏之角 ...

  3. 创新实训工作记录2018-5-31

    我们拍摄了第五集剧本,地点包括教学楼和宿舍,并且我使用pr完成初步的剪辑合成.

  4. 学生计算机培训照片,四川新华电脑学校三维项目实训室参观照片

    四川新华电脑学校为加强学生的实践动手能力,每个专业开设项目实训室,新华独创"任务驱动式五步教学法"让每位新华学子理论与实践并驾齐驱,学校课程设置改革紧跟市场需求,市场需要什么人才, ...

  5. 项目实训-关键词提取-任务理解工作分配

    项目实训记录系列博客 一马当先,争做国家栋梁. 博客说明 本博客初衷是用于学校项目实训知识梳理.工作内容.收获感悟的记录. 若能在您的学习之路上有所帮助,不胜荣幸.但若需转载,也请注明出处. 博客包含 ...

  6. 项目实训 - 智能车系统 - 第七周记录

    项目实训 - 智能车系统 - 第七周记录 日期:4.04 – 4.10 项目进度 本周工作进展: 更换了底层的通信框架(shm) 熟悉速腾雷达驱动,以及ros相关驱动,为二次开发驱动做准备 1.更换底 ...

  7. 项目实训记录(1-2周)

    前言 我是我们项目实训小队的队长,负责了开题答辩.下面是项目实训1-2周的工作记录. 一.确定选题 我们小组四个同学就选题进行了很长时间的讨论,最后确定选择做一个基于人工智能技术的大学生辅助学习系统. ...

  8. 山东大学软件学院项目实训-创新实训-山大软院网络攻防靶场实验平台(二)-docker安装与学习

    目录 前言: 一.docker安装 1.centos7使用yum安装 二.命令行创建 docker 容器测试 前言: 项目实训立项通过后的几天均在学习 docker 的相关知识,上一篇文章也简单记述了 ...

  9. 项目实训-收尾工作-组织协调

    项目实训记录系列博客 一马当先,争做国家栋梁. 博客说明 本博客初衷是用于学校项目实训知识梳理.工作内容.收获感悟的记录. 若能在您的学习之路上有所帮助,不胜荣幸.但若需转载,也请注明出处. 博客包含 ...

最新文章

  1. a different object with the same identifier value was already associated with the session:
  2. SharePoint 2013 配置基于AD的Form认证
  3. mysql-自动备份数据库服务
  4. 【Android 高性能音频】Oboe 函数库简介 ( Oboe 简介 | Oboe 特点 | Oboe 编译工具 | Oboe 相关文档 | Oboe 测试工具 )
  5. 【转】C# 调用 C++ 数据转换
  6. UML模型中的图-行为图【交互图-序列图、协作图】
  7. 巨型机是一种什么的超级计算机,这个世界其实是一个超级计算机
  8. MVC中Model BLL层Model模型互转
  9. 杂谈---如果你是面试官,你希望你未来的同事具有哪些能力呢?
  10. 虚拟化学习笔记-虚拟机迁移的分类及原理
  11. 【软件体系结构】考点整理
  12. 小米虚拟键透明方法_小米 6 用户该换机了!小米 6 Pro 曝光
  13. rails关于utf8问题-------------------utf8申明必须置顶
  14. 软件测试的八股文内容
  15. iOS 苹果企业账号申请流程
  16. python设置颜色_使用python改变颜色的色调
  17. PostgreSQL on Linux 最佳部署手册
  18. HTML5制作99乘法表
  19. Docker教程01
  20. 相机照片删除了怎么恢复?60%的人都用这三步解决了

热门文章

  1. 陈景润对哥德巴赫猜想“执迷不悟”
  2. matlab电力系统失磁仿真图,基于MATLAB的发动机失磁保护
  3. 数字图像处理——实验一 Python中数字图像处理的基本操作
  4. 【电路】驻极体麦克风前置放大电路
  5. 六、colab训练模型
  6. 生成式AI颠覆了所有人机交互模式,大批产品经理失业
  7. Linux文件系统笔记
  8. 手机拍照稳定器项目_代码解析
  9. 在网页中调用摄像头实现拍照上传 - 高拍仪二次开发
  10. 昨晚,我用python帮隔壁小姐姐P证件照 自拍,然后发现。。。