今天在测试相似度算法的过程中,出现了一些问题,比如

('预付卡怎么设置\n', '预付卡 设置', '预付卡怎么设置\n', '预付卡 设置', 1.029370301661967)
('预付卡怎么设置\n', '预付卡 设置', '怎么使用购物卡\n', '使用 购物卡', 0.59755888783038)
('预付卡怎么设置\n', '预付卡 设置', '购物卡怎么办理\n', '购物卡 办理', 0.59755888783038)
('预付卡怎么设置\n', '预付卡 设置', '不知道怎么激活预付卡\n', '激活 预付卡', 0.5972514130863055)

明明 【激活 预付卡】跟【预付卡 设置】的相似度,要比【使用 购物卡】高,可是为什么反而低?

根本原因是因为 预付卡与购物卡过于相似,而设置与激活又有一定的相似词,所以出现这种情况

目前来说,需要调的参数

top n,既要分开相似词与相同词(topn尽可能高),又要让相似词尽量相似,又要尽可能的区分不相似词的不相似度

激活 预付卡
(array([  71,  135,  235,  314,  326,  484,  579,  583,  693,  892,  923,
       1120, 1132, 1138, 1184, 1370, 1440, 1513, 1867, 2196, 2417, 4352],
      dtype=int64),)

购物卡 办理
(array([  235,   314,   326,   579,   693,   892,   970,  1138,  1184,
        1247,  1370,  1394,  1452,  1513,  2139,  2147,  2196,  2282,
        2417,  2872,  3410, 13887], dtype=int64),)

使用 预付卡
(array([  41,   58,  235,  257,  314,  326,  579,  596,  693,  747,  755,
        906, 1138, 1184, 1370, 1551, 1867, 2055, 2196, 2368, 2920, 4352],
      dtype=int64),)

我已经测试过词向量映射到句子向量了,是正确的

转载于:https://www.cnblogs.com/yjybupt/p/9952814.html

算法测试及对比度进一步增强相关推荐

  1. 人脸识别算法_格灵深瞳在人脸识别算法测试(FRVT)中斩获全球第一

    1月6日,美国国家标准与技术研究院(NIST)公布了最新的人脸识别算法测试(FRVT)成果,格灵深瞳再次刷新纪录:在7项测试子任务中,获得2项第一.3项第二,综合排名世界第一的成绩. 过去几个月,很多 ...

  2. 【AI测试】机器学习项目的测试,算法测试

    目录 一.算法测试 1.模型评估 2.鲁棒性 (robustness) 3.模型安全 4.响应速度 二.业务测试 三.白盒测试 四.模型监控 五.算法测试学习入门 一.算法测试 1.模型评估 如何评估 ...

  3. 基本算法研究1-冒泡排序算法测试

    基本算法研究1-冒泡排序算法测试 1.经典冒泡排序法基本原理 先看一个动态图,感觉比较形象: 冒泡排序(Bubble Sort)是一种简单的排序算法.默认是从小到大排序,即把最大的数据排在最后,相当于 ...

  4. 小样本学习数据集||Omniglot和miniImagenet||MAML算法测试

    元学习论文总结||小样本学习论文总结 2017-2019年计算机视觉顶会文章收录 AAAI2017-2019 CVPR2017-2019 ECCV2018 ICCV2017-2019 ICLR2017 ...

  5. 格灵深瞳——人脸识别算法测试FRVT

    7月3日,美国国家标准与技术研究院(NIST)公布了全球最权威的人脸识别算法测试(FRVT)的最新结果,首次参与此竞赛的格灵深瞳取得了优异成绩:在最具挑战的"非约束性自然环境人脸照片&quo ...

  6. Weisfeiler-Lehman(WL)算法测试图同构

    参考文献 [1]Weisfeiler-Lehman算法测试图同构 [2]图神经网络的表达能力与Weisfeiler-Lehman测试 [3]什么是Weisfeiler-Lehman(WL)算法和WL ...

  7. 虹膜识别算法 matlab,基于MATLAB GUI 的虹膜识别算法测试平台

    基于MATLAB GUI 的虹膜识别算法测试平台 田启川;潘泉;程咏梅;张洪才 [期刊名称]<计算机仿真> [年(卷),期]2006(023)002 [摘要]虹膜识别是一种重要的利用生物学 ...

  8. C++:实现量化Mersenne twister梅森旋转算法测试实例

    C++:实现量化Mersenne twister梅森旋转算法测试实例 #include "mersennetwister.hpp" #include "utilities ...

  9. 从人工智能 (AI)发展应用看算法测试的测试策略

    https://www.toutiao.com/a6708688571563246087/ 随着人工智能的发展与应用,AI测试逐渐进入到我们的视野,传统的功能测试策略对于算法测试而言,心有余而力不足, ...

最新文章

  1. Linux字符设备驱动程序的框架(新写法)
  2. 金山员工被离职后拿到高薪工作:感谢公司辞退我,还给我赔偿金
  3. python简单算法题_python几道简单的算法题
  4. JVM的监控工具之jinfo
  5. 网关和BFF是如何演进出来的?
  6. pandas之数值计算与统计
  7. 顺序容器(vector、list、string、deque、forward_list)及迭代器、容器适配器
  8. 【ElasticSearch】Es 缓存
  9. 【Clickhouse】Clickhouse 物化视图 MATERIALIZED VIEW
  10. 初学编程者如何摆脱搭建开发环境的困扰?
  11. 使用 Docker 一步搞定 ZooKeeper 集群的搭建
  12. 打卡赠书,新一年的读者福利 !
  13. python垃圾邮件识别_Python之机器学习-朴素贝叶斯(垃圾邮件分类)
  14. A Density-Based Algorithmfor Discovering Clusters in LargeSpatial Databaseswith Noise(KDD-96)
  15. linux vim命令详解 编辑文件 保存 退出
  16. JPBC库应用之BLS签名
  17. java吸血鬼数字_吸血鬼数字的简单实现
  18. Java毕设项目会议室预约管理系统(java+VUE+Mybatis+Maven+Mysql)
  19. NGS_RNA-Seq
  20. 不接电话会让你的备案号注销(附:网站备案电话查询)

热门文章

  1. DataGridView DataGridViewCheckBoxColumn编辑时实时触发事件
  2. CallBack函数 回调函数
  3. sobel prewitt算法 模板加权模糊的解释 + 两类边缘下的二阶导数值
  4. C# 二维码的生成 Open Source QRCode Library
  5. android 存储私有文件,是否可以只在Android应用程序的私有目录中保存图像,而不是设备的内部或任何外部存储?...
  6. 基于共享内存的聊天室服务程序
  7. leetcode —— 909. 蛇梯棋
  8. leetcode —— 11. 盛最多水的容器
  9. Matlab--view函数详解
  10. 你应该要掌握的7种回归分析方法