最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献。最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索引再循环用sql语句去查每个词的idf,效率都十分不理想。

最新的想法是利用solr搜索引擎的速度来做,所以首先要把mysql的数据导入solr。

一、开启Solr服务

1、下载solr-5.3.1.tgz包,解压之后为solr-5.3.1

2、通过bin/solr start命令开启solr服务

3、开启服务之后,默认是开启8983端口,此时就可以使用localhost:8983/solr/进行访问了

二、从Mysql数据库中导入数据

1、创建core或collection:bin/solr create -c 集合名

2、从mysql官网中下载一个mysql-connector-java-5.1.25.zip压缩包,解压出一个mysql-connector-java-5.1.25-bin.jar包,将它分别copy到solr-5.3.1/server/lib和solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy到第一个路径应该就可以)

3、将solr-dataimporthandler-5.3.1.jar和solr-dataimporthandler-extras-5.3.1.jar从solr-5.3.1/dist/文件夹下copy到solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib当中(只copy第一个文件应该就可以)

4、修改solr-5.3.1/server/solr/集合名/conf/managed-schema文件为schema.xml

5、在schema.xml添加field(根据实际情况),如下:

6、修改solr-5.3.1/server/solr/collection/conf/下的solrconfig.xml的配置文件,增加一段添加数据库数据的xml,如下:

data-config.xml

7、在solr-5.3.1/server/solr/collection/conf/下创建data-config.xml文件,配置访问数据库的用户名、密码、查询语句,column对应数据库中字段、name对应solr的schema.xml中字段(根据实际情况),文件内容如下:

8、重启服务bin/solr restart

9、

solr5.3.1 mysql_Solr5.3.1 dataimport 导入mysql数据相关推荐

  1. solr两种安装、ik分词器设置、DIH导入mysql数据

    文章目录 solr 安装(内置方式) solr 安装(tomcat方式) IK中文分词器设置 solr数据操作 使用dataimport导入数据库数据 solr 安装(内置方式) 安装包 官网下载安装 ...

  2. Windows下Solr的安装与配置,附DIH全量导入MySQL数据、IK分词器配置详解——不用集成Tomcat

    Solr是Apache开源的比较稳定的一款全文搜索引擎,也是市面上相对比较流行的一款全文搜索引擎,好不好用你用过之后自有判断.今天给大家分享一下它的安装与配置,我用的是7.7.2版本.废话不多说,开搞 ...

  3. Sqoop在导入MySQL数据时遇到Timestamp列为0000-00-00 00:00:00报错

    为什么80%的码农都做不了架构师?>>>    Sqoop在导入MySQL数据时遇到Timestamp列为'0000-00-00 00:00:00'时报错,解决方法是:在JDBC连接 ...

  4. mysql导入access2016_php 导入mysql数据到access方法

    我们来看看关于php 导入mysql数据到access方法 哦,下面是一个简单的实例哦,如果你正在把mysql的数据导入到access的话看到这肯定肯定可以实例了. mysql数据库表sqltable ...

  5. 将Excel表格导入mysql数据表_如何把Excel导入mysql数据表的方法详解

    把Excel导入mysql数据表其实是一件非常的简单的事情了,我们可以通过多种方法来实现了,下面我们来看一些关于小编整理的把Excel导入mysql数据表的方法了. 方法一 把Excel导入mysql ...

  6. 使用LOAD DATA和INSERT语句导入Mysql数据

    在"MySQL数据库(表)的基本操作"一节中我们创建过一个会员注册表"Users",这次我们就往这个表中以不同的方式导入数据. INSERT语句 关于INSER ...

  7. 【华为云技术分享】使用sqoop导入mysql数据到hive中

    Sqoop 是一个数据转储工具,它能够将 hadoop HDFS 中的数据转储到关系型数据库中,也能将关系型数据库中的数据转储到 HDFS 中. Apache Sqoop,是"SQL to ...

  8. python导入data-Python通过load data导入MySQL数据

    如何使用python连接MySQL数据库,并进行增删改查操作呢?如何将大批量数据导入数据库的情况,又该如何使用Python进行大数据的高效导入呢? 一.环境介绍 Python版本:Python3.6 ...

  9. mysql导入excel为什么丢行_Excel导入mysql数据丢掉

    Excel导入mysql数据丢失 昨天晚上弄了一个晚上都没解决,来这里求助下,谢谢各位了 for($j=3;$j<=$highestRow;$j++)//表头不读取 { $a = $objPHP ...

最新文章

  1. golang 基础知识4
  2. Win7下安装ubuntu (双硬盘用户加强版)
  3. C/C++之动态分配内存
  4. Day24--Part2-伪Ajax(iframe)
  5. 博览安全圈:360曝Office高危漏洞 微软及时修复
  6. 外设驱动库开发笔记27:ESP8266无线通讯驱动
  7. VS系列IDE(2005、2008等)下使用cppunit的方法及使用示例
  8. [转载] Python学习笔记 String类型常用方法
  9. python编写函数模拟猜数游戏、系统随机产生一个数_C语言编程:编写一个猜数的游戏,系统自动产生一个随机数,你来猜,程序给出提示,直到猜对为止。...
  10. latex生成pdf中文标签乱码pdf复制乱码
  11. android版usb转网线驱动,usb网线转换器驱动下载
  12. 使用maven打jar包
  13. VMware ESXi安装mac os
  14. Message Queue
  15. Netty 如何做到单机百万并发?
  16. 2×3卡方检验prism_别错过,卡方检验实用总结
  17. Java邮箱正则匹配
  18. 切片器可以设置日期格式?_如何分秒必争浅淡时间切片器
  19. 蚁群算法java实现_简单蚁群算法 + JAVA实现蚁群算法
  20. 滴滴云上使用 eCryptfs 加密数据

热门文章

  1. ue4小白人骨骼定义_动画短片在UE4中的工作流程都有哪些?来看游戏建模师如何分析的...
  2. 临时手机验证码_实用网站(一)短信验证码 临时网盘 临时邮箱
  3. oracle开窗函数是什么,ORACLE数据库(六)-----开窗函数
  4. 树莓派okdo_创客的AK47—树莓派4正式发布,性能大幅提升,售价仅为35美元。
  5. Linux查看c语言组件进程,Linux下查看进程IO工具iopp
  6. 看完这个你还不理解右值引用和移动构造 你就可以来咬我(下)
  7. oracle查询哪个sql占用资源,查询oracle最耗资源的sql语句
  8. WPF 和 windows Form Application的区别
  9. 左手价格战右手结盟 巨头加码云计算市场洗牌在即
  10. 20170429,上市公司2016年报全出炉(附最新排行榜)