Tomcat7,solr3.6,mmseg1.8

1:环境的搭建

1:解压tomcat,solr,mmseg4j

2:复制dist文件夹下apache-solr.war到tomcat的webapp文件夹下,修改文件名为solr(不该也行,这里修改文件名方便一会地址栏的输入)

3:创建solr-tomcat文件夹作为solr的根目录

4:tomcat/conf/Catalina/localhost文件夹(不存在手动创建)下创建solr.xml,文件内容如下,根据情况,修改相应的路径

5:复制solr解压后,example文件夹下的solr文件夹到solr-tomcat文件夹下

6:访问http://localhost:8080/solr/,验证是否配置成功(访问后,solr-tomcat/solr文件夹下会多一个data文件夹)

2:配置文件的说明

1:apache-tomcat-7.0.19\conf\Catalina\localhost\solr.xml文件,用来配置solr的根目录,目前只用到一次

2:E:\solr-tomcat\solr\solr.xml文件,目前只看到在配置多核时用到,后面讲

3:E:\solr-tomcat\solr\conf\schema.xml文件(非常重要)

配置域的类型

配置域,在doc文档中的用到的field和solrj中用到的域名必须在这里配置。Index表示是否需要索引,stored是否需要存储,multiValued表示是否有多个值

就是动态匹配

在搜索时可以直接通过“zhang san”来搜索那么,不需要在通过“name:zhang san”来搜索

4:E:\solr-tomcat\solr\conf\solrconfig.xml文件:缓存,请求的配置,索引的配置

3:浏览器客户端的说明

Solr->analyze:分词

Query String:根据索引搜索时用。eg:name:zhang san可以通过name来搜索姓名是zhang san的人。如果配置了copyField也可以直接通过zhang san来搜索

4:中文分词的配置

1:解压mmseg4j,拷贝mmseg4j-all-1.8.5.jar到tomcat\webapp\solr的lib目录下

2:solr-tomcat\solr下创建dic文件夹,存放词库;拷贝mmseg4j下的words.dic到该目录下

3:修改schema.xml文件,添加如下代码(注意修改路径)

4:测试中文分词是否起作用

复制一段中文到Field value中;Field选择name输入complex,测试分词

name在使用name(没有配置中文分词,使用默认的)再次进行测试

5:多核的配置

1:拷贝example\multicore文件夹下的core0,core1,solr.xml到solr-tomcat\solr文件夹下

2:方位http://localhost:8080/solr/

使用浏览器客户端创建索引,搜索

4:创建索引(xml,json,cvs格式的文件cookbook)

1:复制solr解压后的,example文件夹下的exampledocs目录到solr-tomcat下(里面包含了一些测试索引用到的文件)

2:命令行创建索引:E:\solr-tomcat\exampledocs>java -Durl=http://localhost:8080/solr/update -Dcommit=yes -jar post.jar m*.xml,对该文件夹下所有以m开头的xml文件创建索引,此时solr-tomcat\solr\data文件夹下多了一些文件,有段文件,域文件,索引文件等

3:通过浏览器进行搜索,必须通过一个完整的分词(一个完整的单词,不能用a,m,z等搜索,同时this,that等也不能用于搜索)

5:更新索引

更新索引一般都是通过删除索引,然后再创建

6:删除索引

Solrj的使用

private static final String DEFAULT_URL = "http://localhost:8080/solr/";

1:创建索引(如何对一个指定格式的xml创建索引还不清楚)

对文件进行索引

public void index() throws SolrServerException, IOException {

SolrServer solrServer = new HttpSolrServer(DEFAULT_URL);

SolrInputDocument document = new SolrInputDocument();

document.addField("id", "1"); //id必须有

document.addField("name", "test");

document.addField("path", "测试"); //path需要在schema.xml中定义

solrServer.add(document);

solrServer.commit();

}

对Bean进行索引

public class SolrItem {

/**

* id,对应Solr中记录的Id

*/

@Field("id")

public String id;

/**

* 员工姓名

*/

@Field("title")

public String empName;

/**

* 员工邮箱

*/

@Field("subject")

public String email;

...

}

public void index() throws SolrServerException, IOException {

SolrItem item = new SolrItem();

item.setId("1");

item.setEmpName("张三");

item.setEmail("test@ppstream.com");

solrServer.addBean(item);

solrServer.commit();

}

2:搜索

public void query(String query) {

SolrParams params = new SolrQuery(query);

try {

QueryResponse response = solrServer.query(params);

SolrDocumentList list = response.getResults();

for (int i = 0; i < list.size(); i++) {

fail(list.get(i));

}

} catch (SolrServerException e) {

e.printStackTrace();

}

}

3:删除索引

public void delete(String params) throws SolrServerException, IOException {

solrServer.deleteByQuery(params);

//solrServer.deleteById(params);

}

4:高亮显示

public SolrDocumentList query(String str) {

SolrQuery query = new SolrQuery(str);

//设置高亮,以下两种方式都行(相当于开启高亮功能)

//query.setHighlight(true);

query.setParam("hl", "true"); //highlighting

//设置高亮显示的请求,高亮显示的内容由该参数决定,但是返回结果还是由SolrQuery决定

//query.setParam("hl.q", "email:zhang@ppstream.com");

/*

* 那些字段高亮显示,可以用空格或者逗号分隔(有一个域的时候正常,两个及以上没测试通过)

* 老版本使用query.addHighlightField("name");query.addHighlightField("description");给多个字段开启高亮功能

*/

query.setParam("hl.fl", "name");

//高亮显示字段前后添加html代码

query.setHighlightSimplePre("");

query.setHighlightSimplePost("");

SolrDocumentList list = new SolrDocumentList();

SolrDocument document = null;

QueryResponse response=new QueryResponse();

try {

SolrDocumentList documents = response.getResults();

//第一个Map的键是文档的ID,第二个Map的键是高亮显示的字段名

Map>> map = response.getHighlighting();

for(int i=0;i

document = documents.get(i);

document.setField("name", map.get(document.getFieldValue("id")).get("name"));

/*document.setField("email", map.get(document.getFieldValue("id")).get("email"));*/

list.add(document);

}

} catch (Exception e) {

}

return list;

}

Solr的其他应用

1:对一篇文章的前100个分词字创建索引

有时可能需要对某个字段(文章的内容content)的前1000个字符创建索引并存储,可以在solrconfig.xml中添加1000实现(默认是1万)。这里是分词数量,不是汉字或字母的个数。

2:配置中文分词后,如果查询“java编程思想”,会自动拆分成java,编程,思想3个分词依次进行查找

3:多条件查询

可以通过“编程 AND empName:XXX”进行查询,或者“编程 OR empName:XXX”等

4:字段当做一个整体,不进行分词

如果某个字段不需要使用分词,eg:java编程思想,只有在输入完成的书名:java编程思想才会搜索出来,可以在书名字段上的type使用不带分词的类型(schema.xml中配置)

5:检索索引中的部分字段

有时索引中可能存放很多信息,eg:书名,作者,出版时间,ISBN…….;在某次查询中,我们只需要搜索结果书名和作者即可。可以通过如下方式实现

SolrQuery query = new SolrQuery(param);

//返回的结果

String[] str = {"title", "author"};

query.setFields(str);

6:Solr的分页

SolrQuery query = new SolrQuery("*:* AND (empName:XXX OR empName:XX)");

query.setHighlight(true);

query.setStart(0);

query.setRows(2);

QueryResponse response = solrServer.query(query);

long totalCount = response.getResults().getNumFound();

totalCount返回的是满足条件的总记录条数,并不一定是0或2

7:solrj高亮显示时,只显示字段部分内容

SolrDocumentList list = response.getResults();

Map>> map = response.getHighlighting();

//对应的高亮字段(假设是content)。在list中显示正确,map中显示的只是content中的一部分。

query.setHighlightFragsize(100000); //可以通过这种方法改变,设置一个比list中,对应content内容大的数字

query.setHighlightSnippets(0);//或者设置高亮片段为0,这样关键字也就不会在高亮显示

8:搜索条件的部分关键字高亮显示

有时我们查询根据条件“java OR (empId:1000 AND empId:1001)”搜索时,结果如果高亮显示,可能出现1000,1001数字也会高亮,但是我们只希望java关键字高亮,这个时候可以用下面的方法

query.setParam("hl.q", "lucene solr");只对lucene和solr关键字进行高亮显示(solr不作为搜索条件也可以)

9:显示第一个匹配关键字附近的部分内容

有时我们需要显示检索出内容的一部分(在列表页,只需要显示一个概要信息),这时候可以通过设置query.setHighlightFragsize(100000);的大小来控制

10:schema文件,copyField配置

11:自动补全

搜索时在title和content上进行搜索,所以自动补全时要在title和content上同时进行。但是自动补全只能在一个字段上进行(目前我知道这样),所以就创建一个新字段searchField=title+”,”+content用来进行自动补全的提示,该字段仅用来索引不需要存储。

SolrQuery query = new SolrQuery(q);

query.addTermsField(searchField);

query.setTerms(true);

query.setTermsLimit(limit);

query.setTermsLower(pre);

query.setTermsPrefix(pre);

query.setQueryType("/terms");

QueryResponse qr = solrServer.query(query);

TermsResponse resp = qr.getTermsResponse();

List list = resp.getTerms(searchField);

这种搜索存在的问题:

1: q:empName:XXX AND projecteId:19    pre:lucen   在搜索时,返回的TermsResponse结果只应用了pre一个条件

2: title,content无法配置copyField字段使用complex(原因及解决办法没找到)

解决方法:改用Facet替换Term

SolrQuery query = new SolrQuery(q);

query.setFacet(true);

query.addFacetField(searchField);

query.setFacetLimit(limit);

query.setFacetPrefix(pre);

QueryResponse qr = solrServer.query(query);

List fss = qr.getFacetFields();

FacetField ff = fss.get(0);

return ff.getValues();

返回的fss结果仍然是根据pre一个条件返回的结果集,但是不满足条件query的结果集中,对应的count为0,即出现了0次

12:solr删除索引后,索引文件还存在,但是搜索结果已经不存在

13:添加tomcat验证,防止用户直接通过地址栏访问solr,进行修改删除索引

1:修改tomcat-user.xml文件

2:修改solr的web.xml文件,添加如下代码,对所有的请求,都需要tomcat用户及密码的验证

solr

/*

GET

POST

This applies only to the "tomcat" security role

admin

BASIC

admin

3:使用该方法后,通过solrj也不能直接访问,修改如下

String url = PropertiesSon.getText("solr.serverUrl");

String username = PropertiesSon.getText("solr.username");

String password = PropertiesSon.getText("solr.password");

String host = PropertiesSon.getText("solr.host");

int port = Integer.parseInt(PropertiesSon.getText("solr.port"));

DefaultHttpClient httpclient = new DefaultHttpClient();

httpclient.getCredentialsProvider().setCredentials(

new AuthScope(host, port),

new UsernamePasswordCredentials(username, password));

solrServer = new HttpSolrServer(url, httpclient);

4:使用该方法创建时,删除添加索引报错“Cannot retry request with a non-repeatable request entity.”

修改方法:url用http://username:password@10.1.11.165:8081/solr取代http://10.1.20.57:8081/solr(httpclient使用 4.2是时正常,使用4.1时,在删除新增索引仍然会报上面的错误)

solr java浏览器访问_solr解决访问安全相关推荐

  1. 【分享】无法访问GitHub 访问GitHub 解决访问GitHub

    背景:经常需要访问GitHub,但是每次都会卡在跳转到GitHub的步骤,就是还没开始就可以结束了.之前也有尝试过手动修改host文件来解决网站的访问问题 以及更换网络但还是有时候无法如愿的访问Git ...

  2. linux部署tomcat启动后无法访问,linux中启动tomcat后浏览器无法访问的解决方法

    前言 不论是要启动,还是要关闭tomcat服务,都是要去到tomcat安装目录下的bin路径,当然你要是电脑关机自然是不需要的. 但最近在启动后发现了一个问题:Centos服务器,本地和服务器ip互p ...

  3. qq浏览器网站禁止访问怎么办 qq浏览器网站禁止访问如何解决

    打开手机的QQ浏览器说访问网页被禁止,是设置错误造成的,解决方法如下: 1.首先在手机屏幕上左右滑动,找到安装好的QQ浏览器的图标. <a style=qq浏览器网站禁止访问怎么办 qq浏览器网 ...

  4. ie9以下兼容ajax跨域访问,解决ie9以下浏览器ajax请求报error拒绝访问方案 解决ie9以下浏览器ajax请求报400问题方案

    解决方案如下: 1.ie9以下兼容ajax跨域访问   2.ajax请求开始前添加 jQuery.support.cors = true;  允许跨域 3.ie浏览器设置允许通过域访问数据 并且 ur ...

  5. vue检测是不是360浏览器兼容模式_360安全浏览器兼容模式无法访问vue怎么解决?...

    360安全浏览器兼容模式无法访问vue怎么解决?下面本篇文章给大家介绍一下vue在IE和360兼容模式下无法显示问题.有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助. 360兼容模式下 ...

  6. 拒绝访问html,IE拒绝访问如何解决?IE拒绝访问的原因及解决方法

    我们在打开IE浏览器浏览某网页的时候,可能有遇到IE拒绝访问的提示,而IE拒绝访问的原因有很多,那么IE拒绝访问如何解决?下面装机之家分享一下IE拒绝访问的原因及解决方法. IE拒绝访问的原因: 因为 ...

  7. 拒绝访问html,为什么IE常常出现拒绝访问 ie拒绝访问的原因及解决方法

    随着生活水平的提升以及科学技术的进步,电脑进入千家万户,成为家庭的必需品之一.随着电脑使用率的上升,越来越多的电脑问题暴露在人们的面前.而对于刚刚学会使用电脑的人来说,这无缘是束手无策.这就有必要了解 ...

  8. Selenium Webdriver 的使用java执行js代码 解决 ScriptEngine不支持浏览器内置对象window,document的问题

    问题场景: 使用java 掉用js代码,发现 ScriptEngine不支持浏览器内置对象window,document的问题: 问题一:为什么要 用java掉用js代码? 比如在 抓取(爬取)对方网 ...

  9. java spring省略jsp,Java +Tomcat + SpringMVC实现页面访问示例解析

    window7下Java环境安装记录: 一.安装Tomcat 1.下载tomcat 7.0,解压,无需安装,放置到目录:D:\apache-tomcat-7.0.90. 2.配置系统环境变量,CATA ...

最新文章

  1. 中山大学计算机学院运动会,喜讯!我院获2019中大校运会教工组团体第二名
  2. 儿子转眼就长大:Hinton、LeCun、Bengio 口述神经网络简史
  3. 图像降噪算法——维纳滤波
  4. 如何在ABAP ALV中具体的控制每个格子中的编辑属性
  5. 以太坊代币标准: ERC20、ERC223的介绍与比较
  6. xstream 数字映射不上去_6个做端口映射的步骤,外网访问内网,菜鸟也能做?
  7. UVA-1 #1. A + B Problem
  8. excel运行没反应_Excel数据很少文件却很大,问题出在哪里呢?两种方法轻松解决...
  9. Oculus关于Internal Error:OVR53225466报错解决方法
  10. 阿里巴巴100%云上双11
  11. 订单生产计划表范本_生产计划表(生产计划表格模板)
  12. C++模板编程(18)---模板实例化instantiation
  13. location.hostnbsp;与nbsp;locat…
  14. ROS学习笔记14:ROS摄像头驱动及数据接口
  15. 客户服务与工单管理系统功能大全
  16. xss.haozi.me弹窗练习0x00-0x10
  17. vs2015遇到找不到kernel32.lib,无法解析的外部符号 __imp__printf的问题
  18. 在蓝图中设置人物动作 教程
  19. 【汇正财经】什么是股权结构?
  20. Swift游戏实战-跑酷熊猫 07 平台的移动

热门文章

  1. Java知多少(66)输入输出(IO)和流的概述
  2. 技能的切实掌握 必须动手
  3. 多年以后重发:多线程安全的变量模板
  4. 快学Scala习题解答—第二章 控制结构和函数
  5. Oracle Database 11g Express Edition使用限制,与其他版本的区别
  6. 微型计算机控制技术试卷B,微型计算机控制技术试卷b..doc
  7. python程序运行原理_谈谈 Python 程序的运行原理
  8. CBT的完整形式是什么?
  9. Java FilePermission getActions()方法与示例
  10. math.asin_JavaScript中带有示例的Math.asin()方法