在使用elasticsearch建设站内搜索时,随着数据不断丰富,为了数据管理更加精细化,必须建立并实时维护“数据目录”(在程序设计中对应的叫法“数据字典”)。

数据目录需要包含以下几个维度:数据名称、数据分类、数据来源、数据状态、数据量、数据抽取用时、索引时间、操作阶段等。

数据名称:必须要为各类数据名称的命名定义一个标准,在前期阶段,即使是个简易的标准,也比没有标准强万倍,在后续建设中,再不断丰富标准的内容。

数据分类:业务数据、流程数据、消息队列、临时数据、人员数据、权限数据等。

数据来源:具体到项目实际,可分为生产系统、在线归档系统、离线归档系统、共享文件存储空间、外围系统、公网。

数据量:便于数据流处理过程中各个环节数据核对、历史对照、后续工作评估。

数据抽取用时:用于后续工作评估

索引时间:记录时间。

操作阶段:数据评估阶段、数据清洗阶段、数据核对阶段、数据转换阶段、最终阶段等。

转载于:https://www.cnblogs.com/jiangtao1218/p/8490381.html

站内搜索(ELK)之数据目录相关推荐

  1. ElasticSearch技术方案(二)——站内搜索

    文章目录 背景 ES实现站内搜索 ES实现站内搜索 流程图 站内搜索实现分析 SpringBoot整合SpringData ElasticSearch 1. 引入依赖: 2.配置application ...

  2. ajax+lucene pdf,基于Ajax/Lucene的站内搜索技术研究

    摘要: 站内搜索引擎是找出网站重要信息的必要工具,高效的站内搜索将有助于提升网站的价值,发挥网站应有的作用.虽然现在一些网络巨头已开始研究并应用这类工具,但整个互联网行业中,受制于技术的门槛,真正的站 ...

  3. -gMIS持续优化更新, +InSiteSearch站内搜索

    2019独角兽企业重金招聘Python工程师标准>>> -gMIS 部署和应用的场景越来越多,最近在考虑为所有gMIS承载管理的数据库系统增加一个站内搜索功能, +InSiteSea ...

  4. 一个ASP站内搜索的实例源代码

    假如你拥有一个庞大的网站,比如(www.ehpos.com),内容又多,那么来访者往往很难找到自己所需要的东东,这时候你就需要一个站内搜索来帮助来访者更快的找到索要的资料了!现在你就可以用asp轻易的 ...

  5. 一步步开发自己的博客 .NET版(5、Lucenne.Net 和 必应站内搜索)

    前言 这次开发的博客主要功能或特点:     第一:可以兼容各终端,特别是手机端.     第二:到时会用到大量html5,炫啊.     第三:导入博客园的精华文章,并做分类.(不要封我)     ...

  6. Lucene.net站内搜索—5、搜索引擎第一版实现

    目录 Lucene.net站内搜索-1.SEO优化 Lucene.net站内搜索-2.Lucene.Net简介和分词 Lucene.net站内搜索-3.最简单搜索引擎代码 Lucene.net站内搜索 ...

  7. 使用Google Custom Search打造站内搜索

    链接: Google AJAX 搜索 API 参考: http://www.google.com/cse/docs/cref.html?hl=zh-CN http://www.google.com/c ...

  8. 站内搜索--3--之Lucene.Net使用

    上一篇 站内搜索---2----之Log4Net使用 Lucene.Net是由Java版本的Lucene移植过来的,所有的类.方法都几乎和Lucene一模一样. Lucene.Net只是一个全文检索开 ...

  9. 站内搜索——Lucene +盘古分词

    为了方便的学习站内搜索,下面我来演示一个MVC项目. 1.首先在项目中[添加引入]三个程序集和[Dict]文件夹,并新建一个[分词内容存放目录] Lucene.Net.dll.PanGu.dll.Pa ...

  10. 站内搜索 调用方法 (谷歌 百度 雅虎)

    站内搜索  调用方法 对于一个网站来说,使用搜索引擎来进行站内搜索往往比自己编写的站内搜索更高效,并且不占用网站服务器的资源,下面是我搜集到的几个主要搜索引擎(Google和百度.雅虎)的站内搜索代码 ...

最新文章

  1. BZOJ 2456: mode 水题
  2. python中引用上层路径
  3. 蘑菇街2015校招 Java研发笔试题 详解,2015java
  4. python 3d绘图立方体_python绘制3D立方体
  5. python中unicode编码表_python中的unicode编码
  6. 电子签章助力水电气公共事业服务“一网通办”
  7. OCR扫描识别录入之汽车车架号(VIN码)识别查询系统
  8. ul阻燃标准有几个等级_UL94阻燃等级介绍及常见误区分析
  9. 解决npm只能使用管理员权限安装
  10. java 验证18位身份证号是否合法
  11. java protobuf extend_protobuf中extension的使用
  12. java基础—java由来
  13. UCB——上界置信算法
  14. java 佛祖保佑_佛祖保佑 永无bug 注释模板设置详解(仅供娱乐)
  15. Revit二次开发_1.过滤器笔记篇
  16. Java网络编程与NIO详解14:Tomcat 常见面试题汇总
  17. 关于Mybatis中的条件查询。createCriteria example里面的条件
  18. springboot 获取访问者的ip地址、访问设备信息、城市地址信息
  19. 图片处理-图片在计算机的显示
  20. 中小型网站运营者的基础运营思路

热门文章

  1. 一些常见的代码异味及解决之道
  2. [译]使用深度学习方法实现面部表情包识别
  3. 如何在CentOS/RedHat下实现根据源码包创建rpm包
  4. java对象数组排序_java 对象数组排序
  5. 大数据数学基础 python描述下载_正版 大数据数学基础(Python语言描述)Python 大数据 数学 高职-计算机-大数据技术...
  6. mysql基础之忘掉密码解决办法及恢复root最高权限办法
  7. OpenOffice的安装与启动2
  8. 实战build-react(二)-------引入Ant Design(增加)
  9. A.01.03-模块的输入—模拟量输入
  10. SpringMVC 异常记录