python cpca和jieba结合使用获取省市区街道查询例子

jieba 词组切割库 注:python2.7 下载0.39或以下版本
cpca 省市区识别库 注:python2.7 下载0.3.5或以下版本

@json_response
@require_auth
@require_storedef test(request):import  cpcafrom models import 数据表# from django.db.models import Qimport operatoraddr = ['广东省广州市天河区东圃镇前进街道桃园路21号',]#切割地址addr_d = cpca.transform(addr,cut=False,lookahead=50)#获取地址详情(无省市区)address = addr_d.iat[0, 3]#获取地址省province_name = addr_d.iat[0, 2]#根据要求去除省区字眼province_name = province_name.replace('省', '' )province_name = province_name.replace('区', '')#获取地址市city_name = addr_d.iat[0, 1]#获取地址区county_name = addr_d.iat[0, 0]q_list = []#地址切割分词cun_d = str_utils.analyzer_to_search(data_text=address.strip())for item in cun_d:#模糊 OR查询q_list.append(Q(**{'town_name__startswith': item}))CustomerAddress = 数据表.objects.filter(reduce(operator.or_, q_list),province_name=province_name,city_name=city_name,county_name=county_name).values('id').first()#无法查询则赋值if not CustomerAddress:xxxelse:address_id = CustomerAddress['id']import  jiebadef analyzer_to_search(data_text=""):"""结巴分词器"""new_seg_list = []try:seg_list = jieba.cut_for_search(data_text)if seg_list:for seg in list(seg_list):new_seg = remove_text(data_text=seg, rm_text=u"[:!,$%^,。:?、~@#¥%……&*《》「」{}【】()/\\\[\]'\"]")if new_seg and new_seg.strip() != "":new_seg_list.append(new_seg)except Exception as ex:print(ex)return new_seg_list

cpca和jieba相关推荐

  1. jieba分词工具的使用方法

    20210401 https://www.cjavapy.com/article/745/ jieba并行分词 作为我这样的萌新,python代码的第一步是:#coding=utf-8 环境:pyth ...

  2. jieba中文分词源码分析(四)

    一.未登录词问题 在jieba中文分词的第一节曾提到未登录词问题 中文分词的难点 分词规范,词的定义还不明确 (<统计自然语言处理>宗成庆) 歧义切分问题,交集型切分问题,多义组合型切分歧 ...

  3. jieba分词流程及部分源码解读(一)

    首先我们来看一下jieba分词的流程图: 结巴中文分词简介 1)支持三种分词模式: 精确模式:将句子最精确的分开,适合文本分析 全模式:句子中所有可以成词的词语都扫描出来,速度快,不能解决歧义 搜索引 ...

  4. Jieba分词原理与解析

    1 HMM模型 马尔科夫过程: 以天气判断为例:引出隐马尔科夫模型 于是我们可以将这种类型的过程建模为有一个隐藏的马尔科夫过程和一个与这个隐藏马尔科夫过程概率相关的并且可以观察到的状态集合.这就是本文 ...

  5. 自然语言处理课程(二):Jieba分词的原理及实例操作

    上节课,我们学习了自然语言处理课程(一):自然语言处理在网文改编市场的应用,了解了相关的基础理论.接下来,我们将要了解一些具体的.可操作的技术方法. 作为小说爱好者的你,是否有设想过通过一些计算机工具 ...

  6. Python第三方库jieba(中文分词)入门与进阶(官方文档)

    jieba "结巴"中文分词:做最好的 Python 中文分词组件 github:https://github.com/fxsjy/jieba 特点 支持三种分词模式: 精确模式, ...

  7. python语言入门r_小结:jieba分词的Python与R语言基础用法介绍

    当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 人们说话不是一个词一个词崩出来的,文章也就由句子组成.要想让机器识别美文,体会中华名族汉语的博大精深,不是不可能.但是,首先需要将其转化成其 ...

  8. 运用jieba库分词

    代码: 统计出团队中文简介中词频 import jieba txt=open("C:\\Users\\Administrator\\Desktop\\介绍.txt","r ...

  9. 第四次作业 (日期和jieba库的运用)

    设计题1: 设计一个本月份日历,输出格式如下: 要求: 1.初始化start_day,end_day两个日期 from datetime import datetime start_day=datet ...

最新文章

  1. 皮一皮:这大概就是年轻的味道...
  2. Spring-MVC入门(一):入门实例
  3. 微信小程序 rpx和px转换
  4. jquery数据折叠_通过位折叠缩小大数据
  5. 【Python CheckiO 题解】Long Repeat
  6. 年逾九十院士潘际銮:身背千亿科研价值身居斗室
  7. oracle sql 转小写转大写,OracleSQL金额小写转大写函数
  8. 5分钟了解VMware vSAN的分布式RAID
  9. 8255工作方式一选通输入——A口(含时序图分析)
  10. DataGridView添加右键菜单等技巧
  11. Atitit springboot mybatis spring 集成 Springboot1.4 mybatis3.4.6 /springbootMybatis 目录 1.1. 设置map
  12. Ruby类的创建与使用
  13. 软件评测师教程——软件测试基础
  14. Python Tkinter 音乐播放器 Demo
  15. List集合对象去重及按属性去重的8种方法
  16. method not allowed 异常处理
  17. Android - xml动画,识别手势动作,代码抽取,获取手机SIM卡串号,获取联系人数据,开机广播,发送/解析短信,报警音乐
  18. print函数 stm32_STM32 DSP库函数详解
  19. 国内代码托管中心-码云、自建代码托管平台-GitLab
  20. E. The Humanoid(枚举)

热门文章

  1. 在线伪原创-免费批量在线伪原创工具
  2. 阻塞、非阻塞、多路复用、同步、异步、BIO、NIO、AIO 一文搞定
  3. git版本管理-代码提交时忽略target文件夹
  4. 学习EMACScript6新特性
  5. linux工作在传输层,linux net子系统-协议层(传输层与网络层)
  6. 还不了解协程吗?从原理到实现,全局分析
  7. js 跳转到指定位置 高德地图_【高德字符串JavaScript面试题】面试问题:高德地图Js … - 看准网...
  8. 【数学/多项式】用列表去实现一元多项式函数的四则运算,和它的n阶导数的Python算法实现
  9. 以太坊智能合约开发(四):Solidity转账智能合约实验
  10. java设计模式 - 初学笔记 - 模板方法