我需要将中文句子拆分为单独的单词。中文的问题是没有空格。例如,该句子可能看起来像:主楼怎么走(带空格的是:主楼 怎么 走)。

目前,我可以想到一种解决方案。我有一本有中文单词的字典(在数据库中)。该脚本将:

尝试在数据库中找到句子的前两个字符(主楼),

如果主楼实际上是一个单词,并且在数据库中,则脚本将尝试查找前三个字符(主楼怎)。 主楼怎不是一个词,所以它不在数据库中=>我的应用程序现在知道主楼是一个单独的词。

尝试用其余的角色来做。

我不太喜欢这种方法,因为即使分析很小的文本,它也会查询数据库太多次。

还有其他解决方案吗?

参考方案

感谢大家的帮助!

经过一些研究,我发现了一些工作工具(牢记您的所有建议),这就是为什么我要回答自己的问题。

一个PHP类(http://www.phpclasses.org/browse/package/2431.html)

Drupal模块,基本上是另一个具有4种不同细分算法的PHP解决方案(非常容易理解它的工作原理)(http://drupal.org/project/csplitter)

用于中文分词(http://code.google.com/p/phpcws/)的PHP扩展

如果您尝试在baidu.com上搜索“中文分词”,则还有其他解决方案

真诚的

qu

PHP getallheaders替代 - php

我正在尝试从服务器上的apache切换到nginx。唯一的问题是我在PHP脚本中使用的getallheaders()函数,该函数不适用于Nginx。我已经尝试过用户在getallheaders函数上的php站点上提供的注释,但这并不返回所有请求标头。请告诉我如何解决这个问题。我真的想切换到Nginx。 参考方案 您仍然可以使用它,但是您必须像这里一样重新定义…php Singleton类实例将在多个会话中保留吗? - php

举一个简单的例子,如果我想计算一个不使用磁盘存储的脚本的命中次数,我可以使用静态类成员来执行此操作吗?用户1:<?php $test = Example::singleton(); $test->visits++; ?> 用户2:<?php $test = Example::singleton(); $test->visits+…PHP preg_match直到双行中断 - php

我在mysql字段中有此数据:First text text text text text text text text text text text text text text text text text text text text Second text text text text text text text text text text te…PHP:将字符串拆分为字母和数字部分的最佳方法 - php

我有几个格式的字符串AA11 AAAAAA1111111 AA1111111 分离字符串的字母和数字部分的最佳方法(最有效)? 参考方案 如果它们都是一系列字母,然后是一系列数字,并且没有非字母数字字符,那么sscanf()可能比regexp更有效$example = 'AAA11111'; list($alpha,$numeric) =…php-casperjs获取内部文本 - php

我正在为casperjs使用php包装器-https://github.com/alwex/php-casperjs我正在网上自动化一些重复的工作,我需要访问一个项目的innerText,但是我尚不清楚如何从casperjs浏览器访问dom。我认为在js中我会var arr = document.querySelector('label.input…

matlab把句子分割成单词_将句子拆分成单独的单词 - php相关推荐

  1. hubliderx如选择相同单词_高考英语,十六种高效单词记忆法,建议人手一份!

    词汇,无疑是高考英语成败的决定性因素.每位高中生,对词汇的掌握和记忆都不该有丝毫懈怠.西面是豆哥即将高考的同学们整理出来的十六种高效单词记忆法,一定要收藏起来好好学.好好记哦! 更多学习资料以及答题技 ...

  2. python将字符串拆分成单词_将字符串拆分为单词和标点符号

    我正在尝试将字符串拆分为单词和标点符号,并将标点符号添加到拆分生成的列表中. 例如: >>> c = "help, me" >>> print ...

  3. python统计单词出现次数最多的5个单词_【Python】统计文本中单词的出现次数前十的单词...

    代码: # 读取一个文本,并且统计文本中单词的出现次数 def read_file(): # 在windows环境中的编码问题,指定utf-8 with open('F:/python源码/实验区/0 ...

  4. python替换文本文件单词_在大型文本文件中替换一组单词

    我有一个大的txt文件(大约20GB),我想替换此大文件中单词列表的所有实例.我正在努力寻找一种优化此代码的方法.这导致我长时间处理此文件. 我可以改善什么? corpus_input = open( ...

  5. 学python需要记得的单词_学习Python必背的初级单词有哪些?

    今天小编要跟大家分享一些学习Python必须认识的英文单词,同时也是学习编程都必须会的单词,下面来和小编一起学习一下吧! application 应用程式 应用.应用程序 application fr ...

  6. python转行成数据分析_大数据专业成热门,该如何转行做大数据分析师

    展开全部 那我就转载一篇别人转行做数据分析的经验贴给题主吧e69da5e887aa62616964757a686964616f31333365656539: 亲爱的各位加米谷学院的老师和同学们好,首先 ...

  7. python输出以元音字母开头的单词_开头是元音字母的英语单词有哪些?

    展开全部 1.前元音[i:],[I],[e],[æ]的发音特点 A.舌尖抵住下齿. B.舌前部向硬颚抬e5a48de588b662616964757a686964616f31333365643539起 ...

  8. python读取特定单词_在文本python中搜索特定单词

    我正在尝试创建一个函数,它将接受一个词(或一组字符)以及语音的参数,并返回一个布尔表达式来表示单词是否存在,作为一个函数.在speech2 = open("Obama_DNC.txt&quo ...

  9. java tif切割成瓦片_将图片切割成瓦片图-(算法+实现)

    [实例简介] 介绍:https://blog.csdn.net/STRIVEYe/article/details/88388072 [实例截图] [核心代码] 919ed105-5c0c-4f11-a ...

最新文章

  1. private的误解
  2. Java项目构建基础的三个统一,太厉害了!
  3. LiveVideoStack线上分享第三季(十):Flutter浪潮下的音视频研发探索
  4. 系统设计面试的答题思维框架
  5. Vue获取DOM元素的属性值
  6. css 一些好玩的属性,推荐一些比较有用的css3新属性
  7. 爬虫:深度爬取网易云音乐所有歌手及其对应热门歌曲
  8. 数据库连接池连接耗尽,导致tomcat请求无响应,呈现出假死状态
  9. ## Asset Store(unity商店) 如何下载已购买的资源?*
  10. UWP应用解除网络限制
  11. Centos7.5安装MySQL5.7
  12. CCNA-思科网络 EIGRP(增强内部网关路由协议)
  13. 广度优先搜索(BFS)最短路径输出表示(三种方法)
  14. matlab升幂降幂排列,升幂降幂是什么意思(升幂排列与降幂排列)
  15. owin 怎么部署在云中_从几乎未能在云中部署简单的机器学习模型中学到的教训...
  16. Spark 场景题详解
  17. 大数据hbase nosql数据库
  18. IDEA 更新到 2021.2.3 咋样?【2021.3、2021.3.1看评论区】
  19. python 按照顺序读取文件夹中的图片名称
  20. 爬取美国各州实时疫情数据

热门文章

  1. java开发ps插件_超强自主开发的Photoshop CS6增强插件 唯一的面板测试版2
  2. 知到网课大学英语-高职版考试试题|真题题库(含答案)
  3. 涂鸦蓝牙SDK开发系列教程——1.快速入门
  4. python3学习笔记之八——爬取百度音乐盒临时列表中的音乐
  5. 动态一键换肤实现思路和demo
  6. spring boot配置mysql
  7. 北京邮电大学计算机学院马华东,北京邮电大学马华东教授来校交流并作专题讲座...
  8. Datawhale组队学习-Python编程基础-01
  9. 微信登录出现的问题及解决方案
  10. Mac电脑打开隔空投送并传送文件的技巧