Pattern是Python的一个web挖掘模块。它有工具:

1. 数据挖掘: web服务(谷歌,Twitter,维基百科),网络爬虫,HTML DOM解析器

2. 自然语言处理: 词性标记,n-gram搜索,情感分析,WordNet

3. 机器学习: 向量空间模型,聚类,分类(KNN, SVM,感知器)
 
4. 网络分析: 图形中心性和可视化。

它有很好的文档,经过了350多个单元测试,并附带了50多个示例。

https://github.com/clips/pattern

安装:

源码安装:

cd pattern-3.6
python setup.py install

pip安装

pip install pattern

安装出错,显示没有装mysqlclient (目前mysqlclient是安装pattern必须安装的)

error: mysql_config not found

解决方法:

apt install libmysqlclient-devpip install pattern

此外,直接将pattern的文件夹拉到本地需要使用的地方也是可以的

安装pattern出错mysql_config not found相关推荐

  1. CentOS7编译安装MySQL5.7之后安装mysql-devel出错解决方案

    2019独角兽企业重金招聘Python工程师标准>>> 由于我的MySQL是自己编译安装,但是安装之后/etc/yum.repos.d/目录下并没有MySQL的源,导致我在安装mys ...

  2. google浏览器插件安装时出错,Package is invalid: CRX HEADER INVALID

    google浏览器插件安装时出错,Package is invalid: CRX HEADER INVALID 原文件 将.crx结尾的扩展文件改为rar或zip结尾,变成压缩文件 然后解压这个文件 ...

  3. python安装lxml库出错_Python pip安装lxml出错的问题解决办法

    Python pip安装lxml出错的问题解决办法 1. 在使用pip安装lxml过程中出现了一下错误: >>> pip install lxml C:\Users\Chen> ...

  4. yum安装zlib出错

    安装zlib出错:yum install zlib-1.2.3-29.el6.i686 Error: Protected multilib versions:zlib-1.2.3-29.el6.i68 ...

  5. windows2003sp2安装sql2005出错解决方法

    遇到很多widnows2003sp2安装sql2005出错,在官网发现与服务器多核处理器线数有关(https://support.microsoft.com/zh-cn/kb/954835/zh-cn ...

  6. 博图注册表删除方法_技成周报40期 | 三菱、西门子软件安装常见出错解决方法...

    问题:在安装GX WORKS2软件时能够安装成功,但是一打开软件,就出现存储器空间或桌面堆栈不足的错误,应该怎么解决? 解决办法: 1:先在控制面板的添加删除程序中,卸载三菱编程软件及仿真软件:2:再 ...

  7. linux安装mysql出错( file /usr/share/mysql/czech/errmsg.sys from install of MySQL-server-5.5.31-2.el6.i6)

    linux下安装MySQL出错! [root@hadoop0 local]# rpm -i MySQL-server-5.5.31-2.el6.i686.rpm         file /usr/s ...

  8. perl 安装GD 出错解决方案

    perl 安装GD 出错具体如下 install GD Running install for module 'GD' Checksum for /root/.cpan/sources/authors ...

  9. macos安装urar具体步骤_【2019】macOS重装系统出现“准备安装时出错“?

    鉴于有网友向我反映不成功.特此声明:本文旨在记录一次成功修复的经历,给遇到同样问题的朋友提供一个参考.作者只能保证本人照此法真的成功了,并不敢保证大家也能成功.或许诸位遇到的情况与我的不一样也说不定. ...

最新文章

  1. 重磅引才!符合条件博士生,给予300平以上别墅一幢!
  2. html层次选择器例题,JQuery 层次选择器的例子
  3. python asyncio理解_深入理解asyncio(二)
  4. VS2017 15.8第二个预览版本提升了对CPU Profiling和F#的支持
  5. [渝粤教育] 西南科技大学 程序设计语言VB 在线考试复习资料(1)
  6. Illustrator中文版教程,如何在 Illustrator 中为创建的图形添加颜色?
  7. 【机器学习】CART决策树原理及python实现
  8. 2022年全国职业院校技能大赛网络安全赛卷(中职组)卷1
  9. 利用 confluence 打造属于自己的知识库
  10. Android 切割图片
  11. java判断txt文件的编码格式
  12. 1714. 混合牛奶
  13. 2610_lab2 命令行与快捷键
  14. 2022年企业法律顾问综合法律知识考试模拟试题卷及答案
  15. 请说说你对互联网行业的理解。
  16. 网页制作期末大作业成品 HTML5+CSS大作业——简约个性高逼格博客(5页) web网页制作期末大作业模板
  17. 二进制中1的个数——《剑指offer》
  18. linux下命令行制作USB系统启动盘
  19. 手把手教你生成正式签名的APK文件
  20. kc705 万兆以太网 ip 用法

热门文章

  1. [C#]方法示例:判断是否闰年
  2. linux mmap实例_Linux下通过共享内存和mmap实现进程间通讯(含实例)
  3. py4j.java gateway_python 2.7-为什么PySpark无法找到py4j.java_gateway?
  4. java版微信调小i机器人接口说明书_小i机器人微信公众平台调用api
  5. 离职一个月了,也面了很多公司,但都没有offer,软件测试工作怎么就这么难找?
  6. html5对属性布尔的值设定,如何在Javascript中设置HTML5必需属性?
  7. java 箭头函数_箭头函数丶Java教程网-IT开发者们的技术天堂
  8. Django运行服务报NameError: name ‘os‘ is not defined-已解决
  9. linux删除5天前文件和目录,Linux Shell命令定时删除指定目录下n天前的文件
  10. 2FSK频谱matlab,2FSK信号的频谱分析及解调的实现.doc