基于

Python

自然语言处理工具包在语料库研究中的运用

【摘

要】

摘要:国内当前以语料库为基础的研究,在研究工具方面,多以

AntConc

PowerGREP

为主,使用

Python

语言

NLTK

包进行数据处理分析

的研究较少,限于软件自身设计,不能灵活地对研究方法提供支持。在研究中

使用

Python

语言的

NLTK

处理包,使数据有了统一标准,避免了各类文字处

理转换的麻烦,同时也弥补了

Range

等工具在句法分析、图形绘制、正则表达

式检索等方面的缺憾。针对语料库研究的中文本分词、词形归并、文本检索统

计等主要环节,简要介绍

Python

语言的

NLTK

自然语言处理包在语料库研究

中的运用,并以古腾堡语料库中的简·奥斯丁小说

《艾玛》为例,说明如何运用

该自然语言处理包对语料进行加工处理。

【期刊名称】

昆明冶金高等专科学校学报

【年

(

),

期】

2015(000)005

【总页数】

6

【关键词】

Python

NLTK

工具包;语料库研究

不论是语料库的建设,还是语料库研究的数据处理,都需要对语料库进行加工

与处理。基于计算机编程语言

Python

NLTK

工具包是一个可用于对自然语

言进行清洁、赋码、检索、语法及语义分析等处理的工具包,与常见的

Range

PowerGREP

AntConc

等语料库软件相比,

NLTK

工具包不仅具备上述工具中

常见的检索功能,还具备文本清洁、词形归并、词性赋码、语法分析等多种功

能。其中,检索功能可用于词汇搭配研究、类联接研究;文本清洁、词形归并

可用于语料库建库对数据的处理。该处理包的特色在于能让研究者在一个环境

基于python的语料库数据处理电子版_基于 Python 自然语言处理工具包在语料库研究中的运用...相关推荐

  1. 基于python的语料库数据处理电子版_[异步图书].精通Python自然语言处理[PDF][16.04MB]...

    内容简介 自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一. 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目. ...

  2. python交互式和文件式_使用Python创建和自动化交互式仪表盘

    python交互式和文件式 In this tutorial, I will be creating an automated, interactive dashboard of Texas COVI ...

  3. python 按需加载_基于python的opcode优化和模块按需加载机制研究(学习与个人思路)(原创)...

    基于python的opcode优化和模块按需加载机制研究(学习与思考) 姓名:XXX 学校信息:XXX 主用编程语言:python3.5 文档转换为PDF有些图片无法完全显示,请移步我的博客查看 完成 ...

  4. python基于svm项目+课程设计报告_基于机器学习的脑电病理诊断

    是新朋友吗?记得先点蓝字关注我哦- (图片来自于网络) 1 引言 将机器学习方法应用于脑电信号的自动分析,特别是在基于脑电信号的临床诊断领域,因其巨大的应用前景而引起了广泛的兴趣.例如,它是检测和预测 ...

  5. python 嵌入式 linux 产品 发布_基于嵌入式Linux进行Python应用开发

    ByToradex秦海 1).简介 Python 编程语言因其极强的可读性.可移植.易于维护,以及丰富的第三方扩展组件,如数据库.数学计算.图形,甚至机器视觉.人工智能.深度学习框架都提供Python ...

  6. 基于python爬虫技术的应用_基于Python爬虫技术的应用

    办公自动化杂志 一.引言 本文主要是对 Python 爬虫技术进行阐述,基于 python 的爬虫与其他语言相比的有很多优势.通过爬去某个网站的所有新闻这个案例,来进一步阐释 Python 爬虫技术的 ...

  7. python实现小型搜索引擎设计_基于JAVA的中小型饭店餐饮管理系统的设计与实现...

    好程序设计擅长JAVA(SSM,SSH,SPRINGBOOT).PYTHON(DJANGO/FLASK).THINKPHP.C#.安卓.微信小程序.MYSQL.SQLSERVER等,欢迎咨询 今天将为 ...

  8. python登录界面源码_基于Python的自媒体小助手---登录页面的实现代码

    核心技术:Python3.7 GUI技术:Tkinter (Python已经内置) 好多文章写Python GUI之tkinter窗口视窗教程大集合(看这篇就够了) 我看了N遍也没够好多东西都没有就基 ...

  9. python微博评论情感分析_基于Python的微博情感分析系统设计

    2019 年第 6 期 信息与电脑 China Computer & Communication 软件开发与应用 基于 Python 的微博情感分析系统设计 王 欣 周文龙 (武汉工程大学邮电 ...

最新文章

  1. Java 多线程的基本方式
  2. 用UltraISO制作Ubuntu20.04 U盘启动盘
  3. 它来了!无人车穿梭在深圳的“宇宙最强街道”
  4. 程序员 - 爱的表白
  5. 今晚直播 | AAAI 2018论文解读:零资源机器翻译的最新进展
  6. 使用identity+jwt保护你的webapi(三)——refresh token
  7. uva 10622——Perfect P-th Powers
  8. 【IDEA 2016】intellij idea tomcat jsp 热部署
  9. Java小魔女芭芭拉_沉迷蘑菇不可自拔,黏土人《小魔女学园》苏西·曼芭芭拉 图赏...
  10. 前端笔试之手写代码(一)
  11. 不用GAN、VAE,谷歌发明视频生成的扩散模型,实现新SOTA
  12. 中小型公司***的配置及NAT应用案例
  13. python部署服务器 venv_迁移virtualenv环境
  14. Redo Log的逻辑与物理结构
  15. 【NOIP2014模拟8.25】设备塔
  16. Ucinet6 + Netdraw 根据excel文件绘制网络拓扑图
  17. netron配置和使用
  18. softice使用(1)- 在VMware Workstation 中使用SoftICE zz xfocus
  19. 电脑局域网所有IP及对应MAC地址查询
  20. javafx 五、网络请求

热门文章

  1. Windows下nginx-http-flv-module服务部署
  2. C/C++ 读取配置(config)文件 开源库(libconfig)
  3. pycharm中使用anaconda中python环境
  4. linux里grep和egrep,fgrep的区别
  5. Python-读写文件
  6. AIDL注意细节 简单Demo
  7. c语言switch设计计算器,求助。。关于用switch编写简易计算器
  8. idea javafx添加maven_IDEA通过Maven打包JavaFX工程(OpenJFX11)
  9. python etree创建xml_利用 Python ElementTree 生成 xml的实例
  10. php带截切图片上传_PHP大文件切割上传并带进度条功能示例