处理句子中的脏话

pip install better_profanity -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
from better_profanity import profanity  # profanity means dirty words
# 审查元素时忽视大小写情况# profanity.censor function
"""
替换脏话1. profanity.censor可以审查文本中的脏话,默认会将每个脏话替代成四个星号字符(****)被审查后的文本 censored_text_1 中:- 脏话Fuck和jerk都会被替换为****
2. profanity.censor不担心单词(脏话)之间的分隔符,无论是(,/./_),但是除了(@/*/'/"/$/)被审查后的文本 censored_text_2 中:- 脏话Fuck与其它字符以逗号隔开了,脏话jerk与其它字符以点和下划线隔开了,但是它们仍然能被此方法审查到
3. profanity.censor的自定义审查可以改变替换字符(将星号替换为其它的字符)观察函数 profanity.censor(self, text, censor_char="*") 可以得知关键字参数censor_char可以替换默认样式被审查后的文本 censored_text_3 中:- 脏话Fuck和jerk都将被替换为----
"""
censored_text_1 = profanity.censor('Fuck You’re a jerk!')
print(censored_text_1)  # ****,You’re a ****!
censored_text_2 = profanity.censor('Fuck,You’re a_jerk.!')
print(censored_text_2)  # ****,You’re a_****.!
censored_text_3 = profanity.censor('Fuck,You’re a jerk!', '-')
print(censored_text_3)  # ----,You’re a ----!# profanity.contains_profanity() function
"""
判断字符串是否含有脏话可以检查字符串中是否含有脏话,含有则返回True,否则返回False- Fuck You’re a jerk! return True- You are a good boy. return False
"""
print(profanity.contains_profanity('Fuck You’re a jerk!'))  # True
print(profanity.contains_profanity('You are a good boy.'))  # False# profanity.load_censor_words() function
# profanity.load_censor_words_from_file() function
"""
加载单组审查单词(不管通过下列哪种方法都只能加载一次)load_censor_words(custom_bad_words_list) 可以将当前列表的单词加载到审查库中- You are a good boy.很明显不会被审查出脏话,但是当我们将boy和good添加到脏话库中,那么就会被审查为脏话了profanity.load_censor_words_from_file(my_bad_words_file)- You are a good boy.很明显不会被审查出脏话,但是当我们将You和are添加到脏话库中,那么就会被审查为脏话了取消加载审查单词- 直接调用 profanity.load_censor_words()
"""
custom_bad_words_list = ['good', 'boy']  # custom_bad_words_list(自定义的脏话列表)
profanity.load_censor_words(custom_bad_words_list)
print(profanity.contains_profanity('You are a good boy.'))  # True
censored_text_4 = profanity.censor('You are a good boy.')
print(censored_text_4)  # You are a **** ****.profanity.load_censor_words_from_file('my_bad_words.txt')
censored_text_5 = profanity.censor('You are a good boy.')
print(censored_text_5)  # **** **** a good boy.# profanity.load_censor_words() function
# profanity.load_censor_words_from_file() function
"""
白名单单词(使其暂时不成为脏话) --- 关键字 whitelist_words
"""
custom_bad_words_list = ['good', 'boy']
profanity.load_censor_words(custom_bad_words_list, whitelist_words=['good'])
censored_text_6 = profanity.censor('You are a good boy.')
print(censored_text_6)  # You are a good ****.profanity.load_censor_words_from_file('my_bad_words.txt', whitelist_words=['are'])
censored_text_7 = profanity.censor('You are a good boy.')
print(censored_text_7)  # **** are a good boy.# profanity.add_censor_words() function
"""
添加更多审查单词(可以增加多次)
"""
profanity.load_censor_words_from_file('my_bad_words.txt', whitelist_words=['are'])
profanity.add_censor_words(custom_bad_words_list)
censored_text_8 = profanity.censor('You are a good boy.')
print(censored_text_8)  # **** are a **** ****.# Limitations
"""
审查单词是按照单个字符来进行的,那么就很容易通过添加单个字符来绕过审查
"""
profanity.load_censor_words()
censored_text_9 = profanity.censor('Fuck,You’re a jerk!')
print(censored_text_9)  # ****,You’re a ****!censored_text_10 = profanity.censor('Fuckk,You’re a jerkk!')
print(censored_text_10)  # Fuckk,You’re a jerkk!

利用 Python处理句子中的脏话 —— 2022/2/12相关推荐

  1. 如何利用python提取字符串中的数字

    目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...

  2. python 物理学中的应用_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  3. python 表格格式输出_利用python对excel中一列的时间数据更改格式操作

    问题场景:需要将下列的交期一列的数据格式更改成2019/05/10 存货编码 尺寸 数量 交期 0 K10Y0190000X B140 200 2019-05-10 00:00:00 1 K10Y01 ...

  4. python代码物理_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  5. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  6. python对excel数据更改_利用python对excel中一列的时间数据更改格式代码示例

    本篇文章小编给大家分享一下利用python对excel中一列的时间数据更改格式代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 问题场景:需要将 ...

  7. python把汉字变成拼音英文_利用python将表格中的汉字转化为拼音

    GB18030的字符集标准 http://zbgb5.com/2/StandardDetail479488.htm 缺少包时用pip install 进行安装,例如: pip install xlsx ...

  8. 利用python提取视频中的字幕

    利用python提取视频中的字幕 `` 一.导包 import base64 import os import cv2 import requests import aip from aip impo ...

  9. 如何利用Python实现工作中的自动化

    如何利用Python实现工作中的自动化 "偷懒还能干完活,才是本事" 帅张发了一篇<工作要学会偷懒>,深感赞同. 有些事情既然定期都要处理,就没有更好的处理方式?能自动 ...

最新文章

  1. JAVA培训哪里好?学习Java难不难
  2. thinkphp整合系列之phpqrcode生成二维码
  3. php二维数组的取值与转换
  4. 使用Docker堆栈部署的微服务-WildFly,Java EE和Couchbase
  5. npm安装vue_vue搭建脚手架的方式
  6. Qt总结之八:绘制仪表盘
  7. Site-Site Ipsec ×××配置和验证
  8. 41. 和为s的两个数字VS和为s的连续正数序列(C++版本)
  9. Numpy详细函数属性
  10. mod_expires和mod_deflate的配置
  11. springboot简历制作
  12. 计算机二级vbf资源百度云,2018年计算机二级考试考前冲刺卷
  13. qduoj 分辣条2
  14. Linux基础-日志管理
  15. java实现将数据生成图表至excel导出(包括折线图,柱状图,饼状图)
  16. (二):多模态机器学习:综述与分类
  17. Transformer:让ChatGPT站在肩膀上的巨人?
  18. 【Pygame实战】风靡全球的切水果游戏升级版“水果忍者”上线啦,你敢来PK嘛?
  19. 汽车保险客户分类问题
  20. 笨方法学python 34-38

热门文章

  1. python中集合运算_Python—集合的操作、文件的操作
  2. 插件开发之国际化(i18n)
  3. 数据结构与算法A实验六图论---7-8判断是否有路径(并查集)
  4. bootstrap4--表格和网格系统
  5. (课程笔记)Learn How to Learn: Powerful mental tools to help you master tough subjects
  6. 【basler】Chapter5:basler相机C#代码实现与详解(基础版)
  7. 只能上内部,不能上外网,又时打不开网页,能登QQ
  8. 跳槽的必要条件是有一份好的简历
  9. metaRTC实现安卓webrtc推流直播
  10. python出租车数据_1-出租车数据的基础处理,由gps生成OD(pandas).ipynb