在爬取数据时候遇到昵称中有 emoji  符号的在存储数据库的时候会遇到报错,这是因为 emoji 占用四个字符的大小,如果昵称很重要,必须保存完整昵称的,需要修改数据库的设置即可

如果保存完整的昵称不是很重要可以考虑删除昵称中存在的 emoji 符号,方法如下

我看了网上的其他资料,是用 emoji 的编码区间过滤的,很明显有缺陷,因为很难找到很全的 emoji 编码区间表

所以我就在想自己的思路

方法很简单,就是因为 emoji 占的空间会更大,所以我们干脆通过字符占空间大小过滤

方法如下:

import sys
nickname  = 'a比糖甜
temp_nickname = ''
for _ in nickname:if sys.getsizeof(_) != 80:temp_nickname += _
nickname = temp_nickname

如何删除 字符串中的 emoji 表情符号相关推荐

  1. Python | 删除csv或者tsv文件中的emoji表情符号

    删除csv或者tsv文件中的emoji表情符号,并保存到另外的csv文件中 参考链接码起来: https://blog.csdn.net/okm6666/article/details/8100339 ...

  2. python删除指定位置的字符串_python去除区域 python删除字符串中指定位置字符

    python删除字符串中指定位置字符 原程序是这样的: ser = serial.Serial("/dev/ttyAMA0", 9600) def main字符串的话,你可以把他当 ...

  3. 删除字符串中出现次数最少的字符

    在公交车上看一博客实现删除字符串中出现次数最少的字符,认为里面使用数组来作为hash很好,所以我就自己实现一遍. 要求:实现删除一个字符串中出现次数最少的字符.输出删除后的字符,要求安装原来顺序输出. ...

  4. python使用正则表达式删除字符串中的其它字符只保留数字和字母

    python使用正则表达式删除字符串中的其它字符只保留数字和字母 #python使用正则表达式删除字符串中的其它字符只保留数字和字母 # Python code to demonstrate # to ...

  5. C++实现删除字符串中所有重复出现的字符

    C++实现删除字符串中所有重复出现的字符 #include<iostream> using namespace std; char* DeleteRepeatCharacters(char ...

  6. 如何在PHP中删除字符串中的所有空格? [重复]

    本文翻译自:How do I strip all spaces out of a string in PHP? [duplicate] Possible Duplicate: 可能重复: To str ...

  7. 统计substr在母串中出现次数/删除字符串中所有空格

    int count(char*str,char*substr) { int i,j,k,num=0; for(i=0;str[i]!='\0';i++) { for(j=i,k=0;substr[k] ...

  8. 删除字符串中多余的空白字符和空行(C语言实现)

    要求:处理一个字符串,删除字符串中多余的空格.水平制表符和空行,并满足下列要求: (1)对原字符串只能进行一次扫描. (2)不允许申请新的空间. (3)处理后的字符串的首尾不能有空格.制表符和空行. ...

  9. JAVA----------------------华为机试--------------------------删除字符串中出现次数最少的字符...

    题目描述 实现删除字符串中出现次数最少的字符,若多个字符出现次数一样,则都删除.输出删除这些单词后的字符串,字符串中其它字符保持原来的顺序. 输入描述: 字符串只包含小写英文字母, 不考虑非法输入,输 ...

最新文章

  1. 卸载ORACLE 11g
  2. 搭建kubernetes DashBoard
  3. 快速融入新团队的一点个人体会
  4. 网页全文搜索字符和全局搜索文件名【Edge和谷歌浏览器均适用】
  5. 数据库系统(四)——触发器
  6. JVM学习笔记之-堆,年轻代与老年代,对象分配过程,Minor GC、Major GC、Full GC,堆内存大小与OOM,堆空间分代,内存分配策略,对象分配内存,小结堆空间,逃逸分析,常用调优工具
  7. c 编程语言概述,C编程语言概述
  8. ODI配置Mysql5.1数据库服务器
  9. 键盘显示影响布局的解决方法
  10. C#LeetCode刷题之#892-三维形体的表面积(Surface Area of 3D Shapes)
  11. gradle kotlin_我对Gradle Kotlin DSL的第一印象
  12. 西普实验吧-ctf-web-1
  13. 易能变频器说明书故障代码_易能变频器报警报故障代码维修技术指导
  14. CAD导入arcgisMap进行shp导出异常现象
  15. i3wm 获取window class
  16. 计算机局域网硬件维护与网络安全的分析
  17. python中int函数的功能_python中int函数的用法
  18. 炫“库”行动-人大金仓有奖征文-KingbaseES V8R6 手工创建主备流复制集群案例
  19. Spring IOC的工作原理
  20. 据说要改变Web3应用层,X2Earn又是什么?

热门文章

  1. TIB上海工作室成立!
  2. 混合云存储跨云灾备方案之跨云复制
  3. SQL Server高级查询
  4. ad19pcb设置恢复默认_电脑主板BIOS设置详解BIOS知识大全
  5. python3 selenium教程_2018年python3与selenium教程第1节
  6. 讯鸿喜讯丨民建广州市委科技与信息化委员会莅临讯鸿
  7. matlab工具箱使用总结
  8. 如何安装关于编程类软件
  9. 成员信息 c语言,C语言工会成员信息管理系统.doc
  10. 宝塔php版本切换没效果_关于宝塔面板默认PHP版本及切换