def parse_item(self, response):

for jobs in response.xpath('//div[@itemtype="http://schema.org/JobPosting"]'):

item = IndeedCoUkItem()

item["jobtitle"] = jobs.xpath('*[@class="jobtitle"]/a//text()').extract()

yield item

项目保存为CSV文件,

职称

“高级,嵌入式,软件,工程师”

嗨,

以上是我的scrapy搜寻器代码的片段.我想输出是逗号和空白空间.这是从“高级,嵌入式,软件,工程师”到这个“高级嵌入式软件工程师”.我尝试使用replace(),如..extract()[0] .replace(“,”,“”),但它不起作用.任何帮助/建议?

最佳答案 您是否尝试打印/记录进入项目[‘jobtitle]字段的列表?如果它是一个列表(好吧,它是一个列表),那么导出到CSV文件会将此列表转换为逗号分隔的条目.

尝试查看结果并将列表加入到一个:

item["jobtitle"] = ' '.join(jobs.xpath('*[@class="jobtitle"]/a//text()').extract())

如果项目包含额外的空格而不是全部空格,则可以在元素上使用贴图和条带:

item["jobtitle"] = ' '.join(map(unicode.strip,jobs.xpath('*[@class="jobtitle"]/a//text()').extract()))

这会走遍所有元素,并在开始和结束时剥离空白.

或者你可以使用XPath的normalize-space:

item["jobtitle"] = ' '.join(jobs.xpath('normalize-space(*[@class="jobtitle"]/a//text())').extract())

python列表去掉逗号_python – Scrapy crawler,从字符串中删除逗号相关推荐

  1. python字符串去掉空行_Python从字符串中删除空格

    python字符串去掉空行 There are various ways to remove spaces from a string in Python. This tutorial is aime ...

  2. 从 Python 中的字符串中删除最后一个分号或者逗号

    第一种方法 使用 str.rstrip() 方法从字符串中删除最后一个逗号,例如 new_str = my_str.rstrip(';'). str.rstrip() 方法将返回删除尾随逗号的字符串副 ...

  3. python中csv文件通过什么表示字符_python_写入csv文件时候无法进行原样写入(写入字符串中出现逗号,时候,csv文件自动分成两个单元格)...

    问题描述: 写入csv文件时候无法进行原样写入(写入字符串中出现逗号","时候,csv文件自动分成两个单元格) with open("test.csv",&qu ...

  4. [转载] Python从字符串中删除字符

    参考链接: Python | 字符串translate Sometimes we want to remove all occurrences of a character from a string ...

  5. python中指定最后一个字符_如何从Python字符串中删除最后一个字符?

    如何从Python字符串中删除最后一个字符? Python支持负索引切片和正切片.负索引从  -1 到-(iterable_length)开始.我们将使用负切片从可迭代对象的末尾获取元素. 索引  - ...

  6. Python从字符串中删除字符

    Sometimes we want to remove all occurrences of a character from a string. There are two common ways ...

  7. python如何去掉方括号_python从入门到实战外星人入侵

    ## 第一章 软件安装与简单操作 ## 第二章 字符串操作总结 - 方法 方法是Python可对数据执行的操作.每个方法后面都跟着一对括号,这是因为方法通常需要额外的信息来完成,这种信息是在括号内提供 ...

  8. python列表添加元组_python 列表与元组的操作简介

    列表 列表是可变的(mutable)--可以改变列表的内容,这不同于字符串和元组,字符串和元组都是不可变的.接下来讨论一下列表所提供的方法. list函数 可以使用list函数来创建列表: list( ...

  9. python列表比较方法_python列表常用方法

    list是一个类,用中括号括上,逗号分隔,元素可以是数字,字符,字符串,也可以是嵌套列表,布尔类型. 1.通过索引取值 li=[1,12,9,'age',['wangtianning',[19,'10 ...

最新文章

  1. GPU运行Tensorflow详细教程及错误解决
  2. Stream Processing: Apache Kafka的Exactly-once的定义 原理和实现
  3. 一. python面向对象基础
  4. python3.7和3.8的区别-Python 3.8 有什么新变化
  5. Informatica在linux下安装搭建
  6. ORACLE 内置函数之 GREATEST 和 LEAST(转)
  7. ASP.NET画图全攻略(上)
  8. Eclipse 中 工程 引用 其他 工程的 配置方法。
  9. COGS 2507. 零食店
  10. html5广告拦截器识别代码做提示(本站内容无法显示)
  11. leetcode707.设计链表(Python实现)
  12. 计算机不能显示可移动磁盘咋办,移动硬盘不显示盘符怎么办 移动硬盘显示不出来解决方法【详解】...
  13. html里怎样返回首页,返回上一页-html页面返回上一页面怎么写
  14. 关于api-ms-win-crt-runtimel1-1-0.dll缺失引发的解决方案
  15. Tomcat 部署多个SpringBoot 项目:ERROR org.springframework.boot.actuate.endpoint.jmx.EndpointMBeanExporter
  16. Android studio 设置豆绿色
  17. aps后缀是什么文件_asp文件扩展名,asp文件怎么打开?
  18. vb 与 .accdb 格式的access数据库的连接方法
  19. 面试逻辑题和答案(二)
  20. MD5解密 解密网站

热门文章

  1. 入小学教材、主流编程语言增长最快…… Python 的 2017 回顾
  2. 东北大学专业 计算机专业英语教材,东北大学非英语专业硕士生用的哪套英语教材。求赐教!...
  3. [电路]4-两端电路等效变换、电阻串并联
  4. Unity 中实现子弹时间效果
  5. 世界顶级100款XP主题(转)
  6. leetcode:Add Two Numbers(java)
  7. 看雪ctf 流浪者 WP
  8. 中国独角兽上市潮,爱奇艺优信小米值得投资吗? | 一点财经
  9. 疫情之下裸辞后的一些感悟和面试心得
  10. 如何谋杀一门计算机语言?