python爬虫数据写入csv文件中文乱码,用’utf-8‘在pycharm中打开文件没有问题,但是用excel打开却出现了问题,以下为解决方法。
(最近在练习爬虫,这个博文是对自己学习的记录和分享,如果有问题,非常感谢各路大佬指出!!!)

for r in result:r_lis=[]                                 #方法二:将爬到的内容储存在csv文件中r_lis.append(r.text)with open('company.csv','a',newline='',encoding='utf-8-sig') as csvfile:spamwriter=csv.writer(csvfile, delimiter=',')spamwriter.writerow(r_lis)

在with自开合那里加入newline='',encoding='utf-8-sig'是关键

以下是天眼查的爬虫

import requests
from bs4 import BeautifulSoup
from urllib.parse import quote
import csv   #公司信息以csv的格式存储看起来更美观# key='华为'      #从查询一个company开始,加for循环,查询多个企业
lis=['华大基因','知乎','中国国家地理杂志社','中山大学']
for li in lis:url='https://www.tianyancha.com/search?key='+quote(li)    #外部的url,进入要查询的企业的页面headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36 Edg/93.0.961.52','Cookie':'aliyungf_tc=dcee015d38cbc96ad677b845beb17fecf55dfe7bf358e85e3369cb76604d9baa; acw_tc=76b20f8416320655286472268e3b9f535aea9900bb46a056331a772cc85ae5; csrfToken=ZguchyQQdbrVckAuPOspK7Au; jsid=SEO-BING-ALL-SY-000001; TYCID=c06be740195e11ec9d547d348b283d0a; ssuid=5077711456; sajssdk_2015_cross_new_user=1; bannerFlag=true; Hm_lvt_e92c8d65d92d534b0fc290df538b4758=1632065532; _ga=GA1.2.1408096384.1632065532; _gid=GA1.2.1583561769.1632065532; searchSessionId=1632065541.64432166; relatedHumanSearchGraphId=17066311; relatedHumanSearchGraphId.sig=TwOcKyCjpeHTjV7s49eE4L_3pHpB94avftKmZJek8gk; sensorsdata2015jssdkcross=%7B%22distinct_id%22%3A%2218438709046%22%2C%22first_id%22%3A%2217bfeafae43ba9-005e2376b1979-57341f44-1382400-17bfeafae44afa%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E7%9B%B4%E6%8E%A5%E6%B5%81%E9%87%8F%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC_%E7%9B%B4%E6%8E%A5%E6%89%93%E5%BC%80%22%2C%22%24latest_referrer%22%3A%22%22%7D%2C%22%24device_id%22%3A%2217bfeafae43ba9-005e2376b1979-57341f44-1382400-17bfeafae44afa%22%7D; tyc-user-info={%22state%22:%220%22%2C%22vipManager%22:%220%22%2C%22mobile%22:%2218438709046%22}; tyc-user-info-save-time=1632066453345; auth_token=eyJhbGciOiJIUzUxMiJ9.eyJzdWIiOiIxODQzODcwOTA0NiIsImlhdCI6MTYzMjA2NjQ1MiwiZXhwIjoxNjYzNjAyNDUyfQ.XYcBGbzr1qThhAZp9exmEKjWg1Co6_cwyZgmfCNO-9Nrp_KSyyqAr--UnxUhLaaX7x6jNmoX3SACJDL31RocNA; tyc-user-phone=%255B%252218438709046%2522%255D; Hm_lpvt_e92c8d65d92d534b0fc290df538b4758=1632066573'}                                         #这里的Cookie需要是用户登陆后的才可以用,否则需要输入验证码,所以先登陆,再获取Cookiehtml=requests.get(url,headers=headers)soup=BeautifulSoup(html.text,'html.parser')innerUrl=soup.select_one('a.name')['href']       #只需要的一个所以用select_one()来爬取一个内部的url#获取内部url即此处的href# print('获取内部URL:', innerUrl)innerHtml=requests.get(innerUrl,headers=headers)  #这里的headers不需要变soup=BeautifulSoup(innerHtml.text,'html.parser')result=soup.select('.table.-striped-col tbody tr td')for r in result:#     with open('company.text','a',encoding='utf8') as f:      #方法一:将爬到的内容存储在text文本中#         f.write(r.text+'\n')# with open('company.text','a',encoding='utf8') as f:#     f.write('\n')r_lis=[]                                             #方法二:将爬到的内容储存在csv文件中r_lis.append(r.text)with open('company.csv','a',newline='',encoding='utf-8-sig') as csvfile:spamwriter=csv.writer(csvfile, delimiter=',')spamwriter.writerow(r_lis)
print('已完成!')

这是本人的第一篇博文,这些内容主要是对我自己学习爬虫的记录和分享,如果代码中有什么问题的感谢各路大佬指正!!!

Python 爬虫数据写入csv文件中文乱码解决以及天眼查爬虫数据写入csv相关推荐

  1. Pandas导出CSV文件中文乱码解决方法

    问题描述: 使用to_csv方法导出CSV文件,文件出现中文乱码 解决方法: 在使用to_csv时在参数中加入参数encoding='utf_8_sig' 关于原理,请参考以下文章: utf-8和ut ...

  2. excel2019打开csv文件中文乱码解决方法

    CSV通常都是纯文本文件,使用分隔符号分割数据,通常可以用EXCEL正常打开,但是有时会出现用EXCEL打开中文变成乱码的问题.原因有两种,第一种就是文件本身就损坏,例外一种就是文件编码不对. 对于文 ...

  3. python写入csv文件中文乱码解决方案

    python写入csv文件中文乱码解决方案 参考文章: (1)python写入csv文件中文乱码解决方案 (2)https://www.cnblogs.com/vsivn/p/6115537.html ...

  4. python 保存本地乱码,解决python保存数据到csv文件中文乱码的方法

    解决python保存数据到csv文件中文乱码的方法 发布时间:2020-07-08 13:49:53 来源:亿速云 阅读:695 作者:清晨 小编给大家分享一下解决python保存数据到csv文件中文 ...

  5. Python2写csv文件中文乱码问题及解决方法详解

    导读 python2最大的坑在于中文编码问题,遇到中文报错首先加u,再各种encode.decode,这篇文章给大家介绍Python2写csv文件中文乱码问题及解决方法,感兴趣的朋友跟随小编一起看看吧 ...

  6. SQL工具导出CSV文件中文乱码

    DBeaver 导出CSV文件中文乱码 相信在做IT开发的人都碰到过,中文乱码的问题.特别是做数据的工程是,经常有用sql查出一批数据后,要导成CSV文件时,发现导出的信息中,中文都是乱码:便会在网上 ...

  7. UTF-8的CSV文件中文乱码问题解决办法

    UTF-8的CSV文件中文乱码问题解决办法 参考文章: (1)UTF-8的CSV文件中文乱码问题解决办法 (2)https://www.cnblogs.com/leaves1024/p/1117138 ...

  8. CSV文件打开乱码解决方法

    CSV文件打开乱码解决方法 问题: CSV文件通常可以用Excel打开,但有时会碰到直接用Excel打开是出现中文乱码的问题,如下图所示: 解决方法: CSV文件乱码问题一般是编码方式的问题,选择以记 ...

  9. csv文件打开乱码解决

    csv文件打开乱码解决 文章目录 csv文件打开乱码解决 前言 解决方法 前言 公司需要我导出csv的格式进行整理,如下图所示 我导出后用Excel打开却变成了乱码 解决方法 csv格式的文件可以使用 ...

最新文章

  1. pytest实战--参数化parametrize+前置fixture
  2. AlphaFold和RoseTTAFold双剑合璧,成功预测蛋白质复合体结构,北大校友领衔登上Science...
  3. 原来Python函数只是个对象
  4. 研究SAP service order status存储字段
  5. Calibration校准halcon算子,持续更新
  6. android显示圆圈动画,Android实现3个圆圈的动画
  7. python之元组操作
  8. ArcGIS里表示地理信息的动态变化(例三)
  9. 关于js中的this关键字
  10. 一、数据挖掘—初识数据挖掘
  11. 安卓第三方接入登陆-新浪登陆
  12. pd对焦速度_PDAF对焦技术原理解析及生产应用
  13. linux wifi开机自动连接 wifi连接
  14. matlab对xml文件操作,Matlab读写xml文件
  15. 《UEFI内核导读》全集,2023年更新
  16. mfc,WM_CTLCOLOR,WM_PAINT
  17. 微星 H670 Tomahawk 参数
  18. ffmpeg 转换flv压缩大小_视频压缩工具ffmpeg的使用
  19. ANTLR4: No method for rule r or it has arguments
  20. sql盲注 解决_sql盲注-和sql盲注相关的内容-阿里云开发者社区

热门文章

  1. Linux启动/停止/重启防火墙
  2. mysql 设置所有ip均可访问(windows版本设置)
  3. 趣味博弈论——斐波那契博弈
  4. OpenCV初试云雨
  5. 【系统篇 / 域】❀ 06. Windows10 加入域 ❀ Windows Server 2016
  6. 华为AirEngine 5762S-11面板AP配置
  7. Hive-创建表的几种方式
  8. 基于AdaBoost算法的情感分析研究
  9. 关于element plus 插件 e-table的用法
  10. Hadoop配置lzo压缩