这篇文章我们来说一下怎样利用python爬取财经网站的新闻,我们大家都知道:现在是信息爆炸的社会,怎样有效快速的获取关键信息是十分重要的,那么通过借助强大的python,我们是能够实现这一目标的。我们在量化过程中,一部分我们需要从基本面来分析行情,那么此时借助财经网站给我们提供的大量信息,我们可以让程序自动获取这些信息,并且帮我们进行整理分析(下一篇我们将讨论一下是怎么处理的)然后再根据处理的结果,最终做出决策。这个过程也是我们对信息的有效处理分析和应用。处理的信息以及应用的方法,会影响处理的结果进而也影响决策。因此我们需要一个较为准确的数据源以及合理的数据处理的方法是十分重要的。
下面我们就介绍一下怎么用python获取财经网的信息。

1.安装库文件

首先我们选择获取信息的网站是:https://finance.sina.com.cn/stock/,这个网站提供的财经类的新闻是十分全面的,并且更新的比较及时。我们当然可以选择其它财经网站,比如新浪财经等。那么选择了网站后就要获取网站的链接,将链接中的新闻内容存放到文本里。
再此之前我们先要对这个网页进行分析下:具体方法如下:
1)右键—查看元素–我们可以在调试程序中看到新闻的所有链接前面的关键字为href(这对于我们后续的抓取新闻是很重要的)

2)我们需要安装获取新闻信息的安装包:

import jieba.analyse

这个安装包是分词的安装包,我们需要将新闻信息导出后,需要分词处理时应用它。

import urllib.request

这个包中包含链接网站的方法,是获取新闻网站的第一步。

2.python获取新闻代码

python获取新闻我们大致的步骤可分为:
将文章标题存入列表框——将文章链接存入list——通过循环换取所有网页的链接和链接里的内容——将内容存放到txt文件中。
主函数如下所示:

def getnews(self):self.ClearTxt('mjnews')for i in range(1, 20): # 要爬取的网页链接,循环20个网页url = 'https://finance.sina.com.cn/stock/'.format(i)# 获取网页的链接地址linklist = self.getUrl(url)# 定义列表texts用于存储文章的标题texts = []# 定义列表links用于存储文章的链接links = []# 遍历整个linkllist,存储标题和链接for link in linklist:texts.append(link.text.strip())links.append(link.get('href'))#    通过zip,将信息输出到控制台for text, link in zip(texts, links):#去除“原”“转”字,并将结果保存在mjnews.txt中text = text.strip().replace("原        \n        ", "")text = text.strip().replace("转        \n        ", "")data = {'tittle': text, 'link': link}self.write_article1('mjnews',text)#将新闻数据的具体内容写入文本框中def write_article(self, article):"""file_name = 'MJnews.txt'f = open(file_name, 'a', encoding='utf-8')title = list(article.keys())[0]f.write("题目:" + title + '\n')for content in article[title]:f.write(content + "\n")f.write("\n\n")f.close()

以上就是爬取新闻网站的方法,下一篇我们来介绍一下怎么处理爬取下来的信息。

交流学习

欢迎大家和我一起交流学习:qq:823172641,加入公众号;xiaomaIOT小马的技术分享会获取更多详细知识。

上一篇:怎样用python实现微信盯
下一篇:怎样用Python生成词云

怎样用python获取财经网新闻相关推荐

  1. 基于 python获取教育新闻进行分词关键词词共现分析 知识图谱 (附代码+报告)

    本文着眼于对疫情期间教育领域新闻的分析,基于 python 语言,利用爬虫获取教育领域的最新新闻,并将其内容进行分词,抓取关键词.在此基础上,根据关键词进行共现分析,并利用 Gephi 软件绘制主题知 ...

  2. python爬取新闻后提炼_Python爬虫开发的3大难题,别上了贼船才发现,水有多深...

    写爬虫,是一个非常考验综合实力的活儿.有时候,你轻而易举地就抓取到了想要的数据:有时候,你费尽心思却毫无所获. 好多Python爬虫的入门教程都是一行代码就把你骗上了"贼船",等上 ...

  3. python操作三大主流数据库(6)python操作mysql⑥新闻管理后台功能的完善(增、ajax异步删除新闻、改、查)...

    python操作mysql⑥新闻管理后台功能的完善(增.删.改.查) 安装表单验证 D:\python\python_mysql_redis_mongodb\version02>pip inst ...

  4. python实现新闻网站_如何用 100 行 Python 代码实现新闻爬虫?这样可算成功?

    每天我都要坐地铁上班,而地铁里信号差.但我希望在坐地铁的时候读些新闻,于是就写了下面这个新闻爬虫.我并没有打算做很漂亮的应用,所以只完成了原型,它可以满足我最基本的需求.其思路很简单: 找到新闻源;用 ...

  5. 计算器百分号如何用代码实现_如何用 100 行 Python 代码实现新闻爬虫?这样可算成功?...

    每天我都要坐地铁上班,而地铁里信号差.但我希望在坐地铁的时候读些新闻,于是就写了下面这个新闻爬虫.我并没有打算做很漂亮的应用,所以只完成了原型,它可以满足我最基本的需求.其思路很简单: 找到新闻源:用 ...

  6. python 爬取财经新闻_如何用 100 行 Python 代码实现新闻爬虫?

    CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 每天我都要坐地铁上班,而地铁里完全没有手机信号.但我希望在坐地铁的时候读些新闻,于是就写了下面这个新闻爬虫. 我 ...

  7. python爬取新闻并汇总_【python】 爬虫-爬取新闻

    最近,在数据挖掘课,要交课设了,打算做一个通过机器学习进行新闻分类,首先要有大量的文本(新闻),去做训练,并通过爬虫爬取大量的新闻 一,思路如下: 0.首先确定获取数据的网站 1.通过Beautifu ...

  8. matlab python 股票,股票行情数据获取-Python获取股票数据?

    Python获取股票数据? 这里推荐一个包―tushare,tushare是一个免费.开源的python财经数据接口包.主要实现了从数据采集.清洗加工到数据存储过程,能够为金融分析人员提供快速.整洁的 ...

  9. Python 发送每日新闻

    文章目录 Python 发送每日新闻 一. 简介 1. 概述 2. 环境配置 3. 配置文件 二. 前端页面 三. 获取数据 1. 获取图片 2. 获取新闻 3. 制作数据 四. 发送邮件 Pytho ...

  10. Python零基础速成班-第12讲-Python获取网络数据Socket,API接口,网络爬虫Crawler(制作弹幕词云)

    Python零基础速成班-第12讲-Python获取网络数据Socket,API接口,网络爬虫Crawler(制作弹幕词云) 学习目标 获取网络数据Socket API接口 网络爬虫Crawler(制 ...

最新文章

  1. css如何做玻璃效果_拓展训练之后的效果保持工作该如何做?
  2. JavaScript面试系列:JavaScript设计模式之桥接模式和懒加载
  3. Oracle数据库用户角色、表空间创建、删除命令
  4. 在Android手机上配置office 365邮箱
  5. 什么是交换机?交换机的工作原理是什么?
  6. 关于web开发的评论思考
  7. en60204标准_工业机械一般办理CE认证的标准
  8. springboot踩过的坑
  9. C-Free 5.0最新注册码
  10. 内网html获取当前ip,JavaScript 获取本地局域网 IP 地址
  11. 雨过天晴电脑保护系统 试用手记
  12. laravel的elixir和gulp用来对前端施工
  13. mysql 重建索引,mysql优化之索引重建
  14. Python使用Opencc库完成字符繁简体转换
  15. stm32f103 ds18B20 驱动及芯片资料
  16. 领导说要搞微服务,我该怎么搭建开发和测试环境?
  17. 云计算厂商怎么打造自己的生态网络
  18. 配置LXDE快捷键锁屏
  19. 函数模板的特例化(专用化)以及类型含有const的特殊情况
  20. MySQL 求平均数

热门文章

  1. 【工艺】 CNC(数控机床)加工工艺
  2. 【面试必过系列,15个经典面试问题及回答思路
  3. 支付宝开发平台之第三方授权登录与获取用户信息
  4. 无心剑英译许巍《温暖》
  5. Chinese Whisper 人脸聚类算法实现
  6. 什么是搜索引擎???搜索引擎的介绍
  7. 讯飞翻译机抢镜背后,跨语种沟通迈入全新时代
  8. 【基础】PHP变量及变量作用域
  9. 2022-04-21 Android开发扫描二维码
  10. 本科学计算机大学学金融工程,2020年金融工程专业排名