我的问题和这里问的问题类似:

https://stackoverflow.com/questions/14599485/news-website-comment-analysis

我试图从任何新闻文章中摘录评论。E、 g.我有一个新闻网址:

http://www.cnn.com/2013/09/24/politics/un-obama-foreign-policy/

我尝试在python中使用BeautifulSoup来提取注释。然而,注释部分似乎要么嵌入到iframe中,要么通过javascript加载。通过firebug查看源代码不会显示评论部分的源代码。但是通过浏览器的“查看源代码”功能显式地查看注释的源代码是正确的。如何提取评论,尤其是当评论来自新闻网页中嵌入的不同url时?在

这是我到现在为止所做的,虽然不多:import urllib2

from bs4 import BeautifulSoup

opener = urllib2.build_opener()

url = ('http://www.cnn.com/2013/08/28/health/stem-cell-brain/index.html')

urlContent = opener.open(url).read()

soup = BeautifulSoup(urlContent)

title = soup.title.text

print title

body = soup.findAll('body')

outfile = open("brain.txt","w+")

for i in body:

i=i.text.encode('ascii','ignore')

outfile.write(i +'\n')

如果您能帮我做些什么或如何去做,我们将不胜感激。在

python新闻评论分析_从新闻文章中提取评论相关推荐

  1. python商品评论分析_亚马逊产品情感评论分析

    import requests from lxml import etree import re import xlwt from openpyxl import workbook # 写入Excel ...

  2. python新闻评论分析_使用 python 抓取并分析京东商品评论数据

    本篇文章是python爬虫系列的第三篇,介绍如何抓取京东商城商品评论信息,并对这些评论信息进行分析和可视化.下面是要抓取的商品信息,一款女士文胸.这个商品共有红色,黑色和肤色三种颜色, 70B到90D ...

  3. python 评论分析_基于Python-Snownlp的新闻评论数据分析

    摘 要 网上热点新闻的评论不仅反映了民众对社会热点事件的关注程度,也反映了公众所表现出的各类情感价值和思想动态.基于Python- Snownlp经过数据采集,数据预处理,建立向量模型,数据挖掘与分析 ...

  4. python新闻评论分析_新闻详情页

    一,业务流程分析 1,功能 1,新闻详情 2,加载评论功能 3,添加评论功能 二.新闻详情页 1,业务流程分析 业务流程: 1,判断前端传递新闻ID是否为空,是否为整数,是否存在 二,接口设计 1.接 ...

  5. python酒店评论分析_对超过1M的酒店点评进行机器学习,发现有趣的见解

    在之前的文章中,我们学会了如何训练一个机器学习分类器,用来检测酒店点评中提到的不同方面.使用这个方面分类器,我们可以自动的知道一个特定的点评是否在谈论清洁.舒适和设施.食品.网络.地点.工作人员以及/ ...

  6. python商品评论分析_用python3爬取天猫商品评论并分析(1)

    在上一篇文章我们已经完成数据的采集,并将数据存储在mysql,现在我们来继续后面的数据分析工作,先放出项目流程: 0.主要流程 0.数据采集 0. 目标网址获取 1. 爬虫框架选用 注:了解这一步请登 ...

  7. python爬取京东评论分析_【实战好文】|爬取京东书籍评论并分析

    原标题:[实战好文]|爬取京东书籍评论并分析 这是菜鸟学Python的粉丝第10篇原创投稿 阅读本文大概需要5分钟 本篇作者:小郑同学 上周的赠书活动中,收到了楼主送的<利用Python进行数据 ...

  8. python酒店评论分析_酒店舆情分析

    Python进行携程酒店评论舆情分析 第一步:分析设计 我们是对酒店进行舆情分析,所有我们的核心是酒店的评论数据:对住客的评论数据进行特征提取,通过住客对酒店的评分,对数据进行分类,并使用朴素贝叶斯算 ...

  9. python酒店评论分析_手把手用Python网络爬虫带你爬取全国著名高校附近酒店评论...

    点击蓝色"Python空间"关注我丫 加个"星标",每天一起快乐的学习 今 日 鸡 汤 我站在鼓楼下边,一切繁华与我无关. /1 前言/ 简介:本文介绍如何用p ...

最新文章

  1. dpi shell命令 安卓_android 中 dumpsys 命令使用
  2. python中字符串的rstrip()方法
  3. 项目中遇到的几件有趣事
  4. 数据类型(整型、浮点数、字符串、时间和日期)、切分(水平、垂直)
  5. SparkContext、SparkConf和SparkSession的初始化
  6. mysql添加分区健_MySQL添加分区添加索引
  7. linux7给用户授权,CentOS7 添加新用户并授权
  8. 1433 mssql 安全_mssqlsql2008安全配置又一给力教程
  9. mORMot Js对象解析 Json 实例
  10. 引力子与黑格斯粒子是否超对称
  11. visio图片插入word,Acrobat导出pdf格式错乱
  12. CCF小白刷题之路---201809-1 卖菜(C/C++ 100分)
  13. 【JAVA】顺序表与ArrayList
  14. 帆船运行员训练方法研究
  15. NLP学习笔记——情感分析一 (简介)
  16. windows重装系统简易版--不需要u盘
  17. keep跑步截图生成器ios_主题月活动 |『公装跑步月』突破自我 票选邀您来参与!...
  18. Android Studio配置文件路径修改的方法
  19. 【android逆向笔记】(一)简单登录逆向
  20. 求积分方法及积分知识点-----专升本

热门文章

  1. Docker最全教程——从理论到实战(五)
  2. 张善友:自由之精神,中国之队长
  3. .net core 使用Redis的发布订阅
  4. Git 在团队中的最佳实践--如何正确使用Git Flow
  5. git和php的区别,Git与Github的有什么区别
  6. 有人撸了个网页版win11,惊艳!
  7. 如何用SQL来检测文件是否存在
  8. ArcGIS实验教程——实验三十三:ArcScan自动矢量化完整案例教程
  9. 【经典回放】多种语言系列数据结构算法:二叉树(JavaScript版)
  10. ArcGIS 10.2晕渲图+旋转图制作