折腾了几天的WechatScraper终于部署到Linux服务器上能生产使用了

用篇文章来记录下部署过程中遇到的各种bug和坑。

1. 运行问题

webdriver在有GUI界面的系统上运行是只需要下载chromedriver或者geckodriver等就能直接带动浏览器运行,只需要创建一个浏览器实例就行了

from selenium import webdriver

broswer = webdriver.Chrome(executable_path=/path/to/chromedriver, chrome_options)

在有些不带GUI界面的Linux机器上,如果想要使用webdriver,首推的方案是Python+Selenium+PhantomJS,PhantomJS是一个无头浏览器,即使没有GUI界面也能正常运行,常用于测试等环境。

因为没有GUI,如果我们想使用Chrome/Firefox等浏览去,我们就需要Xvfb和python的pyvirtualdisplay库,给浏览器创造一个运行环境,这样浏览器就能顺利运行了。

注:实际检测,PhantomJS在获取搜索结果的时候跟Firefox/Chrome差别很大,具体原因不太清楚,希望有人能解惑。

2. Executable path

这个常见的报错是

the path to the driver executable must be set blabla...

当webdriver调起浏览器时,需要在系统路径中找到geckodriver或者chromedriver这些能操控浏览器的驱动,所以我们需要将这些文件复制到/usr/bin或者/usr/local/bin或者/usr/sbin这几个文件夹下,这样才能让webdriver顺利调起浏览器供我们使用。

3. chrome not reachable

这个报错比较奇怪,而且当直接去以

cd /path/to/chromedriver && ./chromedriver

这个命令执行的时候,会报错glibc-版本号未安装,这个猜测是因为版本不匹配导致的,因为我后来换了低版本的chromedriver是可以直接运行的,所以如果你的系统上glibc版本不高的话,建议使用低版本的chrome和chromedriver。

结语

暂时想到的就这几个,如果有什么问题,可以直接在评论区回复,如果有其它解决方案或者错误之处,欢迎指出。

python中webdriver_Linux上部署python+selenium+webdriver常见问题解决方案相关推荐

  1. 怎么抓python程序的包_如何在AWS上部署python应用程序

    如何在AWS上部署python应用程序,学姐呕心沥血亲自总结,亲测有效,比网上看网上大把大把的文档要快得多! 作者:蕾学姐 亚马逊云计算服务(Amazon Web Services,缩写为AWS),由 ...

  2. python读取枚举_在python中枚举(enumerate in python)

    在python中枚举(enumerate in python) 说, term='asdf'; InvertedIndex = {}; InvertedIndex[term] = [1,2,2,2,4 ...

  3. python 中^是什么意思,python 中%是什么意思

    python中^是什么意思 在Python" // "表示整数除法.Python其它表达式:Python的表达式写法与C/C++类似.只是在某些写法有所差别.主要的算术运算符与C/ ...

  4. python中readlines函数用法,python中read() readline()以及readlines()用法

    我们谈到"文本处理"时,我们通常是指处理的内容.Python 将文本文件的内容读入可以操作的字符串变量非常容易.文件对象提供了三个"读"方法: .read(). ...

  5. python中八进制_在Python中以八进制格式输入数字

    python中八进制 Syntax to convert octal value to an integer (decimal format), 将八进制值转换为整数(十进制格式)的语法, int(o ...

  6. python中返回上一步操作_通过实例解析Python文件操作实现步骤

    当程序运行时,变量是保存数据的好方法,但变量.序列以及对象中存储的数据是暂时的,程序结束后就会丢失,如果希望程序结束后数据仍然保持,就需要将数据保存到文件中. Python 提供了内置的文件对象,以及 ...

  7. python打开谷歌浏览器 关键字_python3之selenium.webdriver 库练习自动化谷歌浏览器打开百度自动百度关键字...

    import os,time,threading from selenium import webdriver from selenium.webdriver.common.keys import K ...

  8. python中撤回上一步_python返回上一步

    python代码运行到某一步能返回到前面某一步吗? 有. Eclipse里编程代码,返回上一步的快捷键是alt+←箭头. eclipse中几个最重要的快捷键. 代码助手:Ctrl+Space(简体中文 ...

  9. docker如何部署python项目_Docker如何部署Python项目的实现详解

    Docker 是一个开源项目,为开发人员和系统管理员提供了一个开放平台,可以将应用程序构建.打包为一个轻量级容器,并在任何地方运行.Docker 会在软件容器中自动部署应用程序.IBV免费资源网 在本 ...

最新文章

  1. 从技术角度谈游戏国际化的一些建议:版本管理和文本翻译
  2. redis 数据结构
  3. Asp.Net生命周期的详解
  4. 启动盘Linux windows,Linux 中创建 USB 启动盘来拯救 Windows 用户
  5. 2021 Chrome Devtools 新特性
  6. jenkins集成钉消息通知
  7. 双层玻璃matlab,数学建模-双层玻璃窗.doc
  8. 吴恩达深度学习的实用层面编程作业:正则化Regularization
  9. Docker部署SpringCloud ELK+RabbitMQ日志
  10. React入门---组件-4
  11. 中国未来5年IP地址需求总量高达345亿
  12. c语言 有关文件读/写函数 详解
  13. Maven实现Web应用集成測试自己主动化 -- 部署自己主动化(WebTest Maven Plugin)
  14. 【资料】《数字电子技术基础》阎石第五版
  15. 西门子smart200 圆弧插补 整合画图程序 2轴3轴
  16. CentOS7安装PHP5.3.28
  17. 独孤思维:哇,看到三点式又激动了
  18. 办公自动化工具-Excel文件、sheet合并工具
  19. MVP模式基本用例开发
  20. 不懂精简指令集还敢说自己是程序员?

热门文章

  1. alpinestars与丹尼斯_骑行靴|丹尼斯VS A星心得分享,它和普通鞋子不同之处竟在这里!...
  2. span居div中_JavaScript-html Dom中的HTMLCollection和NodeList
  3. 修改element中v-loading的自定义图片
  4. 【NOI2014】动物园 kmp性质
  5. 关于TextBox控件字体颜色绑定
  6. C++ 在字符串中插入子串+推断字符串是否由空格组成
  7. RNQOJ Jam的计数法
  8. [jQuery]无法获取隐藏元素(display:none)宽度(width)和高度(height)的新解决方案
  9. Android中解析XML
  10. C#.NET 大型企业信息化系统集成快速开发平台 4.2 版本 - 防止脱库、防止篡改数据...