#!/bin/bash

#Usage:

# ./start-comm-job_pro.sh#------------------------------------------------------#Filename: start-comm-job_pro.sh#Revision:1.0#Date:2017/10/30#Author:

#Description:

#Notes:

#------------------------------------------------------#定义该脚本执行必须输入两个参数:行业ID和日期,如果参数输入个数少于2就会报错

#调用语句如下sh/home/shutong/crawl/script/start-comm-job_pro.sh${industry_id} ${date_id}

Usage="Usage: $0 industry_id date_id"#[ $#-lt 2 ] && echo "${Usage}" && exit -1

#define alias time and bring into effect,alias就是命名一个较长命令的别名,这里用dt代替'date +%Y-%m-%d" "%H:%M:%S',后面的shopt命令就是使这个别名转化在整个脚本里生效alias dt='date +%Y-%m-%d" "%H:%M:%S'shopt-s expand_aliases

#script_dir=/home/shutong/crawl/script/#mysql_dir='/home/shutong/mariadb-5.5.57-linux-x86_64/bin'#date_hour_id=`date -d "1 days ago" +%Y%m%d%H`

#date_id=`date -d "0 days ago" +%Y%m%d`

#判断日期是否有参数,如没有参数默认取当天,参数优先if [ ! -n "$1" ];thendate_id=`date -d "0 days ago" +%Y%m%d`

#echo "参数不存在,默认参数为今天${date_id}"

elsedate_id=$1#echo "参数存在:${date_id}"

fi#定义数据库名称

db='label'#mysql服务器地址

host=192.168.0.112#mysql用户名

user=root

#密码passwd=root

#定义数据文件,格式为:${industry_id}_${date_id}.csv,

#存放目录统一放在/home/shutong/crawl/data/${industry_id}

#例如:汽车行业20171208日数据:004004_20171208.csv

filename="/home/shutong/crawl/data/${industry_id}/${industry_id}_${date_id}.csv"#把数据文件导入src_url表中functionload_to_src_url()

{

filename=$1tab_nm=$2#cd ${mysql_dir}

mysql-h ${host} -u${user} -p${passwd} -e "use ${db}; delete from"$2"where date_id = '${date_id}';

LOAD DATA LOCAL INFILE '${filename}' INTO TABLE "$2"character set utf8

FIELDS TERMINATED BY'^'LINES TERMINATED BY'\n';"}

#开始爬取数据

python/home/shutong/crawl/36bigdata/crawl_bigdata_article.py "${date_id}"#文章标题数据存放路径

#filename="/home/shutong/crawl/36bigdata/input/${date_id}/article_title_info_${date_id}.csv"#load_to_src_url ${filename}"src_article_title"#文章内容数据存放路径

#filename="/home/shutong/crawl/36bigdata/input/${date_id}/article_context_info_${date_id}.csv"#load_to_src_url ${filename}"src_article_context"#hdfs dfs-mkdir -p /input/36bigdata/src_article_title/"${date_id}"#hdfs dfs-put ${filename} /input/36bigdata/src_article_title/${date_id}

#hive-e "use label; alter table src_article_title add partition(date_id=${date_id}) location 'hdfs://hadoop:9000/input/36bigdata/src_article_title/${date_id}';"

shell脚本样本_Shell脚本相关推荐

  1. shell mysql并发_shell脚本中的多进程并发处理

    在前面的篇章里面,我们已经介绍了常见的各种shell命令操作.然而,在实际工作中,我们经常会遇到多种任务需要在一定时间内都解决掉.如果这些任务是相互独立的,即不存在先后执行关系,那么我们完全可以让它们 ...

  2. 测试过程中用shell的地方_Shell脚本应用——条件测试操作

    Shell脚本应用--条件测试操作 前言:在简单的shell脚本程序中,各条语句将按先后顺序依次执行,从而实现批处理的自动化过程,这就使得脚本过于机械化,不够"智能",难以处理更加 ...

  3. mysql使用shell脚本部署_shell脚本部署mysql主从

    centos6两台 Master IP:192.168.88.152 Slave IP:192.168.88.153 以下都是在主机上操作 两机配置免密登录 ssh-keygen -t rsa ssh ...

  4. shell蚂蚁森林_Shell脚本实现光速联自动提速

    宽带提速脚本, 具体使用方法见码云地址 光速联 https://www.fangyb.com/ 码云地址 https://gitee.com/caixiaodao/GuangSuLian [Asm] ...

  5. mysql中的shell脚本命令_shell脚本中mysql命令

    展开全部 本文介绍 MySQL 8.0 shell 子模块 Util 的两个导入特性 importTable/import_table(JS和python 版本的命名差e68a84e8a2ad6261 ...

  6. shell sleep毫秒_Shell脚本之date、sleep、usleep命令

    1.1 date命令 date用于获取和设置操作系统的时间,还有hwclock是获取硬件时间. date有个选项"-d",可以用来描述获取什么时候的时间,描述的方式非常开放,但不能 ...

  7. shell 判断网线插拔_shell脚本自动检测网络掉线和自动重连

    在ppp移植成功后,有时会出现ppp掉线等情况.这篇文章写了一个自动检测连接网络的解决方法. 创建一个shell脚本,在里面添加一下内容.(记得给操作权限) #!/bin/sh //根据你自己的she ...

  8. 整理全网Shell脚本合集,Java脚本,运维脚本,告警脚本,监控脚本,日志脚本,docker脚本等---------持续更新!

    整理全网Shell脚本合集,Java脚本,运维脚本,告警脚本,监控脚本,日志脚本,docker脚本等---------持续更新! 一.ffmpeg脚本 1.1 打开进程,并判断进程数量 1.2 关闭进 ...

  9. 将shell脚本转为python_shell脚本将python脚本加入Linux系统服务

    用shell脚本将Python脚本做成系统服务随着系统的启动而启动,同时又可以通过"service"命令进行管理(start|stop|restart) 新建 FuzzyMatch ...

最新文章

  1. 投资的境界:及时抓住机会或止损才是硬道理
  2. 【PHPWord】TitleTOC
  3. 图片(img标签)的onerror事件,你有用过嘛?
  4. iOS9系统下SEGV_ACCERR问题的解决方案
  5. matlab imwrite函数保存jpg格式图像丢失数据或改变图像
  6. 把度分秒的经纬度转换成十进制的经纬度的工具类
  7. 面试和人生目标(转)
  8. 世界十大最有价值公司(1997-2019)
  9. php 创mysql_PHP MySQL 创建表
  10. 山西评计算机高级职称,山西专业技术职称评审不再统一组织外语和计算机能力考试...
  11. sqlyog怎么查找表_VBA代码解决方案第58讲:在VBA中查找指定工作表的实用方法
  12. 【leetcode刷题笔记】Convert Sorted Array to Binary Search Tree
  13. win7(64位)php5.5-Apache2.4-环境安装
  14. VoLTE前台信令详析及注释说明
  15. 简述微型计算机的发展历程,1.1 计算机的发展历程
  16. element 问号提示_点击HTML页面问号出现提示框(附源码)
  17. Inspector检视视图
  18. 手游直播到底难在哪里?
  19. Slf4j之MDC机制
  20. 新南威尔士计算机科学就业方向,新南威尔士大学计算机科学专业

热门文章

  1. html元素中的click属性,从HTML中的onClick属性调用jQuery方法
  2. mkdir 与mkdir -p 区别
  3. antd mysql_create-react-app使用antd按需加载的样式无效问题的解决
  4. 为什么饿着饿着就不饿了
  5. mysql hang分析_mysql hang
  6. 数据结构专题(二):2.2单链表与顺序表,求元素个数,取值与查找
  7. android程序导入虚拟机,android项目打包成apk应用程序后部署到虚拟机上测试
  8. android图片垂直居中,img图片在div里垂直居中的最佳解决方案
  9. linux mvn m2目录,Maven C盘用户文件下没有.m2
  10. 计算机工作操作中一些问题,计算机二级考试中操作题常见问题之[电子表格]