Is there a way to delete files older than 10 days on HDFS?

In Linux I would use:

find /path/to/directory/ -type f -mtime +10 -name '*.txt' -execdir rm -- {} \;

Is there a way to do this on HDFS? (Deletion to be done based on file creation date)

解决方案

Solution 1: Using multiple commands as answered by daemon12

hdfs dfs -ls /file/Path | tr -s " " | cut -d' ' -f6-8 | grep "^[0-9]" | awk 'BEGIN{ MIN=14400; LAST=60*MIN; "date +%s" | getline NOW } { cmd="date -d'\''"$1" "$2"'\'' +%s"; cmd | getline WHEN; DIFF=NOW-WHEN; if(DIFF > LAST){ print "Deleting: "$3; system("hdfs dfs -rm -r "$3) }}'

Solution 2:

Using Shell script

today=`date +'%s'`

hdfs dfs -ls /file/Path/ | grep "^d" | while read line ; do

dir_date=$(echo ${line} | awk '{print $6}')

difference=$(( ( ${today} - $(date -d ${dir_date} +%s) ) / ( 24*60*60 ) ))

filePath=$(echo ${line} | awk '{print $8}')

if [ ${difference} -gt 10 ]; then

hdfs dfs -rm -r $filePath

fi

done

shell 删除了hdfs 文件,在HDFS上删除超过10天的文件相关推荐

  1. Facebook图片存储系统Haystack——存小文件,本质上是将多个小文件合并为一个大文件来降低io次数,meta data里存偏移量...

    转自:http://yanyiwu.com/work/2015/01/04/Haystack.html 一篇14页的论文Facebook-Haystack, 看完之后我的印象里就四句话: 因为[传统文 ...

  2. 怎样上传超过20G的大文件到网盘?

    我发现winrar这个压缩文件也是有这个选项的,切为分卷. 摘自:https://jingyan.baidu.com/article/77b8dc7facbbcc6175eab665.html 怎样上 ...

  3. linux如何删除指定大小以下的文件夹,Linux中定时删除超过指定大小的文件夹

    背景: 开发环境总是动不动就没有空间了, 大部分都是debug日志.所以有必要在日志很疯狂的时候,删除不必要的日志. 思路:一. 书写删除日志文件脚本: 定时任务执行.  但是有时候的日志是需要保存用 ...

  4. ubuntu在 hdfs上创建一个文件夹_NAS上如何创建和使用加密文件夹?

    共享文件夹是一个网络存储空间.您可以建立数个共享文件夹来存放不同类别的数据,或提供给不同的用户或用户群组来存取文件. 一旦加密共享文件夹被创建后,只有管理员将该共享文件夹装载,文件夹内的内容才可以被打 ...

  5. ajax可以发送文件,通过Ajax上传img时如何发送文件信息

    我正在尝试拆分上传到ajax方法的图像文件.所有的html和JS都在一个文件中,然后我组成了一个包含所有PHP的PHP文件. 我正在努力的是,我不确定如何将图像文件信息发送到php文件,然后如何使其余 ...

  6. GitHub上传超过100M的单个文件(包括处理和解决)

    版权声明:本文为博主原创文章,版权均归本人所有,任何人或团体.机构全部转载或者部分转载.摘录,请保留本博客链接或标注来源.博客地址:https://blog.csdn.net/qq_31285709/ ...

  7. 文件传服务器上全是乱码,解决txt文件上传oss服务器乱码的问题

    今天上传txt文件下载下来却乱码,搞了一下午,发现还挺复杂.记录一下. 1.首先服务器只接受utf-8格式的文件,所以首先想到的就是转码问题. 这是网上很容易就找到的判断文件编码的代码.判断出来之后如 ...

  8. 如何在Windows cmd上递归删除文件或文件夹?批量删除指定大小的图片文件

    如何在Windows cmd上递归删除文件或文件夹? for /r %R in (.gif) do if exist %R (rd /s /q "%R") / q禁用是/否提示 / ...

  9. linux上删除一个目录以及其下文件

    rm [options] 文件夹名称 参数 -i 删除前逐一询问确认 -f 即使原档案属性设为唯读,亦直接删除,无需逐一确认 r 将目录及以下之档案亦逐一删除 删除当前目录下所有文件和目录: rm - ...

最新文章

  1. (转)记忆杭州中的(非杭户籍人)
  2. Struts2 的stream result用法
  3. 贞子的在日本历史出现过的轨迹
  4. [ASP,VB] - 利用ASP调用API COM接口实现开关机
  5. java咖啡机故障5_【咖啡小常识】咖啡机不得不知道的常见故障及解决方法
  6. [医疗开发]医疗相关名词解析
  7. Oracle行迁移和行链接
  8. 《Java程序设计基础 第3版》pdf 附下载链接
  9. access vba代码大全_VBA编程在翻译中的应用
  10. 安装kafka+golang操作kafka
  11. armv7l安卓刷linux,技术讲解-安卓APK快速生成后门(实现手机入侵)
  12. Fallback class must implement the interface annotated by @FeignClient
  13. jenkins + git+maven做持续集成
  14. Ubuntu16.04系统迁移SSD
  15. 【北京】No317| 在京在读研究生,可静可动,乐观,脾气好,很佛系的女孩,喜欢运动,旅游,读书,小吃货一枚,谈恋爱比较粘人...
  16. oracle计算日期倒计时,时间倒算回去到了哪里?│机械倒数计时码表
  17. Java开发人员必须掌握的Linux命令(二)
  18. 解决MacBook浏览器打开北京工作居住证系统问题
  19. 两招彻底驯服Vista任务管理器这头倔驴
  20. 基于C#制作一个桌面宠物

热门文章

  1. 深入浅出讲解C语言#define宏定义应用及使用方法
  2. 智能驾驶板块_智能驾驶股票有哪些?智能驾驶股票一览
  3. python 的csr_python的高级数组之稀疏矩阵
  4. java的封装性的优点_18、Java的三大特性之封装
  5. python帮助文档快捷键_Pycharm快捷键手册
  6. Wireshark常用过滤使用方法
  7. 光端机与交换机有什么区别?
  8. 视频光端机各种视频接口的传输距离是多少?
  9. python参数化建模 书_Python 中如何实现参数化测试?
  10. idea使用c3p0数据库连接池无法加载配置文件xml,配置文件放置的位置