目录

  • 工作流
    • 文献整理(mendeley)
    • 批量序列化重命名(advanced_renamer)
    • 研究机构提取(matlab/python)
    • 表格信息录入
    • 简单的数据统计分析

工作流

首先你得有所有paper的pdf文件库吧,然后这些文件都是这么命名的:

故而需要把文件全都重命名,要包含标题/年份/会议/作者这些信息,然后按照机构分类,在机构下再重编号,比如"IMEC001_IEDM2017_Ge stained metal stack FinFET xxxxxxxxx_Mark harley yyyyyyyy.pdf" 。
这里我们以比利时的IMEC为例进行处理整理,看看我们怎么来做这件事吧。

文献整理(mendeley)

首先我们在WOS上获得了论文数据表格,非常详尽哈。

基于这个表格,我们要筛选出IMEC的paper的所有行,就用查找/筛选这两项就可以了,然后添加一列内容为year-conf-title的格式,便于排序形成检索的依据。

mendeley desktop软件进行初步的重命名,便于形成检索,这个很好用,
批量拖拽未合法命名的论文pdf文件,进入mendeley,可自动抓取pdf的论文标题/作者/出版会议/年份/摘要/DOI等信息,并对pdf文件自动重命名为”年份-会议-标题-作者.pdf”。

  1. 批量拖拽,生成论文列表

  2. 抓取年份/作者/标题等信息,自动重命名

  3. 打开文件所在路径,导出命名好的pdf

批量序列化重命名(advanced_renamer)

advanced_renamer这个软件也是神奇嗷,但是你编订的命名列表里不要含有“/ \ : ! & ”这些字符,会报错,在excel里把他们替换掉吧。

  1. 在excel中使用筛选工具选出IMEC机构一作的全部文献后,按“年份-标题”进行排序,粘贴进advanced_renamer。

  2. 导入pdf文件的顺序要与表格的内容顺序一致,且不重不漏。

  3. 批量重命名

研究机构提取(matlab/python)

接下来需要提取一些第二第三第四单位等信息,提进表格里。写了一个小脚本

  1. 找出所有]和[之间的字符串,即为机构名


在我的下一篇博客里 Matlab脚本分享:字符串列表的正则检索、分割提取

表格信息录入

这些就是需要一篇一篇读文章来获取的内容了。

简单的数据统计分析


卡尔斯鲁厄大学跟IMEC是深度绑定的两个单位,这里就看看这两个的paper的数量关系。其中2018年的KULV的paper我这应该是不太全的,抱歉。

2017-2021年 ISSCC/IEDM/VLSI三大会论文库信息提取与统计的工作流相关推荐

  1. IJCAI 2021:周志华任大会首个华人程序主席,南大校友获AIJ杰出论文奖

    来源:新智元 [导读]近日,IJCAI 2021在线上开幕,IJCAI史上首位华人程序主席南大周志华教授分析本届大会论文接收情况:中国投稿量最多,最热门的前四个领域论文接收率占56%,此外还总结了通过 ...

  2. 顶岗实习周记java方向_会计学院顺利召开2021届毕业生顶岗实习动员大会

    会计学院顺利召开2021届 毕业生顶岗实习动员大会 顶岗实习是实践教学的重要组成部分,是提升学生岗位适应能力,培养学生职业素养的重要环节.为了更好的完成顶岗实习工作,帮助毕业生树立正确的实习就业观,更 ...

  3. 知道创宇区块链实验室受邀参加“2021 CCF中国区块链技术大会”

    2021 年12 月 26 - 27 日 ,由中国计算机学会(CCF)主办的 " 2021 CCF中国区块链技术大会" 在海南海口隆重举办.此次会议邀请来自政府部门.高等院校.金融 ...

  4. 机器学习方向博士毕业有5篇三大会(ICML、Neurips、ICLR)是什么水平?

    链接:https://www.zhihu.com/question/512189171 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 机器学习方向博士毕业有5篇一作三大会(ICML.Neuri ...

  5. 2017中国呼叫中心及企业通信大会在京成功召开

    由中国领先的信息与通信技术行业网站CTI论坛主办的2017中国呼叫中心及企业通信大会[http://www.ctiforum.com/expo/2017/ccec2017spring/index.ht ...

  6. 2017中国产品经理、互联网运营大会官方回顾:未来,属于你

    刚刚结束的周末,2017中国产品经理.互联网运营大会在北京北苑大酒店成功举行,来自腾讯.百度.京东.网易.搜狗等公司的15位嘉宾,与各位小伙伴一起度过了烧脑的两天. 几十个案例拆解,数十个模型分析,从 ...

  7. 2017年上半年总结:大三下学期,马上大四,马上要毕业了.

    2017年上半年总结:大三下学期,马上大四,马上要毕业了. 当这学期马上结束了,想起要写今年上半年的总结了,写下标题才猛然惊起,我已结束大三,下学期就大四了啊? --不可思议且平淡的大三end 回忆这 ...

  8. 2021长三角智能包装产业发展大会

    随着消费者对产品包装的要求越来越高,包装生产工艺也在不断进步,各类提高产品包装速度和美观程度的包装机械设备应运而生. 当前高度自动化.高效化.节能化的包装设备已然受到食品.饮料.医药等下游行业青睐,传 ...

  9. 辰视冯良炳博士演讲的2021长三角智能包装产业发展大会成功举办!

    6月23日下午,由工业技术创新联盟(工创联)联合上海博华国际展览有限公司,ITES深圳工业展.中国传动网协办的[2021长三角智能包装产业发展大会成功举办]. 随着消费者对产品包装质量.外观等要求的提 ...

  10. 2021年人工神经网络第三次作业-第二题:遗传算法与人工神经网络-参考答案

    简 介: 给出了对于BP网络求解异或问题过程中,利用遗传算法完成网络演变的过程.所使用的遗传算法是最基本的遗传算法.利用遗传算法对于网络的系数进行演变,可以对网络系数初始化过程进行优化.对于不同的遗传 ...

最新文章

  1. IntelliJ IDEA 14.0.2破解注册码文件(2015年06月08日)
  2. 一个用于 Entity Framework 对象拷贝的方法
  3. python 分析两组数据的差异_R语言limma包差异基因分析(两组或两组以上)
  4. kotlin学习之函数(二)
  5. 关于业务用例抽象问题对网友的回复
  6. 人工智能选go还是python_深圳人工智能学Python还是go,真实经历分享
  7. 先滑窗后时空联合处理MATLAB,时空联合优化重建方法及系统与流程
  8. 多层GCN的over-smooth问题
  9. 基于OpenVINO的多输入model optimizer(Tensorflow)
  10. 十大经典排序算法(动图演示)(转)
  11. Android studio 突然 无法解析符号
  12. visual studio写python_将 Visual Studio 变身为 Python IDE
  13. 服务器部署文档模板,完整word版)部署文档模板
  14. 使用JavaVisualVM远程监控JVM虚拟机
  15. GoldenDict和主流英语词典产品
  16. linux vga 分辨率低,通过 VGA 接口连接显示器时分辨率不正确
  17. MSM8953_Linux-Android软件手册资料
  18. html圆形头像的制作
  19. 11万多职场文章技巧ACCESS数据库
  20. Spring Boot微服务API网关

热门文章

  1. Qt调用Com组件--QT调用COM组件DLL(dumpCPP工具)
  2. VSCode 摸鱼神器,确定不试一下?
  3. Unity 获取GPS经纬度
  4. VUE 中使用 Element 时间控件(简单上手)
  5. win10 Matlab2017a .m相关文件关联
  6. VMware 镜像安装
  7. snmpwalk工具使用
  8. “牙医”教你用450行Go代码自制编程语言 | Gopher Daily (2021.01.15) ʕ◔ϖ◔ʔ
  9. C++ 调用 SWMM模型.swmm5.dll
  10. 串口监听器使用说明书