编者按

光催化分解水制氢是实现洁净生产氢能的理想途径。为了实现高效的太阳能到氢能的转化效率,我们迫切的需要开发更加高效的光催化剂, 而理解光催化剂的构效关系是其中的关键。然而通常对于构效关系的理解是基于试错(trail-and-error)的方法进行,而且获取的数据量少,导致得到的构效关系具有较大的局限性,无法用来很好的指导更加高效的催化剂的筛选。因此人们一直期待进行更加快速高效的构效关系的研究。来自利物浦大学Andrew I. Cooper 教授研究组为我们提供了一个研究范式。他们基于聚合物光催化剂,通过将自动化实验过程与高通量合成、表征、计算相结合,构建了光催化剂活性与结构的大数据集。以上的大数据集,被用作机器学习算法结构的训练集。在考虑电子亲和能、离子化能力、光学带隙以及聚合物在水中的分散度四方面结构因素时,基于机器学习的模型预测的光催化活性与实验结果的线性拟合优度(确定系数R2)为0.68,具有较高的可靠性

实验

图1解释了作者通过高通量实验、表征构建关于结构、光催化活性的大数据集的策略。作者这里基于Suzuki-Miyaura反应来进行聚合物光催化剂的合成,这是因为可用的备选材料数很大(6354个),可以提供足够丰富的关于结构的信息。结合高通量计算(主要包括电子亲和能、离子化能以及光学带隙),作者首先选取了127个聚合物分子进行合成,通过自动化、高通量地合成和表征(主要包括XRD、PL、FTIR和透光率),最终确定了99个可用于光催化的测试的聚合物分子。这些聚合物分子,最终通过高通量光催化反应器进行活性表征。作者这里也突出展示了高通量、自动化合成的强大优势:这里筛选的聚合物光催化剂数量远远超过了文献中报道的数量的总和!

Figure 1 Workflow for high-throughput synthesis and property screening of the conjugated polymer library.

基于对合成的99个聚合物光催化剂得到的光催化活性与这里主要考虑的四方面结构因素(主要包括电子亲和能、离子化能、光学带隙和透光率)构建的数据集,作者对基于梯度提升的机器学习模型进行训练。利用训练完成的模型对这99个光催化剂分子的光催化放氢活性经行预测,预测结果与实验结果的确定系数R2为0.68,具有较好的可靠性。虽然如此,作者这里也强调,由于R2=0.68也意味着以上四个因素还不足以完全描述决定光催化剂活性的因素,因此也值得更深的探索。

Figure 2. (a) Properties used to train the gradient-boosting model, where IP, EA, and optical gap are calculated, and transmittance is measured experimentally. (b) Experimentally observed HER vs HER predicted using a gradient-boosted trees machine-learning model. The model is evaluated by leave-one-out cross validation, meaning the data shown are for co-polymers not considered during training.

根据机器学习的模型,作者对前述的6354个聚合物的光催化放氢活性进行预测,并最终筛选出来两个全新的聚合物光催化剂, 它们相比文献已经报道的最好的聚合物光催化剂的活性和稳定性,具有明显优势。

Figure 3. (a) Structures of previously reported polymer photocatalysts (P7 and P10; left) and the best-performing polymer photocatalysts in this study (P64 and P62; right), as measured under identical conditions. (b) UV/visible spectra of P7, P10, P62, and P64. (c) H2 evolution rates of P7, P10, P62, and P64. (d) Plot showing sacrificial photocatalytic hydrogen evolution versus time for P64 under solar simulator irradiation. Vertical lines indicate degassing.

评论

本工作充分展示了前沿技术对于催化研究的革命性的促进作用。自动化、大数据、高通量实验、机器学习等在该研究中有机的结合在一起,在量和质两个方面对于光催化剂的研究都起到了巨大的冲击。Andrew Cooper教授是将人工智能领域用于实验研究的先驱,其研究组近期在Nature上报道的全自动决策的Robotic Chemist更是让大家调侃自己是不是要失业了。我们每天都在看到新闻报道各种巨大的科学进步,然而如何将其与自己的研究相结合值得我们认真而严肃的思考。

关键词:聚合物光催化剂;高通量;大数据;人工智能;构效关系

引文:

Bai Y., et al. (2020). "Accelerated discovery of organic polymer photocatalysts for hydrogen evolution from water through the integration of experiment and theory" JACS 141: 9063-9071.

本文编辑:道哥哥

其他用户平台可直接微信搜索关注“科学温故社”

欢迎分享转载,共同进步!

热忱欢迎志同道合之士提供稿件,分享见解 !

有意愿投稿的小伙伴请后台输入“投稿”/“交稿”获取相关流程!谢谢支持!

往期推文:1 甲烷活化制甲醇:致敬大佬之神仙打架2 单原子催化之前世今生3 Chem Rev./Chem. Soc. Rev./Joule/EES/Angew十余篇:CO2加氢相关顶刊综述集锦!4 负载型金属催化剂的动态催化过程5 催化大牛Krijn P. de Jong 工作知多少6 生物质能源转化奠基之作—James A. Dumesic组正刊三连7 破千引用的电催化计算开山之作封面美图:ETH Javier Pérez-Ramírez 课题组精选封面一网打尽【封面】CO2催化转化精选封面一网打尽!

机器学习顶刊文献_“大数据+机器学习”在光催化制氢中的研究范式相关推荐

  1. 机器学习顶刊文献_人工智能顶刊TPAMI2019最新《多模态机器学习综述》

    原标题:人工智能顶刊TPAMI2019最新<多模态机器学习综述> 来源:专知 摘要:"当研究问题或数据集包括多个这样的模态时,其特征在于多模态. [导读]人工智能领域最顶级国际期 ...

  2. 学堂在线_大数据机器学习_小笔记

    学堂在线大数据机器学习小笔记 20220607 - https://www.xuetangx.com/learn/THU08091001026/THU08091001026/10333105/vide ...

  3. python redis模块_大数据入门4 | Redis安装及python中的redis模块加载

    引:前面学习了中文分词.HMM.jieba...这些有很多内容需要总结,但是时间太紧,一下写不完.所以前面的就先放一边,届时复习时再写吧. 今天把刚学的遇到的问题总结一下. 实践部分遇到的问题: 1. ...

  4. 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...

  5. 《大数据》第1期“专题”——大数据机器学习系统研究进展(上)

    大数据机器学习系统研究进展 黄宜华1,2 1.南京大学计算机软件新技术国家重点实验室 南京 210023: 2.南京大学PASA大数据技术实验室 南京 210023 摘要:要实现高效的大数据机器学习, ...

  6. 分布计算 | 大数据机器学习系统研究进展

    1 大数据机器学习系统研究背景 近年来,大数据技术在全球发展迅猛,掀起了巨大的研究热潮,引起全球业界.学术界和各国政府的高度关注.随着计算机和信息技术的迅猛发展和普及应用,行业应用数据呈爆炸性增长.动 ...

  7. 大数据机器学习系统研究进展

    要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统.研究设计高效.可扩展且易于使用的大数据机器学习系统面临诸多技术挑战.近年来,大数据浪潮的兴 ...

  8. python怎么做彩票概率_小白学数据小抄放送 Python,R,大数据,机器学习

    原标题:小白学数据小抄放送 Python,R,大数据,机器学习 大数据文摘作品,转载要求见文末 作者 | Elaine,田桂英,Aileen 导读:前段时间小白学数据专栏出了一期Python小抄表,后 ...

  9. 大数据机器学习(一)概述

    2020.09.17 星期三课程笔记 1.学习资源 (1)在线课程 ①清华学堂在线-袁春老师的<大数据机器学习> ②李宏毅的机器学习课程(中文) ③林轩田<机器学习基石上下>( ...

最新文章

  1. linux arcgis10.4安装教程,ArcGIS 10.1 for Server安装教程系列—— Linux下的单机安装
  2. vue eslint 代码自动格式化
  3. 压力测试以及编译安装httpd2.4
  4. C语言之文件读写探究(三):fputs、fgets、feof(一次读写一行字符(文本操作))
  5. Hibernate 与 Mybatis 如何共存?打破你的认知!
  6. 怎么将EXCEL的网格线打印出来,教程在这里,EXCEL里的网格线如何打印出来
  7. Mac系统如何显示隐藏文件
  8. 爬虫chromedriver被识别怎么办?
  9. Palindromic Tree——回文树【处理一类回文串问题的强力工具】
  10. 网络-4 【http状态码、accept、Content-Type】
  11. SEO 已死,LLMO 万岁
  12. 微信 jsapi支付 和 Native支付 php
  13. 20155214曾士轩 2016-2017-2 《Java程序设计》第1周学习总结
  14. 解决tomcat运行报错java.lang.UnsatisfiedLinkError: apache-tomcat-7.0.37\bin\tcnative-1.dll:Can load AMD 64
  15. android studio新闻界面,课内资源 - 基于Android Studio实现的新闻APP
  16. 动易安装SF5.9时出现“applicationInitialization”错误的解决方法
  17. 基于微信的智能家居控制系统的设计与实现
  18. nc 监听数据_nc命令使用解析大全
  19. 【一文学会MQTT协议和mosquitto】
  20. leadsoft成套电器报价系统Winner解决方案

热门文章

  1. C++中BEGIN_MSG_MAP或者BEGIN_MESSAGE_MAP的个人理解
  2. 地震勘探英文专业文章中的经典句子(1)
  3. 高吞吐低时延日志系统需要注意的方面
  4. 图论:柯尼斯堡桥问题、艾科西亚游戏
  5. C++ STL 教程
  6. Flink流处理练习
  7. java的值排序总结
  8. hook(钩子函数)
  9. pytorch tensor查找0_Pytorch tensor(0): Tensor Introduction
  10. python运维处理序列_Python运维开发:02 序列