Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式
木易 发自 凹非寺
量子位 报道 | 公众号 QbitAI
又一款懒人神器问世了:
Visual Studio Code的扩展,基于CodeBERT的Python文档字符串生成器。
看来现在,这群偷「懒」的程序员们连文档字符串都不想自己写了。
基于CodeBERT的生成器
跟正常的DocStrings用法一样,你只需要输入三引号「“””」,之后按Enter,便能调用这个工具。就像这样:
并且,这个生成器还可以在几种不同类型的文档字符串格式之间进行选择。
而这个工具,不仅仅能够帮助写代码的人,还可以方便后来人读代码。可以说是非常方便的一个扩展了。
这个工具的本质,就是一个自然语言识别的AI,它能够识别你所写代码的内容,然后输出对应的字符串。
具体是如何识别的,该AI的作者是这么介绍的:
参数类型是通过PEP 484类型、默认值和var标签进行识别的。
识别输入之后便是推断,这之间进行训练的方法,也并不复杂,通过CodeBERT便可以实现。
CodeBERT是一种双模预训练模型,它可以捕捉自然语言和编程语言之间的语义连接,是目前已知的第一个大型 NL-PL(自然语言-编程语言)预训练模型。
在训练过程中,使用 CodeSearchNet 语料库作为训练数据,并使用 CodeBERT 中的 Code2NL微调任务。
之后,进行的推断基准测试如下:
从上图也能看出,在不同的推断基准测试中,所需要的生成时间都很短(2s内),这体现在操作上的话,就是延迟。
目前,这个生成器可以支持识别args、kwargs、decorators和errors等参数类型。
此外,还可以输出Google、docBlockr、Numpy、Sphinx等Docstring格式,PEP0257类型的格式,也即将上线。
使用方法
1、从容器中运行模型推断服务
具有GPU的话:在安装nvidia-docker后,运行docker run-it-d-GPU 0-p 5000:5000 gray kode/ai-docstring。
只有CPU:运行docker run-it-d-p 5000:5000 gray kode/ai-docstring。
2、在VSCode中安装扩展并使用
光标必须在定义正下方的行上,以生成完全自动填充的文档字符串。
用三重引号「“””或‘’’」打开文档字符串后,按Enter键;
键盘快捷键是ctrl+shift+2,Mac为cmd+shift+2。
网友讨论
该生成器一经发布,便引起了网友们的讨论。
有网友认为这是一项非常便利的技术,非常期待:
不过,也有网友认为这项技术仍具有不小的局限性:
比如这位网友认为:更常见的注释,是在代码中没有立即出现的上下文之间添加内容。
不过,虽然有局限,但是人总是在「懒」的过程中变得更「懒」(狗头)。
比如jQuery的流行,是因为开发者懒得为DOM编写跨浏览器兼容性代码;
而之后Angular.js的流行,是因为开发者连DOM都懒得操作。
所以,还是非常期待这个扩展的后续,这些程序员能不能针对这些局限性进一步偷懒的。
获取资源
目前这个扩展已经在Visual Studio Code上免费上线。
进入链接即可获取资源:
https://marketplace.visualstudio.com/items?itemName=graykode.ai-docstring
也可以通过Github获取源文件:
https://github.com/graykode/ai-docstring
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
「MEET 2021智能未来大会」启幕,
早鸟票限时抢购中,扫码预定席位!
李开复博士、尹浩院士、清华唐杰教授,以及来自小米、美团、爱奇艺、小冰、亚信、浪潮、容联、澎思、地平线、G7等知名AI大厂的大咖嘉宾齐聚,期待关注AI的朋友报名参会、共探新形势下智能产业发展之路。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见~
Python文档字符串生成器:基于CodeBERT,支持Google、Numpy等多种输出格式相关推荐
- python 文档字符串_新款Python文档字符串生成器来了
又一款懒人神器问世了: Visual Studio Code的扩展,基于CodeBERT的Python文档字符串生成器. 看来现在,这群偷「懒」的程序员们连文档字符串都不想自己写了. 基于CodeBE ...
- 利用CodeBERT,这个VS Code扩展可以自动生成Python文档字符串
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:机器之心 该扩展利用可处理编程语言和自然语言的预训练模型 CodeBERT,实现 ...
- vscode python 自动补全_利用CodeBERT,这个VS Code扩展可以自动生成Python文档字符串...
机器之心报道 编辑:魔王 该扩展利用可处理编程语言和自然语言的预训练模型 CodeBERT,实现快速生成 Python 文档字符串的功能. Visual Studio Code(简称 VS Code) ...
- 这个VS Code扩展可以自动生成Python文档字符串
机器之心报道 编辑:魔王 该扩展利用可处理编程语言和自然语言的预训练模型 CodeBERT,实现快速生成 Python 文档字符串的功能. Visual Studio Code(简称 VS Code) ...
- python——文档字符串
文档字符串 python支持自动附件在对象上的文档,可以在运行时查看.从语法上来看,就是可以跨行的字符串注释.这种注释可以放在模块开头,函数顶部,以及类顶部.这些字符串被正式的称为"文档字符 ...
- python文档字符串格式_Python字符串及文本模式方法详解
一.你想在字符串中搜索和匹配指定的文本模式 遗漏点:re模块其实也是帮助我们进行字符串处理的重要工具,我之前总是想着用内建的函数来处理,其实如果是复杂的文本和数据结构,re模块能帮助我们处理很多信息. ...
- python文档字符串_结构化的python文档字符串,对IDE友好
在PHP中,我习惯了PHPdoc语法: /** Do something useful @param first Primary data @return int @throws BadExcepti ...
- Python文档自动生成器
安装命令: sudo apt-get insatll epydoc 使用方式直接看官方文档...
- python html 语法高亮,在Python中使用doxygen样式文档字符串的Vim语法高亮显示
我开始使用doxygen来生成我的Python代码的文档. 我使用doxypy过滤器来预处理Python文档字符串. 我的目标是在Python中有一个很好的语法突出显示doxygen注释. 在专用.d ...
最新文章
- 转载 - Struts2基于XML配置方式实现对action的所有方法进行输入校验
- 洛谷 P1024 一元三次方程求解
- skywalking环境搭建
- 十分钟看懂什么是VoLTE【包学包会,否则退款】
- opencv在python环境下的安装_关于python环境下的opencv安装
- Uber从Postgres切换到MySQL
- SQL查询语句大全(个人总结)
- HTML5期末大作业:温泉酒店网站设计——中国风的温泉酒店网(13页) HTML+CSS+JavaScript 学生web网页制作期末大作业_住宿 旅游 主题酒店
- 聊聊Java中的System类
- 如何把团队带成一盘散沙?
- 僵尸java7723_僵尸王国7723游戏盒子
- E. MEX and Increments
- Java代码审计学习笔记
- 利用PPT删除图片背景(PPT图片删除背景)
- [C++]打开新世界的大门之C++入门
- 美团点评 Hadoop/Spark 系统实践
- kube-proxy 切换为ipvs模式
- IPO是终点,还是起点?
- 从零玩转第三方登录之WeChat公众号登陆-cong-ling-wan-zhuan-di-san-fang-deng-lu-zhi-wechat-gong-zhong-hao-deng-lu...
- Linux fcntl 函数详解