整理 | 章雨铭 责编 | 张红月
出品 | CSDN(ID:CSDNnews)
近几年来,AI 代码生成器十分流行,从OpenAI的Codex再到DeepMind的AlphaCode。DeepMind甚至表示,AlphaCode在Codeforces(一个编程竞赛平台)举办的编程竞赛(有5000多名参赛者)中,取得了平均排名前54.3%的成绩,并且声称它是首批可与人类程序员竞争的代码生成系统之一。但无论是Codex还是AlphaCode,截止目前都还没有对外开源。

卡内基梅隆大学(Carnegie Mellon University,以下简称CMU)的研究人员表示,“大型科技公司没有公开发布他们的模型,这确实阻碍了科学研究和这种大型语言模型代码的应用。”为此,几个来自CMU的研究人员开发了PolyCoder——一个具有 27B 参数,基于 GPT-2 架构且开源的自动代码生成器模型,在12种编程语言的249GB代码数据库中进行训练。

12种编程语言代码集

研究人员声称,PolyCoder在编写C语言方面的表现优于所有的已知模型(包括Codex)。

和其他开源模型比较,PolyCoder在C、JavaScript、Rust、Scala和TypeScript方面的表现都比类似模型GPT-Neo 2.7B要好。

但是在C语言之外的其他十一种语言中,所有其它开源模型包括PolyCoder可能要略逊Codex。

作为一个开源的 AI 代码生成器,PolyCoder算是取得了不错的成绩。但研究人员担心,像PolyCoder这样的模型可能会提示生成有漏洞的程序,即使是带有一些难以检测的安全漏洞程序。而且他们还担心未来其对手可以在代码生成模型中“隐藏”恶意行为,所以他们建议将Codex大小的模型开源,这不仅可以避免上述情况的发生,还有另一个额外的好处,即开发人员可以通过微调对模型进行个性化操作,这比从头训练模型的成本低很多。

其研究人员还表示,希望能够通过开源,节约资源以及促进科技研究的发展。

参考资料:https://arxiv.org/pdf/2202.13169.pdf
https://venturebeat.com/2022/03/04/researchers-open-source-code-generating-ai-they-claim-can-beat-openais-codex/

C代码写的比Codex还溜的AI神器开源相关推荐

  1. 会写代码的AI开源了!C语言写得比Codex还要好,掌握12种编程语言丨CMU

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 比Codex还 ...

  2. Python代码写得丑怎么办?推荐几个神器拯救你

    Python编程语言需要遵循PEP8规范,但是初学者往往记不住这个规范,代码写得比较丑.本文推荐几个神器来拯救奇丑无边的python代码. 一.Jupyter notebook 篇 Jupyter n ...

  3. 如何将前端代码写的优雅?

    前言 作为一个前端工程师,令我最头疼的两件事,一个是逻辑混乱且没有注释的js代码,还有一个就是污染严重.命名奇葩的css样式了. 在项目开发中,扎实的基础和高超的技术水平固然重要,但是良好的编码风格也 ...

  4. 代码写对了还挂了?程序媛小姐姐从 LRU Cache 带你看面试的本质

    来源 | 码农田小齐 责编 |  Carol 前言 在讲这道题之前,我想先聊聊「技术面试究竟是在考什么」这个问题. 技术面试究竟在考什么 在人人都知道刷题的今天,面试官也都知道大家会刷题准备面试,代码 ...

  5. GitHub 的AI代码生成神器,其四成代码有漏洞,你还敢用吗

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | 闫园园 日前,研究人员发现,GitHub Copilot ...

  6. 3行代码写出8个接口,开挂了?

    欢迎关注方志朋的博客,回复"666"获面试宝典 肯定有不少人会想:这怎么可能呢? 就算用几乎零配置的 SpringBoot,写一个最简单的接口也得有 3 行代码啊! @Reques ...

  7. 百度某员工抱怨:前人代码写得像坨*,颠覆了对大厂的认知

    .来源:网络 一位百度新员工刚入职一周,看了前人的代码,估计没有压住内心的那一团烈火,直接在脉脉开喷... 在脉脉上发这种帖子,很显然,要么被顶,要么被别人喷. 支持者表示,这坨**是一样的味道 有很 ...

  8. python 之路200行Python代码写了个打飞机游戏

    先看一下项目结构 \ """ PlayPlane/ |-- bin/ | |-- main.py 程序运行主体程序 |-- config/ | |-- settings. ...

  9. 数学公式太晦涩,不如用代码写出来:这是程序员学数学的独特方式

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来源:机器之心 简洁的代码不仅能运行程序,还能用来学数学. ∑.∏.∈--如果你学习过 ...

最新文章

  1. HALCON查找圆心C++实现
  2. S3C6410的SPI控制器
  3. 渭南java_渭南java语言入门教程视频
  4. Struts2.perperties中的配置详解
  5. 记一次SAP开发工程师给微软Azure报incident的体验
  6. LeetCode之Excel Sheet Column Number
  7. P2216 [HAOI2007]理想的正方形
  8. 速度堪比Adam,准确率媲美SGD,还能稳定训练GAN:全新优化器成为NeurIPS爆款
  9. 前端:JS/29/实例:控制div显示_滚动的图片
  10. Maven创建servlet项目演示(三)
  11. spring源码:循环依赖源码学习
  12. 数据库左连接,右连接区别解析
  13. 电机控制进阶3——PID串级控制(附全套代码下载)
  14. 计算机cpu好坏之分,学查看CPU天梯图,正确判断CPU性能好坏
  15. 十大管理之项目进度管理知识点
  16. Clean Code 读书笔记四
  17. C/C++动态内存申请与释放
  18. js字符串格式化方法format
  19. 7-14 输出大写英文字母 (15分) 瞎搞
  20. 【线代NumPy】第五章 - 行列式课后练习 | 伴随矩阵求逆 | Cramer公式求联立方程 | 简述并提供代码

热门文章

  1. 东大OJ-1588: Routing Table
  2. JS助记 ----- 盒子模型与获取元素样式
  3. VScode设置console.log('')快捷键
  4. 【分享】如何长时间高效学习
  5. Linux下通过jstat命令查看jvm的GC情况
  6. 13 -3 jquery选择器和 jquery动画
  7. 根据导出的查询结果拼接字符串,生成sql语句并保存到txt文件中
  8. 去除Windows-XP系统下的关机功能
  9. android基础知识(2)
  10. 基于jQuery开发的javascript模板引擎-jTemplates