AI反腐:细查24万份合同,牵出千亿违规采购
秘鲁数字调查机构 ojo-publico 联合数据科学家、调查记者和法律专家,打造了一个针对政府开放数据的贪腐调查 AI,揭露了多个违规采购、贪腐行为。
作者 | 神经星星
来源 | HyperAI超神经
头图 | 下载于视觉中国
在博尔赫斯的一篇小说《博闻强识的富内斯》中,描写了一个具有超凡观察力和记忆力的天才——富内斯(Funes)。
年轻的 Funes 在一次坠马意外后,获得了惊人的记忆力和观察力。他能够回忆出过往经历的每一个细节,书里的每一个文字。甚至能够观察到生活、自然界中如新芽生发、花瓣凋落的细微变化。
小说里的 Funes 富内斯就像开了天眼,有着观察、记忆、理解、阐释一切的能力。
贪腐 AI Funes:揪出合同中的违规线索
这篇小说给秘鲁的数字调查机构 ojo-publico 带来了灵感。他们认为博尔赫斯笔下 Funes 就像现在的算法,能够发掘出表象下很多潜藏、未知的秘密。
该机构中的调查记者、数据库工程师、算法专家和法律顾问,一共四人通力合作。基于秘鲁政府公开的 245000 份政府采购、工程建设、选举捐赠的合同和账务明细,历时两年,训练出了一个用于审查问题合同的 AI 模型。
Funes 官网 https://ojo-publico.com/especiales/funes/
这个 AI 模型能够判断合同中的腐败、违规的风险。调查团队认为这个算法有着观察、审核所有细节的超能力,致敬了博尔赫斯的经典小说,便将模型命名为 Funes。
截至目前,基于 Funes 细致的核查工作,共核查出了 110000 份问题合同(共 245000 份合同),金额为 570 亿新索尔(约为 1009 亿人民币)。
基于这些问题合同的线索,记者团队进行了更深入的调查和求证,揭露了多项秘鲁政府腐败、违规的政府采购行为,涉及到秘鲁多家大型企业,涉案金额近千亿欧元。
采购中的猫腻,AI 目光如炬
其中牵扯出了几起秘鲁近年的腐败行为的大案要案,包括:
秘鲁国有的石油精炼加工公司 Petroperú,在四年时间里通过参与多个州、省的公开招标,获得了近 24 亿人民币的政府采购项目。
其中 90% 的项目,Petroperú 都是作为唯一参与投标企业获得的,这严重违反了秘鲁政府采购的法规,也影响了市场正常竞争。
Funes 还从 24 万份政府采购合同与数据中发现,有数千万元的财政支出支付给了成立不到 20 天的公司。
比如,餐饮公司 Melcesca 注册于 2015 年10 月 23 日,成立两周不到的时间,就获得了秘鲁圣安东尼奥阿巴德·库斯科国立大学(Unsaac)举行了一项公开招标,成为了该校食堂的供应商。(该项采购招标共有 16 个投标方)
部分由 Funes 揭露的案件已经进入侦查、公诉阶段
在秘鲁国内引发了巨大的舆论关注
与此类似的违规操作和风险合同,Funes 发现了十一万份。Funes 敏锐的洞察力和极高的判断力,来源于成熟的商业调查和成熟的算法支持。
在公共政策与社会学的研究领域,有不少学者致力于政府信息公开和贪腐问题的研究。Funes 的算法也是基于一位资深学者 Mihaly Fazekas 的研究成果之上的。
Mihaly Fazekas 是剑桥大学人类、社会和政治科学的博士研究员,在他的研究中,有一套针对政府采购合同、账目流水的贪腐检测算法。
他发现,有几类明显特征的合同,是违规、贪腐案件的突破口。只要抓住这些特征,就可以从海量文书中,找到这些合同和与其相关联的资料。
这些特征包括:
非公开的招投标;
招投标信息的公示时间明显较短;
竞标者中,规模、实力明显悬殊;
采购合同包含大量修改;
中标决策时间过短或过长的。
他依据这些判断设计了一个评估模型,将 CRI (Corruption Risk Index)定义为腐败风险指数
其中 CRIi 代表合同 i 的腐败风险指数,
CIji 代表合同 i 招标中观察到的第 j 个基本腐败指标,
wj 代表第 j 个基本腐败指标的权重。
CRI=0 表示最低腐败风险,
CRI=1 表示观察到的最大腐败风险。
其中,如果第i个合同只有一个投标人,则单个投标人等于1,如果有更多的投标人,则等于0;
Zi 代表合同为单标合同的对数;
β0为回归的常数。
Rij 为第 i 个合同的 j 个腐败矩阵,如公示期的长度。
Cim 代表第 i 个合同的 m 个控制变量的矩阵,如公示期长短;
Cim 代表第 i 个合同的 m 个控制变量的矩阵。
市场上的竞争者;εi 为误差项;
β1j、β4m 代表系数的向量,解释变量和控制变量。
基于 Mihaly Fazekas 的算法,团队中的算法工程师 Gianfranco Rossi 还针对海量数据进行数据库优化、西班牙语合同的文字识别的改进、以及针对秘鲁国情的风险指标调整,极大地提升了 Funes 的运行效率和效果。
数据公开,实现透明,推动创新
开放政府数据,引导公众监督,有利于提高政府透明度,也有利于促进经济发展和社会创新。这方面,目前欧盟和英国正走在最前列。
清华大学公共管理学院的三位学者,曾经在研究《政府数据开放与腐败防治:英国的实践与启示》指出:开放数据可以促进社会监督,公众通过开放的数据可以发现腐败行为。
报告显示,揭露腐败行为最多的是执法部门(34%) ,然后依次是调查记者(25%) 、信息公开请求(14%),举报(13%),开放数据(7%)。
虽然目前通过开放数据揭露的腐败行为只占到 7%,但如果某些关键数据及早公开的话,大量腐败行为可以更早地被发现和侦测,开放政府数据有潜力成为反腐败的重要工具。
即使政府信息公开,也提高了复杂合同和海量交易数据的处理门槛。在 2009年,英国议员滥用公款报销个人账单丑闻接连被媒体曝光。英国三大政党、300 余名议员卷入其中。面对议员们浩如烟海的报销凭证、申请文书,《每日电讯报》、《卫报》等媒体在互联网上公开了大量数据,并邀请英国民众「众包式」地参与调查。
除《卫报》的众包式调查,
《每日电讯报》也将调查程序设计成游戏形式
民众在数据中发现疑点,可以将对应数据在网站上进行标注,调查团队将继续跟进。但众包之下,也问题重重,没有受过调查训练的民众并不能高效、准确地完成这些任务。
Funes 的出现,就实现了政府公开数据揭露腐败行为的突破和最佳实践,以数据科学家、调查记者、法律专家组成的四人团队,有力的展现了人+ AI 的强大调查能力。
Funes 依然在行动
截至目前,Funes 仍作为一项开放、准确的调查工具,活跃在秘鲁新闻调查的前线。
并从去年开始,打造 Funes 的数字调查机构 ojo-publico 已经在用 Funes 核查新冠疫情期间的政府采购项目。
内容参考:
Funes 官网 https://ojo-publico.com/especiales/funes/
journalism AI Festival 2020 项目
全球深度报道官网 https://cn.gijn.org/
点击这里 ???? 关注我们~~~
更多精彩推荐
☞RedHat 年度报告:只索取不贡献的开源消费“大户”不受待见☞腾讯:这可是一只“骨骼清奇”的狗☞用数据分析《你好,李焕英》“斐妈”爆红的真相☞“踢爆”职场焦虑、玩机车、文科转大厂程序媛,乘风破浪的 IT 女神太飒了!
点分享点收藏点点赞点在看
AI反腐:细查24万份合同,牵出千亿违规采购相关推荐
- 鸡泽:中国辣椒网引来11万份合同
河北省鸡泽县曹庄乡的张建民是当地的一位辣椒生产大户,去年,利用中国辣椒网,以理想的价格顺利销售了自家种植的辣椒.现在,他时常上网了解辣椒信息,已经离不开网络了. 在鸡泽县,有许多与张建民一样经常上网的 ...
- 南方周末:股神炒股一周年祭 24万本金仅剩7千
浮沉股海一年间,湖南娄底小股民文武感到自己梦一场.不同的是,梦境是虚的,而炒股亏损却是实的:一年间,24万元的积蓄和借款缩水到不足7000元,而其月工资仅有千余元. 他痛彻心肺地感到:消息不可靠,基本 ...
- 月签电子合同3万+份,电子合同助力高空作业租赁商“大黄蜂”数字化
"数字化时代下,电子合同作为企业提升效率.合规管理.低碳绿色发展的基础设施,已获得市场的充分认可.在碳中和的大背景下,降碳.绿色办公更是大势所趋,大黄蜂紧跟时代潮流,通过数字化布局,推动企业 ...
- 马化腾首谈腾讯开源时,鹅厂已在Github上放出82个项目,标星24万+ | 附AI项目链接...
乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAI "腾讯希望在科研领域投入更多力量,把'科技向善'纳入公司新的使命与愿景.我们将通过内外部开放源代码等方式,积极参与'全球科技共同 ...
- 解决“存证难”,山东签订电子劳动合同超20万份-爱签电子合同
10月22日,山东省政府新闻办召开新闻发布会,介绍全省人社系统"我为群众办实事"实践活动进展情况,推动党史学习教育不断走深走实. 会中指出,积极探索推广电子劳动合同.聚焦劳动者关心 ...
- 阿里、腾讯基本薪资曝光,资深算法工程师24万美元,高级研究员26万美元
整理 | 于轩 出品 | 程序人生 (ID:coder _life) 提到互联网巨头企业,阿里和腾讯是绕不开的话题.作为常年霸榜中国互联网百强企业前两名的两家公司,他们在海外市场的业务发展也是大家一直 ...
- 阿里、腾讯美国员工基本年薪曝光,资深算法工程师24万美元,高级研究员26万美元
提到互联网巨头企业,阿里和腾讯是绕不开的话题.作为常年霸榜中国互联网百强企业前两名的两家公司,他们在海外市场的业务发展也是大家一直关注的焦点. 在阿里.腾讯的美国分公司工作,员工每年能赚多少钱呢?为了 ...
- 2019全球AI人才报告发布:AI专家仅3.6万
有很多证据表明,顶级AI人才供不应求.然而,这类人才究竟有多么稀缺,或者他们都集中在世界各地哪些地方,却几乎不为人知. 近日,加拿大Element AI首席执行官发布了最新的2019年<全球AI ...
- 2020年进军 AI,想年薪 40 万,没这个能力不行
前几天,<百度沸点:2019年度科技热词>来了! 百度沸点:2019年度科技热词 AI排名第一 2019年可以说是AI全面落地和商用的一年,产业智能化成为各个行业重点关注的发展方向,交通. ...
最新文章
- MyBatis框架添加客户有哪些步骤
- linux命令:vim
- 将mnist数据集存储到本地文件
- HDU Problem 2062 Bone Collector【01背包】
- 在Visual Studio 2010 里使用Nunit 进行Debug 测试
- Yolo-v2 Visual Studio 2015安装时报错Team Explorer for Microsoft Visual Studio 2015解决办法
- Windows彻底卸载删除MySQL
- 设置断点检测控件何时创建和析构
- js固定表格行列_纯前端表格控件SpreadJS V14.0发布:组件化编辑器+数据透视表
- 10kv电压互感器型号_电气行业需要知道的10KV电压互感器基本技术参数
- ubuntu下用vagrant搭建集群环境
- Perceptual Losses for Real-Time Style Transfer and Super-Resolution 运行程序
- 系统学习机器学习之随机场(二)--MEMM
- 《手机音频》参数与选择
- Intellij Idea 导入项目
- T6 v6.2puls1 安装了最新补丁之后采购发票结算之后入库单价税合计有1分差额
- 怎样在PDF文件上添加印章
- CMP SUB 区别
- 去掉最高分最低分求平均分
- RP Fiber Power 免费讲座---光纤激光器仿真设计