论文代码复现之:AMR Parsing as Sequence-to-Graph Transduction
资源
- 论文:AMR Parsing as Sequence-to-Graph Transduction
- github链接
复现过程
创建虚拟环境 + 激活
下载数据集
只需要按照作者 github 的命令即可,要下载的东西挺多的
假设我们用的数据是
LDC2017T10
,我们就把这个数据集解压到data/AMR/LDC2017T10
接着运行如下命令,就会自动对 LDC2017T10 中的数据进行预处理,然后将所有的数据分配到
amr_2.0
文件夹的 3 个txt
文件中(amr_2.0
的所有文件都是运行下面代码生成的):
特征标注
下载 CoreNLP 服务器软件 + 选择对应的语言包
- 第一步比较复杂,首先他说第一步要创建一个
CoreNLP
的服务器,这个服务器是 stanford 大学开发的一个应用,只需要把这个服务器打开,然后把需要标注的数据丢给这个服务器,这个服务器就会提供标注服务,返回标注好的数据。实现这部分的 中文参考文章 和 官方地址
- 首先要下载这个服务器的 软件包
- 然后将这个软件解压到我们的项目路径下面,或者其他地方,只要你运行的时候能找到就行,我解压在这个位置:
- 然后按照官网或者中文参考文章中的方式打开服务器;
- 对我的情况而言,我需要:
cd stanford-corenlp-full-2018-10-05/
java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000
- 服务器开启成功
使用 CoreNLP 执行对 amr_2.0 数据的标注
- 接着是第二步,使用服务器标注 AMR 数据,这一步还是参照 github 的指导:
./scripts/annotate_features.sh data/AMR/amr_2.0
- 全部处理完毕后,数据集就变成了这个样子:
- 到这里特征提取就结束了
数据预处理
- 完成预处理的数据集生成了后缀为
.preproc
的三个文件:
训练 + 预测 + post处理 + 评估
- 按部就班执行即可
- 如果训练的时候想要使用预训练模型进行,只需要到下载预训练模型即可:
论文代码复现之:AMR Parsing as Sequence-to-Graph Transduction相关推荐
- 【论文代码复现2】Clustered sampling based on sample size
[论文代码复现]Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Fede ...
- 论文代码复现常见问题
论文代码复现常见问题 场景1:代码太慢 1:写出基础代码 使用少量数据集来实践你的思路,代码可以不用很优化,优先写出来即可.写完后建议封装为函数,方便调用. 2:优化代码逻辑 代码本身足够高效吗? 代 ...
- 深度学习论文 代码复现 环境配置操作
***深度学习论文代码复现 前置工作 安装Ubuntu18.04 安装Nvidia显卡驱动 安装anaconda 安装CUDA与cuDNN 通过软链接的修改实现多版本CUDA间的切换 将~/.bash ...
- stylegan2论文代码复现超详细
stylegan2论文解读 论文就略过啦,参考别人博客了解一下 https://blog.csdn.net/g11d111/article/details/109187245 stylegan2原论文 ...
- 论文代码复现环境配置
论文代码复现环境配置 报错1:python导入tensorflow出现_np_qint8 = np.dtype([("qint8", np.int8, 1)]) 报错2:Value ...
- 进阶必备:CNN经典论文代码复现 | 附下载链接
经常会看到类似的广告<面试算法岗,你被要求复现论文了吗?>不好意思,我真的被问过这个问题.当然也不是所有面试官都会问,究其原因,其实也很好理解.企业肯定是希望自己的产品是有竞争力,有卖点的 ...
- 论文代码复现之:GPT-too: A Language-Model-First Approach for AMR-to-Text-Generation(ARM-to-text)
文章目录 资源引用 复现过程 虚拟环境创建 通过 pip 或者 anaconda 安装依赖 数据集 下载 GPT-2 预训练模型(medium尺寸的)并进行训练 解决作者的代码错误 解决安装包的版本问 ...
- AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 论文代码复现
0. 说明 https://github.com/auspicious3000/autovc 但是听Demo中, 涉及到unseen的情况, 合成音色确实像, 但是质量不满足商用 复现Git的代码, ...
- DELG:Unifying Deep Local and Global Features for Image Search论文代码复现
前言 之前在研究图像检索的过程中,在网上看了一些资料,发现许多方法的检索结果并不是非常适合我的数据集,于是在翻看论文的时候看到了*<Large-Scale Image Retrieval wit ...
最新文章
- CES 2020前瞻:一份最全的趋势预测报告
- PHP扩展开发系列01 - 我要成为一名老司机
- PPT文件转avi/wmv/mpeg格式最好的软件
- 用Python机器学习搞定验证码
- Elasticsearch5.X Mapping万能模板
- dpdk18.11 收发包流程分析
- android 外部存储列表,如何获取Android设备的已安装外部存储列表
- java对象与内存控制
- 第八届开源操作系统年度技术会议(OS2ATC)在京召开, 百位科技菁英到场共鉴“开源协作”
- LNK2026	module unsafe for SAFESEH image
- C# 添加服务引用。
- java之j2se:再学java对象容器
- Linux NVMe Driver学习笔记之6:Admin Queue与Blk-mq初始化
- urule决策引擎实现增量打包部署
- IK分词器结合ES使用
- win7访问局域网计算机提示凭据,win7系统访问局域网共享文件时提示输入网络凭据的解决方法?...
- Java POI 导出 Excel 单元格 合并单元格 相邻的相同值 合并
- 数据生产力崛起:新动能 新治理 - 摘要
- 事件委托、动画、插件
- i.MX6ULL驱动开发 | 04-Linux设备树基本语法与实例解析