资源

  • 论文:AMR Parsing as Sequence-to-Graph Transduction
  • github链接

复现过程

创建虚拟环境 + 激活

下载数据集

  • 只需要按照作者 github 的命令即可,要下载的东西挺多的

  • 假设我们用的数据是 LDC2017T10,我们就把这个数据集解压到 data/AMR/LDC2017T10

  • 接着运行如下命令,就会自动对 LDC2017T10 中的数据进行预处理,然后将所有的数据分配到 amr_2.0 文件夹的 3 个 txt 文件中(amr_2.0 的所有文件都是运行下面代码生成的):


特征标注

下载 CoreNLP 服务器软件 + 选择对应的语言包

  • 第一步比较复杂,首先他说第一步要创建一个 CoreNLP 的服务器,这个服务器是 stanford 大学开发的一个应用,只需要把这个服务器打开,然后把需要标注的数据丢给这个服务器,这个服务器就会提供标注服务,返回标注好的数据。实现这部分的 中文参考文章 和 官方地址
  • 首先要下载这个服务器的 软件包
  • 然后将这个软件解压到我们的项目路径下面,或者其他地方,只要你运行的时候能找到就行,我解压在这个位置:
  • 然后按照官网或者中文参考文章中的方式打开服务器;
  • 对我的情况而言,我需要:
    • cd stanford-corenlp-full-2018-10-05/
    • java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 9000 -timeout 15000
    • 服务器开启成功

使用 CoreNLP 执行对 amr_2.0 数据的标注

  • 接着是第二步,使用服务器标注 AMR 数据,这一步还是参照 github 的指导:
  • ./scripts/annotate_features.sh data/AMR/amr_2.0
  • 全部处理完毕后,数据集就变成了这个样子:
  • 到这里特征提取就结束了

数据预处理


  • 完成预处理的数据集生成了后缀为 .preproc 的三个文件:

训练 + 预测 + post处理 + 评估

  • 按部就班执行即可
  • 如果训练的时候想要使用预训练模型进行,只需要到下载预训练模型即可:

论文代码复现之:AMR Parsing as Sequence-to-Graph Transduction相关推荐

  1. 【论文代码复现2】Clustered sampling based on sample size

    [论文代码复现]Clustered Sampling: Low-Variance and Improved Representativity for Clients Selection in Fede ...

  2. 论文代码复现常见问题

    论文代码复现常见问题 场景1:代码太慢 1:写出基础代码 使用少量数据集来实践你的思路,代码可以不用很优化,优先写出来即可.写完后建议封装为函数,方便调用. 2:优化代码逻辑 代码本身足够高效吗? 代 ...

  3. 深度学习论文 代码复现 环境配置操作

    ***深度学习论文代码复现 前置工作 安装Ubuntu18.04 安装Nvidia显卡驱动 安装anaconda 安装CUDA与cuDNN 通过软链接的修改实现多版本CUDA间的切换 将~/.bash ...

  4. stylegan2论文代码复现超详细

    stylegan2论文解读 论文就略过啦,参考别人博客了解一下 https://blog.csdn.net/g11d111/article/details/109187245 stylegan2原论文 ...

  5. 论文代码复现环境配置

    论文代码复现环境配置 报错1:python导入tensorflow出现_np_qint8 = np.dtype([("qint8", np.int8, 1)]) 报错2:Value ...

  6. 进阶必备:CNN经典论文代码复现 | 附下载链接

    经常会看到类似的广告<面试算法岗,你被要求复现论文了吗?>不好意思,我真的被问过这个问题.当然也不是所有面试官都会问,究其原因,其实也很好理解.企业肯定是希望自己的产品是有竞争力,有卖点的 ...

  7. 论文代码复现之:GPT-too: A Language-Model-First Approach for AMR-to-Text-Generation(ARM-to-text)

    文章目录 资源引用 复现过程 虚拟环境创建 通过 pip 或者 anaconda 安装依赖 数据集 下载 GPT-2 预训练模型(medium尺寸的)并进行训练 解决作者的代码错误 解决安装包的版本问 ...

  8. AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 论文代码复现

    0. 说明 https://github.com/auspicious3000/autovc 但是听Demo中, 涉及到unseen的情况, 合成音色确实像, 但是质量不满足商用 复现Git的代码, ...

  9. DELG:Unifying Deep Local and Global Features for Image Search论文代码复现

    前言 之前在研究图像检索的过程中,在网上看了一些资料,发现许多方法的检索结果并不是非常适合我的数据集,于是在翻看论文的时候看到了*<Large-Scale Image Retrieval wit ...

最新文章

  1. CES 2020前瞻:一份最全的趋势预测报告
  2. PHP扩展开发系列01 - 我要成为一名老司机
  3. PPT文件转avi/wmv/mpeg格式最好的软件
  4. 用Python机器学习搞定验证码
  5. Elasticsearch5.X Mapping万能模板
  6. dpdk18.11 收发包流程分析
  7. android 外部存储列表,如何获取Android设备的已安装外部存储列表
  8. java对象与内存控制
  9. 第八届开源操作系统年度技术会议(OS2ATC)在京召开, 百位科技菁英到场共鉴“开源协作”
  10. LNK2026 module unsafe for SAFESEH image
  11. C# 添加服务引用。
  12. java之j2se:再学java对象容器
  13. Linux NVMe Driver学习笔记之6:Admin Queue与Blk-mq初始化
  14. urule决策引擎实现增量打包部署
  15. IK分词器结合ES使用
  16. win7访问局域网计算机提示凭据,win7系统访问局域网共享文件时提示输入网络凭据的解决方法?...
  17. Java POI 导出 Excel 单元格 合并单元格 相邻的相同值 合并
  18. 数据生产力崛起:新动能 新治理 - 摘要
  19. 事件委托、动画、插件
  20. i.MX6ULL驱动开发 | 04-Linux设备树基本语法与实例解析

热门文章

  1. LED、LCD背光源、CCFL
  2. 电影:《从你的全世界路过》影评摘抄
  3. 经典数值RPG游戏——《魔塔》调研报告
  4. 使用IO口检测电源电压的转换逻辑
  5. 【Eigen】【Eigen实践】【Eigen的使用学习记录】
  6. 深度学习100例-卷积神经网络(VGG-16)识别海贼王草帽一伙 | 第6天
  7. 【湍流】基于kolmogorov结合次谐波补偿的方法生成大气湍流相位屏附matlab代码
  8. 小飞学习Docker之使用容器
  9. 进击的 Vulkan 移动开发(一)之今生前世
  10. 七月算法机器学习笔记9 推荐系统