文章目录

  • 一、LDC数据目录
  • 二、LDC账户注册
  • 三、账户审核结果
  • 四、数据获取和处理
  • 五、一些其他情况
    • 高校未订阅LDC数据
    • 账户转借和数据拷贝

一、LDC数据目录

LDC数据目录 https://catalog.ldc.upenn.edu/byyear
根据上面的数据目录查看自己所需的数据是否在平台上可获取。

二、LDC账户注册

Note 0: LDC将数据提供给学校或科研机构使用,每个组织都有一个管理员负责本机构人员在LDC平台的会员申请。
**Note 1:**正常大学如果搞自然语言很多的话,都有订阅这个平台的数据,如果搞得不多的话,就没注册。如果长时间没有审核结果的话,可以如本文第三步所示,发邮件去咨询LDC的会籍协调员。

  1. 学校、机构邮箱注册
    一定要用所在机构(高校或研究所)的邮箱注册,否则管理员不会通过你的申请。
  2. 注册时选择你所在的组织(高校或研究机构)
    千万不可以选错,别的组织管理员不会搭理你的申请。

三、账户审核结果

账户顺利被提权的快乐千篇一律,申请石沉大海的原由却是各有千秋。

  1. 询问未收到回复的原因
    发邮件给membership coordinator,告知你未收到回复的情况,询问你的组织是否有订阅数据以及管理员的联系方式;LDC一般会告知你你的组织管理员的情况。
    附赠一个邮件模板:
Title: LDC membership application and check
Hello Coordinator:I am a graduate student from XXXX University, Shaanxi, China. During my research, I have an idea about XXX Taskn, so I want to use XXX data for experiment. All the results will be used for academic writing. I've send an application on LDC but there is no reply from the administrator. I wonder if my school has subscribed these membership data and whether the administrator could approve my application or not. Would you help me to check that? My account information is as follows:
#  just copy from your account
college:
address: Road, District, City, Province, PR China
nationality:PR China
Account: XXXX@XXX.edu.cn

邮件的撰写思路为表明身份(组织名和角色)、告知你的工作主题和需求、告知数据用途、告知你遇到的情况、询问你所在的组织是否有订阅该平台数据并请协调员做进一步处理。

  1. 根据coordinator回复联系管理员
    修改一下上面的模板,再发给组织的管理员。主要是调整需求,对于LDC的会籍协调员,你的需求是提权或是组织管理员的联系方式;对于组织管理员,你的需求是审核你的身份和提权。
Title: LDC membership application and check
Hello XXX:I am a graduate student from XXXX University, Shaanxi, China. During my research, I have an idea about XXX Taskn, so I want to use XXX data for experiment. All the results will be used for academic writing. I've send an application on LDC but there is no reply from the administrator. I got your email-address from Taylor, the membership coordinator of LDC. Would you help me to prompt my access? My account information is as follows:
#  just copy from your account
college:
address: Road, District, City, Province, PR China
nationality:PR China
Account: XXXX@XXX.edu.cn

四、数据获取和处理

  1. 数据下载
  2. 数据处理
    有数据处理的脚本

五、一些其他情况

高校未订阅LDC数据

如果你所在高校或组织没有订阅该平台的数据,但你实在是需要用到数据且没有钱购买数据,也有解决办法。

  1. 想办法让你所在的机构加入会员
    2400刀/年,这种情况下学校的学生都可以注册账户使用了;
  2. 个人以学生身份付费,基本1000刀一份数据,也有1700刀一份的;
  3. 个人免费申请
    这种办法我没试过,但是方案来自LDC,想必也可以成功?
    (1) 申请人需要是在读本科生或研究生、学校没买LDC数据、申请人有很好的计划并且真的穷,支付不起数据费用;
    (2) 申请人要提交申请说明自己要哪个数据、做什么研究、成功几率有多大,此外,还要申请人的导师或系主任提供证实。
    (3) 一年有两个申请期,春秋各一次。

账户转借和数据拷贝

  1. 账户转借
    借账户是不可以的,被发现后有可能会被封。
    浙江大学图书馆订阅了LDC数据、贴出了管理员信息并贴出了注册流程,也提醒了本校学生不要外借账户,否则账户会被封。
  2. 数据拷贝
    由于版权原因,数据不允许拷贝给他人。如果想使用数据的话,要么个人申请免费版,要么学校购买,尊重版权。

LDC注册数据获取|ACE2004, ACE 2005,OntoNotes等数据相关推荐

  1. ACE 2005 Data Prep 数据预处理

    以下内容来自https://github.com/mgormley/ace-data-prep ACE 2005 Data Prep ACE 2005数据预处理 Description 描述 This ...

  2. 爆 ChatGPT 大规模封号亚洲节点,并停止注册;Google 否认 Bard 窃取 ChatGPT 数据进行训练|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  3. wordpress开放注册_WordPress.com开源,欧洲开放数据门户网站以及更多新闻

    wordpress开放注册 在本周的开放源代码新闻摘要中,我们将介绍由欧盟委员会(European Commission)创建的全新泛欧开放数据门户网站,WordPress.com开放源代码等等! 2 ...

  4. 5.1 node实现简单注册功能(往json文件中写入数据)

    5.1.1 描述: /* 描述:如果persons中没有对应的用户,则把user写入到persons.json中,提示注册成功并且不能修改原来的数据结构如果有对应的用户名,则提示用户名已经被占用 */ ...

  5. 通达信行情数据获取--python_股票量化交易-获取数据的两种方法

    量化交易第一步就是获取数据,介绍两种免费的方法 1.通过pytdx获取本地通达信数据 2.通过requests爬虫爬取腾讯财经数据 通过python第三方库pytdx获取 这是个很强大的第三方库,原理 ...

  6. 从MSSQL server 2005中移植数据到Oracle 10g

    1. 移植前准备 在移植前,需要安装必需的各种软件,如下: (1).安装好SQL server 2005的补丁包和SP2. (2).安装Oracle安装包里的oracle客户端浏览器(PL/SQL D ...

  7. SQL 2005 中的数据约束

    SQL中的数据约束 制作人:丁琪 QQ:854804038 一.对数据库jwgl,按要求建立以下约束 1. 为student表中年龄字段添加检查约束,使字段值限制在15-30岁之间. 2. stude ...

  8. 实战SSM_O2O商铺_13【商铺注册】View层之初始化页面数据

    文章目录 请求过程分析 DAO层的实现 AreaDao接口,Mapper映射文件及单元测试 ShopCategoryDao接口 ShopCategoryDao.xml Mapper映射文件 单元测试 ...

  9. 通达信行情数据获取--python_[python]沪深龙虎榜数据导入通达信的自选板块,并标注于K线图上...

    1 #coding=utf-8 2 3 #读取'[paint]'开头的csv文件 4 #copyright @ WangXinsheng 5 #http://www.cnblogs.com/wangx ...

  10. 【AdaSeq基础】30+NER数据汇总,涉及多行业、多模态命名实体识别数据集收集

    简介 命名实体识别NER是NLP基础任务,一直以来受到学术界和业界的广泛关注,本文汇总了常见的中英文.多语言.多模态NER数据集介绍. 相关数据详情可以访问链接: https://github.com ...

最新文章

  1. 卧槽!华为工程师总结的5000页Java、LeetCode刷题笔记提供下载,太优秀了!
  2. centos 上传jar 命令_centos上快速将一个jar使用docker部署启动
  3. 重学java基础第十课:windows快捷键
  4. 作者:刘建楠(1963-),男,就职于中国石油天然气股份有限公司庆阳石化分公司...
  5. [Diary]忧伤,止不住忧伤……
  6. 格力关联公司公开“菜谱的推荐方法”相关专利
  7. 服务器不稳定补偿,《异化之地》服务器异常怎么解决 服务器不稳定官方补偿...
  8. 面向面试编程-概念之-分布式与集群的区别和联系
  9. 《Web漏洞防护》读书笔记——第9章,XSS防护
  10. docker批量导出导入全部镜像
  11. 多粒度网络(MGN)的结构设计与技术实现
  12. 常用的红色的RGB值
  13. 爬虫初探:弱水三千只取一瓢,房源三千全都想要
  14. 访存模式分析实验思路(毕设笔记9)
  15. 按照字符串长度大小进行升序排列
  16. 剪不断理还乱--C#重载/重写/覆盖
  17. python爬虫(五)爬虫实战
  18. 那些会讲ppt的技术人有多爽?演讲的6个步骤
  19. 非计算机专业毕业如何从事IT工作
  20. IconMaker:一款好用的图标制作工具

热门文章

  1. h5php大转盘抽奖,Vue.js实现大转盘抽奖总结及实现思路
  2. 只使用适用于DatetimeIndex的方法
  3. 台式计算机通过电流,一台台式电脑正常工作的时候电流是多少安?谢谢
  4. 2021-11-06大数据学习日志——数据埋点+网络爬虫——数据提取
  5. 19款最好用的免费数据挖掘工具大汇总
  6. 穆迪任命Shivani Kak为投资者关系主管,David Hogan为临时财务主管
  7. 扣扣机器人唱歌_qq小冰唱歌指令生成器下载-qq小冰唱歌关键字命令生成器 _5577安卓网...
  8. 基于非结构网格的仿真——太湖之光上的巨大挑战
  9. MAC上完美的PDF阅读器+批注编辑软件——PDF Expert
  10. Android反编译工具绿色版V2.0(改进版)