**

CNdeepdive下载以及deepdive安装

**
百度云下载

1.1 下载完成后解压,安装,运⾏install.sh,选择1安装deepdive。
配置环境变量,deepdive的可执⾏⽂件⼀般安装在~/local/bin⽂件夹下。 在~/.bash_profile下添加如下内容
并保存:
export PATH="/root/local/bin:$PATH"
在终端可以通过vi /.bash_profile 进行修改,:wq保存并退出修改
然后执⾏source ~/.bash_profile设置环境变量。

1.2 关系型数据库Postgresql安装
官方教程给出:运行 bash <(curl -fsSL git.io/getdeepdive) postgres 安装,但是几次尝试都是得到拒绝,所以在电脑上自行百度安装教程
例如我的版本是:brew install postgresql -v
初始化数据库、创建新用户名

1.3 nlp环境安装
运⾏nlp_setup.sh,配置中⽂standford nlp环境。 这一步一般不会出错。

实验步骤

2 数据处理
2.1 命令行生成数据表
deepdive compile && deepdive do transaction_dbdata
查询是否有数据导入:
deepdive query ‘?- transaction_dbdata(company1_name, company2_name).’

company1_name | company2_name
----------------------------±-------------------------------------------
万科企业 | 华润深国投信托
万科企业 | 华润深国投信托
万科企业 | 一航万科
万科企业 | 中润国内贸易
万科企业 | 冯佳董事及廊坊华夏房地产
深圳中国农大科技 | 深圳中农大科技
深圳中国农大科技 | 李林琳
深圳中国农大科技 | 深圳中农大科技
深圳中国农大科技 | 李林琳
深圳中国农大科技 | 北京中农大科技企业孵化器
深圳中国农大科技 | 北京中农大科技企业孵化器
深圳中国农大科技 | 北京中农大科技企业孵化器
深圳中国农大科技 | 北京中农大地科技
深圳中国农大科技 | 北京中农大科技企业孵化器
深圳世纪星源 | 深圳市博睿意碳源科技
:

2.2 待抽取文章导入
deepdive do articles

2.3 用NLP模块进行文本处理
执行deepdive do sentences成功完成句子解析,通过
deepdive query ’
doc_id, index, tokens, ner_tags | 5
?- sentences(doc_id, index, text, tokens, lemmas, pos_tags, ner_tags, _, _, _).

可以看到前五句(下例为第一句)的解析结果为:
1201734457 | 1 | {证券,代码,:,600108,证券,简称,:,亚盛集团,公告,编号,:,2015-072,甘肃,亚盛,实业,(,集团,),股份,有限,公司,关于,全资,子公司,间,股权,转让,的,公告,本,公司,董事会,及,全体,董事,保证,本,公告,内容,不,存在,任何,虚假,记载,、,误,导性,陈述,或者,重大,遗漏,,,并,对,其,内容,的,真实性,、,准确性,和,完整性,承担,个,别,
及,连带,责任,。} | {O,O,O,O,O,O,O,O,O,O,O,ORG,ORG,ORG,ORG,ORG,ORG,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O,O}

2.4 抽取实体生成实体对
运行deepdive do company_mention,得到以下问题
deepdive-do: line 75: mvim: command not found
Canceled execution

初步分析是路径问题,百度查询解决方案
看教程,终端输入export PATH=/usr/local/opt/coreutils/libexec/gnubin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin:/Applications/Wireshark.app/Contents/MacOS
结果连deepdive都显示command not found,突然想到这和一开始配置环境一样,于是再次打开~./bash_profile
此时路径已经修改好了的,只需要确保无改动后再次运行 source ~./bash_profile.
果真OK了,但是呢
下一步
可以执行deepdive do company_mention
但是查询结果时发现为空表:deepdive query ’
mention_id,doc_id | 4
?- company_mention(mention_id, mention_text, doc_id, sentence_index, begin_index, end_index).

mention_id | doc_id
------------±-------
(0 rows)

(找了一圈解答,结果还是路径问题啊啊啊啊,也是,都是现成代码,只能是路径出问题)
将transform.py中的路径设置为绝对路径,不幸的是打开文件一看,本身就是绝对路径。不信邪,删除重新写入文件的绝对路径,然后保存。结果可以啦。
deepdive query ’
mention_id,doc_id | 4
?- company_mention(mention_id, mention_text, doc_id, sentence_index, begin_index, end_index).

mention_id | doc_id
--------------------±-----------
1201734457_3_5_10 | 1201734457
1201734457_3_22_27 | 1201734457
1201734457_3_46_51 | 1201734457
1201734457_3_64_68 | 1201734457
(4 rows)
按照查询语句得到4对实体所在文摘ID号

然后运行deepdive do transaction_candidate:
生成候选实体表,同样进行查询
deepdive query ’
p1_name,p2_name | 4
?- transaction_candidate(p1_id,p1_name,p2_id,p2_name).

      p1_name           |         p2_name

----------------------------±-------------------------
山丹县芋兴粉业有限责任公司 | 甘肃亚盛薯业有限责任公司
山丹县芋兴粉业有限责任公司 | 甘肃大有农业科技有限公司
山丹县芋兴粉业有限责任公司 | 甘肃天润薯业有限责任公司
甘肃天润薯业有限责任公司 | 甘肃亚盛薯业有限责任公司
(4 rows)

2.5 特征抽取
命令行:deepdive do transaction_feature
查询结果
deepdive query ‘| 20 ?- transaction_feature(_, _, feature).’

feature

IS_INVERTED
INV_WORD_SEQ_[郴州市 城市 建设 投资 发展 集团 有限 公司]
INV_LEMMA_SEQ_[郴州市 城市 建设 投资 发展 集团 有限 公司]
INV_NER_SEQ_[ORG ORG ORG ORG ORG ORG ORG ORG]
INV_POS_SEQ_[NR NN NN NN NN NN JJ NN]
INV_W_LEMMA_L_1_R_1_[为][提供]
INV_W_NER_L_1_R_1
[O][O]
INV_W_LEMMA_L_1_R_2
[为][提供 担保]
INV_W_NER_L_1_R_2
[O][O O]
INV_W_LEMMA_L_1_R_3
[为][提供 担保 公告]
INV_W_NER_L_1_R_3
[O][O O O]
INV_W_LEMMA_L_2_R_1
[公司 为][提供]
INV_W_NER_L_2_R_1
[ORG O][O]
INV_W_LEMMA_L_2_R_2
[公司 为][提供 担保]
INV_W_NER_L_2_R_2
[ORG O]_[O O]

2.6 样本打标
在候选实体对中标出部分正负例:利⽤已知的实体对和候选实体对关联
利⽤规则打部分正负标签
deepdive do transaction_label_resolved(代码操作见官方教材,我们只执行)

3模型构建
3.1 变量表定义
定义最终储蓄的表格,预测公司是否存在交易关系
deepdive do has_transaction

3.2 因子图构建
将每⼀对has_transaction中的实体对和特征表连接起来,通过特征factor的连接,全局学习这些特征的权重。
我们可以指定两张变量表间遵守的规则,并给这个规则以权重。⽐如c1和c2有交易,可以推出c2和c1也有交
易。这是⼀条可以确保的定理,因此给予较⾼权重。
deepdive do probabilities
查看我们预测的公司间交易关系概率:
$ deepdive sql “SELECT p1_id, p2_id, expectation FROM has_transaction_label_inference
ORDER BY random() LIMIT 20”

    p1_id        |         p2_id         | expectation

---------------------±----------------------±------------
1201746717_13_0_1 | 1201746717_13_121_125 | 0
1201743744_20_47_48 | 1201743744_20_556_557 | 0
1201738764_11_15_22 | 1201738764_11_8_13 | 0.036
1201747761_51_20_24 | 1201747761_51_14_18 | 0.052
1201746717_2_32_37 | 1201746717_2_48_53 | 0.035
1201746717_43_34_39 | 1201746717_43_81_85 | 0.004
1201734457_3_5_10 | 1201734457_3_46_51 | 0.013
1201743744_24_53_57 | 1201743744_24_30_35 | 0.001
1201743500_3_0_5 | 1201743500_3_51_52 | 0.008
1201734457_3_64_68 | 1201734457_3_46_51 | 0.056
1201738769_3_17_23 | 1201738769_3_45_46 | 0.017
1201743269_1_20_27 | 1201743269_1_29_33 | 0.108
1201743586_13_69_70 | 1201743586_13_81_85 | 0.121
1201738844_1_35_39 | 1201738844_1_71_77 | 0.408
1201743281_7_10_17 | 1201743281_7_55_61 | 0

至此,公司交易关系抽取完成了。
只是得到两个实体之间存在交易关系的概率,可以说,并不是真正意义上的实体关系抽取,毕竟单一。
下一步,看看deepdive人物关系抽取实验吧。

deepdive案例实验中的所遇问题即解决相关推荐

  1. 浏览器实验中的故障排除

    NewVoiceMedia 全球电信与服务经理Alfred Brooks 遇到了客户联络中心代理报告的严重降级音频的问题,本文将介绍他是如何一步步分析问题并最终确定错误是由Chrome实验中对AEC3 ...

  2. 用友U8案例实验应收管理后台配置

    目录 应收参数设置 应收会计科目设置 本单位开户银行 收付款协议档案 应收模块凭证科目设置 期初余额 应收参数设置 案例 erplabs整机公司应收模块与销售模块集成使用,销售发票在销售模块生成并传递 ...

  3. 在计算机教学过程当中,案例教学中计算机基础教学的运用论文

    案例教学中计算机基础教学的运用论文 摘要:案例教学法是一种新兴的教学方法,经常被运用到各种教学环节当中.研究表明,案例教学在计算机基础教学中的有效运用,不仅有利于培养学生的学习兴趣和提升教学成效,而且 ...

  4. LiteOS | 基于LiteOS的智慧农业案例实验分享

    1024G 嵌入式资源大放送!包括但不限于C/C++.单片机.Linux等.关注微信公众号[嵌入式大杂烩],回复1024,即可免费获取! 分享一个基于小熊派+LiteOS+华为云的案例实验(智慧农业) ...

  5. 【茗创科技】如何看待心理学实验中的数据缺失?

    大家好,这里是 "茗创科技" .茗创科技专注于脑科学数据处理,涵盖(EEG/ERP, fMRI,结构像,DTI,ASL, ,FNIRS)等,欢迎留言讨论及转发推荐,也欢迎了解茗创科 ...

  6. 合成实验中,十三种后处理方法:实验室常用13种后处理方法、故障及解决办法

    合成实验中,十三种后处理方法:实验室常用13种后处理方法.故障及解决办法 1.有机酸碱性化合物的分离提纯 具有酸碱性基团的有机化合物,可以得失质子形成离子化合物,而离子化合物与原来的母体化合物具有不同 ...

  7. EMC实验中RE理论干扰源的详细分析

    目录: 一.前言 1.静电耦合 2.磁场耦合 3.电磁耦合与天线 二.电磁辐射如何产生 三.详述辐射的两种天线及相关案例 1.环等效天线 2.案例分析一 3.单极或偶极等效天线 4.案例分析二 四.空 ...

  8. 中职校计算机案例教学法,中职计算机课程中案例教学法的应用研究

    摘 要:在教学中采用案例教学法,能够将教学的理论以及实际情况进行有效的优化整合,从而明确教学的目标,使得教学可以顺利的进行.案例教学法有其自身的应用优势,通过应用设置情境以及采用各种其他的方法来对学生 ...

  9. Lesson 12.1 深度学习建模实验中数据集生成函数的创建与使用

    Lesson 12.1 深度学习建模实验中数据集生成函数的创建与使用   为了方便后续练习的展开,我们尝试自己创建一个数据生成器,用于自主生成一些符合某些条件.具备某些特性的数据集.相比于传统的机器学 ...

最新文章

  1. python 平滑曲线
  2. c语言冒泡法加逗号,Ubuntu 10.04 LTS 无法添加计算机的问题
  3. Oracle集合运算
  4. Running /usr/bin/wineserver -w. This will hang until all wine processes XXXX terminate
  5. iOS 使用 MailCore2
  6. matlab内存不足问题
  7. 最简单 - 单例模式
  8. 能在手机播放的Flash代码
  9. HasMany() = (1..*) HasOptional() = (1..0,1) HasRequired() = (1..1)
  10. Async.js——Node世界中被依赖最多的库No.3
  11. redhat 复制文件夹及子文件夹_Docker COPY 复制文件夹的诡异行为
  12. centos7下安装pycharm
  13. getwmi php 报错,调用win32_service类就报错“get-wmiobject :常规故障”,这是wmi类损坏?...
  14. 东大22春《马克思主义基本原理概论》在线平时作业1百分非答案
  15. 悟空遥控器 --- 手机投屏到电视 播放视频
  16. 【DL】为什么需要深度学习:模组化、端到端学习(语音识别、图像处理情景)、类比逻辑电路
  17. 华为路由器静态路由协议配置
  18. 飞塔防火墙MIB-OID列表
  19. 怎样学习有限元分析才能更快?
  20. 苹果xs还原卡在进度条怎么关机

热门文章

  1. 线性差分方程及其通解的一般求法
  2. html如何制作悬浮窗,使用js实现悬浮窗效果方法
  3. java json 解析_Java解析JSON的四种方式
  4. i tell you
  5. 什么是深拷贝和浅拷贝?以及怎么实现深拷贝和浅拷贝?
  6. SQL Server 2005数据库教程
  7. 解决ps默认打开显卡的设置
  8. 共享单车创始人正在沦为资本家的傀儡?
  9. python居中对齐_python – PyQt5:居中对齐标签
  10. 报错:The path is not a valid path to the xxx kernel headers.