ips:每秒处理的图片数量
End-to-end evaluation on the validation set with TEDS as the indicator. TLD: text line detection; TSR: table
structure recognition; TLR: text line recognition; ME: model ensemble. ESB: empty space box encode; SyncBN:
synchronized BN; FeaC: feature concatenate output of transformer layers. ForC: format correction

rect:矩形
metrics:度量指标

octave
int类型的apertureSize,表示应用Sobel算子的孔径大小,其有默认值3。也就是3x3的核大小
关键信息提取(Key Information Extraction,KIE)
reduce:规约
warp divergence:warg分歧
warp:线程束
register:寄存器
profile 性能
op:算子
lazzy:推迟
nms:非极大值抑制
achor:图像识别 长宽比
RARE(Robust text recognizer with Automatic Rectification,具有自动校正功能的鲁棒性文本识别器)
Handler 处理器
模式 schema
人类视觉系统(HSV)
visual motif matte:就是水印
latent representation:就是词向量
dec :decoder 代码习惯简写
des:destination 等代码习惯简写
im:image图片
res:一般是残差的简写
act:通常是激活函数的简写
translation 平移
decompose:分解
render:渲染
dilation:空洞,扩张
collate_fn: 聚集函数,自己定制
pin_memory:放在gpu中?
We refer to the above module as Self-calibrated Mask Refinement
将xx称为
identify 识别
Apparently, the ground-truth affinity map should be identical with the groundtruth
watermark mask 相同的
affinity map. ?
interpolation 差值
invariance 不变性
分割领域,基于深度学习的语义分割算法开⼭之作是全卷积⽹络FCN(由于⽹络中只有卷积没有全连接,所以这个⽹络⼜叫全卷
积⽹络),⽽UNet是遵循FCN的原理,并进⾏了相应的
重叠-切片(overlap-tile
Visual Geometry Group 视觉几何分组
iff:当且仅当
proposition 命题
inner loop:内层循环
generative stochastic network 生成式随机网络(GSN)
noise-contrastive estimation (NCE) 噪音对比估计
Boltzmann machines (RBMs) 玻尔兹曼机
Deep belief networks (DBNs) 深度信念网络
马尔可夫链蒙特卡洛(MCMC)
pin memory:锁定内存
Intersection over union (IoU).交并比
Average Precision (AP)
峰值信噪比(Peak Signal to Noise Ratio, PSNR)
和结构相似图像指数(Structural Similarity Image Index, SSIM
CLWD(彩色大规模水印数据集)
Large-scale Visible Watermark Dataset (LVW) 大规模可视水印数据集
segmentation 分割
locate 定位
未标记数据增强(AU)
弹性权重巩固(EWC)
真实数据 the ground truth
discriminators 鉴别器对生成的图像和真实图像进行识别
colour watermarked image data set (CW-data set).
white watermarked image data set (WW-data set)
Context Encoder 上下文编码器
image inpainting 图像修复
Spatial-level Transformation (PST) 空间层次转换
pixel deflection 像素偏转
ACID,是指数据库管理系统(DBMS)在写入或更新资料的过程中,为保证事务(transaction)是正确可靠的,所必须具备的四个特性:原子性(atomicity,或称不可分割性)、一致性(consistency)、隔离性(isolation,又称独立性)、持久性(durability)。
control 控件?和tab 标签类似?
草图(Sketch)、线框(Wireframe)、模型(Mockup)和原型(Prototype)。
Sample Auto-Correlation Function (SAC)
Distributed Denial of Service (DDoS)
Page Popularity Index (PPIs)
Adaptive Resonance Theory (ART)
Self-Organizing Map (SOM)
入侵检测系统( IDS)
it required all data to be present on the driver program prior to creating RDD
prior to :在什么之前
dispatcher调度
nio非阻塞式io
bio阻塞式io
aio异步通信
netty通信框架
schedulebackend通信后台
inbox收件箱
outbox发件箱
ref引用
endpoint终端
rack机架
rpc通信
invoke调用
await 阻塞
impl:实现
stw stop the world 世界停止 ,除自己外,停止其他一切对象的活动
简单的总结一下:
所谓的CoarseGrained,以及与之对应的FineGrained,涉及到并行计算的粒度(Granularity )问题。
细粒度的就叫做FineGrained,也就是把一个作业,拆分成单个很小,数量很多的任务;
粗粒度的就叫做CoarseGrained,也就是作业拆分后的任务单个比较大。

Spark拆分成的任务,默认一个task对应的是一个HDFS的Block,这当然是比较大的了。如果是一个任务只处理一行数据,那就是FineGrained了。

作者:JasonWayne
链接:https://www.jianshu.com/p/6cb764328286
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
memory analyzer MAT
heap dump 堆转储
coarse Grained Scheduler 粗粒度的调度器
disk 本地磁盘
off-heap 堆外空间
on-heap 堆内空间
pool 集中
leverage 充分利用
KeyBERT is by no means unique 绝不是独一无二的

dodge:分离
ref 引用
存储空间(Bucket)
OSS(Object Storage Service)对象存储服务
row group stride 行组 ,横切
record 行
每用户平均收入(Average Revenue Per User ARPU
日活跃用户数 (Daily Active Users)DAU
活跃天数LT
expression expr 表达式
truncate 清空表,删除
cascade 强制
客户生命周期(CL:Customer Lifetime)
CAC(Customer Acquisition Cost,用户获取成本
每用户平均收入(Average Revenue Per User,ARPU)
那就是用户留存率(Retention Rate,RR
用户生命周期价值(LTV
生命周期(Life Time,LT)
metastore 元数据
dbs:mysql源数据的数据库系统的源数据信息以及实际数据对应的物理存储路径
tbls:mysql中存的表的源数据信息
verbose 冗余的 显示详细信息
boot 启动
dt:datetime
dn:datenow
sink写
source读
bucket分桶
namespace命名空间 (环境)
runtime运行环境
property.kafka_default_offsets:从哪里开始读 偏移量
offset_beginning:从第一条开始读
max_error_number 最大运行出错的条数
desired_concurrent_number:并行度
properties:参数
bitmap:位图
resolve 解析
accumulator 累加器
Distribution,即分桶
Partition,即分区
非精确的排重(HLL)
数据仓库标准上可以分为四层:ODS(临时存储层)、PDW(数据仓库层)、DM(数据集市层)、APP(应用层)。
dss 决策支持系统(Decision Support Systems
数据仓库,英文名称为DataWarehouse
如果需要加载到数据仓库中的数据,我们首先需要定义好它,这叫做写时模式(Schema-On-Write)。而对于数据湖,您只需加载原始数据,然后,当您准备使用数据时,就给它一个定义,这叫做读时模式(Schema-On-Read)。
ETL(Extract-Transform-Load)
关系OLAP(ROLAP)
模式演化(schema evolution)
数据库管理系统(DBMS)
多维度数据立方体(cube)
criterion就是loss
基于客观系统分析osa和数据分组
处理gmdh网络集成
自组织数据挖掘方法sodm
最小二乘支持向量机( leastsquaressupportvectormachines, LSSVM
受限玻尔兹曼机(Restricted BoltzmannMachine,RBM)
深度信念网络(Deep Belief Networks,DBN)实
调用文件系统(FS)
identifier 符号
Resolving 解析
DART(Dropouts meet Multiple Additive Regression Trees)
DART利用了深度神经网络中dropout设置的技巧,随机丢弃生成的决策树,然后再从剩下的决策树集中迭代优化提升树,这是DART的主要思想。
stacking 堆叠
blending 混合
rebase 变基(基础变化)
TF(Token Frequency)
一部分是TF(Token Frequency),表示一个词在文档中出现的次数,即词频。另一部分是IDF(Inverse Document Frequency),表示某个词出现在多少个文本中(或者解释为有多少个文本包含了这个词
关键词(Token)
criterion 分裂条件
偏自相关系数(PACF)
自相关系数(ACF)
Gradient Boosting Machines(GBM)
部分可观测马尔可夫决策过程(POMDP)
半马尔可夫决策过程(SMDP)
马尔可夫决策过程(MDP)
LTV 全称 Customer Lifetime Value,意为“客户终身价值”,是电子商务、市场公司中很流行的一种概念。它定义了在未来一个时间段内用户预期为公司带来的收益,通常以美元为单位。
sku:商品+厂商+规格
support vector regression 中文名为支持向量回归机, 简称svr , 它是svm
算法的一个重要的变体
LBP(Local Binary Pattern,局部二值模式)
它们在 feed 场景中采用了Skip Above的方式来提高效果。具体来讲就是根据用户最后一次点击行为的位置,过滤掉最后一次点击之后的展示,可以认为用户没有看到,也可以保留最后一次点击之后的少数几个。笔者认为也可以进行尝试。

CTR 点击率(Click K Through Rate)
商品交易总额(Gross Merchandise Volume)
它在HTTP协议的基础上加入了安全套接层(Secure Sockets Layer,简称SSL协议)和传输层安全(Transport Layer Security,简称TLS)协议,SSL协议依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密

浏览器提供了一个对象模型,开发者可以通过它访问浏览器的属性或实现一些方法,这个对象模型就是浏览器对象模型,简称BOM(Browser Object Model)。BOM并没有正式的标准,在交互性方面,由于现代浏览器几乎实现了与JavaScrip相同的方法和属性,所以这些方法和属性被认为是 BOM 的方法和属性。BOM中有很多对象,例如window、window.navigator、window.screen和window.history等。

假如需要动态改变页面上的元素,实现页面元素的添加、移除和修改,甚至是重排,那么就需要获得能够对HTML文档中所有元素进行访问的入口,这个入口就是文档对象模型,简称DOM(Document ObjectModel)。DOM是W3C组织推荐的处理可扩展标志语言的标准编程接口。在网页中,组织页面或文档的对象被放在一个树形结构中,其中用来表示对象的标准模型就称为DOM。DOM能够以一种独立于平台和语言的方式访问和修改一个文档的内容和结构

field-aware 特征域
resolve() 解析,执行
JSON 英文全称 JavaScript Object Notation
瞬时扰动( Moment Perturbation )
隐私保护的支持向量机
(Privacy-Preserving Support Vector Machine,PPSVM)
模糊处理(Obfuscation)
交叉并行(Mixed Parallelism)
混合并行(Hybrid Parallelism)
任务并行( Task Parallelism ) 也叫作以任务为中心的方法
(Task-Centric Approach),指的是计算机程序在同一台或多台机器上的多个处理器上执行。它着力并行执行不同的操作以最大化利用处理器或内存等计算资源。 YARN
MEGA ( Mini-batch 、Exchange 、GlobalSync 和
Apply)模型
图并行(Graph Parallelism)方法,也称为以图为中
心的方法(Graph-Centric Approach)
分层并行(Layer-WiseParallelism)
分层(Layer-Wise
随着DNN模型变得越来越大,如BERT模型[158],我们可能会面临一个DNN模型不能加载到单一计算节点内存中的问题。对于这种情况,我们需要分割模型,并将各部分置于不同的计算节点中。这种方法被称为模型并行(Model Parallelism)方法,也叫作以模型为中心的方法
(Model-Centric Approach)[
模型并行指的是一个模型
(如DNN模型)被分割为若干部分(如DNN中的一些层在一个部分,另
一些层在其他部分),然后将它们置于不同的计算节点中
数据为中心的方法(Data-Centric Approach)
数据并行(Data Parallelism)
高斯混合模型(Gaussian Mixture Model,GMM)
分布式深度学习( Distributed Deep Learning , DDL )
张量处理单元(Tensor Processing Unit,TPU)
面向扩展性的DML ( Scalability-
Motivated DML)和面向隐私保护的DML(Privacy-Motivated DML)
数据分片(Shard)
(DistributedMachine Learning,DML) 分布式机器学习
模型反演攻击(Model Inversion Attacks)
成员推理攻击
(Membership-Inference Attacks)。
特征推理攻击( Attribute-Inference Attacks)
重构攻击(Reconstruction Attacks)
机密性(Confidentiality)
可用性(Availability)
完整性(Integrity)
安全机器学习(Secure ML)
差分隐私(Differential Privacy,DP)
同态加密方法(Homomorphic Encryption,HE)
安全多方计算(Secure Multi-party Computation,MPC)
Privacy-Preserving Machine Learning,PPML)面向隐私保护的机器学习
increment 递增
placeholder 占位符
hover 悬停
opacity 透明度
reflow 重排
A component’s name is its identifie 标识符
arbitrarily 任意地
stands for 代表
runtime parameters 运行时参数
take in 接收
reside in 存在于
holds 具有
stepwise 逐步地
protobuf是由Google开发的一套对数据结构进行序列化的方法
protocol buffers
Float(浮动)

margin(外边距)
outline 轮廓
border 边框

padding 填充
text-indent 文本缩进
line-through 线穿过
overline 线上面
文字排列(text-alignment)
margin-left:20px 左边距
外部样式表(External style sheet)
内部样式表(Internal style sheet)
内联样式(Inline style)
样式属性(style attribute)
不间断空格(Non-breaking Space)
RGBA 的意思是(Red-Green-Blue-Alpha)它是在 RGB 上扩展包括了 “alpha” 通道,运行对颜色值设置透明度。
enctype 编码方式
MailTo 邮箱
文本域(textarea)、下拉列表、单选框(radio-buttons)、复选框(checkboxes)
创建文本字段 (Text field)
用来组合文档中的行内元素, 内联元素(inline)
块级 (block-level)
alt 别名
text-align(文字对齐)
font-family(字体)
CSS (Cascading Style Sheets)
万维网联盟(W3C)
SGML(Standard Generalized Markup Language 标准通用标记语言)
DTD (文档类型声明)
标记标签 (markup tag)
差分隐私(DP) / 多方安全计算(MPC) / 同态加密(HE)
retrieve 检索
outlier_impute(
那些被视为离群值

Population Stability Index (PSI)
meta-service 元信息管理

eggroll

协同过滤 (Collaborative Filtering, 简称 CF)
retrieves 检索
cicd 持续集成持续部署
dp:差分隐私
multi-party computation (MPC)
领域专用语言(DSL)

它是一种重视“软件开发人员(Dev)”和“IT运维技术人员(Ops)”之间沟通合作的文化、运动或惯例。透过自动化“软件交付”和“架构变更”的流程,来使得构建、测试、发布软件能够更加地快捷、频繁和可靠。
DevOps

加性同态加密(AHE)
P2P (peer to peer) 点对点
差分隐私保护理论(Differenti al privacy) (5)、k 匿名(k-Anonym ity) (6) 和l 多样化(l-Diversity)

用户对齐
特征对齐
对齐:就是大家拥有的都一样?

throughput 最大吞吐量
no viable alternative at input 'alter table ztdata_hive.tb_catagory_distribution
没有此种用法

Column ‘user_type’ cannot be resolved
resolve 解析

line 2:8: backquoted identifiers are not supported; use double quotes to quote identifiers

backquoted identifiers 键盘1的左边的引号 反引号
double quotes 双引号

UDF 用户自定义函数
Spark SQL、Presto等查询引擎支持
These Columns can be used to select the columns from a DataFrame. For example, DataFrame.select() takes the Column instances that returns another DataFrame.

instances 实际触发运行后的实例,对象
PySpark is included in the distributions available at the Apache Spark website. You can download a distribution you want from the site.
distribution 打包文件
lowerBound: Long, # 分区的下界
upperBound: Long, # 分区的上界
numPartitions: Int, # 分区的个数
HA架构:高可用架构
case 事例
nested 嵌套
stdout 标准打印输出
Lei [7] proposes a
new incremental learning of wLPSVM for DCIL
for:用于
learning from data to adjust itself adaptively
to handle varied class imbalances
短语翻译用逗号隔开
Linear Proximal support vector machines
[LPSVM]
Learning from class imbalance data stream,
incremental learning algorithm is desirable to (希望)pose a
capability (具有…能力)for dynamic class imbalance learning
(DCIL)

exhibit 表现
event_loop(消息循环)
Finally, G-mean is used for prediction of good classifier
from ensemble classifier
prediction 名词作动词
this technique modify
the distribution of training data such that cost of example
calculated based on appearance of example.
如此 …以至于
headline(签名)、description(个人简介)
隧道代理(TB)
deploy 发布
Scrapy 是一个为了抓取网页数据、提取结构性数据而编写的应用框架,该框架是封装的,包含 request (异步调度和处理)、下载器(多线程的 Downloader)、解析器(selector)和 twisted(异步处理)等。对于网站的内容爬取,其速度非常快捷。

默克尔树(Merkle tree)
这就是简单支付验证(SPV),这样的节点就叫做SPV节点
EDA exploratory data analysis
have little in common with the target
和目标没有什么共同点
individualized grouping (iGroup),
identical 相同的
in the context of 情况下
anomalous deviations 异常偏差
在企业风险管理整体框架(E R M)
客户尽职调查(CDD)
美国金融犯罪执法局(Fin-CEN)
《银行保密法》(BSA)
美国货币监理署(OCC)
最终受益人(UBO)
金融情报中心(FIU)
金融行动特别工作组(FATF)
Editorials, position papers, keynotes, reviews, summaries tutorials, books, courses or workshops, panel discussions.
社论,意见书,主题报告,评论,总结教程,书籍,课程或研讨会,小组讨论。
“system,” “process,” “model” and “method”
Synonyms 同义词
identified 确定的
identification 识别
research questions (RQs)
Evidence Based Software Engineering (EBSE).
Over the years 多年来
Of the identified categories
systematic literature review (SLR)
anti–money laundering (AML)
transfer pricing 移转定价
valuables 贵重品
purchasing businesses through which funds can be channeled,
购买可以作为资金渠道的企业
It does not address nor recognize the presence of imbalance in the data.
它没有处理或承认数据中存在的不平衡。

a few rare 极少的
Completeness is bound by various parameters
受约束
Accuracy of all traditional and standard classifiers is highly proportional to the completeness or quality of the training data
凸函数(convex function
is highly proportional to
成比例的
大体过程是,对一个句子X = (x1, x2, . . . , xn), 我们选取它的一个子序列(span)
Byte Pair Encoding (BPE)技术,所以也可以把这些最小单元当作是子词(subword),比如说superman,分成 super+man 两个子词。
Permutation Language Model
假设我们固定住x3所在位置,就是它仍然在Position 3,之后随机排列组合句子中的4个单词,在随机排列组合后的各种可能里,再选择一部分作为模型预训练的输入X。比如随机排列组合后,抽取出x4,x2,x3,x1这一个排列组合作为模型的输入X。于是,x3就能同时看到上文x2,以及下文x4的内容了。这就是XLNet的基本思想
看到Ti单词的上文Context_before,来预测Ti这个单词。但是又希望在Context_before里,不仅仅看到上文单词,也能看到Ti单词后面的下文Context_after里的下文单词
变量(previous)
重叠区间(overlapping intervals)
回文(palindrome)
比较包含回退(backspace)的字符串(中等)
因为如果只有一个指针,你必须继续在数组中循环回来才能找到答案。
这种使用单个迭代器进行来回在时间和空间复杂度上都很低效——这个概念被称为「渐进分析(asymptotic analysis)」。
内部协变量偏移(Internal Covariate Shift)和批归一化(Batch Normalization)
Local Response Normalization (LRN)
Leaky ReLU (LReLU)
Parametric ReLU (PReLU)
Exponential Linear Unit (eLU)
We are not sure exactly as to why
self-regulation disorder 自我监管障碍
abnormal life activity 异常生命活动
reflects 反映
symptoms, signs, and complications
症状、体征和并发症
and the appearance or disappearance of other abnormalities
以及其他异常的出现或消失
other than drug and operation 除了毒品和手术
Sociology 社会学
anatomy 解剖学解剖
complications 并发症
Prevention 预防
Emerging therapies 新兴的治疗方法
Screening 筛查
History and Physical 病史与体格检查
etiology 病因
Prognosis 预后预断病情
epidemiology, pathogenesis and cases
流行病学、发病机理及病例
Clinical pathway 临床路径
ingredients, indications and adverse reactions of Chinese and western medicines
中药、西药的成分、适应证及不良反应
pharmaceutical and biological industry 制药和生物产业
thesaurus 词典宝库
ATC是世界
卫生组织维护的解剖学、治疗学及化学分类系统,它
的本体结构依据的是药物成分对人体解剖学的治
疗、药理和化学特征效应,ATC共包含消化道、血液
形成器官、心血管等14大类解剖学概念对应的药物
成分及其用法用量标准。MeSH 是美国国立医学
图书馆编制的医学主题词表,它包含15大类所属的
18 000多个医学主题词,主要辅助PubMed标引和
检索医学文献。
ICD-10是世界卫生组织维护的国际疾病分类
代码,它是包含疾病、症状、体征、异常发现、社会环
境以及外部原因导致的损伤或疾病的代码。ICD-10
编码以树状层级结构描述了22大类的10 000多个
概念
国、际医疗术语标准开发组织维护的系统化临床医学术
语集SNOMED-CT[8]、Linked Open Data(LOD)收
集的1 000 多种生命科学知识库、BioPortal[9]、
Bio2RDF[10]
如世界卫生组织维护的国际疾病分类代码ICD-10[6]
SOAP(subjective,objective,assessment,plan)
,首先描述各种症状、体征以及重要检查结果,然后对这些证
据进行综合评估做出诊断,最后给出相应的诊疗计划.
面向医疗问题的方式(POMR)

了只标注医疗问题的命名实体活料库 ShARc(Shared。d Annotatcd Rcsourse,

CLEF (Confcrcnce and Labs ofthe Evaluation Forum)健康评估实验室

商向问题的组织方式(POMR, Problcm-Oricnted Mcdieal Rccord).
CLEF(CLinical E-Science Framework)

临床电子化科学体
umls

ctakes
英文电子病历命名实体租实体关系标注i击料库构建工作起步较早,其标f主体系、标注方法和1一致性评价
(Inter-annotator agreement, IAA)对中文电子病历语料库的构边是非常重要的参考
临床决策支持(Clinical Dceision Support),
临床信息学(Clinical Informatics) 、用户健康信息学(Consumcr Hcallh ln formatics
医学信息学(Medical Informatis)和1 转化医学(Translational Medicine
inter-annotator agreement IAA
physician 医师
health care provider: 医疗服务人员
preliminary experiment 初步实验
stripped out 剔除
Inertial thinking 惯性思维
conservative treatment 保守治疗
Schematics 图表
routine inspection and qualitative testing. 常规检查和定性检查
derived 提取
nature 性质
心脏彩超示[echocardiography display]
laboratory test 实验室检查
外伤(“blood transfusion”)).
therapeutic 治疗的
曾多次服用感冒药和处方药[have taken cold
medicine and prescription drugs many times] = (感
冒药(“cold medicine”), 处方药(“prescription drugs”)).
(捷甘清(“JieGanqing”), 亮菌甲素(“bright bacteria A”)).
drug therapy 药物治疗
medication in doctor s order 医嘱上的药物
medicine history 医学史
purple 紫色
patent ductus arteriosus 动脉导管未闭
药物过 敏(“drug allergy”).
overall diagnosis 全面诊断
complex causal relationship 复杂的因果关系
a certain extent 某种程度上
evolution 演化
(心脏(“heart”), 胸腔(“thorax”).
Orientation information 方向信息
稍感胸闷气短[mild chest tightness and shortness of breath]
疼痛时伴有右下肢活动受限[pain accompanied by limited activity of right lower limb]
inseparable 不可分割的 依赖的
liver spleen untouched swelling 肝脾未见肿胀
swollen 肿胀的
affirmative meaning 肯定的意义
mobile dullness 移动性浊音
Inspection and laboratory test (I&Lt) 检验及化验(I&Lt)
(“schistosome contaminated water contacting” 血吸虫疫水接触
appetite normal
食欲正常
The abnormal conditions include abnormal conditions, abnormality findings
异常情况包括异常情况、异常表现
abnormal conditions 反常情况
manifestations 临床表现
patient s normal condition 患者正常情况
Light green 浅绿色
inchoate 早期的
Hospitalization 住院治疗

主述
现病史
既往史
家族史
个人史
体格检查
专科检查
辅助检查
入院诊断
specialty
accessory
admission
negation words 否定词
overlapped or nested 重叠或嵌套
symmetrical 对称的
speech tremor in the right lung 右肺言语震颤
congenital heart disease 先天性心脏病
anti-inflammatory and symptomatic supported treatment
抗炎和对症支持治疗
Temporal word 时间词
Heart Murmur 心脏杂音
present history 现病史
patients chief complaints 病人主诉
section heading 表头
it is notable that 值得注意的是……
authentic admission records 真实的入院记录
rich information 丰富的信息
Morbidity 发病率
course of disease 病程
de-identified 身份不明的
anatomy 解剖学
discharge abstracts (DA) 出院小结
Word Segmentation 词切分
drugs (medication) 药物
Subdivided 细分
admission summaries and 400 discharge summaries 入院小结 出院小结
analogous 类似的
Signs and symptoms 体征和症状
inflammatory bowel disease 炎症性肠病
temporal information 时态信息时间信息
pathological reports 病理报告
Unprecedented 空前的
Medical Process 医疗过程
Medical personnel 医务人员
Electronic medical records (EMRs) 电子病历
excavating 挖掘
Resident Admit Notes (RANs)
Meditations 药物
种: 状况( Condition)、药物( )、药物( )、药物( Drug)、干预 )、干预 (Intervention)、部位( )、部位( Locus)、检查( )、检查( Investigation
SNOMED CT(Systematized Nomenclature of Medicine – Clinical Terms)医 学系统 命名法 ——临床术语
一体化医学语言系统 (Unified Medical Language System;UMLS
Fusion Dependency Parsing
融合依赖解析
Dedication 奉献
provided you give appropriate credit to the original author(s) and the source
只要你对原作者和来源给予适当的信任
de-identified 识别不出的
semantic relations betweenmedical concepts fall into five coarse-grained categories and fifteen fine-grained categories
医学概念之间的语义关系分为5个粗粒度类别和15个细粒度类别
On the basis of reference to medical semantic relation
annotation specification of 2010 i2b2/VA Challenge
在参考2010年i2b2/VA挑战医学语义关系标注规范的基础上
reference to 参考
we superimposed the identity mapping function on a network.
我们把恒等映射函数叠加在网络上
superimposed 叠加的
this paper addresses the
semantic relation identification problem among medical
concepts in Chinese EMRs
address 解决了
Overall, the existing models
mainly focus on English EMR texts,
总的来说,现有的模型 主要关注英语EMR文本,
Li et al. raised an electronic health records relation classification model based on CNN-LSTM
raise 提出
Drawing on these studies on open-domain relation extraction
在此基础上对开域关系提取进行了研究
Utilizing 利用
firstly employed recurrent neural network (RNN) on the task of relation extraction
employ 应用
knowledge base 知识库
adequate 足够的
put forward 提出
natural language processing (NLP)
Disease causes symptoms (DCS)
Test reveals the disease (TeRD)
Since then medical concept relation classification has being paid
attention by more and more researchers.
此后,医学概念关系的分类得到了越来越多的研究者的关注。
On account of the importance of this subject
考虑到这个课题的重要性
lacunar infarction
腔隙性脑梗死
These relations are hold between medical problems, tests, and treatments
存在于
pathology reports 病理报告
radiology report 放射学报告
discharge record 排放记录
Clinical 临床的
narrative data 叙述数据
treasure trove 宝藏
vital signs 生命体征
demographics
人口统计资料
With the tremendous growth of the adoption of EMR
随着电子病历的广泛应用
HIS (hospital information system).
sentence tokenized
句子标记化的
a dump of the full text
全文的转储
allowing our highprecision features to work as intended
允许我们的高精度功能按预期工作
since most features would only be seen once, rendering them useless to the classifier
因为大多数特征只会被看到一次,这使得它们对分类器毫无用处
render as
呈现为
problematic 有问题的
Rather than use each of the above features in the classifier independently
rather than 而不是
Miscellaneous 其他
traversal 遍历
broad-coverage dependency parser MINIPAR 广泛覆盖的依赖解析器MINIPAR
a number of 许多
In addition to lexical features
除了词汇特征
boldface. 黑体字
but not large enough to justify the increased demand on our computational resources
但还不足以证明对计算资源的需求增加是合理的
In combination with
the other lexical features, they gave a small boost
to precision
提升
function words 功能词
variations 变化
In an attempt to approximate syntactic features
试图(尝试)接近句法特征
nouns, verbs, adverbs, adjectives, numbers, foreign
words, and everything else.

名词,动词,副词,形容词,数字,外文
语言,还有其他一切。

treebank 树图资料库
conjunction 结合
A window of k words to the left of Entity 1 and their part-of-speech tags
在xxx的左边
In isolation, neither of these features is conclusive, but in combination, they are.
孤立地看,这两个特征都不是决定性的,但结合起来,它们就是决定性的。
producer 制片人
Academy Awardwinning 奥斯卡金像奖
[co-produced 联合出品
loosely 大体上
combine 合并
come across 遇见
encountered 遇到
protestants 新教徒
run through 贯穿
intuition 直觉
MUSIC TRACK 音乐声带
export to 导出到
NNDB (biographical
information), MusicBrainz (music), the
SEC (financial and corporate data),
NNDB(传记信息),MusicBrainz(音乐),SEC(金融和公司数据)
text boxes and other tabular data 文本框和其他表格数据
We use relations and relation instances from
Freebase, a freely available online database of structured semantic data
the person-nationality relation holds between
the entities named ‘John Steinbeck’ and
‘United States’
hold 存在
Following the literature, 根据文献
genre. 类型
infobox. 信息框
formalism 形式主义
Part-of-speech 词性
meronym (part-of) relation 部分词
Except for 除了
syntactic versus lexical 句法与词汇
canonical names 规范名称
plague 困扰
obviate 排除
vast numbers of 大量的
whereas 然而
Freebase a collaboratively created graph database for structuring human knowledge
ACL 国际计算语言学协会(The Association for Computational Linguistics)
bioinformatics 生物信息学
hypernym (is-a) relations between entities
上位词
WordNet 词汇网络
patterns 模式可以理解为模板
a third 三分之一
particular knowledge base
特定的知识基础
extracts strings of words between entities in large amounts of tex
大量的
Supervised relation extraction suffers from a number of problems
遭受
a wide variety of 很多的
Automatic Content Extraction (ACE) RDC 2003 and 2004 corpora,
corpora 语料库
corpos 语料
lexically distant 词法遥远的
syntactic parsing 句法
sentiment 情绪
semantic 语义 穿着语义的好色男人

陌生单词-专业英语代码编码符号2相关推荐

  1. 陌生单词-专业英语代码编码符号1

    identical 相同的 identify 识别 lexically distant 词法遥远的 syntactic parsing 句法 transduction model 转换模型 To th ...

  2. 计算机专业英语实战记录(整理了上千个相关单词)

    自上一篇<每次阅读外文技术资料都头疼,终于知道原因了>已过去多月,最近又在做简单的实践,实践方式很朴素,就是对照阅读React官方资料和国内翻译的资料,逐句对比,发现了许多问题,特在此记录 ...

  3. 用计算机计算成品率计算公式,计算机专业英语+单词+部分习题.doc

    计算机专业英语单词部分习题 KEY TERMS 第一单元 application software应用软件 basic application基本应用软件 communication device通信 ...

  4. 带你一起学软件工程的专业英语!(IT行业、四六级党快记起来)《软件工程专业英语》第一单元:启动软件项目——单词、短语、名词缩写、难句、备忘录的基本格式样本(必备技能)

    https://blog.csdn.net/hanhanwanghaha宝藏女孩 欢迎您的关注! 欢迎关注微信公众号:宝藏女孩的成长日记 如有转载,请注明出处(如不注明,盗者必究)   英语是全球IT ...

  5. j计算机专业英语题库,计算机专业英语单词习题

    计算机专业英语单词习题 (30页) 本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦! 19.9 积分 KEY TERMShard disk 硬?ImiMicroc ...

  6. 计算机代码英语,计算机专业英语 (四)(示例代码)

    计算机专业英语 (四) 第一部分:基本单词 interconnect vt 使互相链接 active adj 主动的,活动的 passive adj 被动的 strengthen v 加强,巩固 mu ...

  7. 计算机专业英语选词填空,专业英语考试+单词翻译+单项选择+选词填空+成成呕心沥血之作.doc...

    专业英语考试单词翻译单项选择选词填空成成呕心沥血之作 第一单元 application software应用软件 basic application基本应用软件 communication devic ...

  8. 用计算机打字英语单词,常用计算机专业英语词汇-前401-500单词

    常用计算机专业英语词汇-前401-500单词 贡献者:邓鹏 类别:中英混合 时间:2020-10-28 16:48:34 收藏数:2 评分:0 返回上页 举报此文章 请选择举报理由: 广告/谣言/欺诈 ...

  9. 计算机必修课程英语单词,《计算机专业英语》课程标准.doc

    文档介绍: <计算机专业英语>课程标准课程代码: 参考学时: 64 学分: 3 课程类型: 公共基础课 2015年1月编一.适用专业计算机应用技术专业(3年制中职,5年制高职)二.开课时间 ...

最新文章

  1. 世道变了!这个AI竞赛不再要刷榜成绩,直接看商业落地计划书
  2. HDU 5410 CRB and His Birthday ——(完全背包变形)
  3. 信息学奥赛一本通 1080:余数相同问题 | OpenJudge NOI 小学奥数/2.1 7647:余数相同问题
  4. ARM三个寄存器 : 堆栈指针SP(R13)、连接寄存器LR(R14)和程序计数器PC(R15)
  5. php论坛如何加评论表情,DEDECMS会员评论时添加多个表情
  6. pl/sql连接Oracle数据库的方式
  7. mysql_udf_http(根据mysql表自动触发发送http请求)
  8. mybatis输出SQL格式化
  9. windows游戏编程大师技巧光盘
  10. python+selenium实现QQ空间的登录
  11. 读《天才在左,疯子在右》01--偷取时间
  12. TJX公司:一家不但股价便宜,产品价格也非常便宜的美国低价零售商
  13. React Native-6.React Native Text组件,多组件封装实战之凤凰资讯页面
  14. 青春犹如一场盛大的演出,
  15. Android 面试必备 - 系统、App、Activity 启动过程
  16. BTree和B+Tree详解结构
  17. 【MATLAB】matlab中clc,close,close all,clear,clear all作用区别
  18. 计算机系统基础实验报告
  19. 射频器件在电路中的分类
  20. SpringBoot之监控器/AOP/拦截器的使用及执行顺序

热门文章

  1. php 邮箱附件 大小限制,不能作为电子邮件的附件发送的是什么?
  2. (Python语法篇)4.序列(3)字典
  3. 《娱乐至死》读书笔记
  4. 前端js——倒计时效果实现 动态显示倒计时
  5. python turtle画圣诞树动图_用 turtle 画一棵圣诞树
  6. PLY文件读取与显示
  7. 贵州省发票认证系统服务器地址,贵州省增值税发票综合服务平台登录入口:https://fpdk.guizhou.chinatax.gov.cn...
  8. 微信小程序网络请求异常怎么办_微信小程序网络超时的处理
  9. 绕过CDN查找真实IP方法
  10. 2022天梯L1-L2题解