PyTorch:Embedding初始化及自定义
-柚子皮-
torch.nn.Embedding(num_embeddings: int, embedding_dim: int, padding_idx: Optional[int] = None, max_norm: Optional[float] = None, norm_type: float = 2.0, scale_grad_by_freq: bool = False, sparse: bool = False, _weight: Optional[torch.Tensor] = None)
参数
前面两个参数的简单理解:torch.nn.Embedding(m, n)。m 表示单词的总数目,n 表示词嵌入的维度,其实词嵌入就相当于是一个大矩阵,矩阵的每一行表示一个单词。
num_embeddings (int) – size of the dictionary of embeddings 词典的大小尺寸,比如总共出现5000个词,那就输入5000。此时index为(0-4999)。注意这里num_embeddings必须要比词对应的最大index要大,而不是比词个数大就可以。
embedding_dim (int) – the size of each embedding vector 嵌入向量的维度,即用多少维来表示一个符号。embedding_dim的选择要注意,根据自己的符号数量,举个例子,如果你的词典尺寸是1024,那么极限压缩(用二进制表示)也需要10维,再考虑词性之间的相关性,怎么也要在15-20维左右,虽然embedding是用来降维的,但是>- 也要注意这种极限维度,结合实际情况,合理定义
PyTorch:Embedding初始化及自定义相关推荐
- 【pytorch速成】Pytorch图像分类从模型自定义到测试
文章首发于微信公众号<与有三学AI> [pytorch速成]Pytorch图像分类从模型自定义到测试 前面已跟大家介绍了Caffe和TensorFlow,链接如下. [caffe速成]ca ...
- pytorch Dataset, DataLoader产生自定义的训练数据
pytorch Dataset, DataLoader产生自定义的训练数据 目录 pytorch Dataset, DataLoader产生自定义的训练数据 1. torch.utils.data.D ...
- Pytorch学习笔记7——自定义数据集
Pytorch学习笔记7--自定义数据集 1.读取数据 首先继承自torch.utils.data.Dataset 重写len与getitem train就用train数据集,test就用test数据 ...
- PyTorch框架学习七——自定义transforms方法
PyTorch框架学习七--自定义transforms方法 一.自定义transforms注意要素 二.自定义transforms步骤 三.自定义transforms实例:椒盐噪声 虽然前面的笔记介绍 ...
- pytorch默认初始化_PyTorch的初始化
背景 在使用PyTorch深度学习框架的时候,不管是训练还是测试,代码中引入PyTorch的第一句总是: import torch 在Gemfield前述专栏文章里,我们已经得知,torch/csrc ...
- 六、v4l2 ctrl 函数初始化---增加自定义接口v4l2_ctrl_new_custom
一.V4L2应用层调用流程 二.V4L2设备注册 三.video设备初始化 四.V4L2 control结构框架图 五.v4l2 ctrl 函数初始化-增加标准接口v4l2_ctrl_new_std ...
- Pytorch Distributed 初始化
Pytorch Distributed 初始化方法 参考文献 https://pytorch.org/docs/master/distributed.html 代码 https://github.co ...
- pytorch Embedding 修改 自定义
现在你有一个[20,64]的编码emb1,代表20件商品.现在你想将每个商品的特征信息emb2融入到编码中,获得一个新的[20,64]的编码emb1'.假设商品信息编码emb2是[20,8]的,你需要 ...
- pytorch默认初始化_“最全PyTorch分布式教程”来了!
前言 本文对使用pytorch进行分布式训练(单机多卡)的过程进行了详细的介绍,附加实际代码,希望可以给正在看的你提供帮助.本文分三个部分展开,分别是: 先验知识 使用过程框架 代码解析 若想学习分布 ...
- PyTorch图像分类从模型自定义到测试
点击上方"小白学视觉",选择加"星标"或"置顶"重磅干货,第一时间送达 01.什么是 Pytorch 一句话总结 Pytorch = Pyt ...
最新文章
- AI+医疗:基于模型的医疗应用大规模分析 | 腾讯AI Lab学术论坛演讲
- python免费教学视频教程-Python免费教程_Python免费视频教程大全_易玩网
- jQuery学习笔记系列(一)——入口函数,jQuery对象和DOM对象,jQuery选择器、样式操作、效果(显示隐藏、滑入滑出、淡入淡出、自定义动画、停止动画队列)
- 2018年云栖社区值得订阅的11个精选技术期刊!
- 力扣算法题—075颜色分类
- C++/C--字符串分割函数 --strtok()
- 使用 Python 的 jsonschema 对 json 做验证
- ASP.NET AJAX 1.0 Beta 2 发布
- soapUI简单教程
- 优道在线屏幕截图控件(UUDoc Screen Capture Control)
- 天刀论剑显示服务器,《天涯明月刀ol》服务器维护公告 天下镖和论剑优化
- 有限元方法数学理论之分片一次多项式空间逼近理论
- win10红警2黑屏_win10怎么玩红警2尤里的复仇及其mod的方法汇总,mod打不开、卡顿的通用解决方案...
- 最新HTML完整结构
- 新浪微博API错误代码说明对照表
- 英飞凌TC264学习(三)定时器
- 【胡侃系列】基于多元回归模型的双十一购物狂欢节天猫商城销售额预测
- 用计算机软件绘制思维导图和手绘思维导图,原来手绘思维导图的好处这么多,你还在用软件画导图吗?...
- 【Android每周专题】触摸屏手势
- 与EEG信号的相关的基础知识以及运动想象信号的生理活动