作者的完整代码及其他数据资料存放的地址
1、将若干音乐表示成compound word的形式。compound word将音乐信息的类型分为7类,分别为family、tempo、chord、position/bar、pitch、duration、velocity。直观来说,用一个7维向量可以表示一个音乐信息。


2、又可通过family的类别,将剩余6类,划分为2大类,分别为与note相关的类以及与metric相关的类。

3、划分训练集存储在train_data_linear.npz中,其中存储train_x,train_y,train_mask的信息。
train_x : (1625, 3584, 7)
train_y : (1625, 3584, 7)
train_mask : (1625, 3584)

//其中train_mask是因为3584是所有音乐的最大tokens数,在分别处理音乐的时候需要进行补0操作,需要用train_mask记录补0的位置,后续训练时对这些地方进行mask。
mask = np.concatenate([np.ones(seq_len), np.zeros(MAX_LEN-seq_len)])

4、在dictionary.pkl中记录tokens和数字的对应情况。

Compound word transformer代码详解(一)数据预处理相关推荐

  1. Transformer代码详解: attention-is-all-you-need-pytorch

    Transformer代码详解: attention-is-all-you-need-pytorch 前言 Transformer代码详解-pytorch版 Transformer模型结构 各模块结构 ...

  2. Transformer代码详解与项目实战之Masking

    在此模型中Masking有两种,分别是Padding Masking和Look-ahead Masking. Padding Masking:遮挡一批序列中所有的填充标记(pad tokens).这确 ...

  3. ViT( Vision Transformer)详解

    文章目录 (一)参考博客和PPT原文件下载连接 (二)VIT原理详解 2.1.self-attention 2.2.sequence序列之间相关性 α \boldsymbol{\alpha} α的求解 ...

  4. 将卷积引入transformer中VcT(Introducing Convolutions to Vision Transformers)的pytorch代码详解

    文章目录 1. Motivation: 2. Method 2.1 Convolutional Token Embedding 模块 2.2 Convolutional Projection For ...

  5. linux 进程间通信 dbus-glib【实例】详解三 数据类型和dteeth(类型签名type域)(层级结构:服务Service --> Node(对象、object) 等 )(附代码)

    linux 进程间通信 dbus-glib[实例]详解一(附代码)(d-feet工具使用) linux 进程间通信 dbus-glib[实例]详解二(上) 消息和消息总线(附代码) linux 进程间 ...

  6. java编程数据溢出问题_Java数据溢出代码详解

    Java数据溢出代码详解 发布时间:2020-10-05 15:08:31 来源:脚本之家 阅读:103 作者:Pony小马 java是一门相对安全的语言,那么数据溢出时它是如何处理的呢? 看一段代码 ...

  7. LoRa节点开发:5、代码详解LoRaWAN中的几种数据包(发送与接收数据)

    本文来源微信公众号[物联网思考] 本文主要结合LoRaNode SDK v4.4.2和LoRaWAN规范1.0.3来展开. 1.数据包类型 LoRaWAN规范中有不同的数据包,通过MType字段区分, ...

  8. Android实战:CoolWeather酷欧天气(加强版数据接口)代码详解(上)

    -----------------------------------该文章代码已停更,可参考浩比天气(更新于2019/6/25)----------------------------------- ...

  9. 超级超级详细的实体关系抽取数据预处理代码详解

    超级超级详细的实体关系抽取数据预处理代码详解 由于本人是代码小白,在学习代码过程中会出现很多的问题,所以需要一直记录自己出现的问题以及解决办法. 废话不多说,直接上代码!!! 一.data_proce ...

最新文章

  1. R语言绘制线图(line)实战
  2. 静态联编与动态联编之virtual的作用
  3. original_keras_version = f.attrs[‘keras_version‘].decode(‘utf8‘)
  4. 嗅觉计算机应用,重磅!美国科技巨头宣布!计算机终于有了“嗅觉”了!
  5. Executors创建的4种线程池的使用
  6. go语言中channel的创建和销毁以及匿名函数的使用
  7. 实现quartz定时器及quartz定时器原理介绍
  8. 【排错】net::ERR_ABORTED 404
  9. c++远征之模板篇——运算符重载
  10. AI应用开发基础傻瓜书系列2-神经网络中反向传播与梯度下降的基本概念
  11. 唐人街神探:用数学方法确定罪犯位置
  12. javaWeb回忆思维导图
  13. 几何画板画椭圆_几何画板降龙十九式视频教程每天只要十分钟
  14. 如何利用jQuery post传递含特殊字符的数据
  15. 正确使用SqlConnection对象,兼谈数据库连接池
  16. KEIL中无IAP或者STC芯片型号怎么办
  17. 统计|(可/无)重复双因素方差分析一般步骤及分析表
  18. 壁挂炉计算机控制系统,DIY壁挂炉温控器连入米家实现自动和远程控制
  19. Linux中FTP设置登录欢迎词,怎么为FTP登陆用户设置欢迎语(servu)
  20. 红旗linux 优盘安装教程,硬盘简单安装红旗Linux教程

热门文章

  1. 东北大学秦皇岛分校通信工程中外合作2020级C/CPP实验8
  2. 如何让AR拥有镜子的反光效果(ios)
  3. 在Word中引用参考文献
  4. Blender 烘焙贴图 导入Unity
  5. Tcl异常处理命令之try、throw
  6. php添加水印,水印平铺整个图片
  7. 由曦:王坚在这本书里讲了他的坚持
  8. 【从零开始学爬虫】采集B站UP主数据
  9. c语言中如何表示特殊字符星星,C语言如何用代码打出星星,如下知道
  10. PHP医院手麻系统源码,大型医院手术麻醉管理系统源码