t-SNE是一种经典的降维和可视化方法,是基于SNE(Stochastic Neighbor Embedding,随机近邻嵌入)做的,要了解t-SNE就要先了解SNE。本文同样既是总结,又是读论文笔记。

SNE 随机近邻嵌入

SNE的的第一步是用条件概率来表示高维空间中样本点之间用欧氏距离度量的相似度。假设样本选择其近邻的概率与与以自身为中心的高斯分布的概率密度成正比,SNE用pj∣ip_{j|i}pji来表示高维空间样本xix_ixi会选择xjx_jxj作为其近邻的概率,二范数距离越近,pj∣ip_{j|i}pji越大,二范数距离越远,pj∣ip_{j|i}pji越小。回忆一下高斯分布的概率密度函数:
f(x)=12πσexp⁡(−(x−μ)22σ2)f(x)=\frac{1}{\sqrt{2 \pi}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2}) f(x)=2π

σ1exp(2σ2(xμ)2)

pj∣ip_{j|i}pji定义为:
pj∣i=exp⁡(−∥xi−xj∥2/2σi2)∑k≠iexp⁡(−∥xi−xk∥2/2σi2)p_{j|i}=\frac{\exp(- \|x_i-x_j \|^2/2\sigma_i^2)}{\sum_{k\neq i}\exp(-\|x_i-x_k\|^2/2\sigma_i^2)} pji=k=iexp(xixk2/2σi2)exp(xixj2/2σi2)

其中σi2\sigma_i^2σi2是以xix_ixi为中心的高斯分布的方差,其取值后面再给出。由于只对成对样本的相似性感兴趣,SNE令pi∣i=0p_{i|i}=0pii=0
对于xi,xjx_i,x_jxi,xj对应的低位表示yi,yjy_i,y_jyi,yj,用qj∣iq_{j|i}qji表示含义相似的条件概率,不同的是这里方差取1/21/\sqrt{2}1/2

,因此:
qj∣i=exp⁡(−∥yi−yj∥2)∑k≠iexp⁡(−∥yi−yk∥2)q_{j|i}=\frac{\exp(- \|y_i-y_j \|^2)}{\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)} qji=k=iexp(yiyk2)exp(yiyj2)

同样令qj∣i=0q_{j|i}=0qji=0。如果yi,yjy_i,y_jyi,yj能够正确地表征高维样本xi,xjx_i,x_jxi,xj之间的相似性,pj∣i,qj∣ip_{j|i},q_{j|i}pji,qji就应该相等,因此SNE的目标就是寻找恰当的高维样本的低维表示使得pj∣i,qj∣ip_{j|i},q_{j|i}pji,qji之间的比例失当最小。损失函数CCC用Kullback-Leibler divergence(K-L散度,互熵,文中说此处的kl熵等价于交叉熵加了一个参数)来表示:
C=∑iKL(Pi∣∣Qi)=∑i∑jpj∣ilog⁡pj∣iqj∣i(1)C=\sum_i KL(P_i||Q_i)=\sum_i\sum_j p_{j|i} \log \frac{p_{j|i}}{q_{j|i}} \tag{1} C=iKL(PiQi)=ijpjilogqjipji(1)

然后SNE用梯度下降法来求解。由于K-L散度不是对称的,C(p∥q)≠C(q∥p)C(p\|q)\neq C(q\|p)C(pq)=C(qp),因此低维映射中成对的距离的不同类型误差不是以同一权重度量的。从CCC的定义来看,pj∣ip_{j|i}pji较大时,期望寻找的qj∣iq_{j|i}qji也是较大的,pj∣ip_{j|i}pji较小时则无所谓。这说明SNE关注的主要还是如何保持局部结构(如果方差σi2\sigma_i^2σi2取值合适的话)。

接下来的问题就是设置方差值σi2\sigma_i^2σi2。SNE认为,在样本点分布比较稠密的区域,应该选择更小的方差值,否则反之。SNE设置了一个由用户调节的参数Perp(Pi)Perp(P_i)Perp(Pi)来衡量混乱度,其定义为:
Perp(Pi)=2H(Pi)H(Pi)=−∑jpj∣ilog⁡2pj∣iPerp(P_i)=2^{H(P_i)} \\ H(P_i)=-\sum_j p_{j|i}\log_2p_{j|i} Perp(Pi)=2H(Pi)H(Pi)=jpjilog2pji

H(Pi)H(P_i)H(Pi)PiP_iPi以二进制度量的香农熵。这是什么意思呢,我感觉意思就是由用户给定一个Perp(Pi)Perp(P_i)Perp(Pi)值,然后SNE给出了Perp(Pi)Perp(P_i)Perp(Pi)pj∣ip_{j|i}pji的关系,根据这个关系,用二分查找的方法来确定σi2\sigma_i^2σi2
混乱度参数可以平滑地度量有效的近邻数量,典型取值范围在5到50之间,从实验效果来看,SNE对混乱度参数的取值比较鲁棒。

SNE最小化公式(1)(1)(1)的过程是用梯度下降法来实现的,其导数惊人的简单:
∂C∂yi=2∑j(pj∣i−qj∣i+pi∣j−qi∣j)(yi−yj)\frac{\partial C}{\partial y_i}=2\sum_j(p_{j|i}-q_{j|i}+p_{i|j}-q_{i|j})(y_i-y_j) yiC=2j(pjiqji+pijqij)(yiyj)

我来试着求一下:
∂C∂qj∣i=−pj∣iqj∣ipj∣i⋅pj∣iqj∣i2=−pj∣iqj∣iqj∣i=exp⁡(−∥yi−yj∥2)∑k≠iexp⁡(−∥yi−yk∥2)∂qj∣i∂yi=exp⁡′(−∥yi−yj∥2)⋅∑k≠iexp⁡(−∥yi−yk∥2)−∑k≠i′exp⁡(−∥yi−yk∥2)⋅exp⁡(−∥yi−yj∥2)[∑k≠iexp⁡(−∥yi−yk∥2)]2=∑k≠iexp⁡(−∥yi−yk∥2)(2yi−2yk)⋅exp⁡(−∥yi−yj∥2)−exp⁡(−∥yi−yj∥2)(2yi−2yj)⋅∑k≠iexp⁡(−∥yi−yk∥2)[∑k≠iexp⁡(−∥yi−yk∥2)]2pj∣iqj∣i∂qj∣i∂yi=pj∣i∑k≠iexp⁡(−∥yi−yk∥2)(2yi−2yk)−(2yi−2yj)⋅∑k≠iexp⁡(−∥yi−yk∥2)∑k≠iexp⁡(−∥yi−yk∥2)=pj∣i[∑k≠iqk∣i2(yi−yk)−2(yi−yj)]=2pj∣i[qj∣i−1](yi−yj)+pj∣i∑k≠i,jqk∣i2(yi−yk)qi∣j=exp⁡(−∥yj−yi∥2)∑k≠jexp⁡(−∥yj−yk∥2)∂qi∣j∂yi=exp⁡(−∥yj−yi∥2)(2yj−2yi)⋅exp⁡(−∥yj−yi∥2)−exp⁡(−∥yj−yi∥2)(2yj−2yi)⋅∑k≠jexp⁡(−∥yj−yk∥2)[∑k≠jexp⁡(−∥yj−yk∥2)]2pi∣jqi∣j∂qi∣j∂yi=pi∣j(2yj−2yi)exp⁡(−∥yj−yi∥2)−(2yj−2yi)⋅∑k≠jexp⁡(−∥yj−yk∥2)∑k≠jexp⁡(−∥yj−yk∥2)=pi∣j[(2yj−2yi)qi∣j−2(yj−yi)]=2pi∣j(qi∣j−1)(yj−yi)∂C∂yi=−∑j(pj∣iqj∣i∂qj∣i∂yi+pi∣jqi∣j∂qi∣j∂yi)\frac{\partial C}{\partial q_{j|i}}=-p_{j|i}\frac{q_{j|i}}{p_{j|i}}\cdot \frac{p_{j|i}}{q_{j|i}^2}=- \frac{p_{j|i}}{q_{j|i}} \\ \ \\ q_{j|i}=\frac{\exp(- \|y_i-y_j \|^2)}{\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)} \\ \frac{\partial q_{j|i}}{\partial y_i} =\frac{ \exp '(- \|y_i-y_j \|^2)\cdot \sum_{k\neq i}\exp(-\|y_i-y_k\|^2)-\sum_{k\neq i}'\exp(-\|y_i-y_k\|^2)\cdot \exp(- \|y_i-y_j \|^2)}{[\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)]^2} \\ = \frac{\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)(2y_i-2y_k) \cdot \exp (- \|y_i-y_j \|^2)-\exp (- \|y_i-y_j \|^2)(2y_i-2y_j) \cdot \sum_{k\neq i}\exp(-\|y_i-y_k\|^2)}{[\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)]^2}\\ \frac{p_{j|i}}{q_{j|i}}\frac{\partial q_{j|i}}{\partial y_i} = p_{j|i} \frac{\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)(2y_i-2y_k) -(2y_i-2y_j) \cdot \sum_{k\neq i}\exp(-\|y_i-y_k\|^2)}{\sum_{k\neq i}\exp(-\|y_i-y_k\|^2)}\\ = p_{j|i}[\sum_{k\neq i} q_{k|i}2(y_i-y_k)-2(y_i-y_j)] \\ = 2p_{j|i}[ q_{j|i} -1](y_i-y_j)+p_{j|i}\sum_{k\neq i,j} q_{k|i}2(y_i-y_k) \\ \ \\ q_{i|j}=\frac{\exp(- \|y_j-y_i \|^2)}{\sum_{k\neq j}\exp(-\|y_j-y_k\|^2)} \\ \frac{\partial q_{i|j}}{\partial y_i}=\frac{ \exp(-\|y_j-y_i\|^2)(2y_j-2y_i)\cdot \exp(- \|y_j-y_i \|^2) -\exp(- \|y_j-y_i \|^2)(2y_j-2y_i)\cdot \sum_{k\neq j}\exp(-\|y_j-y_k\|^2) }{[\sum_{k\neq j}\exp(-\|y_j-y_k\|^2)]^2} \\ \frac{p_{i|j}}{q_{i|j}}\frac{\partial q_{i|j}}{\partial y_i} =p_{i|j} \frac{ (2y_j-2y_i)\exp(- \|y_j-y_i \|^2) -(2y_j-2y_i)\cdot \sum_{k\neq j}\exp(-\|y_j-y_k\|^2) }{\sum_{k\neq j}\exp(-\|y_j-y_k\|^2)} \\ = p_{i|j}[(2y_j-2y_i)q_{i|j}- 2(y_j-y_i)] \\ = 2p_{i|j}(q_{i|j}-1)(y_j-y_i) \\ \ \\ \frac{\partial C}{\partial y_i}=-\sum_j (\frac{p_{j|i}}{q_{j|i}}\frac{\partial q_{j|i}}{\partial y_i}+\frac{p_{i|j}}{q_{i|j}}\frac{\partial q_{i|j}}{\partial y_i}) \\ qjiC=pjipjiqjiqji2pji=qjipjiqji=k=iexp(yiyk2)exp(yiyj2)yiqji=[k=iexp(yiyk2)]2exp(yiyj2)k=iexp(yiyk2)k=iexp(yiyk2)exp(yiyj2)=[k=iexp(yiyk2)]2k=iexp(yiyk2)(2yi2yk)exp(yiyj2)exp(yiyj2)(2yi2yj)k=iexp(yiyk2)qjipjiyiqji=pjik=iexp(yiyk2)k=iexp(yiyk2)(2yi2yk)(2yi2yj)k=iexp(yiyk2)=pji[k=iqki2(yiyk)2(yiyj)]=2pji[qji1](yiyj)+pjik=i,jqki2(yiyk)qij=k=jexp(yjyk2)exp(yjyi2)yiqij=[k=jexp(yjyk2)]2exp(yjyi2)(2yj2yi)exp(yjyi2)exp(yjyi2)(2yj2yi)k=jexp(yjyk2)qijpijyiqij=pijk=jexp(yjyk2)(2yj2yi)exp(yjyi2)(2yj2yi)k=jexp(yjyk2)=pij[(2yj2yi)qij2(yjyi)]=2pij(qij1)(yjyi)yiC=j(qjipjiyiqji+qijpijyiqij)

不好意思我求不出来。

继续看论文。物理上看,这个梯度可以理解为yiy_iyi和所有其他的yjy_jyj之间存在的“流(spring)”合在一起构成的合力,所有的流构成了沿着yi−yjy_i-y_jyiyj方向的合力。yi,yjy_i,y_jyi,yj之间的流是否抵制或吸引样本点,取决于二者之间的距离是否会过大或过小地表示xi,xjx_i,x_jxi,xj之间的距离。
为了避免局部最优解,SNE还给梯度添加了一项很大的动量项。换句话来讲,当前的梯度被加上了一项指数衰减的之前的梯度:
Y(t)=Y(t−1)+η∂C∂Y+α(t)(Y(t−1)−Y(t−2))\mathcal{Y}^{(t)}=\mathcal{Y}^{(t-1)}+\eta \frac{\partial C}{\partial \mathcal{Y}}+\alpha(t)(\mathcal{Y}^{(t-1)}-\mathcal{Y}^{(t-2)}) Y(t)=Y(t1)+ηYC+α(t)(Y(t1)Y(t2))

其中Y(t)\mathcal{Y}^{(t)}Y(t)表示当前迭代轮次的解,η\etaη为学习率,α(t)\alpha(t)α(t)表示当前迭代轮次的动量。
在优化刚开始的时候,每次迭代都会给样本点添加高斯噪声,可以起到一个退火的效果,避免局部最优解。如果噪声的方差改变缓慢,SNE就可以寻找到更好的全局最优解。然而这对噪声数量和衰减速率很敏感,往往需要在一个数据集上训练多次以寻找合适的参数,从这个意义上讲SNE不如一些可以遵循凸优化原则的方法,如果能找到一种不需要额外计算和参数的方法就更好了。这样就引出了t-SNE。

Hinton发明的这个SNE跟神经网络的一些做法都很相似了。t-SNE作者在论文里对SNE的批评也和对多数神经网络的批评一样。我读着这些东西都快要走到深度学习的路上去了。

对称SNE

t-SNE(t-Distributed Stochastic Neighbor Embedding,t分布的SNE)的目标是优化SNE的上述缺点。与SNE不同的是,t-SNE的损失函数(1)是对称的,且有更简单的梯度;(2)使用t分布(Student-t distribution)而非高斯分布来样本在低维空间的相似性。t-SNE在低维空间使用重尾分布(heavy-tailed distribution)来缓解SNE的弊端。

CCC的定义不变:
C=∑iKL(Pi∣∣Qi)=∑i∑jpijlog⁡pijqijC=\sum_i KL(P_i||Q_i)=\sum_i\sum_j p_{ij} \log \frac{p_{ij}}{q_{ij}} C=iKL(PiQi)=ijpijlogqijpij

同样令pii=qii=0p_{ii}=q_{ii}=0pii=qii=0,不过t-SNE希望pij=pji,qij=qjip_{ij}=p_{ji},q_{ij}=q_{ji}pij=pji,qij=qji,即具有对称性。因此定义:
pij=exp⁡(−∥xi−xj∥2/2σ2)∑k≠lexp⁡(−∥xk−xl∥2/2σ2)qij=exp⁡(−∥yi−yj∥2)∑k≠lexp⁡(−∥yk−yl∥2)p_{ij}=\frac{\exp(-\|x_i-x_j\|^2/2\sigma^2)}{\sum_{k\neq l} \exp(-\|x_k-x_l\|^2/2\sigma^2)} \\ q_{ij}=\frac{\exp(-\|y_i-y_j\|^2)}{\sum_{k\neq l} \exp(-\|y_k-y_l\|^2)} pij=k=lexp(xkxl2/2σ2)exp(xixj2/2σ2)qij=k=lexp(ykyl2)exp(yiyj2)

但是这样会造成一个问题,如果xix_ixi是个outlier(即如果所有其他样本距离它的距离都很远),pijp_{ij}pij就会很小,此时xix_ixiCCC就只有很小的影响,也就是说除了yiy_iyi的位置并没有很好地被其他样本影响。为了规避这个问题,令pij=pj∣i+pi∣j2np_{ij}=\frac{p_{j|i}+p_{i|j}}{2n}pij=2npji+pij,这样对于所有的样本点xix_ixi都保证了∑jpij>12n\sum_j p_{ij}>\frac{1}{2n}jpij>2n1,每个样本点都能对损失函数CCC产生显著影响。而且这样一来梯度公式就会更简单:
∂C∂yi=4∑j(pij−qij)(yi−yj)\frac{\partial C}{\partial y_i}=4\sum_j(p_{ij}-q_{ij})(y_i-y_j) yiC=4j(pijqij)(yiyj)

我来试着求一下:
∂C∂yi=−∑j(pijqij∂qij∂yi+pjiqji∂qji∂yi)∂qij∂yi=−qij⋅2(yi−yj)∂qji∂yi=−qji⋅2(yj−yi)=qji⋅2(yi−yj)∂C∂yi=∑j[pij⋅2(yi−yj)−pji⋅2(yi−yj)]=2∑j(pij−pji)(yi−yj)\frac{\partial C}{\partial y_i}=-\sum_j (\frac{p_{ij}}{q_{ij}}\frac{\partial q_{ij}}{\partial y_i}+\frac{p_{ji}}{q_{ji}}\frac{\partial q_{ji}}{\partial y_i}) \\ \ \\ \frac{\partial q_{ij}}{\partial y_i}= -q_{ij} \cdot 2(y_i-y_j) \\ \frac{\partial q_{ji}}{\partial y_i}=-q_{ji}\cdot 2(y_j-y_i) =q_{ji}\cdot 2(y_i-y_j) \\ \frac{\partial C}{\partial y_i} = \sum_j [p_{ij}\cdot 2(y_i-y_j) - p_{ji}\cdot 2(y_i-y_j)] =2\sum_j (p_{ij}-p_{ji})(y_i-y_j)\\ yiC=j(qijpijyiqij+qjipjiyiqji)yiqij=qij2(yiyj)yiqji=qji2(yjyi)=qji2(yiyj)yiC=j[pij2(yiyj)pji2(yiyj)]=2j(pijpji)(yiyj)

还是求不出来。后面再看看吧。继续读论文。

文章提出了一个开创性的观点:“crowding problems”:如果高维空间中有许多点均匀地分布在样本iii周围,并且现在希望将这些点映射到二维空间中,那么在二维空间中可得的能够容纳适度远的点的区域将没有可以容纳临近点的区域大。因此,如果我们希望在二维空间准确地描述较小的距离,就必须把样本iii周围适当距离的点放到二维空间更远的距离上。

t-SNE

t-SNE使用的是只有一个自由度的Student t分布(与柯西分布相同)来定义qijq_{ij}qij
qij=(1+∥yi−yj∥2)−1∑k≠l(1+∥yk+yl∥2)−1q_{ij}=\frac{(1+\|y_i-y_j\|^2)^{-1}}{\sum_{k\neq l} (1+\|y_k+y_l\|^2)^{-1}} qij=k=l(1+yk+yl2)1(1+yiyj2)1

这东西的好处在于,使得联合概率的表示对于样本在高维和低维空间距离尺度的变化几乎不敏感,而且大的比较分散的点集就像独立的点一样互相作用,其优化操作与SNE和对称SNE相同,但是尺度更合适。一种理论支持是,Student t分布是高斯分布的无穷混合,与高斯分布非常接近。而且由于没有指数项,Student t分布也会让计算更方便。偏导直接给出:
∂C∂yi=4∑j(pij−qij)(yi−yj)(1+∥yi−yj∥2)−1\frac{\partial C}{\partial y_i}=4\sum_j (p_{ij}-q_{ij})(y_i-y_j)(1+\|y_i-y_j\|^2)^{-1} yiC=4j(pijqij)(yiyj)(1+yiyj2)1

t-SNE总体流程如下:

文章说t-SNE的效果还可以通过两个trick进一步提高。一是“提前压缩”,即在优化开始前令样本全都聚集在一起,这样便于样本簇互相移动穿越,并且更便于寻找全局最优。

降维系列之 SNE与t-SNE相关推荐

  1. 五、降维——从SNE到t-SNE再到LargeVis

    0x00 前言 本文谢绝转载,如有需要请联系bindog###outlook.com,###换成@ 数据可视化是大数据领域非常倚重的一项技术,但由于业内浮躁的大环境影响,这项技术的地位渐渐有些尴尬.尤 ...

  2. 从SNE到t-SNE再到LargeVis

    0x00 前言 本文谢绝转载,如有需要请联系bindog###outlook.com,###换成@ 数据可视化是大数据领域非常倚重的一项技术,但由于业内浮躁的大环境影响,这项技术的地位渐渐有些尴尬.尤 ...

  3. SNE(Service Network Engine)

    1 背景 随着NGN.IMS等以IP为承载核心的网络逐步投入建设和商用,以及3G.WiFi.WiMAX等无线接入技术的不断涌现,电信业务超向于: 融合 用户可以通过多种终端.多种接入手段随时随地享受多 ...

  4. 降维的基本知识点总结

    降维的基本知识点总结 降维方法分为线性和非线性降维,非线性降维又分为基于核函数和基于特征值的方法. 线性降维: PCA.ICA.LDA.LFA.LPP 非线性降维: 基于核函数的方法:KPCA.KIC ...

  5. t-sne算法用于处理词嵌入中的高维降维问题

    Chrispher 关于 留言板 时间轴 笔记专题 课程图谱 t-SNE完整笔记 2017年02月05日  机器学习  机器学习 字数:26531 t-SNE(t-distributed stocha ...

  6. 可视化降维方法 t-SNE

    本篇主要介绍很好的降维方法t-SNE的原理 详细介绍了困惑度perplexity对有效点的影响 首先介绍了SNE 然后在SNE的基础上进行改进:1.使用对称式.2.低维空间概率计算使用t分布 t-SN ...

  7. 高维信息降维可视化常用算法比较

    我们人类比较容易理解三维以内的信息,在做数据分析挖掘以前,先要对数据集有个浅显的认识,比如统计分布.可视化.相关性等.这里引入了常用降维算法模型原理,对MNIST 784维数据做可视化和结果对比展示, ...

  8. 降维(二)----Laplacian Eigenmaps

    降维系列: 降维(一)----说说主成分分析(PCA)的源头 降维(二)----Laplacian Eigenmaps --------------------- 前一篇文章中介绍了主成分分析.PCA ...

  9. 降维(一)----说说主成分分析(PCA)的源头

    降维系列: 降维(一)----说说主成分分析(PCA)的源头 降维(二)----Laplacian Eigenmaps --------------------- 前一篇文章中介绍了主成分分析.PCA ...

  10. 数据降维降维(二)----Laplacian Eigenmaps

    改章节个人在上海游玩的时候突然想到的...之前就有想写几篇关于数据降维的博客,所以回家到之后就奋笔疾书的写出来发布了 降维系列: 降维(一)----说说主成分分析(PCA)的源头 降维(二)----L ...

最新文章

  1. 西安翻译学院计算机分数线,西安翻译学院录取投档线
  2. oracle中判断空,Oracle中判断空游标的方法
  3. Java常见排序算法之堆排序
  4. 震惊!阿里的程序员竟被一个简单的 SQL 查询难住了!
  5. PHP - 图像处理
  6. 【kafka】kafka 中 消息 record 格式
  7. JQuery杂项方法
  8. Quartz开发-插件开发
  9. java重载函数_JAVA函数的重载和重写
  10. python中grid的用法_SVM中如何使用grid.py
  11. 魔抓编程_编程中的魔数是什么?
  12. 剖析 Chrome 的小恐龙游戏
  13. MT5 EA交易期货-获得持仓
  14. 金错刀对话口袋购物王珂:找到痛点,确认卖点,制造爆点!
  15. 《人体解剖学(基础医学)》
  16. 解决Android 8.1 获取不到wifi名称
  17. Java按钮监听器ActionListener 事件监听教程.
  18. 2019牛客暑期多校训练营(第七场)-B Irreducible Polynomial(多项式因式分解)
  19. 提升客户生命周期价值(CLV)的5大方法
  20. wps云文档回收站在哪_获得自己的云并回收数据

热门文章

  1. DevExpress Dashboard for .NET简化商业智能开发
  2. ASP.NET 2.0使用Web Part创建应用程序之一(共二)
  3. centos下mysql备份数据库命令_[CentOS]下mysql数据库常用命令总结
  4. python dataframe行数_python – 如何在DataFrame中增加groupby中的行数
  5. python根据关键词下载图片_python批量下载PPT图片,看完本代码你也会批量下载图片...
  6. java 继承特点_java 继承特点
  7. dbf文件转excel_Excel批量转PDF,关键一步不能忘
  8. mysql延迟写入概念_三分钟了解MySQL的简单概念
  9. nginx启动vue_nginx下部署vue项目的方法步骤
  10. 日语python_Python日志和日语(或任何非ascii)