VGG16对10种猴子分类

dataset:

import os
import torch
import numpy as np
from PIL import Image
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
class Datasets(Dataset):def __init__(self,path):self.path=pathself.dataset=[]self.dataset.extend(open(os.path.join(path,"label.txt")).readlines())# self.dataset.extend(open(os.path.join(path, "negative.txt")).readlines())# self.dataset.extend(open(os.path.join(path,"part.txt")).readlines())def __getitem__(self, index):strs=self.dataset[index].strip().split( )# print(strs)image_path=os.path.join(self.path,strs[0])label=torch.Tensor([int(strs[1])])# offset=torch.Tensor([float(strs[2]),float(strs[3]),float(strs[4]),float(strs[5])])image_data=Image.open(image_path)image_data = image_data.convert('RGB')#把图片制作成正方形,否则采样的时候会报错w, h = image_data.sizebackground = Image.new('RGB', size=(max(w, h), max(w, h)), color=(127, 127, 127))  # 创建背景图,颜色值为127length = int(abs(w - h) // 2)  # 一侧需要填充的长度box = (length, 0) if w < h else (0, length)  # 粘贴的位置background.paste(image_data, box)
#VGG16输入图像尺寸224*224image_data=background.resize((224,224))image_data=torch.Tensor(np.array(image_data)/255-0.5)# image_data = torch.Tensor(np.array(Image.open(image_path)) / 255 - 0.5)# print(image_data.shape)image_data=image_data.permute(2,0,1)# print(image_data.shape)return image_data,labeldef __len__(self):return len(self.dataset)
if __name__ == '__main__':dataset1=Datasets(r"F:\study\MyProject2\2020_4_26_ten_monkey\ten_monkey\train")# print(dataset1[1008][0])# print(dataset1[1008][1])dataload=DataLoader(dataset1,batch_size=100,shuffle=False)for i,(x,y) in enumerate(dataload):print(i)print(x)

Net:

import torch
import numpy as np
from dataset import Datasets
from torch.utils.data import DataLoader
import torch.nn as nn
class Net(nn.Module):def __init__(self):super().__init__()self.layer1=nn.Sequential(#layer 1nn.Conv2d(in_channels=3,out_channels=64,kernel_size=3,padding=1,stride=1),#224*224*64# nn.MaxPool2d(kernel_size=2,stride=2)nn.ReLU(),nn.Conv2d(in_channels=64, out_channels=64, kernel_size=3,padding=1,stride=1),#224*224*64# nn.MaxPool2d(2)nn.ReLU(),#poolingnn.MaxPool2d(kernel_size=2,stride=2),#112*112*64#layer 2nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3,padding=1,stride=1),#112*112*128# nn.MaxPool2d(2),#8*8*128nn.ReLU(),nn.Conv2d(in_channels=128, out_channels=128, kernel_size=3,padding=1,stride=1),#112*112*128# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=128, out_channels=128, kernel_size=3, padding=1, stride=1),#112*112*128# nn.MaxPool2d(2)nn.ReLU(),#poolingnn.MaxPool2d(kernel_size=2, stride=2),  # 56*56*128#layer 3nn.Conv2d(in_channels=128, out_channels=256, kernel_size=3, padding=1, stride=1),#56*56*256# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=256, out_channels=256, kernel_size=3, padding=1, stride=1),  # 56*56*256# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=256, out_channels=256, kernel_size=3, padding=1, stride=1),  # 56*56*256# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),#poolingnn.MaxPool2d(kernel_size=2, stride=2),  # 28*28*256#layer 4nn.Conv2d(in_channels=256, out_channels=512, kernel_size=3, padding=1, stride=1),  # 28*28*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=512, out_channels=512, kernel_size=3, padding=1, stride=1),  # 28*28*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=512, out_channels=512, kernel_size=3, padding=1, stride=1),  # 28*28*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),#poolingnn.MaxPool2d(kernel_size=2, stride=2),  # 14*14*512#layer 5nn.Conv2d(in_channels=512, out_channels=512, kernel_size=3, padding=1, stride=1),  # 14*14*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=512, out_channels=512, kernel_size=3, padding=1, stride=1),  # 14*14*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),nn.Conv2d(in_channels=512, out_channels=512, kernel_size=3, padding=1, stride=1),  # 14*14*512# nn.MaxPool2d(2),  # 4*4*64nn.ReLU(),#poolingnn.MaxPool2d(kernel_size=2, stride=2),  # 7*7*512)self.layer2=nn.Sequential(nn.Linear(7*7*512,4096),nn.Dropout(0.5),nn.ReLU(),nn.Linear(4096, 4096),nn.Dropout(0.5),nn.ReLU(),nn.Linear(4096, 102),nn.Softmax(),)def forward(self, x):output=self.layer1(x)output=output.view(-1,7*7*512)output=self.layer2(output)return output
if __name__ == '__main__':dataset1 = Datasets(r"F:\study\MyProject2\2020_4_26_ten_monkey\ten_monkey\train")# print(dataset1[1008][0])# print(dataset1[1008][1])train_data = DataLoader(dataset1, batch_size=100, shuffle=False,drop_last=True)net = Net()optimizer = torch.optim.Adam(net.parameters())loss_func = nn.MSELoss()for epoch in range(10000):for i, (x, y) in enumerate(train_data):xs=torch.Tensor(x)output=net(xs)ys = y.long()target=torch.zeros(ys.size(0),102).scatter_(1,ys.view(-1,1),1)loss=loss_func(target,output)optimizer.zero_grad()loss.backward()optimizer.step()out=torch.argmax(output,dim=1)acc=np.mean(np.array(out==ys,dtype=np.float32))if i%10==0:print("loss:",loss.item())print("acc:",acc)

VGG16对10种猴子分类相关推荐

  1. 在PyTorch中使用Logistic回归进行10种猴子物种分类

    欢迎关注 "小白玩转Python",发现更多 "有趣" 引言 本文提供了一个使用PyTorch构建一个非常基本的 Logistic模型的简单步骤,并将其应用于猴 ...

  2. 用VGG16对102种鲜花分类

    用VGG16对102种鲜花分类 dataset: import os import torch import numpy as np from PIL import Image from torch. ...

  3. 30个深度学习库:按Python、C++、Java、JavaScript、R等10种语言分类

    30个深度学习库:按Python.C++.Java.JavaScript.R等10种语言分类 包括 Python.C++.Java.JavaScript.R.Haskell等在内的一系列编程语言的深度 ...

  4. yolov5部署以及训练10种中药材分类数据集

    记录以下我使用yolov5来训练自己数据集的过程以及遇到的坑~~~ 首先要部署yolov5的环境 首先去github上下载yolov5直达 安装依赖包 编译环境我是用的是anaconda 创建的虚拟环 ...

  5. 【人工智能项目】深度学习实现10类猴子细粒度识别

    [人工智能项目]深度学习实现10类猴子细粒度识别 任务说明 本次比赛需要选手准确识别10种猴子,数据集只有图片,没有boundbox等标注数据. 环境说明 !nvidia-smi Fri Mar 27 ...

  6. 如下10种分类算法对比Classifier comparison

    如下10种分类算法对比 names = ["Nearest Neighbors", "Linear SVM", "RBF SVM", &qu ...

  7. 区块链游戏常见的 10 种分类

    区块链游戏表面上与现有的游戏玩法并无二致,但是有了区块链的加持,玩家能够拥有独一无二的真正属于自己的数字资产,并且更加安全. 现阶段大体可以将区块链游戏分为四大类:以太坊游戏.链克游戏.公有链游戏和私 ...

  8. B2B行业网站10种经营模式研究及组合方案

    许多人对B2B网站的理解仅停留在企业对企业的在线交易上,认为按照B2B电子商务的概念就应该是在网上进行交易.但目前中国比较成功的B2B网站却并非所有都是在线交易模式,尤其是B2B行业网站,许多都没有做 ...

  9. 「数据科学家」必备的10种机器学习算法

    来源 | 雷克世界(ID:raicworld) 编译 | 嗯~是阿童木呀.KABUDA.EVA 可以说,机器学习从业者都是个性迥异的.虽然其中一些人会说"我是X方面的专家,X可以在任何类型的 ...

最新文章

  1. vi (vim) 常用命令
  2. Android绑定多个aidl,android aidl 多`module`版的实现
  3. LinkedList插入元素一定比ArrayList快吗
  4. o oia ospf 路由优先_CCNP理论之OSPF协议(二)
  5. v-model双向绑定原理_【Vue原理】VModel 白话版
  6. Web API应用架构在Winform混合框架中的应用(3)--Winfrom界面调用WebAPI的过程分解...
  7. access口 环路_利用STP解决二层环路、实现链路冗余-stp文件怎么打开
  8. python接口自动化 post请求,body 带headers参数
  9. Atitit 获取多媒体mp3 mp4 m4a元数据 G:\桌面安装\paidashi\bin\ffprobe.exe ffprobe -i 1.flv -print_format json -sh
  10. aix7.1安装12c执行root.sh无法启动ohasd服务案例
  11. 微波工程(3)——网络
  12. 罗克韦尔Studio5000遇上西门子Process Simulate:数字化仿真与虚拟调试案例
  13. 88.合并两个有序数组
  14. 如何设置条形码的尺寸
  15. 适合学生党上手测试的免费云服务器推荐
  16. centos xfs硬盘扩容
  17. PHP开发安全之近墨者浅谈(转)
  18. 008产品设计的思考(创造思维+用户体验+用户画像+用户群体)
  19. Aiml智能标记语言规范(20201216)
  20. Python网络爬虫基础

热门文章

  1. python 通过摄像头识别二维码或条形码
  2. 创业板首批十家公司今天集体招股
  3. VPP上利用IPSec加密Vxlan隧道实验
  4. 正则表达式获取url后面的参数
  5. 日文假名全半角转换空格删除
  6. python仿360界面_python实现360的字符显示界面 -电脑资料
  7. 计算机怎么会复制两份怎么解决,有两个表格,要把其中一个的内容复制到另一中,但又不是全部,怎么办...
  8. 企业级应用开发(SSM) Spring
  9. Linux-Audio Codec
  10. Java字符串替换指定位置的字符