介绍ML.NET——面向.NET开发人员的机器学习库
目录
介绍
背景
二元分类问题
创建.NET应用程序并安装ML.NET库
使用代码
培训数据
数据类
创建和训练ML模型
评估模型
测试模型
兴趣点
介绍
大多数常见的机器学习(ML)库都是用Python编写的,对.NET开发人员来说并不容易。ML.NET库是ML库和.NET应用程序之间的桥梁。
ML.NET是一个开源库,可以直接在.NET应用程序中使用。在本文中,我将介绍如何在Visual Studio 2017中使用ML.NET库(我正在使用VS 2017社区版)。
背景
二元分类问题
假设我们有两个点(在二维空间中)是红色和蓝色的组,我们将根据此点的坐标(x和y)来预测一个点是属于该Red组还是属于该Blue组。我们的培训数据如下所示:
3 -2 Red
-2 3 Red
-1 -4 Red
2 3 Red
3 4 Red
-1 9 Blue
2 14 Blue
1 17 Blue
3 12 Blue
0 8 Blue
我们有十行点组。每行的两个第一个值是每个点的坐标(x和y),第三个值是该点所属的组。
因为我们只有两个输出,Blue或者Red,我们的问题是二元分类问题。解决二元分类问题有很多不同的ML技术,在本文中,我将使用Logistic Regression,因为它是最简单的ML算法。
创建.NET应用程序并安装ML.NET库
为简单起见,我们将创建一个Console Application C#(.NET Framework)并命名它为MyFirstMLDOTNET。在Solution Explorer窗口中,我们还将Program.cs重命名为MyFirstMLDOTNET.cs:
我们可以通过右键单击MyFirstMLDOTNET项目并选择Manage NuGet Packages 来安装ML.NET :
在NuGet窗口中,我们选择Browse选项卡并在Search字段中输入' ML.NET '。最后,我们选择Microsoft.ML并单击Install按钮:
单击“预览更改”中的“确定”,然后在“许可证接受”中单击“ 我接受 ”。几秒钟后,Visual Studio将在“输出”窗口中响应一条消息:
此时,如果我们尝试运行我们的应用程序,我们可以收到如下错误消息:
通过右键单击MyFirstMLDOTNET项目并选择“属性” 来解决此错误。在Properties窗口中,我们选择左侧的Built选项,并在Plaform目标选项中将Any CPU更改为x64:
我们还需要选择.NET Framework的4.7版本(或更高版本),因为我们将遇到早期版本的一些错误。我们可以通过选择左侧的Application项并在Target framework项中选择版本来选择.NET Framework的版本。如果我们没有4.7版本(或更高版本),我们可以选择Install other frameworks,我们将被引导到Microsoft页面下载并安装.NET Framework包:
到目前为止,我们可以尝试再次运行我的应用程序,它是成功的。
使用代码
培训数据
在创建ML模型之前,我们必须通过右键单击MyFirstMLDOTNET项目并选择Add> New Item 来创建训练数据文件,选择Text File类型并在Name字段中输入myMLData.txt:
单击“ 添加”按钮。在myMLData.txt窗口中,我们输入(或复制上面)训练数据:
3 -2 Red
-2 3 Red
-1 -4 Red
2 3 Red
3 4 Red
-1 9 Blue
2 14 Blue
1 17 Blue
3 12 Blue
0 8 Blue
单击“ 保存”并关闭myMLData.txt窗口。
数据类
创建训练数据文件后,我们还需要创建数据类。类(命名为myData)定义训练数据的结构(两个坐标(x和y)和一个标签(Red或Blue))
public class myData{[Column(ordinal: "0", name: "XCoord")]public float x;[Column(ordinal: "1", name: "YCoord")]public float y;[Column(ordinal: "2", name: "Label")]public string Label;}
另一个类(命名为myPrediction)保存预测信息:
public class myPrediction{[ColumnName("PredictedLabel")]public string PredictedLabels;}
创建和训练ML模型
我们可以创建ML模型并训练它:
//creating a ML model
var pipeline = new LearningPipeline();
// loading the training data
string dataPath = "..\\..\\myMLData.txt";
pipeline.Add(new TextLoader(dataPath).CreateFrom<myData>(separator: ' '));
//convert string (Red or Blue) to number (0 or 1)
pipeline.Add(new Dictionarizer("Label"));
//combining the two predictor variables (XCoord and YCoord)
//into an aggregate (Features)
pipeline.Add(new ColumnConcatenator("Features", "XCoord", "YCoord"));
//using the Logistic Regression technique for a binary classification problem
pipeline.Add(new LogisticRegressionBinaryClassifier());
pipeline.Add(new PredictedLabelColumnOriginalValueConverter(){ PredictedLabelColumn = "PredictedLabel" });
//training the ML model
Console.WriteLine("\nStarting training \n");
var model = pipeline.Train<myData, myPrediction>();
评估模型
我们可以按如下方式评估我们的ML模型:
var testData = new TextLoader(dataPath).CreateFrom<myData>(separator: ' ');
var evaluator = new BinaryClassificationEvaluator();
var metrics = evaluator.Evaluate(model, testData);
double acc = metrics.Accuracy * 100;
Console.WriteLine("Model accuracy = " + acc.ToString("F2") + "%");
测试模型
最后,我们可以用一个新点测试我们的模型:
myData newPoint = new myData(){ x = 5f, y = -7f};
myPrediction prediction = model.Predict(newPoint);
string result = prediction.PredictedLabels;
Console.WriteLine("Prediction = " + result);
我们所有代码都在MyFirstMLDOTNET.cs文件中:
using System;
using Microsoft.ML.Runtime.Api;
using System.Threading.Tasks;
using Microsoft.ML.Legacy;
using Microsoft.ML.Legacy.Data;
using Microsoft.ML.Legacy.Transforms;
using Microsoft.ML.Legacy.Trainers;
using Microsoft.ML.Legacy.Models;namespace MyFirstMLDOTNET
{class MyFirstMLDOTNET{public class myData{[Column(ordinal: "0", name: "XCoord")]public float x;[Column(ordinal: "1", name: "YCoord")]public float y;[Column(ordinal: "2", name: "Label")]public string Label;}public class myPrediction{[ColumnName("PredictedLabel")]public string PredictedLabels;}static void Main(string[] args){//creating a ML modelvar pipeline = new LearningPipeline();// loading the training datastring dataPath = "..\\..\\myMLData.txt";pipeline.Add(new TextLoader(dataPath).CreateFrom<myData>(separator: ' '));//convert string (Red or Blue) to number (0 or 1)pipeline.Add(new Dictionarizer("Label"));//combining the two predictor variables (XCoord and YCoord)//into an aggregate (Features)pipeline.Add(new ColumnConcatenator("Features", "XCoord", "YCoord"));//using Logistic Regression technique for a binary classification problempipeline.Add(new LogisticRegressionBinaryClassifier());pipeline.Add(new PredictedLabelColumnOriginalValueConverter(){ PredictedLabelColumn = "PredictedLabel" });//training and saving the ML modelConsole.WriteLine("\nStarting training \n");var model = pipeline.Train<myData, myPrediction>();//Evaluating the Modelvar testData = new TextLoader(dataPath).CreateFrom<myData>(separator: ' ');var evaluator = new BinaryClassificationEvaluator();var metrics = evaluator.Evaluate(model, testData);double acc = metrics.Accuracy * 100;Console.WriteLine("Model accuracy = " + acc.ToString("F2") + "%");//Predicting a new point (5,-7)myData newPoint = new myData(){ x = 5f, y = -7f};myPrediction prediction = model.Predict(newPoint);string result = prediction.PredictedLabels;Console.WriteLine("Prediction = " + result);Console.WriteLine("\nEnd ML.NET demo");Console.ReadLine();}}
}
运行我们的应用程序并获得如下所示的结果:
兴趣点
在本文中,我只介绍了ML.NET - .NET开发人员的机器学习库 - 基本上。ML.NET仍在开发中,您可以通过此处的教程了解有关此库的更多信息。
原文地址:https://www.codeproject.com/Articles/1268051/Introducing-the-ML-NET-A-Machine-Learning-Library
介绍ML.NET——面向.NET开发人员的机器学习库相关推荐
- 面向 Java 开发人员的 Ajax: 构建动态的 Java 应用程序
面向 Java 开发人员的 Ajax: 构建动态的 Java 应用程序 Ajax 为更好的 Web 应用程序铺平了道路 在 Web 应用程序开发中,页面重载循环是最大的一个使用障碍,对于 Java™ ...
- 面向.NET开发人员的Dapr——状态管理
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——发布和订阅
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——服务调用
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——绑定
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——可观察性
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——机密
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 面向.NET开发人 ...
- 面向.NET开发人员的Dapr——参考应用程序
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr 面向.NET开发人员的Dapr--入门 Dapr refe ...
- 面向.NET开发人员的Dapr——入门
目录: 面向.NET开发人员的Dapr--前言 面向.NET开发人员的Dapr--分布式世界 面向.NET开发人员的Dapr--俯瞰Dapr Get started with Dapr Dapr 入门 ...
最新文章
- easyui treegrid idField 所在属性中值有花括号(如Guid)当有鼠标事件时会报错,行记录一下...
- 重磅 | 19 页花书精髓笔记!你可能正需要这份知识清单
- java基础语法3 方法
- LeetCode-438. 找到字符串中所有字母异位词
- mysql跳脱字符 单引号_MYSQL特殊字符(单引号,行尾斜杠)的处理
- Freeswitch+Sip.js实现软电话功能
- 【Error】Android: java.lang.RuntimeException: Can't toast on a thread that has not called Looper.prepa
- MenuetOS, FreeDOS 有了新的发行
- Hazelcast IMDG参考中文版手册-第三章-概述
- 项目管理工具之甘特图
- 教你一招:Win10切换输入法与Win7一样(Ctrl + 空格)
- 电视盒子有哪些软件支持电视节目回看?
- 收购Beat Game,Facebook离“VR游戏社交王国”梦还有多远?
- 林大计算机学子第一篇博客
- 怎么把视频里的音乐提取成音频?一分钟帮你搞定
- Android app集成支付宝支付
- CCTV-8K超高清频道开播,“百城千屏”公共大屏项目启动,博冠8K助力实现“科技冬奥·8K看奥运”
- tp5 + workerman 实现聊天室
- kubernetes自动伸缩
- 软银的孙正义与Vision Fund
热门文章
- cuda linux 算力_华为AI再进化,CANN 3.0释放算力狂魔
- redhat怎样修改语言_硕士博士个人陈述(PS)辅导及修改服务带你极速前进!
- PSD分层模板,助你设计出有创意的圣诞海报
- 火热抢购(双11)双12通用海报设计素材,PSD分层!
- sonar覆盖率怎么统计的_实战|Java 测试覆盖率 Jacoco插桩的不同形式总结和踩坑记录(上)...
- 10进制转16进制 java_Java中将10进制转换成16进制
- python安装环境配置
- 数组在内存中存储方式
- GDB Checkpoints
- Remixer-谷歌的UI参数动态修改框架