要做一个什么样的东西

将数据加工运用到实际的应用中,处理分类和拟合。这个月最好做出一个反垃圾的产品出来。

组成部分

1、客户端:根据具体的功能抽象出一些接口。

a、文本

b、文本+用户ID

c、文本+用户ID+维度

2、抽象:对接收到的文本进行提取,最好能做到动态编译。

a、特征:数字、URL、EMAIL等。

b、维度抽象。

c、处理过程。

3、训练:

a、从已经是垃圾的内容中提取特征,最好保存在本地。

b、根据垃圾的内容训练分类模型。

4、工具:

a、特征提取的工具。

b、公用的分类模型。

处理流程

1、收到文本。

2、提取特征、抽象维度。

3、如果特征命中,返回是垃圾,否则继续。

4、根据分类模型判断是垃圾的可能性,返回结果。

CrystalBall相关推荐

  1. 透过水晶球一瞥下一代SOC

    今天,51CTO发表一篇译文<SOC 2.0:下一代安全运营中心先睹为快>,英文原文出自DarkReading,题为:SOC 2.0: A Crystal-Ball Glimpse Of ...

  2. 编写程序计算交错序列_外文翻译 | FlyMC:高度可扩展地测试分布式系统中的复杂交错...

    作者:Jeffrey F. Lukman, Huan Ke, Cesar A. Stuardo等 日期:2019年3月25日 原文链接: https://ucare.cs.uchicago.edu/p ...

  3. 【Python基础】科学计算库Scipy简易入门

    0.导语 Scipy是一个用于数学.科学.工程领域的常用软件包,可以处理插值.积分.优化.图像处理.常微分方程数值解的求解.信号处理等问题.它用于有效计算Numpy矩阵,使Numpy和Scipy协同工 ...

  4. 无数的讽刺侮辱挖苦打击否定不屑与嘲笑,只有罗永浩才撑得住吧

    亲历锤子科技发布会,先不论产品,这的的确确是一场盛大的北京科技圈社交的盛会,除了技术开发者.媒体.意见领袖,相关从业者.关注者.锤友都疯狂的在社交媒体.朋友圈直播.刷屏.转发.评论,甚至对骂.互怼,一 ...

  5. 历代显卡精彩演示DEMO赏析点评之NV篇

    1 无论ATI还是NVIDIA,每次有新显卡发布都会同时公布一个或者多个美轮美奂的演示DEMO.这些演示DEMO的设计初衷就是通过完美的3D效果征服每一位观众,让大家对新显卡的性能及技术充满憧憬和期待 ...

  6. 【机器学习基础】Scipy(科学计算库) 手把手手把手

    0.导语 Scipy是一个用于数学.科学.工程领域的常用软件包,可以处理插值.积分.优化.图像处理.常微分方程数值解的求解.信号处理等问题.它用于有效计算Numpy矩阵,使Numpy和Scipy协同工 ...

  7. gitlab .gitlab-ci.yml 文件赏析

    GitLab官方的流水线 .gitlab-ci.yml 内容 GitLab 代码仓库地址 GitLab 主流水线入口 GitLab 所有引入的流水线 共24个yaml文件,可怕啊.... stages ...

  8. activiti中的bug列表

    分享牛原创(尊重原创 转载对的时候第一行请注明,转载出处来自分享牛http://blog.csdn.net/qq_30739519) Bug [ACT-1968] - Custom Database ...

  9. [转]绿色的水晶球效果

    [img]http://dl.iteye.com/upload/attachment/435134/b797675d-eb2f-3c7f-8ed0-f612a5813b84.jpg[/img] 这东西 ...

  10. 用matlab画水晶球,如何在内部绘制带有双色颗粒的水晶球

    Ben Bolker.. 59 在R中,使用rgl包(R-to-OpenGL接口): library(rgl) n set.seed(101) randcoord d with(d,data.fram ...

最新文章

  1. go gin多层路由嵌套示例
  2. 二分查找 寻找指定数 python 实现
  3. hotspot 垃圾收集器_HotSpot增量Java垃圾收集器
  4. 拳王虚拟项目公社:网上做什么兼职副业比较容易挣到钱?虚拟资源项目是赚钱的最佳选择
  5. solr 英文模拟mysql like查询xml_Solr实现类似MySQL的LIKE查询功能
  6. 【渝粤教育】电大中专金融与税收_1作业 题库
  7. Sibelius 8 for Mac(西贝柳斯打谱软件)中文破解版
  8. TimesTen索引的概念与日常操作
  9. 描述内存分配方式以及它们的区别?
  10. python求因子个数_python怎么求因数
  11. python编程学习笔记(三)
  12. 腾讯云服务器性能评测:配置参数16核 32G 28M
  13. adt-bundle-mac android 模拟器 sd卡增加文件
  14. 三层交换机 no switchport 命令
  15. 单服务器node.js和php性能测试
  16. linux下,pip安装lap出现问题 ,已解决,亲测有效
  17. Linux下Socket编程一 socket 基础
  18. 《漫画中国式项目管理》----蒋昕炜 ,读书笔记
  19. Solution:设备管理器中Prolific USB-to-Serial Port出现黄色感叹号
  20. centos7中journal和rsyslog日志

热门文章

  1. iOS数据库的使用(三):sqlite多线程
  2. 重复的事情让机器来做,简化的思想
  3. 声明,本博客文章均为转载,只为学习,不为其他用途。感谢技术大牛的技术分享,让我少走弯路。...
  4. Aliyun mysql配置 远程访问 10038
  5. JS中的变量和输入输出
  6. Linux内核分析——第七章 链接
  7. JavaScript继承方式详解
  8. Jquery CSS 操作 - height() 方法
  9. [Java]一则自定义的XStream转换器,主要用于POJO XML反序列化为Map/List
  10. win10计算机管理字体糊,大神分析win10系统高分屏字体模糊的办法介绍