《一种面向主题的 Flickr 组内照片浏览方法》
创新点/意义:提出一种面向主题的照片浏览算法,解决Flickr里缺乏明确主题的组中的照片浏览。
研究思路:1.建立“标签——照片”的矩阵空间;
2.非负矩阵分解NMF,学习照片之间的潜在语义关联,找出主题;
3.综合照片的各种属性建立主题内照片印象力计算模型;
4.在Flickr数据集上对该方法进行验证。
文章架构:
1.引言部分:技术发展促进了Flickr网站的流行->介绍Flickr的实现,引出组
->对组的概念细分,引出本文的主要研究对象:缺乏明确主题的组
->主题明确的组的研究:{Ne- goescu:采用LDA将相同主题的组进行聚类,提出基于主题的组的浏览方式}
{郑楠老师前期的研究:通过三维标注关系,提出一种基于张量分解的个性化组推荐模型}
->缺乏明确主题的组:本文提出一种面向主题的照片浏览方法
2.面向主题的照片浏览方法:
2.1建立矩阵空间:
1.Z ∈ R(I×J)其中 I,J 分别表示标签和照片的个数;
2.矩阵的元素表示用户使用了标签i标注了照片j的次数,如果没有就设为0;
3.每一列表示某一张照片被打上的标签的集合(集合里面的数值表示被对应的标签标注的次数);
每一行表示被该标签标注过的图片的集合(非0值表示被标注过)
2.2基于非负矩阵分解的照片主题发现
1.非负矩阵分解早期的研究证明了该算法在挖掘标签语义方面的可行性;
2.非负矩阵分解是在进行数据预处理:{
1.非负矩阵分解的思想:用两个非负矩阵的乘积逼近原始矩阵 Z,将IJ的的矩阵分解成IR和R*J的两个矩阵,R是分解的主题数目;
2.通过乘性迭代规则达成将损失函数最小化的非负矩阵分解目标;
这部分要不断地迭代(为了逼近所需目标或结果,不断重复反馈),设最大迭代步数为M;
通过对非负矩阵误差的不断迭代,找出当误差变化幅度很小时的R与M。
3.将系数矩阵的每一行归一化后,矩阵中相应位置的值代表对应照片在相应主题中所占的权重,权重越大表示照片在相应主题的重要性越大;
4.排序,选取权重较大的值构成属于该主题的照片集合。
}
2.3照片影响力要素分析及计算模型——数据分析
照片的质量和上传照片的时间反映了照片的影响力
1.照片的质量:
Att:根据照片浏览次数计算照片关注度
Pref:根据照片好评次数计算照片喜好度
Qua = a × Pref + b × Att a+b=1,80/20法则;
好评信息的数量更能体现照片的质量;
2.时间影响:
Inf = Time( tlast,tthis) × Qua
通过使用指数遗忘函数定义时间参数,来平衡上传时间越长的照片,浏览次数和好评次数越多所带来的不公平;

3.实验分析:3.1数据描述;3.2参数设定:通过数据的验证,分析解释了模型中的参数主题数目 R,与最大迭代步数M的取值      3.3非负矩阵分解结果分析:3.3.1稀疏性:除了少数照片具有较高的权重外,绝大多数照片的权重近似为 0. 分解结果的稀疏性能够有效地凸显出与主题相关的照片;3.3.2语义关联性:验证非负矩阵分解挖掘到的实体之间的潜在语义关联是否有效;3.4.面向主题的照片浏览展示:该系统能够利用社会标注系统中的标注信息较准确地区分照片的主题。技术层面:通过JSP技术实现浏览器的HTML页面输出,Servlet实现客户端和服务器上的数据库连接,后端用MYSQL管理。
方法优势:

1.通过浏览组内照片,对涉及的领域更直观的了解;
2.更快速定位相关主题的照片;
3.模型基于照片的质量与新颖度对照片的进行更有效的排序,可以更便利的浏览最新的高质量照片;
4.简单的分类导航贴近用户的实际需求,更快速的获取信息。
5.照片和标签都是动态变化的,后台定期更新的机制,在后台定期采用非负矩阵分解方法提取照片的主题。
4.结束语:对本文提出的实验方法再次总结论述。

补充学习:
Web2.0技术具备的要素:
*网站应该能够让用户把数据在网站系统内外倒腾。——基于RSS/ATOM/RDF/FOAF等XML数据的同步、聚合和迁移。
*用户在网站系统内拥有自己的数据——微内容:英文是microcontent。用户所生产的任何数据都算是微内容。
*完全基于Web,所有的功能都能透过浏览器完成。——通过openapi,数据提供商开放了自己的数据,通过mashup将信息孤岛连接起来。
以 Flickr、 Delicious 等为代表的社会标注类网站:
服务于用户个体的微内容的收集、创建、发布、管理、分享、合作、维护等的平台。
比如说:微博,FaceBook,QQ空间

网络应用程序的三层结构:
三层网络架构设计的网络有三个层次:核心层(网络的高速交换主干)、汇聚层(提供基于策略的连接)、接入层 (将工作站接入网络)。

JSP(全称JavaServer Pages):
JSP部署于网络服务器上,可以响应客户端发送的请求,并根据请求内容动态地生成HTML、XML或其他格式文档的Web网页,然后返回给请求者。JSP技术以Java语言作为脚本语言,为用户的HTTP请求提供服务,并能与服务器上的其它Java程序共同处理复杂的业务需求。
JSP将Java代码和特定变动内容嵌入到静态的页面中,实现以静态页面为模板,动态生成其中的部分内容。也可以创建JSP标签库,然后像使用标准HTML或XML标签一样使用它们。标签库能增强功能和服务器性能,而且不受跨平台问题的限制。
JSP文件在运行时会被其编译器转换成更原始的Servlet代码。JSP编译器可以把JSP文件编译成用Java代码写的Servlet,然后再由Java编译器来编译成能快速执行的二进制机器码,也可以直接编译成二进制码。

Servlet:
Java Servlet 是运行在 Web 服务器或应用服务器上的程序,它是作为来自 Web 浏览器或其他 HTTP 客户端的请求和 HTTP 服务器上的数据库或应用程序之间的中间层。
使用 Servlet,可以收集来自网页表单的用户输入,呈现来自数据库或者其他源的记录,还可以动态创建网页。

《一种面向主题的 Flickr 组内照片浏览方法》阅读笔记相关推荐

  1. trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer

    一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...

  2. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

  3. Transformers包tokenizer.encode()方法源码阅读笔记

    Transformers包tokenizer.encode()方法源码阅读笔记_天才小呵呵的博客-CSDN博客_tokenizer.encode

  4. 源码阅读笔记 BiLSTM+CRF做NER任务 流程图

    源码阅读笔记 BiLSTM+CRF做NER任务(二) 源码地址:https://github.com/ZhixiuYe/NER-pytorch 本篇正式进入源码的阅读,按照流程顺序,一一解剖. 一.流 ...

  5. Mina源码阅读笔记(一)-整体解读

    2019独角兽企业重金招聘Python工程师标准>>> 今天的这一节,将从整体上对mina的源代码进行把握,网上已经有好多关于mina源码的阅读笔记,但好多都是列举了一下每个接口或者 ...

  6. “CoreCLR is now Open Source”阅读笔记

    英文原文:CoreCLR is now Open Source 阅读笔记如下: CoreCLR是.NET Core的执行引擎,功能包括GC(Garbage Collection), JIT(将CIL代 ...

  7. QCon 2015 阅读笔记 - 团队建设

    QCon 2015阅读笔记 QCon 2015 阅读笔记 - 移动开发最佳实践 QCon 2015 阅读笔记 - 团队建设 中西对话:团队管理的五项理论和实战 - 谢欣.董飞(今日头条,LinkedI ...

  8. 05《软件需求模式》阅读笔记

    剩下的两个阅读笔记写第二部分.各类需求模式,共八个领域和它的需求模式,这一次写前四个. 基础需求模式,它是所有种类的系统都可能需要的一些东西.系统间接口需求模式使用系统间接口需求模式定义被定义的系统和 ...

  9. [置顶] Linux协议栈代码阅读笔记(一)

    Linux协议栈代码阅读笔记(一) (基于linux-2.6.21.7) (一)用户态通过诸如下面的C库函数访问协议栈服务 int socket(int domain, int type, int p ...

  10. 大型网站技术架构:核心原理与案例分析阅读笔记二

    大型网站技术架构:核心原理与案例分析阅读笔记二 网站架构设计时可能会存在误区,其实不必一味追随大公司的解决方案,也不必为了技术而技术,要根据本公司的实际情况,制定适合本公司发展的网站架构设计,否则会变 ...

最新文章

  1. HTML的标签描述24
  2. DNA测序技术的发展史之——第一代测序技术
  3. python3连接oracle教程,Pycharm中Python3连接Oracle
  4. logstash导入数据到Elasticsearch踩过的坑详解
  5. Hyper-V P2V转换遇到的问题
  6. 一次向svn中增加所有新增文件 svn add all new files【转】
  7. android 关闭软键盘_HTC官方社区明天正式关闭,收入持续下滑或是直接原因
  8. char str[] 和 char *str 的区别
  9. spark shuffle的写操作之准备工作
  10. Python程序开发——第二章 条件语句和循环语句
  11. Linux账号和权限管理详解(超详细示例操作)!
  12. MyEclipse下SVN的配置(下载及其配置)
  13. C#开发终端式短信的原理和方法
  14. 壕!腾讯再公布股权激励:2.97万员工 人均49万港元
  15. java字节流复制_Java使用字节流复制文件的方法
  16. db2 导出换行_数据库 db2 换行符
  17. 《嵌入式Linux基础教程学习笔记一》
  18. SpringBoot使用快递鸟进行电子面单的获取以及打印
  19. Linux远程服务器环境搭建
  20. rust编程 UI框架 -druid -Selector选择器

热门文章

  1. layuiadmin监听提交,增加修改和查询
  2. 科技类的学术论文配图用什么字体最好?-测试狗
  3. 社工工具安全测试-Seeker和ngrok
  4. 消息队列MQ与微消息队列MQTT
  5. PDF的文本工具在哪里?有哪些工具怎么用?
  6. 从数字孪生到未来AR基础架构——AR Cloud是把双刃剑吗?
  7. 休闲零食混战:三只松鼠“守淘”,良品铺子“攻抖”
  8. Java IDE使用基础
  9. python画椭圆形函数算法_python如何使用matplotlib绘制椭圆的数学公式-百度经验
  10. 家庭华硕路由器如何实现NAT硬件加速?本文让您从入门到精通