由于新闻本身具有数量大、更新快、冗余度高以 及地域性等特点,移动新闻推荐系统和其他移动 推 荐系统(如移动应用程序推荐、移动电子商务推荐)之 间的差异性表现在3个方面:时效性(recency)[9]、新

3.2.1 新闻表示方法

文本新闻是移动新闻推荐的主流研究,视频或 音频新闻通常也可以由其附带的标题、类别属性、标 签集合等信息构成相应的新闻文档.由于新闻数量 庞大,新闻文档没有统一的格式标准,因此为了便于 存储和后续处理,需要将非结构化的新闻文档采用 统一的结构化方法表示.通常结构化新闻表示方法 在移动新闻推荐和传统新闻推荐中是一致的. 目前常用的新闻表示方法有 VSM(VectorSpace Model)、概率模型[37]等.概率模型表示方法即利用 不同的概率生成模型获取新闻潜在的语义结构及相 关分布,例 如 主 题 概 率 分 布.LDA(LatentDirichlet Allocation)[38]、PLSA(ProbabilisticLatentSemantic Analysis)[37]、ESA(ExplicitSemanticAnalysis)[39] 等都是应用比较广泛的概率生成模型.PLSA 可以 对高维空间进行降维,且模型比较稳定,但是缺乏处 理新 文 档 的 能 力,存 在 过 拟 合 现 象;LDA 克 服 了 PLSA 中存在的不足,更适用于大规模新闻集,但是 不能对主题在新闻中出现的相关性进行建模;不同 于前两种模型,ESA 采用可识别概念表示新闻,提高 了其解释性,但是前期建立知识库比较复杂.VSM 是 一种经典的结构化表示方法.它通过用一组词项及其对应权值构成的向量空间来描述新闻,即每篇新 闻文档都可以用一个{T,W}二元组来表示.T 是所 有词项(词语、主题或命名实体等)的集合,通过对新 闻文档去停用词、分词和语义分析等获取.其中常用 的分词工具有Lucene、CKIP[17]、ECScanner[18]等.和 其他词项相比,命名实体可以更有效地捕捉到新闻 主旨,如发生了什么事件,事件发生的时间、地点、涉 及人 员 等.VSM 中常用的权值计算方法有频率统 计[40]、TF-IDF[9,25]及其 改 进 方 法.其 中 使 用 最 广 泛 的是 TF-IDF,其计算某个词项权重的公式如下:

新闻本身具有数量大、更新快、冗余度高相关推荐

  1. raid10模型比raid01模型的冗余度高

    RAID10和RAID01的冗余度看起来差不多,但本质上有一定的区别. RAID10:左边损坏1块盘,右边还可以容忍一块盘损坏而不影响整体的数据;冗余度=2 RAID01:左边损坏1块盘,此时左边已经 ...

  2. windows更新不支持的硬件_Win10五月大更新细节,解决高CPU占用,不支持AMD

    在2月11日时微软发布了Windows 10 KB4524244更新补丁,但许多用户表示安装完后出现了各种问题,最终微软官方宣布补丁存在BUG,已经撤回了. 微软推送补丁出现问题已经不是第一次了,甚至 ...

  3. webrtc QOS方法二.3(FEC冗余度配置)

    一.概述 webrtc的FEC冗余度配置整体思想是: 1.接收端根据收到报文情况计算一个丢包率,通过RTCP_RR报文反馈给发送端. 接收端丢包率计算代码走读请参见:<webrtc代码走读十一( ...

  4. Android Studio Electric Eel | 2022.1.1 发布,快来看看有什么大更新吧

    原文链接:https://developer.android.com/studio/releases 本次 Android Studio 又发布了大量的内容更新,按照惯例推荐是等两个小版本后再更新会比 ...

  5. ZzzFun动漫看番必备App,资源丰富更新快,再见B站大会员

    好久没有推荐黑科技系列了.很多读者都是嗷嗷叫呀.最近好多人问我有没有动漫的好工具. 既然你们有需求,登登就不客气了,是时候展示我真正的实力了. 今天分享的这款工具,从各个角度看都非常的给力. ZzzF ...

  6. microsoft store更新不动_App Store顶尖笔记软件大更新!快来看看有何不同!(文末有福利)...

    经过此次更新,goodnotes5 的界面变得更为直观,同时美观性上也有所提升.相比于老版本中只能通过左上角的"文档"进入/检索文件夹,新版本提供了与电脑界面相近的视图. 左图:老 ...

  7. 突发!微信大更新,黄脸表情会动了,还能炸群!还有状态、浮窗...张小龙剧透的功能全来了...

    点击上方 "编程技术圈"关注, 星标或置顶一起成长 后台回复"大礼包"有惊喜礼包! 每日英文 Be confident with yourself and st ...

  8. PyTorch大更新!谷歌出手帮助开发,正式支持TensorBoard | 附5大开源项目

    边策 乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 大家又少了一个用TensorFlow的理由. 在一年一度的开发者大会F8上,Facebook放出PyTorch的1.1版本,直指Te ...

  9. 微信大更新,黄脸表情会动了,还能炸群!还有状态、浮窗...张小龙剧透的功能全来了...

    1月21日,微信在十岁生日这天,正式向iOS用户推送了8.0版本.张小龙前天在微信公开课上剧透的几个小功能,也一一出现在新版微信中. 会动的表情.微信个人状态.浮窗......在1月19日的微信公开课 ...

  10. 微信更新对html影响,微信再次大更新 将极大影响用户使用习惯

    [导读]微信再次迎来历史性大更新,小程序终于展露腾讯野心! 微信再次迎来历史性大更新,小程序终于展露腾讯野心!... 微信小程序桌面 在昨日1月22日晚,微信更新7.0.3版本,腾讯在App Stor ...

最新文章

  1. 35个高级Python知识点总结
  2. 南安出台行动方案推进智慧城市建设
  3. Windows Server 版本信息及支持期 Win10系统各版本服务起止日期。
  4. 【leetcode】First Missing Positive(hard) ☆
  5. 图片压缩小工具,jpg,png压缩
  6. 创建win10介质进度为0_MediaCreationTool(Win10介质创建工具) V10.0 官方版
  7. linux分段加载程序_Linux的分段机制
  8. 【JZOJ】1183:【入门】判断是否构成三角形
  9. 三国志战略版:【满红杀手】名将卡包新武将_许攸分析
  10. python中out函数_Python中函数的使用
  11. 开源分享,让技术发光——最受欢迎“开发者布道师”评选结果来啦!
  12. ArcGIS 制图搭配:文字、比例尺等大小
  13. 一个存储过程帮你了解 事务(TRAN)、异常处理(TRY/CATCH)、@@ERROR
  14. R语言水文序列突变点检验之滑动平均差法
  15. 【Linux】如何将ntfs硬盘挂载到home目录下并具有读写权限
  16. Windows认证机制详解(借物表在文章末尾)
  17. 39. 腾讯面试题:有一千万条短信,有重复,以文本文件的形式保存,一行一条,有重复。
  18. 视频传输解决方案,让视频会议更高效
  19. 2021计算机系统大作业 CSAPPHello‘s P2P
  20. JAVA工具类Hutool介绍与使用

热门文章

  1. php 横杠箭头,为什么我的箭头下面有一横线?
  2. 《色彩解答》系列之二 色彩比例
  3. IntelliJ IDEA安装lombok
  4. 路飞学城-Python爬虫集训-第二章
  5. 开启进程的两种方式:类、函数
  6. 设置vim默认显示行号
  7. 娱乐篇第十期:互联网的事情you意思(十)
  8. EF架构~看看下面这代码,你还敢用它的延时加载吗?
  9. linux标准mib,Linux系统中测试你的MIB值
  10. 在Linux下如何安装Jupyter Notebook