在寻找人的业务场景中,用户可以直接找到各个垂直类别的专家帐户,并且可以通过跟踪专家帐户直接获取各个垂直类别的高质量内容。在热门的微博业务场景中,内容流来自垂直类别的专家帐户:在发布特定类别的高质量内容之后,帐户具有初始影响力。大数据计算出其类别后,热点微博将在相应的类别中。内容推荐被暂停,并且该帐户逐渐成长为专家帐户,从而形成产品闭环。人才标签的主要功能是为各种高质量的语料库构建重要的基础数据源。专家用户组由才能标签界定,并提取相关信息AxureShop,例如高质量的语料库;在大多数情况下,人才标签不会直接显示在业务场景中。

三、人才标签挖掘框架

人才标签挖掘,即停止在用户标签系统中挖掘人才标签。详细来说,在整个用户才能标签挖掘过程中,首先是通过用户关系数据(主要是分组,用于显示粉丝对用户才能的认可),用户内容数据(主要是原始博客帖子,用于显示用户本身)人才),用户行为数据(主要是用于表达用户在相关领域中的影响力的交互式信息,例如转发,评论和喜欢的信息),以挖掘出用户的人才标签及其基本权重;二,用户自我介绍填写信息和认证信息,作为人才标签权重计算的调整因子;然后通过多维定向挖掘系统和业务响应系统,停止对人才标签的校正,增加对人才标签的隐藏。最后,将挖掘的用户才能标签和权重输出到用户才能标签库,以供上层服务使用。整个挖掘框架如图4所示:

图4:用户人才标签挖掘的总体框架

四、人才标签挖掘的关键技术要点

本节主要介绍标签词聚合的三个关键技术点,用户影响力,时间窗口和人才标签挖掘中涉及的时间衰减。

标签词收集

用户的分组信息是用户贴在感兴趣对象上的标签,并作为用户关系数据引入到挖掘过程中。由于标签属于UGC,因此它将构成相同的标签主题。有很多不同的表达方式。汇总表达方法以形成标签集,并映射到我们的标签系统中,可以有效地提高人才标签的准确性和覆盖率。

首先,通过火灾模型将分组信息分为两种类型:强关系类型(同学,同事等)和兴趣类型(互联网,财务等),而兴趣类型分组信息是我们的基本期望。

接下来,通过聚类和关联等相关算法停止标记词(分组信息)的聚合;

最后,根据相关程度等因素,聚合标签集分为高相关和低相关两类。

以Internet标记为例,汇总的最终结果如表1所示:

表1:与互联网相关的标签集

用户影响力

用户影响力是指某个标签下用户的影响力,因此影响力计算的前沿(如图5所示)是与标签相对应的感兴趣的用户组(包括标签的有才华的用户),即组对标签对应的类别有一定了解的用户。详细地

图5:用户影响力计算边界

其中,相同类别用户的影响力是通过其他用户的交互行为(例如,按一定的权重比重新发布,评论和喜欢相关博客帖子)来计算的。所谓相关博客文章,是指用户发布的属于该标签所对应类别的原始博客文章(即带有内容标签的原始博客文章,属于大数据内容团队,以及相关文章将在后面介绍。

时间窗口和时间衰减

关于原始博客文章的消费价值和计算成本的思考。关于用户内容数据,我们选择了用户最近一段时间的原始博客帖子作为基本语料库来终止计算。

关于时间衰减,我们根据牛顿冷却定律和微博的业务需求推导了相应的衰减公式,并在比较了衰减效果后,确定了相关衰减参数的值,最后得到了含量的权重。用户才能标签的时间衰减功能,如图6所示。

图6:用户才能标签内容权重衰减函数

五、摘要

目前,我们主要识别用户的才能标签,并根据社会关系,原始内容和影响力三个维度计算相应的权重。同时Axure高保真原型,用户的自填信息,认证信息等信息停止调整。对于某些特定的垂直类别或具有明显特征的某些类型的用户组,我们通过有针对性的挖掘系统暂停处理,然后将它们集成到最终用户人才标签库中以暂停输出。

关于用户才能标签,受到用户兴趣标签影响的上层业务正变得越来越普遍,它所依赖的数据也变得更加复杂和多变。在下一系列用户肖像文章中,我们将详细介绍用户兴趣标签的挖掘过程。

本文采用“ CC BY-SA4.0 CN”协议来复制学习交流,内容的版权属于原作者,如果涉及著作,版权等问题,请联系“我们”来处理。

本文的关键字:用户标记能力信息的数据挖掘

Sugeike是新一代的用户行为分析和数据智能平台。它支持16种分析模型的数据分析产品,包括用户数据分析,操作数据分析,保留分析,路径分析,渠道分析,用户画像,SEM数据分析等。支持网站统计,网站分析demo,APP统计,APP分析和其他分析工具以及诸如会员营销系统和A / B测试工具之类的数据智能应用程序,支持SAAS和私有化部署用户画像标签,提高了用户保留率和转换率,并实现了数据驱动的增长!

用户画像标签维度_用户画像标签 数据挖掘系列:用户头像的用户标签相关推荐

  1. 用户画像标签维度_神策数据钟秉哲:一文了解用户标签画像,从洞察到突破

    在神策 2020 数据驱动用户大会「精英训练营」现场,神策数据业务咨询师钟秉哲发表了关于<用户标签画像,从洞察到突破>的演讲.(文末附 PPT 下载地址)本文根据其现场演讲整理所得(数据均 ...

  2. 用户画像标签维度_一文看懂用户画像标签体系(包括维度、应用场景)

    一文看懂用户画像标签体系(包括维度.应用场景) 互联网相关企业在建立用户画像时一般除了基于用户维度(userid)建立一套用户标签体系外,还会基于用户使用设备维度(cookieid)建立相应的标签体系 ...

  3. 用户画像标签维度_用户画像详解:关于用户画像的What、Why、How

    今天谈谈大家经常听到却又一肚子懵逼的"用户画像". What 基础概念扫盲 用户画像(User Profile):也称人物角色,是根据用户社会属性.生活习惯和消费行为等信息而抽象出 ...

  4. 为什么单击用户账户没有反应_为什么您的网站没有流量?是因为用户搜不到你!...

    网站要想有流量,前提条件是得让人能在搜索引擎上搜到你.怎么增加搜索引擎搜到你的几率呢? 首先,首页title一定要放关键词. 首页title放关键词,这是别人找到你的重要"标签", ...

  5. wordpress标签页面_如何为您的WordPress管理仪表板加白标签

    wordpress标签页面 Have you ever wanted to white label WordPress admin dashboard for your clients or user ...

  6. 统计app用户在线时长_「云工作普及系列」2.如何实时统计工作时长,提高工作效率

    记上节我们讲了[1.如何注册云工作平台]之后,接下来一起探索下该平台提供的各个产品功能.今天主要讲一下如何它的实时统计工作时长是怎么实现的? 我们先来了解一下它的工作时长实时统计的功能. 一,从web ...

  7. python打开谷歌浏览器新标签页_【Python】爬虫系列 | 3、谷歌浏览器的基本使用...

    你要问程序员最喜欢的浏览器是什么? 基本都会说当然是谷歌浏览器,它完全遵守了W3C的标准,是最最最受程序员欢迎的浏览器 其次火狐浏览器,安全性高.可以作为备用浏览器. Edge是微软最新发布的浏览器, ...

  8. 大数据 客户标签体系_大数据场景营销之标签体系、用户分群、用户画像

    大数据一直是各行各业的核心资产,蕴含巨大价值待挖掘,在数据→信息→知识的转化过程中,标签.指标是基础,它将抽象的数据转化为一个相对具象的信息中心,用户分群和用户画像都是在建立在信息中心上的综合应用手段 ...

  9. python用户标签体系_什么是用户画像和标签?

    一.先熟悉一些名词和概念 1. 标签(Tag) 对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性. 例:对于"人"这类群体,可将"男&qu ...

最新文章

  1. 走进JavaScript响应式编程(Reactive Programming)
  2. php获取当前设备,Linux_在Linux系统中使用lsblk和blkid显示设备信息的方法,今天我们将会向你展示如何使 - phpStudy...
  3. 用linux命令清空文件夹,技能包!Linux 下清空或删除大文件内容的 5 种方法
  4. python中123+5.0的执行结果_python实战笔记(一)
  5. python测试嵌入式_用Python测试嵌入式系统的测试框架
  6. 5.7. Text Processing
  7. 【Golang】Go语言defer用法大总结(含return返回机制)
  8. python标准库os中的方法startfile_如何使用Python 打开exel等各种文件或者应用,就用:os.startfile...
  9. winrara注册文件
  10. Android 进阶技术汇总一: 个性化控件(View) 方案汇总
  11. size-constrained-clustering
  12. HDU 6070 Dirt Ratio
  13. 地铁bas服务器系统,轨道交通BAS系统/火车站地铁BAS系统包括什么
  14. 【英语美文】权利的游戏——守夜人誓词
  15. esp8266 wifi信号强度示意表
  16. 使用GnuRadio + OpenLTE + SDR 搭建4G LTE 基站(上)
  17. 解决Invalid HTTP_HOST header: 'xxx.xx.xxx.xxx:8000'. You may need to add 'xxx.xx' to ALLOWED_HOSTS问题
  18. java毕业设计诚越园区垃圾分类信息科普系统Mybatis+系统+数据库+调试部署
  19. 乘2取整法_十进制小数转换成二进制小数,可以采用“乘2取整”法
  20. WIN7系统安装及动态分区详解步骤

热门文章

  1. A 8b Time-Interleaved Time-Domain ADC with Input-Independent Background Timing Skew Calibration
  2. HP-UX top 输出中实存(real memory)/虚存(virtual memory)数据解释
  3. 微信小程序如何双重循环
  4. android的nfc卡模拟开发
  5. java集合-遍历arraylist-for循环-从指定下标开始遍历-for的用法
  6. java的split劈开获取数组的数据问题
  7. 1075: 聚餐人数统计 C语言
  8. 如何给数组中的元素赋值?
  9. 0是false 还是true?
  10. 永久修改pip国内镜像源