当前位置:首页 > 经验 >

tag和总tag区别(tag和untag模式选哪个)

来源:原点资讯(www.yd166.com)时间:2022-10-26 18:57:24作者:YD166手机阅读>>

编辑导读:微信已经成了不少人获取咨询的来源之一,看一看功能在这基础上实现内容的精确推荐,以及拓宽用户阅读兴趣,打破信息茧房。本文从六个方面,以多模型内容策略与召回的角度分析微信看一看,希望对你有帮助。

tag和总tag区别,tag和untag模式选哪个(1)

一、看一看介绍

相信对于不少人而言微信已经成为获取资讯的主要场景。与此同时,由于微信用户群体的庞大,也吸引了大量的内容生产者在微信公共平台创造内容,以获取用户关注、点赞、收藏等。微信内的内容推荐产品:看一看应运而生。

基于微信通过多年的用户沉淀,积累得到的大量“隐式反馈”阅读兴趣信息,可以精准的实现内容与内容消费者之间的推荐。同时,秉承降低用户获取信息茧房效应,拓宽用户阅读兴趣,增强互动,强化用户认知,及时获取咨询等等诉求,看一看不断在算法迭代的同时,引入各类腾讯系,外部图文,视频,资讯,小视频等内容,丰富内容多样性的同时不断上线优化产品体验与进行样式优化。

二、内容库与内容画像

1. 内容源

看一看接入了非常多合作方的数据作为内容源,包含但不仅限于微信公众平台及其他外部内容等等。

由于接入数据源较多,各家数据在内容、质量、品类等方面差异性比较大。看一看平台方会对数据做“归一化”操作,包括标签统一化,推荐标签提取,内容投放目标,投放人群倾向性等内容理解处理,这部分我们称为看一看内容画像部分。

2. 内容画像

内容理解:对接各种外部图文等内容,对接入内容做业务级内容多维基础理解,同时进行外部标签与自有标签体系对齐,完成应用级内容打标。

反馈至下游应用方:用户需求系统,召回策略,召回模型,排序/混排等使用。同时,在业务数据滚动与迭代中修正数据判断精度与效果,逐步贴合与提升业务线效果。

tag和总tag区别,tag和untag模式选哪个(2)

我们将内容画像,定义为两个大维度:通过内容本身来理解内容, 通过用户行为来理解内容。前者主要针对内容抽取静态属性标签;后者则通过用户行为积累的后验数据、统计或模型预估内容的知识、倾向性、投放目标以及抽象表达。

3. 多模态标签语义标签

我们将文本语义按粗到细粒度分为:文本多分类(1-3级),主题topic model(长效topic,实时topic),tagCluster, tag/entity,这也是NLP领域持续在关注和研究的重点方向。

文本分类与模式识别中心合作对长/短文本训练基于标注的增量多分类模型(1-2级分类准确率可以达到90% ),支持领域内DL文本分类模型。

Topic Model作为重要分支,为支持看一看推荐业务,解决了时效性热点的快速topic增量模型,实现多层级(1000维,1500维度,5000维, 1W维)topic model,以及以此为基础衍生出的topic Embedding技术等。

Tagcluster是介于tag和topic粒度之间的一类tag聚簇概念,维度为10W级;用于解决语义自动语义聚合的可解释问题;关键词提取(标签提取),技术演进从传统的基于标注,到半监督,到自动标注的序列提取的浅层模型;已经全部迁移为基于bilstm attention CRF 和 bert的一套深度模型系统。

标签是推荐系统的核心基础能力,深度模型的引入对算法准确率与覆盖率都有显著的提升。

视频理解的相关维度,我们与外部团队深度合作,建立起一套基于短/小视频,封面图多维度的多媒体特征体系,包括人脸识别,人脸embedding,标签,一二级分类,视频embedding表示,水印,OCR识别,清晰度,低俗色情,敏感信息等多种维度。有力辅助多媒体理解深度,并广泛用于召回模型,曝光展示策略,过滤策略等,目前,在召回与策略层面已经证明有一定在线提升效果。

4. 基于知识体系的表示与可解释标签

知识图谱作为知识承载系统,用于对接内外部关键词信息与词关系信息;内容画像会将原关系信息整合,并构建可业务应用的关系知识体系。

其次,依赖业务中积累用户行为产生的实体关系数据,本身用户需求的标签信息,一并用于构建业务知识的兴趣图谱,基于同构网络与异构网络表示学习等核心模型,输出知识表示与表达,抽象后的图谱用于文本识别,推荐语义理解,兴趣拓展推理等场景,直接用于兴趣推理的冷启场景已经验证有很不错的收益。

5. 嵌入表示

语义嵌入表示:这类是相对已经比较成熟的技术,基于短文本tag, word粒度,句子粒度,doc粒度都可以构建embedding表示。其次,除文本外,更为丰富的多媒体信息的融入,已经可以验证在一定程度上可以增强表达能力。

其次,我们基于微信阅读场景的用户点击/分享/关注等等序列结合场景的上下文信息,以他们作为文本切割的序列标注信息,早起基于传统的HMM,CRF类浅层模型,发展至目前的seq2seq,RNN,transformer,Bert等序列类,语义类模型,将内容作为文本切割的一个子序列,从而实现对文本的序列的表示信息。由于更加贴近推荐场景,这类嵌入表示业务可用性会更高,也体现在召回/排序模型的应用效果会更加明显。

6. 倾向性与目标性识别

tag和总tag区别,tag和untag模式选哪个(3)

这部分是通过用户行为数据来理解内容的重要体现。分为两部分:内容倾向性与内容投放目标性。都是建立在一套基于文本,多媒体,kg,投放日志等下的一套分类器进行打标,模型如上图所示。

内容倾向性:内容通过分类模型预打“倾向性”标签,例如:内容适合的性别倾向、年龄倾向性、地域倾向性等等,从而预判待投放内容的特殊人群倾向性。

目标性识别:看一看的场景会比较多,例如:主TL流,视频流,专题流,tag可点流,看一看 小程序,每个场景都有不同的投放目标(例如:主TL内容会以点击率为主,专题流会以时长消费为主,小程序分享率为主)。所以,我们会在item上同样基于投放预估的模型预先打上一组目标识别标签预判分数,供在线策略使用与内容库构建、以及内容试探等。

综上,通过内容理解与内容库构建的概要流程图如下:

tag和总tag区别,tag和untag模式选哪个(4)

栏目热文

tag如何用(tag如何安装)

tag如何用(tag如何安装)

分支规范首先分享一下我们的分支规范,然后再介绍摸索出的打tag的规范。常用分支mastermaster : 主分支 , ...

2022-10-26 19:01:13查看全文 >>

tag的正确操作(tag 怎么用)

tag的正确操作(tag 怎么用)

家居收纳是一门重要学问,是打造精致家居生活的必要手段。家居收纳做得好,不仅能让整个家居看起来更加整洁敞亮,还能方便日常生...

2022-10-26 19:31:54查看全文 >>

tag正确用法(tag 怎么用)

tag正确用法(tag 怎么用)

网站SEO中Tag标签有什么用处?在网站SEO优化过程中,Tag标签的使用是很常见的,但一些新手SEOer对Tag标签的...

2022-10-26 19:32:28查看全文 >>

带tag的好处(打tag的意义)

带tag的好处(打tag的意义)

在网站SEO优化方面,假如不注重优化的细节,就很容易被竞争对手拉到,作为Tag标签,是当前互联网上最为常见的一种功能,尤...

2022-10-26 19:03:58查看全文 >>

tag的真正用途(tag干什么用的)

tag的真正用途(tag干什么用的)

编辑导语:标签和指标一样,对于数据分析来说十分重要。那么数据指标和标签体系二者之间,有什么具体的区别呢?本篇文章作者讲述...

2022-10-26 18:53:35查看全文 >>

tag正确用途是什么(tag标签重要吗)

tag正确用途是什么(tag标签重要吗)

话说,tag标签作用真不少,它能对内容进行分类,让更多用户准确的找到需要的视频或文章,同时也有利于优化seo,方便搜索引...

2022-10-26 18:59:09查看全文 >>

tag干什么用的(tag怎么用)

tag干什么用的(tag怎么用)

最近收到一些客户疑问,为什么现在做CUT&Tag技术的人更多?ChIP-seq还有必要做吗?ChIP-seq作为研究蛋白...

2022-10-26 19:01:41查看全文 >>

tag的正确用途是个啥(tag的正确用途是什么)

tag的正确用途是个啥(tag的正确用途是什么)

蛋白质作为生命活动的主要执行者,绝大多数疾病的发生都与其结构、功能密切相关。因此,想要对某一特定的蛋白进行分析与研究则成...

2022-10-26 19:17:27查看全文 >>

tag正常用途(tag的正确使用)

tag正常用途(tag的正确使用)

网站优化tag的正确用途,利用tag页面将事半功倍 网站tag栏目的描述调用文章描述的方法,最近着手新站www.uimo...

2022-10-26 19:13:10查看全文 >>

tag属性有哪三种(tag的正确使用)

tag属性有哪三种(tag的正确使用)

每个抖音用户都会被系统打上标签,算法从而给用户推荐更准确的内容;同样,我们的创作者也会被系统打上标签,算法会根据标签向我...

2022-10-26 19:09:20查看全文 >>

文档排行