自我介绍范文网

当前位置:自我介绍范文网 > 文章阅读 > >

数据分析实战|人人都是产品经理网站(下篇):作者视角

来源::网络整理 | 作者:管理员 | 本文已影响

数据分析实战|人人都是产品经理网站(下篇):作者视角

一、最后一个问题

数据分析实战|人人都是产品经理网站(下篇):作者视角

本篇将解决《数据分析实战|人人都是产品经理网站》系列的最后一个问题,将从作者关心的角度来分析,一篇文章发表后是否能够变成爆款。

这是由之前的读者变成作者后获得的一些新体会。以前是读者的时候只有看客心态,网络上的文章繁多,随便看看就好。只有那些特别好的可能会转发,可能会收藏,但看完后网页一关就还是与我无关了。

现在作为一名业余的内容创作者,每篇文章从构思准备到下笔完成可能要花半个月以上时间,期间会想象准备什么样的内容能够得到用户喜欢,反复的思考和推敲总结,酝酿写下来的文字否能将思想得到准确传递。

最后当稿子提交审核的时候,将会有更多的牵挂。每天都会上客户端看一看,今天新增了多少阅读和收藏,是不是有读者给我留言了,有没有上热门文章等等。

虽然会有一些困扰,但这种乐趣是和平时做产品、发布产品的心情是一样的。如何让自己的心血能够得到多一点点的回报将是每个作者的心愿,而其中最直接和最具体的表现则是文章的阅读量

本篇为了能够更快的得出结论,这里再把本篇的问题和目标确定一下:

作为一名作者,投稿的文章是否会在人人都是产品经理网站(以下简称人人网)上成为爆款?

二、观察和分析 1. 从阅读量到爆款

其实作者关心的问题最初是有如下几个选择的:

如何提高文章的阅读量?

投稿文章的阅读量是多少?

文章是否会成为爆款?

第一种,讨论提高文章的阅读量。你需要将一篇文章用两种不同的写法、在同一个平台、同一个时间分别投稿,也就是AB Test才能得到的结果。做产品可以这样测试,但写文章度不现实。而且讨论起来将会是个相当复杂的过程,甚至可以开一个辅导班。

第二种,讨论文章的阅读是多少是一个回归问题,但对比于第三种来说意义略小,比如预测了一篇文章的阅读量为10000,请问它在人人网上是多还是少?看过上篇的同学可以回答,10000阅读量的文章在人人网上连文章的均值都不到。

第三种,有了以上简单分析,根据前篇的数据分析,将阅读量最多的10%文章定义为爆款即可。这也建立了从阅读量到爆款之间的联系,即设定阅读量在足够多的情况下会成为爆款。

2. 影响阅读量的主要因素

这里根据我多年的互联网经验,在各种内容平台上,有以下几个因素会直接影响到一篇文章(内容)的阅读量,当前排名不分先后:

文章出现的频率(位置)。出现的位置越多则频率越高,举个极端点的例子:如果大家进入到人人网站的时候,有个弹窗要求大家必须访问某篇文章后,才能继续浏览网站内容,请问这篇文章的阅读量是否会爆增?虽然现实情况下一般不会发生,但文章出现频率是可以受平台控制的。无论是运营的置顶、新文章的首页推荐、搜索结果的返回顺序等等,都会直接影响到文章的阅读量。

文章的质量。优质的文章本身并不能直接吸用户来提高阅读量,但质量将直接影响文章的二次传播。比如微信中的爆款文章并不是因为大家都关注了发布者的公众号,而是因为爆款文章它的内容受到读者的认可,被传播得到处都是,让吃瓜群众不得不看。

文章对用户的匹配程度。仅从点击量来说,文章的介绍信息将直接影响用户是否点击查看,介绍信息包括但不限于标题,图片,描述,文章来源等等。更进一步的说,随着用户数量的增加,每种类型的文章都有固定的观看比例,比如求聘文章的标题10个人中就有8个人会点击查看,而数据分析的文章可能10个人就只有4个,这就是匹配度的不同导致的点击量不同。

文章的发布时长。互联网的长尾访问特性,内容发布得越早则次数越多,毕竟这是一个累加不可逆的过程。

3. 在人人网上的实际情况

刚刚讨论的是普遍情况,这里我们需要结合目标网站自身的实际情况做进一步分析。在人人上投稿几次之后,综合长时间在人人网的学习和观察,大约一篇文章的阅读量走势会如下图所示(其中色块的划分代表各因素在不同阶段的影响力大小):

数据分析实战|人人都是产品经理网站(下篇):作者视角

数据分析实战|人人都是产品经理网站(下篇):作者视角

4. 心智模型的建立

现实世界非常复杂,影响一篇的文章阅读量的因素,我们还可以有很多的猜想。但我们不是全知全能的神,对任何事物的认知总是有限的。

心智模型则是将这些认知串联起来,以便我们在做判断的时候可以的时候得出结论。越是经验、学识丰富,就会离真相越近,相对的,则会显得愚昧无知。而鬼这样一个凭空出现的事物,则是几千年以来,人类对未知事物感到恐惧所产生的一个集合。

本章节花大篇幅描写的就是这样一个心智模型的构建过程。

回到本文梳理之前的经验与思路,可以建立一篇文章到是否能够爆款的脉络:

爆款≈阅读量>90%文章爆款≈阅读量>90%文章

阅读量≈匹配度+频率+内容质量+发布时长+……

这是我目前能够想到的有关因素。也许还不是很精准,甚至有可能错误,但数据分析就是一个不断的假设、验证、得出结论,再修正、再重复的过程。

这样,我们的心智模型和对这个世界的认知才会越来越完善,得出结论和应对新事物时会更得心应手。

但如果大家要是觉得还有什么关键影响因素的也可以在评论中留下自己的看法。

三、机器学习

机器学习是一种数据分析技术,让计算机执行人和动物与生俱来的活动:从经验中学习。

机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。

当你遇到涉及大量数据和许多变量的复杂任务或问题,但没有现成的处理公式或方程式时,可以考虑使用机器学习。

回到本文的讨论,文章是否会成为爆款,这是一个比较典型的,分类监督学习,而最近正好也在研究XGBoost算法,可以拿来练手。所以本章节将会按照应用机器学习的开发步骤展开:

第1步,数据收集。获取对建立算法和数据模型有关的数据;

第2步,特征选择。一般原始数据都会有大量的无关项,而筛选的标准则是有助于构建之前建立的心智模型

第3步,特征工程。指的是将原始数据转换为特征矢量,比如字符串转成数值、残缺数据的补全等;

第4步,训练算法。选择一部分数据,使用合适的机器学习算法推导出特征之间的权重


本文标题:数据分析实战|人人都是产品经理网站(下篇):作者视角
分享到: 更多

随机阅读TODAY'S FOCUS