产品设计

    今日:80| 主题:15619
收藏本版 (1)
软件产品、PC、移动、网站、平台的开发、策划等内容。

[其他] 数据的验证价值:如何利用数据验证你的想法及假设?

[复制链接]
灭婊AK 发表于 5 天前
56 3

立即注册CoLaBug.com会员,免费获得投稿人的专业资料,享用更多功能,玩转个人品牌!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

数据的验证价值:如何利用数据验证你的想法及假设?-1 (排行榜,决定论,设计者,价值,如何)

  数据的使用价值,以其目的,可以分为三类。一类用于验证假说的是否,二类为思维之翻译,三类以趋势做预测。
  前者是科学之所以为科学的护盾。这是说,我们总有一些道理,不知出处,或道听途说,或直觉所致,大体上,都可以暂理解为“假说”一类的道理,即未经证实的假设。我们提出一条假说,为验证假说,做了一个实验,总结了一些数字,用数字证明假说正确与否——这是我认为的数据的第一大效用。
  第二类效用,举凡KPI、排行榜、算法之类的皆属此列。这类应用的思想是,算法设计者“想”让“谁”得到高分。因此,其数据结果的高度,取决于“规则设计者”的高度——我总是对这一类应用抱有警惕。因我自身偶尔都会扮演一下这“设计者”的角色,而时时苦恼于此。
  第三类常见于各类趋势表,可观历史,亦测未来。准确且长远地预测未来是此效用的终极理想。理论上,时间越近,关联越少,预测越准确。但是我们使用数据总是希望分析更加复杂的事务,因此受限于我们对世界的了解程度,使得预测结果总是存在或多或少的不确定性。
  决定论认为事物具有因果联系性、规律性、必然性。通俗点说,就是如果我们理解了宇宙所有物质的运行规律,就可以准确知道未来会发生什么,决定论也认为我此时写下这句话是在世界诞生之初就决定好了的,曰之“命运”。非决定论与其相反,认为世界存在一定的不确定性。
  预测科学试图通过特定范围的关联因素及因果性预测出一定程度准确的未来,但是也为“不确定性”保留了“置信区间”。
  本文因笔者的学识有限,姑且将焦点放置于第一类效用,即:验证假设。展开为三个部分:一为指标,对基本概念的理解。二为分析,数据分析场景的梳理,及数据后台的设计。三为验证,假说与验证的思考方式。
  指标

   数据来源

  用户在前台进行各种行为留下痕迹,由于用户行为留下的数据较大,用户有行为就记录,对服务器压力较大,所以会把前台的行为数据单独存储到日志服务器中。
  那么按照数据的存储位置,大致会分成行为数据和后台数据两个类型。
  第三方数据分析工具获取的都是前台的行为数据,也就是第三方(比如友盟)代替了原本的“日志服务器”的角色。
  我们在设计数据产品时,应该了解数据来源,并且将不同的数据来源进行对接。

数据的验证价值:如何利用数据验证你的想法及假设?-2 (排行榜,决定论,设计者,价值,如何)

   数据

  由于产品形态的差异,获取数据的类型也有一些差别。
  网页产品的组织结构是页面,用户行为从刷新某一个页面开始到刷新下一个页面结束,PC产品可以获取到的基础数据主要有:
  访问终端IP地址

  用户访问网站时使用设备的IP地址。不同设备有对应的IP地址,主要用于分辨地域,但是统计结果有较大误差。
  访问时间戳

  用户访问页面的时间点,用于判断用户行为的时间顺序。如用户访问页面A时记录时间点,访问页面B时记录时间点,可以认为用户在第二个时间点离开了页面A。
  访问地址路径

  可以理解为用户访问页面URL,用于分辨用户访问网页的目的地,也就是访问了A页面还是B页面。
  访问来源

  来访的来源信息,比如来自搜索引擎的搜索结果页、直接访问、外链网站等。
  来访者的其他信息

  操作系统、浏览器、爬虫等信息。这类数据是由来访者表明身份获得的信息,因此取决于来访者的自觉性,有误差。有些浏览器不提供给非合作者信息,非正规爬虫也不会表明信息。
  APP产品获取的基础数据主要有:
  终端信息

  获取终端(手机、平板等)信息用于识别用户
  操作系统

  OS/Android/Win等
  客户端信息

  APP上传的自身信息。
  客户端时间

  用于判断用户启动或操作应用的时间点
  操作事件

  APP按照自定义事件所需,上传用户的操作行为和伴随这个行为的客户端信息。这是APP区别与PC的一类重要数据,其对用户行为的跟踪比网页通过刷新获取的数据更加精准。
   用户识别

  如果我们想要分析的某个结果需要涉及不同的数据来源(比如我们的用户在某个时间段使用APP的场景更多还是PC场景更多?),那么数据与数据之间的关联工作是最重要的。我们通过用户识别的方式关联不同来源和结构的数据(识别产品a的用户a和产品b的用户b是同一个用户U),以下是三类用户的识别方式:
  网站用户识别

  如果我们有两个网站产品,我们如何知道有哪些来访者同时访问了AB两个网站呢?
  Cookie是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取。Cookie是目前网站识别访客的主要手段。由于用户禁止或对Cookie进行清理等问题,这个数据结果的误差也会比较大。
  APP用户识别

  APP的识别方式类似网站,把信息写入终端。由于手机发生信息丢失的情况(比如刷机)比较少,所以APP的用户识别相对比较准确。我们可以知道每次启动这个应用的访客是不是我们认识的那一个。
  产品用户识别

  如果同时有网站端和移动端产品,我们又想知道哪些用户同时使用了网站和APP,由于以上识别方式是基于设备,数据中就无法判断用户了。所以跨产品形态的用户识别通常使用注册用户ID,前提是推动用户的注册和登录行为。
   指标

  以下是我们在产品数据分析中常用的指标。
  网站常用的指标

  IP地址

   PV浏览量:页面浏览量。每刷新一次页面,被记录为一次PV。
   Visit访问次数:今日早上访客A进入网站后离开,下午访客A又一次进入网站,并记录为2次Visit(开发者使用会话数session定义一次访问行为,与visit的意义相同)。
   visitor访问者/UV访客数:本周访客A进入网站10次,记录为1个UV,10个visit
   访问时长:即访客的停留时间,访客先进入页面A然后进度页面B,页面B的访问时间减去页面A的访问时间即访客停留页面A的时长,另外我们定义访客停留时间超过某个时长(通常是半小时)即离开网站,一次visit结束。
   访问深度:访客在一次访问行为中,访问了几个页面。
   跳出率/退出率:访客访问landing page(一次访问行为的第一个页面,任何一个页面都可能成为这个网站对于用户的登录页)时离开网站即“跳出”。退出页是指用户这次访问行为的最后一个页面(因每次访问都必然退出,所以退出率只能用于判断某个页面,网站的退出率理论上是百分之一百)。
   留存率:留存率通常指整个产品的留存,周日(起始日)进入网站的新用户为100人,周一这100人里有50人继续访问了,到下周日,这100人中访问网站的还有2人。可得出,周日网站的次日留存50%,7日留存2%。
  上下两图中,整体活跃用户数都在增长,但是留存曲线告诉我们下图留存表现更好,留存曲线在最后趋于平稳,而上图,用户在增加,但是也在不断流失,所以最后用户总数也无法提升。
123下一页
友荐云推荐




上一篇:占位符文本的选择
下一篇:傅志华:大数据量化用户体验
酷辣虫提示酷辣虫禁止发表任何与中华人民共和国法律有抵触的内容!所有内容由用户发布,并不代表酷辣虫的观点,酷辣虫无法对用户发布内容真实性提供任何的保证,请自行验证并承担风险与后果。如您有版权、违规等问题,请通过"联系我们"或"违规举报"告知我们处理。

dsftgdy 发表于 5 天前
有种帖子让我迷茫,有种回复让我欲罢不能
回复 支持 反对

使用道具 举报

sky22221321 发表于 4 天前
和谐校园里,骑自行车的也许是位博导,而开奔驰的则可能是个后勤……
回复 支持 反对

使用道具 举报

kkkzc1009 发表于 前天 03:44
别拿你的木马,挑战我的密码。
回复 支持 反对

使用道具 举报

*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

我要投稿

推荐阅读

扫码访问 @iTTTTT瑞翔 的微博
回页顶回复上一篇下一篇回列表手机版
手机版/CoLaBug.com ( 粤ICP备05003221号 | 文网文[2010]257号 )|网站地图 酷辣虫

© 2001-2016 Comsenz Inc. Design: Dean. DiscuzFans.

返回顶部 返回列表