Hadoop项目实战-用户行为分析之分析与设计

news/2024/7/8 2:04:13

Hadoop项目实战-用户行为分析之分析与设计

http://www.cnblogs.com/smartloli/p/4569882.html

1.概述

  本课程的视频教程地址:《用户行为分析之分析与设计

  下面开始本教程的学习,本教程以用户行为分析案例为基础,带着大家对项目的各个指标做详细的分析,对项目的整体设计做合理的规划,让大家能通过本课程 掌握Hadoop项目的分析与设计。该课程主要包含以下课时: 他们分别是:项目整体分析,项目指标与数据源分析以及项目整体设计。如下图所示:

  

  首先我们来学习第一课时:《项目整体分析》。

2.内容

2.1 项目整体分析

  本课时简述分析一个项目产生的背景,以及该项目能给企业带来那些良好的结果, 从而让大家更好的去把握项目需求。该课时主要包含以下知识点,他们分别是:对项目背景做简要的概述以及对项目的目的做合理的分析。如下图所示:

  下面,我们来看看项目的背景涉及的知识点,其内容包含以下内容,如下图所示:

  以上便是为大家介绍的项目背景(详细介绍,大家可以观看视频,这里就不赘述了),下面我们来看看项目的目的。如下图所示:

 

  我们通过对项目的分析,我们可以得到以下目的:

  • 目的1

  通过对用户浏览记录的统计,我们可以分析出用户在各个业务模块的活跃度,以及他们在各个模块下的停留时间等等。让公司可以准确的掌握用户在公司业务的一个动向。

  • 目的2

  公司在制定一些决策的时候,往往是需求一些实际的数据来做支撑的,这时,我们统计出来的用户 行为结果就能帮助公司这某块业务制定决策的时候提供数据依据。

  • 目的3

  在给用户推送一些信息的时候,也是有技巧的,我们不能盲目的去推送,这样会给用户一个错觉,让用户 认为我们是在推送广告之类的信息,造成用户的反感,从而导致流失一部分用户,那我们应该如何去推送信息 来提升用户留存率。那么用户行为统计结果就是一个很好的依据,我们可以根据统计结果来分析出用户对那块感兴趣,通过精准的推送用户感兴趣的信息,来提升用 户的留存率。

2.2 项目指标与数据源分析

  我准备为大家介绍 如何有效的去分析各类KPI和数据源,让大家掌握将数据源和各个KPI合理的关联起来。下面我们来看看本课时需要学习的知识点。

  本课时主要包含以下知识点, 他们分别是:

  • 合理的去分析数据源和KPI
  • 将数据源与KPI进行有效的整合

  内容如下所示:

  下面我们来学习如何有效的去分析数据源和KPI 。 我们知道,在Web日志中,每条日志数据通常表示着用户的一次访问行为,下面我给 大家展示一条示例数据,如下图所示:

  在阅读完这条日志信息后,下面我来给家分析下这条日志信息。从该条日志信息中,我们可以得到以下信息量,这里我用一个图来说明相关问题,如下图所示:

  从该图中我们可以看出,前面的一条访问记录,可以包含图中所示的信息。

  在分析了数据源和KPI,下面看看如何去整合这两者的关系,如下图所示:

  详细的信息大家可以观看视频,这里就不赘述了,视频地址——《指标分析

2.3 项目整体设计

  项目整体分析,我为大家介绍设计一个项目的整体架构和流程开发,以及各个KPI的设计,让大家掌握整个项目的设计流程。

  本课时主要包含以下知识点,他们分别是:

  • 为大家介绍项目的整体设计的过程
  • 给大家介绍如何去设计相关KPI

  内容如下图所示:

  下面,我给大家介绍项目的整体设计的过程,我给大家画了一个图,即项目的开发 流程设计图,其中包含了各个阶段的技术选型,如下图所示:

  KPI的相关指标,我为大家绘制了一个图,如下图所示:

  这里KPI指标设计有:IP,这里指的是独立的IP访问量,计算跳出率的时候需要用到,PV量,一个网站的总的访问量,Amount 用户每小时的访问量(包含游客和会员),用户偏好,用户会在他们感兴趣的模块停留的时间较长,我们可以统计出用户的偏好 (这里面的浏览记录包含游客和会员),另外,我们还设置了转化率,来衡量网站的内容对访问者的吸引成都和网站的宣传效果,这里我们设置跳出率,用来衡量网 站的质量及网站的用户体验。

  关于这课的详细介绍,大家可以去观看视频教程,视频地址——《整体设计

3.总结

  本课程我们对项目进行了整体的分析,并指导大家去分析项目指标和数据源,以及帮助大家去设计项目的开发流程等知识,大家学完本课程应该掌握以下知识,其内容如下图所示:

4.结束语

  这就是本课程的主要内容,主要就对Hadoop项目做相应的分析与设计,对后面的编码实践工作做一个准备。

  如果本教程能帮助到您,希望您能点击进去观看一下,谢谢您的支持!

  转载请注明出处,谢谢合作!

   本课程的视频教程地址:《用户行为分析之分析与设计

 

http://blog.csdn.net/zdy0_2004/article/details/46481721

http://www.cnblogs.com/sharpxiajun/archive/2011/11/01/2232254.html

 


http://www.niftyadmin.cn/n/3297871.html

相关文章

有关TinyXML使用的简单总结(转)

这次使用了TinyXML后,觉得这个东西真是不错,于是将使用方法坐下总结来和大家分享。 该解析库在开源网站(http://sourceforge.net )上有下载,在本Blog也提供下载(下载TinyXML) TinyXML是一个开源…

Problem--1A--Codeforces--TheatreSquare

Theatre Square time limit per test1 second memory limit per test256 megabytes inputstandard input outputstandard outputTheatre Square in the capital city of Berland has a rectangular shape with the size n  m meters. On the occasion of the city’s anniver…

数据挖掘算法介绍

数据挖掘算法是创建挖掘模型的机制。若要创建模型,算法将首先分析一组数据,查找特定模式和趋势。然后,算法将使用此分析的结果来定义挖掘模型的参数。 算法创建的挖掘模型可以采用多种形式,这包括: 说明在交易中如何将…

FastDFS、Nginx安装、配置、测试(java client)

生产环境结果应该如下: 本文tracker、storage都在一台机器上!本机既是tracker,又是storage,仅用于测试! 一、需要下载的 fastdfs-nginx-module_v1.15.tar.gz nginx-1.4.1.tar.gz libevent-2.0.21-stable.tar.gz FastDF…

Problem--71A--Codeforces--Way Too Long Words

Way Too Long Words time limit per test2 seconds memory limit per test256 megabytes inputstandard input outputstandard outputSometimes some words like “localization” or “internationalization” are so long that writing them many times in one text is quite…

C#中如何保存文本为Word文件或Excel文件

一, 如何保存文本为Word文件 要在.net中操作Word,就需要在项目中引用Word的对象库文件MSWORD.OLB,这可以在office安装目录下找到(C:"Program Files"Microsoft Office"OFFICE11"MSWORD.OLB),把它引入项目中就可…

ElasticSearch关联查找

ElasticSearch是一个基于Lucene的开源搜索引擎,支持全文检索,提供restful接口。在ES中,提供了类似于MongoDB 的面向文档存储服务,这种面向文档的存储非常灵活,但是文档与文档直接的关联却比较麻烦,MongoDB里…

Problem--158A--Codeforces--Next Round

Next Round time limit per test3 seconds memory limit per test256 megabytes inputstandard input outputstandard output“Contestant who earns a score equal to or greater than the k-th place finisher’s score will advance to the next round, as long as the cont…