注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

zjcjack的博客

 
 
 

日志

 
 

大数据价值产生---就在今天  

2012-04-25 12:06:35|  分类: 数据挖掘 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
引言         最近有两个观点看待大数据,要么认为大数据需要在未来逐步发掘价值,要么认为大数据本身就是大忽悠,但我两者都不认同。

大数据无非以两种业务形式存在,一种是事务流程数据,一种是社交网络数据。事务流程数据的本质,就是按照业务流程或产品流程而进行, 例如用户网购行为、用户浏览网页过程、用户银行借贷流程、ERP操作流程等,都属此类;社交网络数据,就是通过通讯、互联网等方式的用户与用户之间的互动、交友产生的行为,都属此类。

我们分清楚两大类数据, 其目的就是看清所谓大数据的本质。例如事务流程分析的核心本质,就是看用户或事务发生的流程,是否符合企业(准确地说是BI使用方)想要的流程行进,BI分析的目的始终围绕是否符合企业的流程行进,如果没有,相关问题是什么,问题出现在哪些方面,我们可以用什么方式来使他们走向“正规”?

社交网路分析的核心本质就要复杂一些,根据社交网络的模式形态,可再细分为交友型社交网络(如交友网站等)、产品功能型社交网络(如专业技术网站)、以及综合型社交网络(如微博,既有交友也有专业问题讨论功能)至少三种分类。

那么这些大数据如何利用,就看商业模式怎么靠拢,大数据涵盖复杂、微妙的信息,要很快分析到极致,是不可能的,漫无目的分析,也没人适用而产生价值。所以最好的办法,就是贴近业务,贴近运营和产品本身。

关键准备工作数据质量和完整性

数据质量是一个专题,这里不做详细介绍,但数据完整性常常被忽略,导致分析无法达到极致,让BI产生应用的价值。

例如物流从A仓库先到B虚拟仓库再转到CD仓库,如果订单数据中,无法将本来2步的流程关联在一起,那么我们无法知道某批货物从AB后,到底去了C还是D,这时就需要保证数据完整性,数据分析才能产生应有的价值

业务细致地分解贴近数据

任何业务流程都是与流程和产品功能组成,任何价值产品的问题和机会,都逃不开流程细节中产生,产品运营问题、产品是否够好,都可以从功能的使用上找到答案。所以如果谁说连业务流程和产品功能都没整理清楚就能做好BI,那肯定是在玩数据,而不是做BI

例如我们发现某款产品用户黏度在降低,活跃用户、使用时间和频率等KPI都在降低,该怎么办?那么我们除了对用户要进行分析,例如分析用户生命周期外,必须对产品的功能都要吃透,才能发现哪些流程和功能让用户改变了看法。当然具体数据分析方法,根据不同业务特点和功能特点,需要具体再选择,这是具体实现的过程。

商业价值导向数据价值事务流程类数据

这类数据是最常见的大数据,他们的最大2个陷阱是:

1.  弄错业务运营与数据分析的顺序。例如我们想利用好商品的周期性,增强销售和用户粘性。但如果你是想先通过数据分析找出周期性,然后再想办法改善运营,就是完全荒谬的流程。因为购买周期性是运营措施引导用户根据商品周期性而产生,如果你没有引导,绝大数情况不会自动产生周期性,用户没那么听话。

2.  业务流程和产品功能整理得不够细,例如电商访问分析中,如果你忽略了用户看帮助的动作,那么你就会忽略他后面的行为,到底是因为什么原因而中止购买,会简单认为可能只是逛逛,业务他不太明白某些事情而中止,单是你数据分析中可能忽略了。

社交网络类数据

事务流程类数据价值容易理解一些,但是社交网络数据价值,恐怕难度很大,一则社交网路商业价值本身有待开发,其次大用户集社交网络计算量庞大,随着用户量规模上涨呈指数级上升,导致很多情况下,大家关注点是在技术本身,而非如何挖掘数据在商业上的价值。

其实社交网络的价值是比较明确的,只不过在实际运营中会有难度,并非社交网络就是用户与用户之间的关系这么单纯。

例如综合型社交网络,它的表面上的核心目的,是增强用户粘性,对用户的价值,是让用户在上面既能找到自己想要的信息,也能找到合适自己的朋友,同时自己发布的信息有合适听众。

那么潜在商业价值至少有专题访谈推广(靠综合人气,而非社交)、社会化推广(借助社交网络口碑化传播)、精确传播(通过用户行为、社交网络传播)、专业**(通过用户行为了解用户专业倾向以及圈子的影响力)、直接广告、VIP用户精确服务。

从每个业务目的来说,并不需要把网状关系图全部计算出来才能产生价值,反之如果我们身陷网状社会关系图的描述中,往往会迷失分析的真正目的。

例如从A用户到D用户没有直接社交关系,但通过最近路径计算,可以通过A关系B,然后B关系C,最后C关系D,发现这是他们最近的关系图,但是这种路径计算毫无明显的业务价值和商业价值,太绕而迷失计算算法中。如果我们需要让合适的话题让合适的需求者知道,并非需要这样的计算达到目标,而是直接通过精确的用户类型和话题分类分析,直接引导和推荐达到该目的。

总结大数据无非就那么两大类,它们的价值完全隐藏在我们需要的业务中,他们的信息还有那些不能满足我们,这也完全看我们对业务的理解发现,然后再去找更多的数据,来满足我们对数据的进一步需求。
  评论这张
 
阅读(244)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017