注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

zjcjack的博客

 
 
 

日志

 
 

关于构建数据分析团队的一些思考  

2012-06-19 16:38:40|  分类: 数据挖掘 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Big Data 最近在互联网圈子很流行,互联网在创造大量数据的同时,面临这如何存储,检索,分析,利用这些数据的难题。但是如果没有应用场景,大数据本身,除了浪费资源外,没有太大的实际价值。因此,不管你是因为怀有对高科技的热情而关注这个热点领域,还是因为公司战略而研究海量数据,下面的问题是每个从业者都需要思考的:

你的数据分析团队需要做什么?

摆在我们面前的可能是一堆数据,访问日志,性能日志,行为日志 … 。同时还有一堆问题,如何提升用户转化率? 提升设备利用率? ,我们如何把数据同问题联系起来,如何建立起描述问题的数据模型?,度量数据的指标Metric 是不是得到大家的认可? 谁需要这些数据? ,在生产环境中,如何检验数据或者模型的效果?

第一个问题直接导致了第二个问题: 你现在思考问题的方式或许是错误的

在构建数据分析团队时候,你需要招聘个大拿进来,获取你给他个数据科学家,或者数据分析师什么的Title 。这个人进来,或许要推翻你旧有的想法。国外给这个人的时间是3个月,国内的团队可能会更长一些,把问题丢给他们。在3个月的时间内,让他们用全新的方式思考问题。这里有篇文章可以参考 “创建一个数据分析团队

如何为数据分析团队配置资源

数据分析团队成员的背景会比较多元化,有搞统计的,搞建模的,搞数据清洗的,搞基础设施的。 我们要解决这个联队,如何融入现有的组织结构。 因为团队目标不同,所以同普通的工程团队项目,支持方式也不同,比如要不要在数据分析团队适用现有的开发,运维规范?。

团队成员如何产出

数据分析最终会落实到生产环境代码中,比如一个模型,需要20台机器,每天定时跑。一般情况下数据分析人员会缺乏生产环境经验,比如写代码,部署,运维等。因此在工程团队和数据分析团队中,要有数据会商,沟通机制。 在人力资源允许的情况下,是不是可以考虑工程师轮岗机制,工程团队的同事,定期轮岗到数据分析团队中,处理数据团队的工程难题

数据科学家能够让你更好的思考你的问题集了吗?

数据科学家一般来源于不同于工程团队的背景,比如数据系,统计系。这些人的背景和技能,在工程团队会比较稀缺。在同数据团队每天的沟通中,你要能够从新的角度思考问题,并且在公司范围内,让更多的人了解到数据团队的产出。

人人都想了解数据分析

在公司里面,要把数据团队比较好的隔离开来,与其跟其他部门解释比较复杂的数据分析过程,还不如让大家关注业务上面的产出。类似的沟通问题,可以参考产品经理团队和工程团队沟通的经验。

工具问题

虽然有开源的软件栈,比如Mysql, Pentaho , Hadoop ,Hbase ,R 但是这些产品本身非常工程化,使用成本很高,并且存在诸多不稳定因素。因此目前的数据分析人员,更多的像拿着原始的步枪在工作。 在实际工作中,不要忽略数据处理工具本身,对团队产出的影响

  评论这张
 
阅读(295)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017