ITPub博客

首页 > 大数据 > 数据分析 > 分享网络数据收集与分析的方法和要点

分享网络数据收集与分析的方法和要点

数据分析 作者:qw21er43 时间:2012-03-26 10:57:00 0 删除 编辑

数据的收集与分析是从事互联网相关工作人员的必备技能,小到个人站长,大到行业集团决策者,在作任何一个选择与决策的时候,都是以数据作基础与支撑,面对 互联网的各种数据繁杂多变,如何做好数据的收集,整理与分析工作呢,下面我就以个人的实际操作的案例来详细说一下数据的收集与分析的要点,希望对大家有所帮助。

步骤/方法

 1. 1

  明确收集数据方向

  我们要收集的数据是什么?就本案例而言, 要收集的是地方论坛,而且是有人气的地方论坛,这就是方向,如何界定是人气的论坛呢?我们给它一个参数,日均 发贴量,根据以往经验,日均发贴量达3000的论坛,就是很活跃,很有人气的论坛了,(注:日均发贴量3000的论坛是什么概念呢?做过论坛运营的朋友应 该了解,这里就不多说,据了解,可能国内地方论坛达到这个级别的,也就是300个以内,为了确定目标以收集200个为准)只有明确了数据收集的方向,才能 做到有的放矢!

 2. 2

  确定收集数据的方法

  当我们有了收集数据的方向后,就要确定收集数据的方法了,这其实就是要解决两个问题:1.这些数据在哪里可以找到?2.怎么样可以更快速获得想要的数据? 本例找的是地方论坛,数据来自全国各个地方,要获取数据,综合考量有几种方法:1.通过搜索引擎按地名论坛关健词搜索;2.通过一些导航类网站索引进行筛 选;3.以“蜘蛛爬行”的方式查找。当然,这些方法可以独立的用一种,也可以几种结合一起用,目的只有一个,就是能快速收集到我们想要的东西,提高我们的 效率,因为日均发贴量达3000的地方论坛,至少都是地级市的论坛,或者是省级的论坛,所以,如果用搜索引擎,则关键词可设为“地级市名+论坛”“省名+ 论坛”这样的方式让搜索引擎来给我们先做一个查找;如果用导航类网站的索引来查找,则可通过按省到市这样一个从大到小的区域来查找;如果以第三种方式,则 可通过网站的友情链接来扩散,本案中最快的方法是通过导航网站的索引来查找是最快的,因为导航网站相当于已经把论坛作了一次过滤,这样我们查找起来就更方 便了!

 3. 3

  收集与整理数据

  找到方法后,按即定的方针,分别对各个地方的论坛按条件进行初步筛选后,就可以得到一份原始数据了,按下来就是整理这些数据了,首先要对这些收集到的数据 作个评估,为了保证数据有一定的客观性,须对收集到的地方论坛作个监控,利用三五天的时间对收集到的论坛进行每日回访统计,只有平均值达标,才是我们要留 下的数据!

 4. 4

  数据的分析要有切入点

  收集到的收据该怎么进行分析呢,这就需要一个切入点,即你要收集这份数据的目的是什么?根据要求给数据设定一些能反映目的参数,通过参数的对比,才能区分 差别,本例收集的地方论坛,可以有很多用途,比如可以了解人气地方论坛的当前生态,还可以解这些论坛的分布,也就是人气的分布,网民多少的分布,甚至可以 用来与各地方合作作参考,个人站长可以用来发外链等等,只要在分析数时,根据目的设定分析的数据参数,才能反映也所收集的数据的价值所在!

 5. 5

  制作成一份美观,清晰的表格

  收集,整理与分析后的数据,应该是一份表格数据,咱们做数据分析一般使用的是excel表格记录,只有把这份表格制作一份美观,清晰的表格,去掉一些不合 格,多余的数据,才算完成一次网络数据的收集与分析,这样不仅使我们可以清楚的看到这份数据的重点,方便查到所想要的数据,也可以提高日后使用数据的效 率。

  END

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22067966/viewspace-1110489/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
下一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2009-07-08