这就是他们的商业模式,在你看来甚至是垃圾的信息,都是他们珍视的金矿,或是核心资产,通过措置阐发,将它们批量打包“卖”给视你们为潜在消费者的商家。
所以,数据挖掘和阐发这门活计,几近是从每一个互联网公司自出世之日起就起头要做的,因为光收集你在网上任何蛛丝马迹的信息远远不敷。一般而言,除非你是日砸千金的VIP,老年夜哥不成能一对一对你做个性化办事,因此你只能作为被整合到统一特征范围的整体傍边的一个“样本”,有时候你作为男性的一分子被挖掘和阐发,而另外一些时候你又作为摇滚乐欢愉喜爱者傍边的一员被他们研究。老年夜哥按照他们的经验不竭炮制和修正他们的算法,从而更精准匹配你的需求。
这里牵涉两个层面的问题。一个是对你供献的数据的收集、挖掘和阐发;另外一个则是,有了关于你作为“你”的总体特征之后,能用这些“知识”去做什么而快速地赚到钱呢?之所以说数据其实不是万能的,就体现在第二层面的问题上,乌龙就在所难免了。
比如,某个新闻门户按照你的汗青点击,记实你在每个页面上停留时间还有阅读的内容,于是后台的工作人员起头假定了:你看军事的内容比较多,那估计你是20多岁年轻男子;如果你看的八卦内容比较多,那估计你就是20多岁的女孩。基于这些假定,他们本可以针对你做个性化内容的推荐了,比如判断你是个男生,就给你推时政新闻或是啤酒节的消息。可是,可能昨天阅读太多军事新闻只是你一时兴起,兴许今天你转而对某个明星的八卦感兴趣了。于是,你极不耐烦地把鼠标移到右上角点了叉。
因此你会发现,到现在也没有哪个新闻门户会真的这么做。他们仍是会一视同仁地向你展示经过他们分类编辑好的统一的信息页面。究其原因,不只是你的兴趣是波动不定的,但说到底,仍是因为他们对你体会不敷透彻。虽然他们知道你昨天刚买了个电脑,但鬼知道你今天要看的就是牛仔裤呢?
所以,后台那些整日琢磨怎么从你行为轨迹上挖掘你需求的工程师们,要挖空心思调剂假定、修正算法。数据年夜牛们只要看看一个互联网公司收集数据的根本表格都可以年夜体知道这家公司的数据沉淀及数据应用水平了。这可是老年夜哥们赚钱的命根,这些数据乃至工程师们最引以为傲的算法,保密水平不亚于可口可乐的配方。
当然了,他们即便有再强年夜的算法,还要有劳您继续日复一日地去阅读网页、去交友通信、去签到、去下单买东西啦!他们巴不得网络就是你的全部。
老年夜哥
英语里有一个专有名词,BIG BROTHER,直译为汉语便是“老年夜哥”,典出乔治·奥威尔的名著《1984》。
时间到了2000年,当1984成为一个曩昔的时间符号的时候,英国生产了一档电视娱乐节目《BIG BROTHER》,电视台召集一些年轻男女,把他们放到一个四处布满摄像头的公寓里,拍摄他们的生活然后剪辑播放。同时,在电脑手艺范畴,呈现了一款同名软件,功能为“系统监督”。
无论是电视娱乐节目仍是“系统监督”的得名,都来历于《1984》里的一个经典场景:“老年夜哥在看着你!”在小说《1984》里,乔治·奥威尔为我们描述了一个无处不在的“老年夜哥”形象:一个无时无刻无所不在的“老年夜哥”监督着所有人的一举一动,无论是吃饭、睡觉、工作或走在街上、躲进洞窟——-包含思想勾当。