一 : 大数据时代:无法替代的百度
在大数据时代,对于个人来说,大部分数据都是跟自己无关的,一个人需要的数据往往只占很小的比例,就像太平洋当中的一滴水。因此,挑选和筛选数据成为大数据时代的常见现象。而这个挑选和筛选数据的过程,就是传说中的搜索。
有海量数据产生的地方,搜索就有价值。当今的海量数据,大体可以分为两大类:死数据和活数据。死数据即传统的网页数据,具有媒体属性。活数据即为个人量身 定制的数据,具有一个人属性。网页数据是通过传统的搜索引擎搜出来的,如百度、谷歌等,一万个人输入同一个关键词,得到的是同样的结果。而活数据是通过新 兴的社交搜索搜出来的,一万个人输入同一个关键词,得到的是一万个结果。
可能看到这里,很多人会对第二种搜索更感兴趣一些,并且看到了未来的一个大趋势。2010年,美国《连线》杂志的克里斯·安德森就喊出了那一句著名的“web is dead!”,引起了业界的轩然大波。很多人也开始反思网页数据是不是逐渐要被淘汰了。
其实,说网页数据已死,真的太绝对了,说基于Web数据的传统搜索也要死去,也太偏激了。只能说社交数据的爆炸过于猛烈,一下子吸引了人们太多的注意力。但是热潮过后,人们还是会回归理智,继续依赖网页数据。
社交平台的兴起必然会带动海量碎片化数据的产生,这时候就会产生一个社交数据搜索的需求。但是这个搜索并不会挑战到传统搜索,甚至根本不会对传统搜索产生 干扰。中国的云云搜索做得再好,对百度的冲击也是非常微弱的。因为活数据和死数据根本就不能放在一个池子里。如果这两者混在一起,就像一锅八宝粥,用户无 论用传统搜索引擎去搜还是用社交引擎去搜得到的依然是八宝粥,需要自己再进行繁琐的二次甚至三次筛选。
两种搜索必须分离,因为传统搜索的基因和社交搜索的基因是截然不同的。传统搜索拥有的而是媒体基因,而社交搜索拥有的是社交基因。媒体基因讲求的是一点对 多点,用户接收的是同样的东西,而社交基因则是多点对多点,用户接收的是自己社交圈子的个性化东西。比如用百度搜一个“科比”,得到的可能是人物简介、高 清视频、档案资料等东西,而用社交搜索引擎搜一下得到的可能是“有多少人关注了科比”、“大家对科比的评价怎么样”、“谁与科比成为了朋友”等等。传统搜 索搜出来的东西没有包含用户关系在里头,谁也不认识谁。而社交搜索搜出来的东西则是自己的亲朋好友所推荐的、关注的,你也是可以参与进去的。
然而说社交搜索对传统搜索没有影响,那我自己也承认太绝对了。起码社交搜索会从实时性和真实性上对传统搜索形成挑战。比如用户在百度上搜一个“NBA”, 可能得到的是百科介绍,但是这并不是用户需要的东西,用户可能想得到的是实时赛况描述和比分结果,而这在微博搜索上就可以轻易获得。另外,用户在百度上搜 某一款不熟悉的手机,可能会得到很多评价,但是你会相信这些评价吗?当下五毛党和水军绝对不是吃素的,这些评价只能参考一下。但是在自己的朋友圈里搜一下 这个手机时,得到的一定是最真实的评价,除非你不相信你的朋友。
除此之外,传统搜索依然可以守住一块大蛋糕,那就是经典的知识和信息,如百科知识、课程、品牌网站等等。如果传统搜索能够把这些死数据好好整合,传统搜索 依然是一个强大的知识媒体,依然是用户的首选。就像我们将来有一个孩子时,无论家里或者亲戚朋友圈中有几个教授,我们都会把孩子送到好学校接受教育,而不 是让家里的多个教授来培养。有些东西不是那么容易替代的。
本文由仓储货架http://www.nuobeirack.com/原创,转载请标明出处,谢谢!
二 : 51CTO专访巨杉数据库CTO王涛:大数据时代数据处理和技术选型的方法
大数据已经渗透到各行各业之中,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。随着数据量的不断增大、以及对数据存储检索要求的不断提高,数据库技术也同大数据一样被推到风口浪尖。51CTO专访巨杉数据库CTO王涛为您解读大数据时代,数据处理和技术选型的方法。
记者:介绍一下您之前的工作经历,以及巨杉数据库的情况?
嘉宾:最初我在IBM做DB2关系型数据库,但是到了2011、2012年的时候,大数据行业不断兴起,我们发现IBMDB2的数据库不符合未来的趋势,于是我们就在北美做了一个数据库引擎,也就是NoSQL。后来,把它带到国内,将其产品化。在2012年巨杉数据库成立,2013年推出第一个版本,很快就有了第一个客户,后来我们的客户遍及政府、金融、电信等行业。到2014年我们完成了Pre-A轮和A轮两轮融资。
记者:刚才您也提到对政府、电信、金融等行业的支持,现在应用这个数据库自主研究数据库的效果和情况怎么样?
嘉宾:首先NoSQL是一个稳打类的数据库,我们不是世界上第一家,在国外Hadoop跟我们比较相似,我们也在跟很多接口上跟Hadoop兼容。
MonggoDB在国外的市场份额非常大,之前有老外做了测评在功能、性能上Hadoop在某些场景下是非常有优势的。
Monggodb有一个特点就是功能非常多,但有很多不实用的东西存在,而我们有具有后发优势—看清楚市场需求,进而推出产品,然后更新。同时我们同mongdb的最大不同是,SQL方面我们会更多的关注企业级的市场,
记者:刚才你也提到Hadoop这种存储方式,各种存储方式都有优缺点,对于处理大数据的处理以及与Hadoop Spark技术的结合关于这种技术选型,对开发者有什么建议?
嘉宾:现在Oracle的东西已经不在讨论的范畴之中,基本上都在说MySQL。虽然MySQL现在很多人都在用,但是这种MySQL对于应用的开发和运维是非常不友好的。第二就是在性能方面,当用户做一些大的关联的时候,极有可能会产生数据风暴,里面很多数据进行交换,这是非常可怕的,处理不好会出现非常严重的问题。
于是就有人提出用NoSQL这种新一代的数据结构。NoSQL现在用的比较多的三大分支是KV、宽表、文档。KV的用法很多,一般是用作缓存,Redismemcached等等。我想要说的是真正做数据化存储的两大类;一个是宽表类,另一个是文档类。
宽表类的优势体现在列存储上,但并不是传统意义上的列存储,有点像列簇,举个例子来说,比如有一万个字段,一条记录,把它集中十份,每份有一千个字段,这一千个字段所代表的是逻辑上比较相近的东西,我可以把每一千个字段独立的分布在机器上、当我需要查找的时候,只要拿出其中一部分就可以了,但是大家很少会用到这么多东西。
而文档类的数据库在我看来是最接近关系型数据库的一种,虽然Hadoop的功能做的很丰富、但是大家都默认它是文档类的工作。
现在很多文档有一个行存储,而且一般支持随机索引,例如我们可以在A字段做索引,过几天再做B字段的索引,这样沃恩可以在很多个字段上做随机查找,就不像宽表那样只能在键值段做索引。例如在电信的应用场景里,我查找主叫号码和被叫号码,我就可以使用文档型数据库建立索引查找。
记者:企业现在数据量越来越大,对数据库的扩容要求也很高,SQL在这个方面或者说巨杉数据库在这个方面优势在哪儿,或者说怎么处理这个扩容的问题?
嘉宾:如果说到扩容,那么传统的DB2是大家最熟悉的了。之前在IBM的时候有一个客户是256节点,需要增加64个,于是IBM派人做了一个月才做完
现在做非关系型数据库会使用到各种机制,当我需要插入新的功能节点的时候,我只需要去移动最少量的数据,而其他还是稳定的存储,这基本上就可以做到轻易扩容。
记者:刚才你也提到关系型数据库,SQL对于关系型数据库,相对传统一些的数据库,它俩会是什么关系,会是什么样的方式存在?是取代还是?
嘉宾:我认为两者的关系既不是并存也不是取代而是融合,毕竟SQL有它自身的价值和应用范围,SQL永久性存储的能力还是非常好的。所以SQL不会被淘汰,而是一个强结构化的变化。在传统金融业务上没有道理需要用NoSQL取代SQL,因为SQL数据结构是非常严谨的。
反观这种严谨性所带来的应用开发延迟所导致的不够敏捷,在互联网业务上的弊端也就暴露无疑了,其实这也是NoSQL的地位所在。
这两者在将来会是有一个互相融合的趋势,NoSQL自身不会有接口。我认为所谓非结构化存储或者半结构化存储,相当于结构化存储里面的某一个部分。从某种意义上来讲,使用非结构化存储也可以满足很多结构化存储的需求。在上层完善的时,完全可以把SQL引入。我们也看到了在很多地方在尝试引用NoSQL的概念,,两者之间越来越像,可能某一天就融合了。
记者:现在这种对于大数据库Hadoop、spark,传统的那些数据库,对处理方式的支持上有什么弊端,遇到了什么问题?无论是Hadoop还是Spark,NoSQL对于它们的支持优势在哪?
嘉宾:Hadoop它讲究的是弹性扩张,水平扩张,传统的关系型数据库刚最大的问题就是扩张不容易,甚至ORACLE这种完全是无法扩张的,这样的话就是你的上层扩张了一百台机器,底下很多东西东西,没有一个本质上的提升。所以不管上面怎么扩,底下还是那样一个瓶颈。 而最NoSQL本身是分布式的,Hadoop、spark也都是分布式的,我们做的conect这个接口可以让Hadoop用本地的方式访问本地的NoSQL的数据,这样的结合就很紧密。
三 : 大数据时代的EDM新玩法
摘要:基本已经处于被玩剩下的EDM(许可式电子邮件营销)如今有了新玩法,无论是土豪大牌还是平民无名品牌,任何推广方式的效果保证前提都是找到对的人,说对的话。
“在工作中,每天当你到办公室打开电脑,习惯性的会去通过即时通信工具和邮箱去查看沟通信息或者工作文件,随即你在 Foxmail或者Outlook,亦或是其他邮箱登陆平台上浏览你的企业邮箱及个人邮箱时,就会有各种品牌通过你注册会员账号所留下的邮箱地址把EDM(许可式电子邮件营销)投送到你的眼前,五花八门,但因为内容是你关注过或者所希望拥有和感兴趣的,所以你不会厌烦,甚至会开启邮件,如果这是一个高回报率的信息,你可能会收藏在会员账户中,等待适当的时候出手。”新网EDM营销人员对EDM现状做了以上简单的阐述和分析。
小编通过采访了解到这就是EDM营销所带来的效应,因为在获取的会员信息中,以及在用户浏览、收藏、消费等行为下的数据收集,结合消费者心理和习惯进行分类,进一步优化具有针对性的方案,最终达成精准的数据库营销模式,从而有的放矢的解决海量信息中,怎么才能把有价值的内容投放给目标消费群体。新网(xinnet.com)EDM营销人员透露“EDM营销并非新营销方式,但是随着云计算技术的兴起,大数据的应用,逐渐挖掘出EDM的真正价值,就是‘精准人群+精准内容’,怎么理解?
l 精准人群的搜集、分类和深度挖掘
新网 EDM营销人员给小编举了个例子,比如在北京国贸附近有一家小型餐饮店面,隐藏在布满商铺的商务办公楼之间,餐饮店每天早上派一名服务员或者雇佣派发人员在地铁口和周边上班族的必经之路上分发DM单,在上班高峰期早8:00-9:00之间,平均每5秒钟发出一张,1小时可以发出720份,经调查有超过50%的人不会接收,有20%的人可能因为新店开业或者折扣信息而接收,其余人员可能礼貌性接收后直接丢掉或者收集起来以备用,这样的到达率和阅读率都极低,按发放千份估算每天成本在100元左右。但如果使用EDM,同样对周围人群发送电子版的宣传单页,按照新网EDM 40000封1500元计算,平均每封折合单价0.038元,千份估算每天成本在38元左右。大大降低了宣传投入的成本,其次这些用户的地址信息还可被重复利用。
说的这么好,小编会想EDM地址信息从哪里来,EDM最难最主要的也是精准的地址库,因为地址信息收集后,需要在使用过程中反复验证,系统筛查并进行统计分析,才能发挥其作用。从这方面小编根据新网营销人员提供的信息,总结出两点来分享给大家,一种是像新网EDM,其有超过3亿有效地址库,可以根据地域等要素进行交叉分类。另外一种是超精细化的排查,例如在QQ即时通讯系统查找附近的人,或是根据所属省市区县进行垂直分类,来获取店铺周边的ID号,收集整理成表格导入EDM地址库中,达到精准人群精准投放。
但收集到精准邮箱地址,完全可以使用个人邮箱群发的途径,新网营销人员解答了小编的疑问,例如使用QQ邮箱群发,但如果对方不是QQ好友就有可能直接被拦截或进入垃圾邮箱。所以在使用EDM平台时要首先了解到,与网易、腾讯、263等常用邮箱是否有战略合作关系,以避免无法到达的情况,并可以高速、畅通、定时到达有效群体。
l 精准内容读懂用户心灵,直达用户眼球
精准人群找到了,需要制作出针对这些人群的内容信息,新颖的标题和个性化内容是必不可少的,这需要在邮件模版设计过程中花费不少心思,才能够一眼就抓住消费者的眼球,对于很多用户而言,在使用EDM过程中的另一个难题就是设计制作内容模版,根据用户的商品信息定制化设计;延续品牌形象特征;平实用词,避免使用高调的促销宣传词语;定时在用户收发邮件高峰期进行发送。
同时,EDM最主要的价值还有对到达效果、阅读人数、阅读次数、点击人数、点击人次等数据的交叉统计分析,在已定位的精准人群基础上进一步的做更加详尽而有效的统计。这样才能了解消费者对哪些信息感兴趣,以及发送时间段对消费者打开阅读率和最终购买的影响,从而能够估算出通过邮箱进入官网的流量,以及最终转化率和收益率。
通过这一系列的数据分析,可以说大数据在EDM或者说EDM在大数据时代起到了真正的作用。建议可以综合微博、微信等自媒体信息式轰炸,形成多维立体的传播效果,在内容不断的通过多维度提示中,使消费者感知购买后的价值,刺激消费者购买欲望,从而形成更多的销售转化。
四 : 大数据时代 EDM的新玩法
摘要:基本已经处于被玩剩下的EDM(许可式电子邮件营销)如今有了新玩法,无论是土豪大牌还是平民无名品牌,任何推广方式的效果保证前提都是找到对的人,说对的话。
“在工作中,每天当你到办公室打开电脑,习惯性的会去通过即时通信工具和邮箱去查看沟通信息或者工作文件,随即你在 Foxmail或者Outlook,亦或是其他邮箱登陆平台上浏览你的企业邮箱及个人邮箱时,就会有各种品牌通过你注册会员账号所留下的邮箱地址把EDM(许可式电子邮件营销)投送到你的眼前,五花八门,但因为内容是你关注过或者所希望拥有和感兴趣的,所以你不会厌烦,甚至会开启邮件,如果这是一个高回报率的信息,你可能会收藏在会员账户中,等待适当的时候出手。”新网EDM营销人员对EDM现状做了以上简单的阐述和分析。
小编通过采访了解到这就是EDM营销所带来的效应,因为在获取的会员信息中,以及在用户浏览、收藏、消费等行为下的数据收集,结合消费者心理和习惯进行分类,进一步优化具有针对性的方案,最终达成精准的数据库营销模式,从而有的放矢的解决海量信息中,怎么才能把有价值的内容投放给目标消费群体。新网(xinnet.com)EDM营销人员透露“EDM营销并非新营销方式,但是随着云计算技术的兴起,大数据的应用,逐渐挖掘出EDM的真正价值,就是‘精准人群+精准内容’,怎么理解?
l 精准人群的搜集、分类和深度挖掘
新网 EDM营销人员给小编举了个例子,比如在北京国贸附近有一家小型餐饮店面,隐藏在布满商铺的商务办公楼之间,餐饮店每天早上派一名服务员或者雇佣派发人员在地铁口和周边上班族的必经之路上分发DM单,在上班高峰期早8:00-9:00之间,平均每5秒钟发出一张,1小时可以发出720份,经调查有超过50%的人不会接收,有20%的人可能因为新店开业或者折扣信息而接收,其余人员可能礼貌性接收后直接丢掉或者收集起来以备用,这样的到达率和阅读率都极低,按发放千份估算每天成本在100元左右。但如果使用EDM,同样对周围人群发送电子版的宣传单页,按照新网EDM 40000封1500元计算,平均每封折合单价0.038元,千份估算每天成本在38元左右。大大降低了宣传投入的成本,其次这些用户的地址信息还可被重复利用。
说的这么好,小编会想EDM地址信息从哪里来,EDM最难最主要的也是精准的地址库,因为地址信息收集后,需要在使用过程中反复验证,系统筛查并进行统计分析,才能发挥其作用。从这方面小编根据新网营销人员提供的信息,总结出两点来分享给大家,一种是像新网EDM,其有超过3亿有效地址库,可以根据地域等要素进行交叉分类。另外一种是超精细化的排查,例如在QQ即时通讯系统查找附近的人,或是根据所属省市区县进行垂直分类,来获取店铺周边的ID号,收集整理成表格导入EDM地址库中,达到精准人群精准投放。
但收集到精准邮箱地址,完全可以使用个人邮箱群发的途径,新网营销人员解答了小编的疑问,例如使用QQ邮箱群发,但如果对方不是QQ好友就有可能直接被拦截或进入垃圾邮箱。所以在使用EDM平台时要首先了解到,与网易、腾讯、263等常用邮箱是否有战略合作关系,以避免无法到达的情况,并可以高速、畅通、定时到达有效群体。
l 精准内容读懂用户心灵,直达用户眼球
精准人群找到了,需要制作出针对这些人群的内容信息,新颖的标题和个性化内容是必不可少的,这需要在邮件模版设计过程中花费不少心思,才能够一眼就抓住消费者的眼球,对于很多用户而言,在使用EDM过程中的另一个难题就是设计制作内容模版,根据用户的商品信息定制化设计;延续品牌形象特征;平实用词,避免使用高调的促销宣传词语;定时在用户收发邮件高峰期进行发送。
同时,EDM最主要的价值还有对到达效果、阅读人数、阅读次数、点击人数、点击人次等数据的交叉统计分析,在已定位的精准人群基础上进一步的做更加详尽而有效的统计。这样才能了解消费者对哪些信息感兴趣,以及发送时间段对消费者打开阅读率和最终购买的影响,从而能够估算出通过邮箱进入官网的流量,以及最终转化率和收益率。
通过这一系列的数据分析,可以说大数据在EDM或者说EDM在大数据时代起到了真正的作用。建议可以综合微博、微信等自媒体信息式轰炸,形成多维立体的传播效果,在内容不断的通过多维度提示中,使消费者感知购买后的价值,刺激消费者购买欲望,从而形成更多的销售转化。
五 : 大数据时代 如何理解“大数据”
最早提出“大数据”概念的学科是“天文学”和“基因学”,这两个学科从诞生之日起就依赖于“基于海量数据的分析”方法。
大数据可以说是“计算机”和“互联网”结合的产物,计算机实现了数据的“数字化”;互联网实现了数据的“网络化”;两者结合才赋予了“大数据”生命力!
随着互联网如同空气、水、电一样无处不在地渗透入我们的工作和生活,加上移动互联网、物联网、可穿戴联网设备的普及,新的“数据”正在以指数级别的加速度产生。据说目前世界上90%的“数据”是互联网出现以后迅速产生的。
不过,抛开数据的海量化生产和存储这种表面现象,我们更加要关注的是由数据量变带来的质变,这种“质变”表现在以下3个方面:
1)数据思维
大数据时代带给我们的是一种全新的“思维方式”,思维方式的改变在下一代成为社会生产中流砥柱的时候就会带来产业的颠覆性变革!
- 分析全面的数据而非随机抽样;
- 重视数据的复杂性,弱化精确性;
- 关注数据的相关性,而非因果关系。
历来的商业变革都是由“思维方式的转变”开始的,旧的经济体制和传统的商业理念面临新的商业思维逻辑的时候,如果大脑不能与时俱进,吸收并转变为顺应潮流的新思维,通过新思维重新组织企业组织的战略、结构、文化和各种策略,那么貌似强大的体魄反而变成了企业前进的累赘。这种新思维颠覆巨头的案例最先发生在信息技术的传统领域,然后渗透到传统的商业领域:黑莓(Blackberry)、摩托罗拉、诺基亚、柯达、雅虎。。。案例比比皆是!
当然,这些企业的没落并不是因为没有“数据思维”,但他们都是被“新互联网思维”淘汰的昔日巨人。“数据思维”是最新的思想,其影响力还没有发展到导致巨头轰然倒塌。但是,如果不给予足够的重视,下一波没落王国的名单中,可能就会有你!
2)数据资产
大数据时代,我们需要更加全面的数据来提高分析(预测)的准确度,因此我们就需要更多廉价、便捷、自动的数据生产工具。除了我们在互联网虚拟世界使用浏览器、软件有意或者无意留下的各种“个人信息数据”之外,我们正在用手机、智能手表、智能手环、智能项链等各种可穿戴数码产品生产数据;我们家里的路由器、电视机、空调、冰箱、饮水机、吸尘器、智能玩具等也开始越来越智能并且具备了联网功能,这些家用电器在更好地服务我们的同时,也在生产大量的数据;甚至我们出去逛街,商户的路由器,运营商的WLAN和3G,无处不在的摄像头电子眼,百货大楼的自助屏幕,银行的ATM,加油站以及遍布各个便利店的刷卡机都在收集和生产数据。
在互联网领域,我们喜欢说“入口”这个词,“入口”对应的直接意义是“流量”,而流量在互联网领域就意味着“金钱”,这种流量变现可能是广告,可能是游戏,也可能是电商。在大数据时代,“入口”这个词还有更深刻的意义,那就是“数据生产的源头”,用户通过某个APP或者硬件产品满足某种需求的同事,也会留下一系列相关的“数据”,这些数据的合理使用可以让拥有这部分数据的企业获得更大的商业利益!所以,在“大数据”时代,意识到“数据也是资产”的公司都已经开始在各个“数据生产的源头”进行布局,可能是一个解决刚兴需求的WEB网站,也可能是一个单纯的工具APP,还可能是一个可穿戴的数码产品!
3)数据变现
有了“数据资产”,就要通过“分析”来挖掘“资产”的价值,然后“变现”为用户价值、股东价值甚至社会价值。
大数据分析的核心目的就是“预测”,在海量数据的基础上,通过“机器学习”相关的各种技术和数学建模来预测事情发生的可能性并采取相应措施。预测股价、预测机票价格、预测流感等等。
“预测事情发生的可能性”继续往下延伸,就可以通过适当的“干预”,来引导事情向着期望的方向发展。比如亚马逊和所有的电商一样,都会基于对用户的喜好及消费能力分析来推荐“商品”,引导用户提高消费金额;Google等互联网巨头也会通过各种技术手段来试图向不同的用户展现不同的广告,并称之为“精准营销”,由此来提高点击率(公司收入);网游公司也会在运营工程中通过玩家行为数据的分析来及时调整游戏关卡及计费点等设计。
最后,如果你看了这段文字还不能更好地理解“大数据”时代的“预测未来”能力,那么我推荐你看看热播美剧《疑犯追踪》!
本文标题:大数据时代管理方法-大数据时代:无法替代的百度61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1