一 : 下一代腾讯网:大数据时代的智慧门户
7月3日,国内最大的综合门户腾讯网正式启用新版首页。同时,腾讯公司网络媒体事业群宣布启动门户、微博、视频、无线的跨平台深度整合战略,期待实现“1+1+1+1>4”的效果,着力将下一代腾讯网打造成大数据时代的智慧门户。
据了解,用户打开新版腾讯网首页时将自动登录,除了栏目导航指引更清晰以外,还能看到聚合了腾讯微博社交属性和腾讯视频可视化效果的全新门户形态。比如,“大家爱看”栏目的资讯将按照用户微博关系链来呈现,财经频道则将根据用户需求提供自选股等完全个性化的内容。
腾讯公司网络媒体事业群总裁刘胜义表示:“五年前,腾讯就率先尝试为用户和广告主提供跨平台的媒体解决方案,同时率先倡导代表网络媒体先进营销思想的腾讯智慧(MIND)营销方法论。现在,腾讯网媒的变革进一步深化,朝着社会化、人性化、便携化的方向不断发展,而此次改版,正是基于变革思路构建‘下一代腾讯网’的第一步。我们会强化新媒体平台的融合与对用户需求的挖掘,最终目标是要构建一个能读懂用户心理的智慧门户。”
经过多年发展,目前腾讯网从用户数、流量和收入来说都已位于行业前列。今年一季度,腾讯网络广告业务收入达8580万美元,成为国内最大的在线营销平台。
腾讯网总编辑陈菊红指出,在传统门户时代,与流量伴生的数据的价值长期被低估。进入大数据时代后,腾讯将从这些海量数据中挖掘、分辨出用户的行为模式、兴趣偏好等。比如,用户对资讯的偏好不仅和兴趣相关,也和所处的阅读场景、资讯的关联性等其他方面相关。通过对这些方面的日常数据的累积和挖掘,腾讯网就可以很准确地向用户推荐最适合的内容,打造专属于每个人的智慧门户。
在有智慧的下一代腾讯网中,腾讯网、腾讯微博、腾讯视频中的相关内容,不但可以根据用户心理和行为轨迹整体展现,还将相互联动。以即将到来的伦敦奥运为例,用户可以通过“跨栏”的微博标签找到刘翔的奥运新闻和点评,而一旦用户收听了刘翔的微博,就可以在访问腾讯网时看到刘翔的奥运微博专题和赛事视频。这种在腾讯网相关内容报道中嵌入相应视频和微博的方式,让用户实现内容的一站式阅览。同时,系统还可以从腾讯微博找到用户的兴趣点,让腾讯网生成更有针对性的内容。
业内专家表示,腾讯网的此次改版和向智能方向演进的下一代腾讯网,着重满足用户对信息的可视化、社交化、个性化、移动化等需求,符合互联网整体发展方向。更意味着门户网媒在长时间的同质化竞争后,开始通过产品设计寻求差异化布局。“下一代腾讯网很可能是国内唯一的大型混合式全媒体平台。如果能在产品形态融合和大数据上有实质性的突破,将是对传统门户的一次彻底变革。”
突破传统门户边界
从1994年雅虎成立至今,门户网媒是历史最久的大众互联网产品之一。第一代门户主要通过罗列海量新闻满足用户对资讯的需求,第二代门户试图成为能够交互的资讯平台,但并不成功。很长一段时间里,门户的形态没有本质变化,始终扮演用户在互联网上的一个简单入口和资讯提供商的角色。门户鼻祖雅虎近年来业绩急速下滑,国内几大门户网媒也始终没有突破同质化竞争的瓶颈。
如今,社交网络的兴起和移动互联网的成熟正在深刻改变每个人接受信息的习惯和路径,微博、视频等新的媒体形态不断对传统门户网媒发起挑战。美国互联网信息统计公司ComScore数据显示,目前美国用户在社交网站的平均停留时间为总时间的16.6%,而门户网站则为16.7%,预计今年内前者将首次超越后者。同样的趋势也发生在中国。门户网媒开始向基于大数据的以人为本的第三代演进。
“除了社交网站的兴起,可视化的视频内容和移动化的客户端这些新产品都使国内互联网媒体生态环境发生了质的变化。门户网媒必须突破传统的单一服务和经营模式,响应用户更便捷、个性化、能进行社交分享、极致体验等需求。“腾讯网总编辑陈菊红表示。
据介绍,腾讯网络媒体事业群早在一年前就开始思考如何以用户关系链为核心,打通腾讯旗下门户、微博和视频三大平台。比如,腾讯视频很早就开始布局可视化媒体产品,令传统图文为主的网络门户变得更立体化。同时,腾讯网在移动客户端领域也开始集中发力,腾讯微博、腾讯新闻、腾讯爱看、腾讯自选股等客户端相继推陈出新,结合微信的资讯模块、手机腾讯网和Pad版腾讯网,搭建的起覆盖数亿用户的移动产品矩阵。
全方位构建下一代腾讯网的努力已取得初步回报。腾讯网在欧洲杯的报道上成为国内第一家跨平台(腾讯网体育频道、腾讯视频、腾讯微博)和全终端(PC、Pad、手机)直播大型体育赛事的网媒,并且实现盈利,为接下来的奥运报道大战打下基础。
腾讯在欧洲杯的成功说明,相比传统门户网媒一味强调的“大门户“模式,符合便携化、人性化、社会化大趋势的营销平台更受欢迎。”我们倡导的大数据时代的智慧门户,不仅要秉承腾讯的社交基因,充分利用大数据和关系链,为用户筛选、推荐最适合他的内容,也要建立一个真正基于效果和用户关系的自主营销平台。“陈菊红表示。她指出,腾讯的广告产品不再只是基于传统网络媒体的展示,更多是基于用户社交关系链的口碑营销。下一代腾讯网正是腾讯社会化营销平台的核心之一。
二 : 大数据时代的管理会计
在我国面临全面改革,实现经济转型升级的今天,正适逢世界走向数据化,迈入大数据时代的时刻。笔者作为长期致力于将管理会计理论和实战方法“本土化”的实践者,也深刻体会到在大数据时代,我们需要用管理(www.61k.com]会计的思维来开创一个新的管理时代的需求,大数据正影响着这个时代的管理会计。
首先,大数据时代为充分发挥管理会计的职能提供了重要支撑。
大数据以预测为核心,而管理会计的一项重要职能就是做好企业当前经营和长期规划的经济前景预测,并帮助企业管理者做出正确的决策。在复杂多变的宏观经济形势下,如何把握企业经济的发展方向,使企业更好地适应市场需求,是体现企业综合管理水平的重要方面。而预测分析正是唯一可持续做好企业当前经营和长期规划的经济前景预测,以及长期竞争优势的工具――不但有能力回答企业经营管理中的各种问题,关键是可以发现问题,帮助企业确定科学合理的战略目标。而大数据为预测分析提供了基础数据和依据,可以在更大程度上提高预测结果的准确性和可靠性。
以战略成本为例,战略成本管理是始于通过路径分解进行的战略规划。而管理会计一项重要的工作是对企业前一年取得的工作成果、不足、优势和劣势进行总结,对新一年的目标进行定性和定量的描述,做到寻找路径、识别风险因子、合理配置资源和可落地的到人与时间点的行动计划。而做好战略成本,要将战略与绩效管理进行关联,即在制作规划的过程中,将公司的战略分解成具体可量化的目标,然后通过价值树形成公司绩效到部门绩效再到岗位绩效目标的一体化,并将公司目标、绩效指标、预算形成有效的关联。
其次,大数据时代也使得管理会计成为助力企业价值提升的助推器。
大数据给人类带来的是生活、工作和思维的变革,企业也将面临众多机遇和挑战,而掌控风险将成为企业管理变革的重要课题。管理会计的重要特征之一就是控制经济活动过程,使之按设定的目标和轨迹运行。而作为企业内部管控最有效的一种工具,全面预算管理正是实现企业“战略、业务、财务和人力”四位一体的最有效方法,而“四位一体”的根本目的是通过全面预算管理,使企业的各部门对经营目标形成统一的认识,以产生战略协同效应。
战略管理与全面预算管理的关系也是相互促进的,因此,企业实施全面预算管理过程中的基础数据也非常重要,如果基础数据不准确、不透明、不对称、不集成,整个预算就是“无源之水、无本之木”,企业高层的决策者就难以获取准确的信息。
第三,在大数据时代,财务部门的角色定位将从根本上发生转变。
对企业而言,大数据时代不仅为管理会计理论和方法的推广与运用提供了重要支撑,同时也助力了企业价值的提升。而大数据时代也将对企业传统的盈利模式提出挑战,盈利模式的变革对职能部门的角色定位也必将提出新的要求。
在大数据时代背景下,企业财务部门的定位不再是“成本中心”,而是“利润中心”。那么,如何实现财务部门从“成本中心到利润中心”的转变呢?笔者认为,除了在企业建立共享服务中心外,进行集团企业的资金大集中管理也助益颇多,这样可以树立财务部门在公司的话语权。而资金集中的第一步是进行全国的账户集中管理,即通过规模效应与银行谈判,降低资金的使用成本。之后,再等到资金归笼后,可以将“现金为王”的理念通过“资金占用费”等形式落到实处。
三 : 从棱镜计划看大数据时代下的情报分析
摘 要:棱镜计划自被曝光之日起,就受到了世界各方面的广泛关注,而大家关注的焦点主要集中在个人隐私与保护上,其实棱镜计划针对哪些大数据、通过哪些分析、实现了何种战略目标,更值得关注与讨论。文章从情报分析的视角剖析了棱镜计划的数据基础、分析过程与方法、实施目标,进而对大数据时代下的情报分析进行探讨。
关键词:棱镜计划 大数据 情报分析
中图分类号: G250.2 文献标识码: A 文章编号: 1003-6938(2014)05-0002-05
Intelligence Analysis in the Big Data Era in the Context of PRISM
Abstract The PRISM program has drawn extensive attention from all over the world after being exposed, and attention seems to focus on personal privacy and its protection. But in fact, what data are collected, how they are processed and what strategic objectives are to be achieved are more worthy of attention and discussion. This article makes a comprehensive analysis of the prism program from the perspective of intelligence analysis, which includes data resource, analysis process and methods, strategic target, and ends on a discussion about intelligence analysis in the era of big data.
Key words PRISM; big data; intelligence analysis
1 引言
曾供职于美国中央情报局(CIA)的技术分析员爱德华?斯诺登(Edward Snowden)于2013年6月将美国国家安全局(NSA)关于棱镜计划(PRISM)监听项目的秘密文档披露给了《卫报》和《华盛顿邮报》,引起了大家的广泛关注。围绕美国情报监视的相关讨论、分析和评论可谓铺天盖地,指责美国家安全局侵犯公民隐私、非法窃取外国情报的批评声音成为关注与讨论的焦点[1-4]。然而,作为情报研究人员,反以思之,如果我们拥有这些大规模数据,是否能够完成相应的情报分析?面对这些大数据与情报任务,该如何开展工作,经过哪些步骤,需要运用哪些方法?这些问题也同样值得我们深思。
PRISM是一项由NSA自2007年起开始实施的绝密电子监听计划。该计划的正式名号为“US-984XN”。根据报道,泄露的文件中描述PRISM计划能够对即时通信和现存资料进行深度的监听。许可的监听对象包括任何在美国以外地区使用参与计划公司服务的客户,或是任何与国外人士通信的美国公民。NSA在PRISM中可以获得电子邮件、视频和语音交谈、影片、照片、VIP交谈内容、档案传输、登录通知,以及社交网络细节等。《总统每日简报》里很多报告都使用了来自PRISM的资料[5]。
与此同时,大数据研究计划主动公开。2012年美国奥巴马政府发布了“大数据研究和发展倡议”,正式启动“大数据发展计划”,并为此投入两亿美元以上资金。该计划将提升美国利用收集的庞大而复杂的数字资料提炼真知灼见的能力,推进和改善联邦政府部门的数据收集、组织和分析的工具及技术,以提高从大量、复杂的数据集中获取知识和洞见的能力,强化美国国家安全,协助加速科学、工程领域创新步伐,转变学习和教育模式[6]。
把这两件事情关联在一起,我们不禁想到,如何针对大数据进行有效地分析与处理,更好地挖掘出有价值的情报,为国家的战略规划与制定提供必要的情报支撑,可能这才是从情报视角看PRISM的重点。鉴于此,本研究将深入剖析PRISM的数据基础、分析过程与方法、实施目标,从情报分析的视角全面展示PRISM,并对大数据时代下的情报分析进行探讨。PRISM在大数据与战略目标之间存在一个黑盒,而揭开此盒就需要剖析大数据情报分析的过程与方法(见图1), 这正是本文的研究重点与价值所在。
2 数据基础
2.1 数据来源
“棱镜”项目监视范围很广,参加PRISM 的公司有近十家,包括(按加入项目的时间)微软(2007年)、雅虎(2008年)、Google(2009年)、Facebook(2009年)、Paltalk(2009年)、YouTube(2010年)、Skype(2011年)、美国在线(2011年)以及苹果公司(2012年)等(见图2)[5]。这些公司都是典型的大数据公司,通过不同的方式掌握着海量用户的信息。
在数据的采集方式或来源方面,当前的大数据主要包括访问日志采集、社交网络数据、过程行为数据、传感网络数据、智能终端数据,移动终端、视频采集、语音通话等数据。数据获取技术的革命性进步、传感器等自动采集的数据、Web2.0等用户生成数据(UGC)以及移动设备生成的数据(位置、移动和行为信息等)等多源数据使得数据生产迅速、数据存量庞大。大数据的特点包括数据存量大且增长迅速、数据类型繁多结构复杂、价值密度低等。
2.2 数据类型
受到NSA信息监视项目“棱镜”监控的信息主要有10类:电邮、即时消息、视频、照片、存储数据、语音聊天、文件传输、视频会议、登录时间和社交网络资料的细节(见图3)。NSA可从公共、商业等来源扩大通讯数据,来源包括银行代码、保险信息、社交网络“脸谱”档案、乘客名单、选举名册、GPS坐标信息,也包括财产记录和未具体说明的税务资料[7]。来自交易、业务往来、事件和电子邮件等的内部数据能够为组织提供有价值的洞察与分析[8]。技术的发展极大地扩展了信息的传播媒介和传播能力,印刷媒介(报纸、杂志、宣传册等)、电子媒介(电视、广播、电影、电话等)、网络媒介(社交网站、视频分享网站、博客等)、展示媒介(陈列、橱窗、广告等)和其他媒介(政府数据、航拍图片和学术信息)等形成了多位一体的公开信息来源渠道。据美国中央情报局统计,2007年的情报收集总数中超过80%来自公开信息。公开信息有多种渠道与来源,把不同渠道、利用多种采集方式获取的具有不同数据结构的信息汇聚到一起,形成具有统一格式、可以面向多种应用的数据集合,称之为多源信息融合。同一个事实或规律可以同时隐藏在不同的数据形式中,也可能是每一种数据形式分别支持了同一个事实或规律的某一个或几个侧面,这既为数据和信息分析的结论的交叉验证提供了契机,也要求分析者在分析研究过程中有意识地融集各种类型的数据,从多种信息源中发现潜在价值与情报[9]。因此,综合利用多来源、多形式的数据是现代科学决策的鲜明特点。“兼听则明,偏信则暗”,多维度、多数据源的分析才有说服力。
2.3 数据规模
PRISM的每个数据源,其数据规模都是巨大的,是典型的大数据。如Facebook有10亿节点和千亿连边,YouTube月独立访问人数超过8亿,Google每天都会收到来自全球超过30亿条的搜索指令,每个月处理的数据量超过400PB。Yahoo!数据中心的Hadoop云计算平台有34个集群,总存储容量超过100PB。据美国《连线》杂志报道,NSA正在盐湖县与图埃勒县交界处建造一个新的数据中心,这个“数据中心”占地48万平方米,耗资17亿美元。在这个巨大的“数据中心”里,有四个25000平方英尺的大厅将用来存放服务器,NSA每6小时可以收集74兆兆级字节的数据,如此计算下来,这些收集的未经编辑原始数据几乎每24小时便能填满4个美国国会图书馆[10]。
PRISM中较好地体现了大数据,而大数据存在、产生并应用于很多领域。从数据存量的角度,一般认为PB以上级别的数据就可称之为大数据。维基百科将大数据定义为无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合[11]。万维网具有超过万亿的统一资源定位符(URL),淘宝网站每天有超过数千万笔交易,单日数据产生量超过50TB。百度公司目前数据总量接近1000PB,每天大约要处理60亿次搜索请求。医疗卫生、地理信息、电子商务、影视娱乐、科学研究等行业,每天都产生大量的数据。根据赛门铁克公司的调研报告,全球企业的信息存储总量已达2.2ZB(1ZB 等于1000EB),年增长达67%。而麦肯锡全球研究院(MGI)预测,到2020年,全球数据使用量预计达到35ZB[12]。如何处理超大规模的网络数据、移动数据、射频采集数据、社会计算数据,已经成为科研学术界和产业界亟待解决的关键科学技术问题。
3 情报分析
3.1 分析理念
邦弗朗尼原理表明并非给定数据集和挖掘任务就肯定能挖掘出合理的结果,因此,分析就变得很重要。数据具有累积性和关联性,单个地点或单一来源的信息可能不会暴露用户的隐私,但是如果有办法将某个人的很多行为从不同的独立地点聚集在一起时,他的隐私就很可能会暴露,因为有关他的信息已经足够多,这就是PRISM中大数据的原理。例如,通过Google的检索日志可以获取用户关注信息的兴趣点以及关注热点的变化,通过Facebook、paltalk等社交网站可以了解用户的人际网络与活动动态,通过微软、Yahoo!可以掌握人们联机工作的时间、方式以及内容等。而把这些信息融合到一起,可以较为全面地认识并掌握某个用户或某类群体的信息行为特征。
大数据时代在数据分析理念上有三个转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果[13]。在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。大数据处理的一个重要逻辑就是将价值含量较低的海量数据进行价值凝练和萃取,在不失代表性的前提下进行数据简化处理。亚马逊的推荐系统用更快更便宜的方式找到数据的相关性,梳理出了有趣的相关关系,但并不知道背后的原因。在大数据环境下,知道“是什么”就已经足够,不必非要弄清楚“为什么”。
情报分析的理念在大数据时代也需要做出相应的调整与转变。如何有效地利用好大数据,从中分析出有决策价值的情报,值得我们关注。大数据时代下的情报研究应从单一领域情报研究转向全领域情报研究、综合利用多种数据源、注重新型信息资源的分析、强调情报研究的严谨性和情报研究的智能化五个方面[9]。
3.2 分析流程
传统的情报分析流程包括计划与指示、搜集、分析与处理、报告撰写、研究传递等过程。大数据环境下的情报分析流程除了原有的过程之外,更加强调信息搜集与分析处理,具体包括:情报需求定义、情报计划制定、信息检索与数据采集、多源信息融合与清洗、信息分析与内容挖掘、信息展现与情报提炼、报告撰写与情报传递等一系列过程(见图4)。
大数据时代的情报分析,首先要明确情报任务的类型,确定情报任务的主题,分析情报任务的情境,捕捉情报用户的特点,然后把情报需要转化成情报需求,并明确地给予定义。在明确了情报需求以后,根据需求确定情报流程、构建指标体系、计划情报时间、组建情报队伍、选择合适的研究方法、选配相应的技术与工具。根据情报任务计划确定信息检索与数据采集的来源渠道、范围、规模、类型,然后制定收集策略并实施收集,对收集的数据结果进行评估,包括数据规模、时效性、真伪等。对数据进行预处理,把多种来源、不同结构的数据进行融合,重复的数据进行过滤、对重名、别名等问题进行识别、数据拆分提取、查漏补缺、数据降维等一系列操作。经过预处理的数据可以进行分析挖掘,形成有决策支持或参考价值的情报报告,在恰当的时间以合适的方式把准确的情报传递给正确的人。3.3 分析方法
如何针对特定的情报需求,快速地获取准确数据、高效地分析海量数据、清晰地解读系列数据是情报工作者面临的严峻挑战。应对这一挑战,需要敏锐的思维以及专业的工具与方法。通过关联分析、聚类分析、孤立点分析、模式分析、网络分析、异常分析、时序分析、演化分析等一系列方法挖掘出有价值的情报。例如,通过模式分析可以识别某种罪犯的犯罪模式,通过关联分析可以分析恐怖分子的活动网络,通过聚类分析可以聚类某一类用户并分析该类用户的特征,根据爆发词分析可以分析关注热点甚至预测流感爆发的时间与地点。在科技情报领域,针对论文、项目等数据,通过统计排序、数量分布统计、年度增长统计、关联规则等实现关键人物发现、重要机构识别、国家实力对比、前沿热点监测等,根据这些结果可以判断科学技术发展各要素及总体的现状与趋势,并进一步分析出机遇和威胁,从而把信息变成情报。
4 结果与目标
4.1 棱镜计划的战略目标
据外媒报道,NSA自2010年11月起开始准许以海外情报意图来分析电话以及电邮记录,监视美国公民交友网络。根据NSA 2011年1月的备忘录,政策转向目的是在帮助该局“发现并追踪”海外情报目标和美国人民之间的关联。该文件指出,NSA得到授权,可在不检查每个电邮地址、电话号码或任何指针的“外来性”情况下,“大规模以图表分析通讯原数据”。在泄露的秘密文档内的一页幻灯片中,显示了两种数据来源:PRISM和Upstream(另一个监听项目的代号)。PRISM是从上述美国服务提供商的服务器直接进行收集,Upstream项目则在承载互联网骨干通信内容的光缆上安装分光镜,复制其通信内容。英国的政府通信总部(GCHQ,与NSA对应的信号情报(SIGINT)机构)最早从2010年6月起就能访问PRISM系统,并在2012年使用该计划的数据撰写了197份报告[5]。
PRISM的目标不是关注某个普通民众的个人隐私,这对国家战略没有实质的意义。大数据其中一个特点就是价值密度低,普通民众的个人隐私信息对于国家的宏观治理并没有太大的价值,真正有价值的是普类群体特征或个别关键人物的活动信息。PRISM的主要战略目标可能包括以下几个方面:恐怖主义人物与活动的监测、预测犯罪行为模式与频率、部分国家领导人活动与政策动态、国际合作谈判所需的数据与情报支撑、新的战略新兴产业与机会发现、某些国家的不安全因素挖掘等等,这些都是国家战略。例如,通过关键词筛选、用户联系频率与地点与恐怖袭击可能存在的联系、不正常现金流向的分析,也许能从中找出“恐怖袭击”的蛛丝马迹,并进行有效的预测与预防打击。
4.2 大数据分析的目标
奥巴马政府发布的“大数据研究和发展倡议”[6]旨在提升利用大量复杂数据集合获取知识和洞见的能力,提升美国利用收集的庞大而复杂的数字资料提炼真知灼见的能力,协助加速科学、工程领域创新步伐,强化美国国土安全,转变教育和学习模式。还将在科学研究、环境保护、生物医药研究、教育以及国家安全等领域利用大数据技术进行突破。美国政府认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志,对未来的科技与经济发展必将带来深远影响。国土安全部项目主要推进可视化数据分析,应用领域主要为自然灾害、恐怖事件、边境安全、网络威胁等。
大数据虽然表面上是个技术术语,但实际上已经渗透或将要渗透到社会生活、经济运行、国防军事、科学技术等各个方面。数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。大数据是人们获得新的认知、创造新的价值的源泉。大数据还是改变市场、组织机构以及政府与公民关系的方法。当前大数据应用领域处于领先的是Amazon、Google、Facebook等美国新兴网络企业。他们已经开始通过基于云计算的平台,汇集来自互联网、无线标签、全球定位系统(GPS)、智能手机等采集的大量数据,经过分析后用于客户信息管理或者市场营销活动。IBM拥有一个5000人组成的数据分析团队,帮助石油企业更高效地勘测、开采和炼制石油。通用汽车投入15亿美元收购大数据分析公司,以充分挖掘多个数据点,找到有效的途径,延长燃气涡轮、喷气式发动机和其他重型设备的运行时间,同时也不必进行不定期维护。
我国当前在大数据等方面有一批有一定优势的企业,如电信企业、商业银行、腾讯、阿里巴巴、百度等。大数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像飘浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。而挖掘出这冰山下面的隐藏价值,可以实现很多目标[13]。大数据从不同视角反映人物、事件或活动的相关信息,把这些数据融合汇聚在一起进行相关分析,可以更全面地揭示事物联系,挖掘新的模式与关系,从而为市场的开拓、商业模式的制定、竞争机会的选择提供有力的数据支撑与决策参考。
4.3 大数据时代的情报目标
一个国家拥有数据的规模和运用数据的能力将成为综合国力的重要组成部分,对数据的占有和控制也将成为国家间和企业间新的争夺焦点。如在赛博战领域如何利用大数据分析(Big Data Analysis,BDA)实现赛博态势感知、在电子战领域如何利用BDA实现有源与无源情报的分类与融合等。此外,随BDA而来的诸多新类型情报也有待进一步研究,如移动情报、云情报、社会情报、大数据情报等[14]。
在大数据时代,情报人员需要围绕情报任务与需求,广泛搜集各类相关信息、运用多种工具与方法进行内容分析,监测其中的新现象、新情况、新异常,并根据蛛丝马迹发现其中的规律、本质、战略意图等,并将这些内容“填充”到情报分析结果的模式中,或按预定的模式组织所发现的内容,形成情报分析报告。这样的情报对于企业来讲可以服务于产品研发、市场开拓、技术合作、人才争夺等活动,实现跟踪竞争对手的动态、分析战略部署,把握主要趋势与次要趋势,厘清长期战略与近期目标,从而完成趋势判断、动向感知、前瞻预测、情景研判等情报目标,实现“耳目、尖兵、参谋”的情报功能。5 结语
通过上述分析,本文认为,PRISM的真正目标并不在个人隐私与保护上,而是如何运用大数据提升科学决策与发展战略。大数据时代数据来源广泛、结构类型复杂、数据规模庞大,如何有效地获取、融合并进行关联、聚类、孤立点、模式、网络、演化等一系列分析,从中发掘出有价值的情报,为战略决策提供全面准确、客观有力的支撑与参考服务,是大数据时代情报分析的重点,也是情报从业人员的关键能力所在。
参考文献:
[1]汤?昊. 从“棱镜门”事件看美国的情报监督机制[J]. 情报杂志,2013,(9):6-10,22.
[2]方兴东,张笑容,胡怀亮. 棱镜门事件与全球网络空间安全战略研究[J].现代传播(中国传媒大学学报),2014,(1):115-122.
[3]储昭根. 浅议“棱镜门”背后的网络信息安全[J]. 国际观察,2014,(2):56-67.
[4]李娜. “棱镜门”暴露大数据时代隐私危机[J]. 科技导报,2013,(18):9.
[5]维基百科[EB/OL].[2012-10-22].http://zh.wikipedia.org/wiki/US-984XN.(www.61k.com]
[6]Big Data Across the Federal Government[EB/OL].[2012-10-22].http://www.whitehouse.gov/sites/default/files
/microsites/ostp/big_data_fact_sheet_final.pdf.
[7]中国日报网.斯诺登再曝美监控公民细节(图)[EB/OL]. [2013-10-12]. .
[8]王新才,丁家友.数据知识图谱:概念、特征、应用与影响[J].情报科学,2013,31,(9):10-14,136.
[9]李广建,杨林.大数据视角下的情报研究与情报研究技术[J]. 图书与情报,2012,(6):1-8.
[10]美安全局机房曝光 监控百亿亿兆级别数据[EB/OL]. [2013-12-15]..
[11]Wikipedia.Big data[EB/OL]. [2012-10-22]. http://en.wikipedia.org/wiki/Big_data
[12]Cohen J, Dolan B, Dunlap M, et al. MAD skills: New analysis practices for big data[J].PVLDB,2009,2(2):1481-1492.
[13]维克托?迈尔-舍恩伯格,肯尼思?库克耶.盛杨燕,周涛译.大数据时代――生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.
[14]张春磊,杨小牛. 大数据分析(BDA)及其在情报领域的应用[J].中国电子科学研究院学报,2013,(1):18-22.
作者简介:化柏林(1977-),男,北京大学信息管理系博士后,研究方向:知识抽取与情报分析。
四 : 大数据时代下数学建模还有作用吗?
网友傅渥成对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
一直以来很想回答这个问题。只是后来发现我想说的很多回答者已经回答过了。今天看了「拒绝用QQ邮箱发应聘邮件的求职者是否合理?」的有关讨论,突然发现,在这个问题里面,可以把我的「没处答的一些话」写下来。
我曾经有一次跟 @曾博 讨论过有关机器学习的事情,我很相信这样的方法可以为我们「解决」某些问题提供帮助,但是他对这些方法很不喜欢,因为「解决」问题跟「理解」问题是两码事。大数据时代的各种统计学习方法可以为我们解决许多问题,但我们却不知道为什么会这样。
有了大数据,我们直接从数据里面就得出来很多奇妙的结论。例如@杨宣 指出的,在「不通过」这个分类之下,qq 邮箱是概率排名前五的强特征。这就是「大数据时代」(或者其它各种各样类型的「实证研究」)为我们解决的一个问题——至少 HR 们筛掉 qq 邮箱在统计的意义上是有些理性依据的。
但是是不是有什么东西被我们错过了呢?
今年暑假的某一天,我听一个我很尊重的老师批评了目前在做复杂系统有关问题时,主要基于统计的那些研究者,他们做出来的一些东西。我们都知道现在做这些问题的研究者可以发表很多很好的文章,但是这些文章缺少了某些东西。
以往,如果我写了一篇论文,发现某个结论,并且在文中提出得出这个结论可能的一个原因,甚至提出来一个数学模型,这个模型可以解释我从数据分析中得到的那个结论。要是把我写的这篇文章投稿到比较好的期刊,审稿人必然会提意见——你提出了一种产生这个结论的原因,可是你怎样排除掉其它的原因呢?如果你不能排除掉其它的因素的影响,那我们很遗憾只能拒绝掉你的文章了。
在大数据时代,审稿人们还能以此为理由拒绝掉别人的文章吗?这些数据这么珍贵,甚至有的是从运营商、航空公司、网站和志愿者处花费了金钱和时间才得到的,提出这样的一个解释就已经很好了……可是我们很可能会距离理解各种问题越来越远。在大数据时代,通过各种统计的方法,我们可以得到许多有意思的结论,但是这些结论不能让我们心安。就像「用 qq 邮箱的求职者很可能有着较低的简历质量」也可能会是一个从大数据分析得到的结果,可是我们不会知道为什么会这样。公开这些结论,甚至可能招致他人的批评。每个人可能有不同的看法,也会自己提出对这个问题的解释,即每个人都会对这个结论提出自己的「模型」,并把自己的「模型」跟这个结论等价起来。如果「模型」不能排除其它因素的影响,那么你可以提出你的理论来解释这个问题,而我也可以提出我的模型来解释这个结论,我们最终会无法说服他人。遗憾的是,正因为我们的结论来自大数据,很多时候我们很难再找出「对照实验」的那些数据了,杂志社没有办法说「如果你能排除掉其它的因素的影响,我们就发表你的文章」。我们很可能会距离「为什么」越来越远。
而如果把「大数据」和「数学模型」对立起来,则这里所说的「模型」便是另一码事了。这里的「模型」与「机制」「假设」「简化」等等更接近。有了「模型」,我们就可以从「纯粹理性」而非「实践理性」的高度让你心安。就像每个 HR 都可以提出无数个讨厌 qq 邮箱求职者的理由,只可惜,这些模型都是你个人的角度,大家攻击起来实在容易。我们或许会越来越难摒弃掉这些偏见,因为没有一个可以让大家都相信的「理论」(或者「模型」)。我们只知道结论。
这时候,如果你是天才的建模者,提出一个能被大家公认的模型,并排除掉其它也可能造成这一现象的干扰因素,那就是真正的大神了。我比较悲观,因为我自己也会在实用的结论面前满足。
网友Suri对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
正好今天大Boss讲什么是Mathematical Modelling,搬来分享下。
一个好的数学模型具备以下三点:
1. 描述性;
2. 预测性;
3. 说明性。
具体地说就是,一个好的数学模型能描述建模基于的系统,并且对其做出预测,同时能解释为什么这么建模以及建模得出的结论。
针对以上三点,我们来看看数据和模型的区别。首先数据可以说是具有描述性,但仅是局部描述性,除非给出的数据能遍历每一种情况,而数学模型则具有全局描述性。其次,数据的预测性表现在可以通过数据建立模型,来给出预测结果。最后,好的数学模型能明确解释数据的走向,但光看数据你只能知道数据是怎么变化的,但不知道为什么这么变。
在我看来,建模和数据是相辅相成的,针对一个问题,建模是将其抽象到纯数学层面以寻求普适的解决方法与结论,数据是用来验证建模的结论,或者是辅助求解模型的(比如有些固定参数需要通过具体的实验或者观测数据来确定)。当然,只有用在好模型上,数据才会显得有意义。
最后,如果数学建模真的因为大数据而没用了,那也不会有那么多应用数学家还在探讨关于数学建模的问题了。
网友李辉对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
有用。只是因为现在数据挖掘的条件已经成熟,一个是硬件计算能力足够强了,另外是数据获取能力也足够容易了,所以大数据才流行。大数据不是一个新概念。
其实数据和建模本来就是相辅相成,两者都是研究和解决问题不同的角度,如同交错的螺旋线。等到数据挖掘和机器学习到达瓶颈的时候,人们又会转向建模。
网友MichaelEvans对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
当然有用!我从以下几个方面给你回答吧:
首先,为什么要建模?我个人一直认为,模型是对现实问题的抽象,是使用数学语言来描述你要分析的问题,是量化你的问题。比如你想知道什么决定了市场价格?什么决定了产品销量?等等这些问题摆在你面前的时候,这时你就需要建立相应的模型来寻找问题的答案。
其次,建模时最先需要做什么?一些人此时就会说“好用的模型、好找的数据”,这个答案其实是错误的,此时你该做的是机理分析,而不是找个别人用过的模型、再用模型中提到的相应数据开始建模。这些人总想图省事儿,直接套用别人用过的模型,这样往往就会忽略问题的本质。比如研究经济学中的要素产出弹性,很多人直接拿来C-D生产函数,找到相应的数就开始回归,无论建模的过程如何规范,照猫画虎也能够得到显著的参数估计结果,但是这是本末倒置的建模过程。就好比你看上了一款帽子,你不去考虑你的脑袋大小、形状、出汗与否等问题,就戴在自己头上,如果不合适就去削掉自己脑袋上的肉吗?所以,从问题出发,提出自己的假设,把你认为影响这个问题的因素、因素之间的关系都找出来,再去考虑什么样的模型能够描述这样的机理。
再次,数据的作用是什么?如果机理是模型的骨骼的话,数据就是模型的血液,血液的规模、质量直接决定你建立的模型是否能够回答你的问题。一般来说,越复杂的模型,越能够将问题描述清楚,机理也就越清晰,反之亦然。模型的复杂性必然会提高对数据的需求,在“大数据”这个概念下,很多机构、公司必然会加大数据的搜集力度,增加数据的种类,提高数据的质量。所以,大数据时代下的模型必然向复杂性更高的方向演化,复杂性更高的模型,必然能够更加清晰的剖析问题产生的原因、过程和结果。
最后,再说一点关于我个人工作中遇到的数据与模型之间的矛盾问题。当我建立一个简单模型的时候,我发现虽然变量数据很好找,但我能获得的数据周期短,数据统计口径时常发生变化,使数据不具备可比性,即使参数显著也仅限于统计意义,经济意义更是荡然无存。当我建立一个具备复杂机理的模型时,我又发现很多数据找不到、找不全,不得不简化机理,忽略掉一些关键机制,降低模型的解释意义。所以,在这个到处宣扬“大数据”概念的时代,我真心寄希望于高效率的民营企业真正了解市场需求,用数据这种“虚拟资产”创造出最大的价值,将大数据作为推动社会前进的强大动力。
当然,以上只是我个人的简单见解,有不妥之处望请指明。
网友liupc对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
大数据时代,数学建模的作用尤其重要。
当数据已经足够多并且还将继续增多的时候,很多观点和其反面观点一样都可以通过数据轻松得到论证。这时候,逻辑才能对两个截然相反的观点做出判别;这时候,数学建模是有效地搭建起逻辑与数据之间桥梁的工具。
网友babayage对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
直到现在我都会在给别人的名片上写下自己的QQ邮箱,无论是安全性稳定性还有大附件发送都是一流的。这就好比当年有人拿破绽百出的MSN当白领象征却丝毫不考虑那东西有多烂一样,那些企业邮箱的稳定性和功能有几个能超过QQ会员+QQ邮箱的?
如果当年有数据统计,留下MSN账号的肯定比留下QQ账号的人受欢迎,对吧?
这就是大数据滥用的表现,真正挑选人才恰恰是寻找少数人的过程,而不是从大多数里选人。
另,所有统计都有可能陷入“得乳腺癌的人普遍脚大”这类陷阱,任何样本跟踪观察都会出现这样的结论,这就需要一点起码的常识和开放的思考去辨别这类结论的相关性,是巧合,还是真有相关,毕竟任何样本,再大的数量,也依然是小样本,存在偶然性。
选择人才永远都需要选择人,而不是这个人用的是什么邮箱。大数据是工具,不是用来偷懒和逃避规定动作的借口。
不过早就料到了大数据会这样,其实说白了就是数据的工业革命而已,任何时候工厂化流水线做出来的东西,都只是”标准“而已,距离真正的好东西谬以千里。
网友蒙面大侠对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
大学里建模课的时候的第一步是收集数据。
无论什么大数据时代,只不过是数据被珍视,而建模所要采用的模型和计算方法是另外一回事。
网友轩辕糖酥对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
统计分析,模型预测,实验室的基础科学,至少在health industry是相辅相成,缺一不可的。没有哪个比较重要或者比较好,方法的选择是建立在需要研究的问题上的。
数据确实可以反映一些问题,但是却不能给出预测,也很难完全排除其他factor的影响。基础研究可以对问题的原因和pathway进行细致系统的研究,可以排除其他原因的干扰(但很难完全排除)发现更深层的原因,但是在没有统计预测以前,有时候很难着手——因为可能性太多了很难一一进行研究。而这两者的结果都是基于现有的,要如何使研究结果对未来产生影响,或者如何把未来的发展考虑进理论,就是数学模型的任务。
所以啦,虽然在小的问题上,也许某一种方式比较合适。但是从宏观来讲,这三者都非常有必要。它们并不是竞争的关系,而是合作的关系。毕竟研究的目的是要找出问题,解决问题,更多的了解这个世界,让这个世界更好,不是吗?
网友囧瑟夫对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
大数据时代下正是需要数学模型来利用数据,发掘隐藏在数据中的信息和规律。
能充分挖掘出大数据的价值的要素:
精准的数据模型 + 高效的算法 + 稳定的运算平台 + 人的头脑
分享一个个人在前公司的项目经验:
客户: 电信行业(公司名保密)
数据: TB级别
算法: Logistic + elastic net, 拟合效果好,解释性高,简单易实施
平台: 分布式系统
个人经验而言,即使是相同的算法或者模型,不同的人用起来效果差别也是很大的。
因此,在大数据时代,有一个清晰的分析思路和方法为前提,结合大数据和数学模型才能够发挥出真正的作用。
网友蒙面大侠对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
我觉得在哪个时代,数学建模都是非常重要的。数学建模的思想在各个行业都能它的影子,甚至在咨询管理行业,每解决一个问题都是用各种数学模型来验证,只是你要找到这些因素,然后用事实来阐述你的思想,再反过来证明你的假设前提。经济学也是,各种经济学派大部分都是基于参数的不同及比重的差异而有所不同。
网友杜豫章对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
简单来说吧,所谓的“大数据”分析需要有四个要素。第一,分析主题,即你分析的目的是什么,比如,监测信用卡异常交易?预测下月销量?追踪埃博拉疫情蔓延态势?第二,基础数据,包括结构化及非结构化数据,当然结构化数据分析起来通常要方便些。第三,分析方法,即用什么样的数学方法来分析,既可以是基础的概率统计,也可以是高阶的机器学习,复杂数学建模等。第四,分析工具,即用于分析的软件与硬件工具,我们常听到的hapdoop,mapreduce等名词,就属于这个范畴
上述四要素,缺一不可。
所以,无论小数据时代,还是大数据时代,数学方法,那都是必不可少的。
网友蒙面大侠对[数学模型的作用]大数据时代下数学建模还有作用吗?给出的答复:
idea>数据>算法>模型
举个例子,交通模型那么多人,研究多久了,解决了交通拥堵了吗,现在一个百度地图使用大数据显示实时路况,大大方便了出行。
五 : 大数据时代的裸奔
1、相关关系比因果关系更重要
老王开了个包子铺,有时做少了不够卖,有时做多了没卖完,两头都是损失。老王琢磨着买包子的都是街坊,他们买包子是有规律的,例如老张只在周六买,因为闺女周末会来看他,而且闺女就爱吃包子。于是老王每卖一次就记次账,谁在哪天买了几笼包子,并试图找出每个街坊的买包子规律。
数据虽然越记越多,但老王啥规律也没找出来,即使是老张也都没准,好几个周六都没来买,因为他闺女有事没来。有个人给老王支招,你甭记顾客,就记每天卖了多少笼就行,这个法子明显简单有效,很容易就看出了周末比平时会多卖两笼的规律。
这个例子虽然简单,却道出了大数据的一个重要特点【相关关系比因果关系更重要】,周末与买包子人多就是相关关系,但为什么多呢?是因为老张闺女这样的周六来吃包子的人多?还是周末大家都不愿意做饭?对这些可能性不必探究,因为即使探究往往也搞不清楚,只要获得了周末买包子的人多,能正确地指导老王在周末时多包上两笼,这就行了。
要相关不要因果,这是大数据思维的重要变革,以前数据处理的目标更多是追求对因果性的寻找,或是对猜测的因果性的验证,人们总是习惯性地找出个原因,然后心里才能踏实,而这个原因是否是真实的,却往往是无法核实的,而虚假原因对面向未来的决策来说是有害无益的。承认很多事情是没有原因的,这是人类思维方式的一个重大进步。
2、要全体不要抽样
传统的调查方式都是抽样的,抽取有限的样本进行统计,从而得出整体的趋势来,之所以选择抽样而不是统计全部数据,只有一个原因,那就是全部数据的数量太多了,根本没法操作。
抽样的核心原则就是随机性,不随机就不能反映整体趋势性。例如搞一个保暖内衣的调查,找了一群精壮的武警战士试穿,战士们穿上了普遍反映不冷,但这并不能说明内衣的保暖效果有多好。
抽样随机性的道理谁都知道,但要做到随机性其实是很难的。例如电视收视率调查,要从不同阶层随机找被调查人,但高学历高收入的大忙人们普遍拒绝被调查,他们根本就不会为几条毛巾赠品而耽误时间,愿意接受调查的多是整天闲得无聊的低收入者,电视收视率的调查结果就可想而知。
互联网为大数据的采集带来的新手段,云计算为处理大数据带来了新方法。还以电视收视率调查为例,互联网电视普及后,每一部电视正在收看什么节目的信息会毫无遗漏地发送到调查中心。这就是大数据的第二个特点【要全体不要抽样】,对全部数据进行统计分析,其结果当然会更加准确。
3、要效率不要精确
俗话说的好,萝卜快了不洗泥,既然我们要的是全体数据,自然会夹杂进来一些错误的数据,这是难以避免的。我们传统的数据分析的思路是“宁缺勿烂”,因为传统小数据分析的数据量本身并不大,任何一个错误数据都有可能对结果产生相对较大的负面影响,对错误数据必须花大精力去清除,这是小数据时代必须坚持的原则。
大数据时代的原则就变了,变成了【要效率不要精确】,并不是说精确不好,而是因为在大数据时代是做不到的,如果继续把排除错误数据作为重要工作,那大数据分析就进行不下去了。更重要的是,大数据分析的目标在于预测,而不在于追溯以前发生过的事件的真相。
4、大数据时代的裸奔
有次我给学生畅想未来,你走在大街上,基站的智能天线以一道极窄的波束指向你的手机,从而获得你的方位角,通过开机瞬时的上百次功率调整和探询,换算后就能获得你与基站的距离,两个信息结合就精准地确定了你的位置。根据你的搜索记录,互联网早已知道了你的爱好,然后手机“滴”地一声通知你,你前方10米处右侧有您最喜爱吃的咸豆腐脑店,正在八折酬宾中,“滴”地又来了一声,老板已得知您是咸豆腐脑的忠实拥护者,特别给您打五折,来尝一碗呗。
在我描绘完未来信息社会的全新生活方式后,有个学生问我:我走在大街上,手机“滴”地一声,通知我前面有个同志聚会,系统通过我以前的搜索和看过的片子早已确定了我的性向,并将我的信息经过精确配对发送给了好多基友,但我并不想出柜,这可咋整啊?
这个学生的玩笑话道出了大数据时代我们都面临的一个重大问题,那就是隐私权问题。美国某机构曾做过一个实验,根据网友的搜索记录来筛定目标,虽然信息已经进行了模糊,还是有不愿意出柜的基友被筛出来了,基友的妈妈非常震惊和生气,将该机构告上了法庭。
微博上常有维权人士声称电话被政府监听了,因为手机语音出现了不正常的声音,其实这是他们多心了,他们的电信知识还停留在用鳄鱼夹搭电话线窃听的阶段。并不是说政府不会窃听,而是说如果政府窃听你的电话,你是绝对察觉不出来的,多手段全方面的监控手段早已超出了外行的想象力。即使是技术内行,例如卖国家机密的间谍被收网后往往会马上崩溃,他所有的电话短信邮件出行会面谈话都有清清楚楚的铁证。
犯罪成本太高了,将来无死角的摄像监控头会记录下一切,即使你犯罪时蒙着面,根据前两天你没蒙脸踩点时的录像,通过姿态步态的匹配算法就能把你筛选出来。现在公安系统有句话“只要上手段,没有查不出来的”,上手段就是指包括摄像头监控、手机监控、网络监控等综合手段。现在的基础设施还不完善,等将来所有的路灯杆都变成了多传感监控器,加上强大的大数据分析能力,你还想咋藏?
更有意思的是,将来的犯罪逮捕会变成事前,有天你啥事没做睡在床上就被逮捕了,警察通告你:根据警方对你所有信息的大数据分析,显示你已经知道了老婆出轨之事,根据以往犯罪案例及你本人性格的大数据分析结果,你有76.3%的概率会在本周内对老婆进行轻伤以上程度的犯罪,超过了法律规定的60%轻伤以上犯罪概率必须入监的标准,特羁押你一个月,根据大数据分析结果,放出来后的你仍然犯罪的概率会降低到法律规定可以释放的5%以下。
听着很安全吧?但是不是也感到了毛骨悚然?在大数据时代,我们每个人都是赤条条地在信息社会中裸奔,真的是光着屁股一丝不挂地那种裸奔,难到没有人意识到这点吗?当然不是,英国等西方国家早就对街道监控摄像头展开了全社会的大讨论,安全与隐私该如何权衡?随着近年来随着恐怖主义的盛行,安全显然更重要了,公民们很无奈地同意把更多的隐私权交给了政府,以获得更大的安全感。
必须对公民隐私信息进行分级制的严管,公安部门掌握着每个人的开房信息,如果不涉及到重大违法犯罪的话,绝不能滥加使用,更不能透露给当事人的配偶,否则社会就会大乱。掌握信息和利用信息的应是独立的两个机构,如果让利用信息的公安部分掌管公民所有隐私信息,那就会成为一个人人自危的恐怖国家。
我们现在该如何做好迎接大数据时代的准备?我觉得应该培养公权机构绝不能泄露公民隐私的社会舆论,前几天网上流传着范冰冰的机场安检照,记者们以此做娱乐文章称人家如何如何,这就是一个极坏的兆头!如果放任这种公权力的滥用,我们每个人将来都会成为光屁股裸奔的人,光不光屁股则取决于掌握公民信息的权力人士的一念之差。
最近有报道称银行内鬼贩卖账户信息,银行方面居然称这事主要靠自觉,他们内部查不出来。这事也是大恶!查不出来是因为银行内部缺乏相应的技术手段,根本就没有建立起相应的信息保密制度,这种不作为是未来大数据时代的严重隐患。
前两天我参加一个学生的婚礼,作为导师我被安排在领导桌,刚坐定就有个陌生人来照相,询问后才知是婚宴酒商的员工,把我们作为背景来照酒的照片,估计是用于宣传。我把他轰走了,我不愿意这个数据留在网上,不愿意让它将来作为分析我的大数据资料。
结论:
与以往的抽样统计不同,大数据使用的是全部数据,更着重的是效率而不是数据的精确性,关注的是相关性而不是因果性,这些特点造就了大数据对事物发展的极强的预测能力,它可以给我们带来更安全更便捷的新生活,同时也给个人隐私带来了巨大的威胁,对掌握公民隐私信息的公权力的严格控制,应该成为全社会的共识。
本文标题:大数据时代下的会计-下一代腾讯网:大数据时代的智慧门户61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1