61阅读

阿里巴巴:什么才是大数据思维-12306 外包给阿里巴巴、IBM 等大企业做是否可行?

发布时间:2017-08-20 所属栏目:12036

一 : 12306 外包给阿里巴巴、IBM 等大企业做是否可行?

二 : 大数据100指数是什么

南方新浪大数据100指数将南方基金的专业股票研究优势与互联网“大数据”结合,在南方基金量化投资研究平台的基础上,通过新浪财经“大数据”定性和定量分析,找出股票热度预期、成长预期、估值提升预期与股价表现的同步关系,精选出具有超额收益预期的股票,建构、编制并发布策略指数。在当前的投资指数体系中,大数据100指数丰富和完善了指数体系,为市场提供新的投资工具,并有助于满足投资者多样化的投资需求。大数据100指数是什么?

一、指数代码与名称

指数代码:399415

指数简称:i100

指数中文名称:大数据100指数

指数英文名称:CNI BIG DATA 100 INDEX

指数代码:399416

指数简称:i300

指数中文名称:大数据300指数

指数英文名称:CNI BIG DATA 300 INDEX

二、基日与基点

大数据系列指数以2010年1月29日为基日,基日指数为1000。

三、选股原则

大数据系列指数样本股分别由在深圳证券交易所、上海证券交易所上市的100只、300只A股组成,按照下列原则选取:

1. 入围标准

(1)非ST、*ST的A股;

(2)有一定上市交易日期,一般为一年。

2. 选样方法

对样本空间的股票,按照财务因子得分、市场驱动因子得分和大数据得分进行模型优化,然后将计算的综合得分从高到低排序,选取排名在前100名的股票构成大数据100指数初始样本股,选取排名在前300名的股票构成大数据300指数初始样本股。

在综合得分排名相似的情况下,综合考虑公司的行业代表性及所属行业的发展前景、公司盈利记录等,优先选取指标优良的上市公司股票作为样本股。

单个股票的综合评分如下:

(1) 财务因子得分:计算最新市盈率PE、净资产收益率ROE、年度营业收入同比增长率、年度净利润同比增长率,剔除PE、ROE排名靠后的股票、剔除营业收入同比增长为负和年度净利润同比增长为负的股票;计算主营业收入和净利润同比和环比预测结果增长相对上期该指标的幅度变化作为业绩加速得分;通过因子模型计算上述得分作为财务因子总得分。

(2) 市场驱动因子得分:计算最近一个月股票换手率、波动率、价格变化率、流动性因子,通过量化因子模型计算得分作为市场驱动因子的总得分。

(3) 新浪大数据得分:根据新浪财经频道下的股票页面访问热度计算单个股票的热度得分、根据财经频道下的新闻报道正负面影响计算单个股票新闻报道得分、根据股票在微博上的正负面文章影响计算单个股票微博得分,综合上述得分并根据历史回测优化结果作为大数据得分。

四、指数计算方法

大数据系列指数平均分配样本股权重,采用派氏加权法,依据下列公式逐日连锁实时计算:

样本股:指纳入指数计算范围的股票。

样本股权数:为样本股的自由流通量,子项和母项的权数相同。

等权重因子:见“六、样本股权重调整”。

分子与分母:分子项中的乘积为样本股经过权重调整后的实时自由流通市值,分母项中的乘积为样本股经过权重调整后的上一交易日收市自由流通市值。

Σ:是指对纳入指数计算的样本股经过权重调整后的自由流通市值进行汇总。

自由流通量:是上市公司实际可供交易的流通股数量,它是无限售条件股份剔除“持股比例超过5%的下列三类股东及其一致行动人所持有的无限售条件股份”后的流通股数量:①国有(法人)股东;②战略投资者;③公司创建者、家族或公司高管人员。

自由流通市值:股票价格乘以自由流通量。

股票价格选取:每个交易日集合竞价开市后用样本股的开市价计算开市指数,其后在交易时间内用样本股的实时成交价计算实时指数,收市后用样本股的收市价计算收市指数。样本股当日无成交的,取上一交易日收市价。样本股暂停交易的,取最近成交价。

五、样本股调整

1. 样本股定期调整方法

大数据系列指数样本股实施月度定期调整,实施时间定于每月的第一个交易日。

2. 样本股临时调整方法

(1) 样本股暂停上市的,从其暂停上市日起,将相应样本股从指数计算中剔除,并选择选样空间中排名最高的非样本股补足。

(2) 样本股终止上市的,从进入退市整理期的第一个交易日起,将相应样本股从指数计算中剔除,并选择样本空间中排名最高的非样本股补足。

(3) 若样本股公司因重大违规行为(如财务报告重大造假)而可能被暂停或者终止交易的,将依据指数专家委员会的决定将其在指数样本中及时剔除,并选取选样空间中排名最高的非样本股作为样本股。

(4) 样本股公司发生收购、合并、分拆情形的处理,同巨潮100(4383.035, 141.11, 3.33%)指数。

六、样本股权重调整

1. 样本股权重分配

在指数计算中,设置等权重因子使每只样本股每期初始权重相等。

2. 等权重因子定期调整

当指数样本股发生定期调整时,指数同步进行相应的等权重因子调整,以调整实施日前倒数第5个交易日的收盘自由流通市值来计算调整时的等权重因子。

3. 等权重因子临时调整

在下一个定期调整日之前,等权重因子一般固定不变。

当出现样本股临时调整时,新进指数的股票继承被删除股票在调整前最后一个交易日的权重,据此计算新进股票的等权重因子。

当样本股出现退市或暂停上市时,其他样本股的权重调整因子不进行调整。

当样本股股本结构出现显著变化或者其它原因导致其权重发生突变时,将决定是否对权重调整因子进行临时调整。

七、指数的调整计算

同巨潮100指数。

八、指数的发布与管理

大数据系列指数由深圳证券信息有限公司与南方基金管理有限公司[微博]、新浪财经联合编制,其发布与管理同巨潮100指数。

九、免责声明

同巨潮100指数。

新三板是什么?新三板指数介绍
三板做市指数是什么
三板成指是什么?三板成指编制方式

更多有价证券,网贷,银行,理财,房产相关信息,请实时关注希财网。希财网(www.61k.com是国内知名的第三方理财产品导购平台,网站汇聚了海量的理财产品,金融,股票,网贷资讯,欢迎您的分享讨论。

三 : 12306 外包给阿里巴巴、IBM 等大企业做是否可行?

[12036]12306 外包给阿里巴巴、IBM 等大企业做是否可行?
如果 12306 项目外包给阿里巴巴或 IBM 等大企业,会不会更好
下面就看看www.61k.com小编为您搜集整理的参考答案吧。

网友蒙面大侠[12036]12306 外包给阿里巴巴、IBM 等大企业做是否可行?给出的答复:
现有的部分讨论,双方缺少对基本事实的共识。

在下转一篇文章,给诸位提供一些材料,不管是支持还是反对,至少可以指出支持反对哪一点,免得鸡同鸭讲。文章是两年前的,欢迎知情人士指出两年来是否有什么变化。

文章主要说了12306这个网站有多独特,技术难点在哪里,有什么可能的改善方法。

==================

由12306.cn谈谈网站性能技术


2012年1月16日 陈皓

http://12306.cn网站挂了,被全国人民骂了。我这两天也在思考这个事,我想以这个事来粗略地和大家讨论一下网站性能的问题。因为仓促,而且完全基于本人有限的经验和了解,所以,如果有什么问题还请大家一起讨论和指正。(这又是一篇长文,只讨论性能问题,不讨论那些UI,用户体验,或是是否把支付和购票下单环节分开的功能性的东西)



业务

任何技术都离不开业务需求,所以,要说明性能问题,首先还是想先说说业务问题。

其一有人可能把这个东西和QQ或是网游相比。但我觉得这两者是不一样的,网游和QQ在线或是登录时访问的更多的是用户自己的数据,而订票系统访问的是中心的票量数据,这是不一样的。不要觉得网游或是QQ能行你就以为这是一样的。网游和QQ 的后端负载相对于电子商务的系统还是简单。其二有人说春节期间订火车的这个事好像网站的秒杀活动。的确很相似,但是如果你的思考不在表面的话,你会发现这也有些不一样。火车票这个事,还有很多查询操作,查时间,查座位,查铺位,一个车次不 行,又查另一个车次,其伴随着大量的查询操作,下单的时候需要对数据库操作。而秒杀,直接杀就好了。另外,关于秒杀,完全可以做成只接受前N个用户的请求(完全不操作后端的任何数据, 仅仅只是对用户的下单操作log),这种业务,只需要在内存cache中放好可秒杀的数量,还可以把数据分布开来放,100商品,10台服务器一台放10个,无需在当时操作任何数据库。可以订单数够后,停止秒杀,然后批量写数据库。而且秒杀的商品不多。火车票这个不是像秒杀那么简单的,春运时间,几乎所有的票都是热门票,而且几乎是全国人民都来了。(淘宝的双十一也就3百万用户,而火车票瞬时有千万级别甚至是亿级别的)其三有人拿这个系统和奥运会的票务系统比较。我觉得还是不一样。虽然奥运会的票务系统当年也一上线就废了。但是奥运会用的是抽奖的方式,也就是说不存在先来先得的抢的方式,而且,是事后抽奖,事前只需要收信息,事前不需要保证数据一致性,没有锁,很容易水平扩展。其四订票系统应该和电子商务的订单系统很相似,都是需要对库存进行:1)占住库存,2)支付(可选),3)扣除库存的操作。这个是需要有一致性的检查的,也就是在并发时需要对数据加锁的。B2C的电商基本上都会把这个事干成异步的,也就是说,你下的订单并不是马上处理的,而是延时处理的,只有成功处理了,系统才会给你一封确认邮件说是订单成功。我相信有很多朋友都收到认单不成功的邮件。这就是说,数据一致性在并发下是一个瓶颈其五铁路的票务业务很变态,其采用的是突然放票,而有的票又远远不够大家分,所以,大家才会有抢票这种有中国特色的业务的做法。于是当票放出来的时候,就会有几百万人甚至上千万人杀上去,查询,下单。几十分钟内,一个网站能接受几千万的访问量,这个是很恐怖的事情。据说12306的高峰访问是10亿PV,集中在早8点到10点,每秒PV在高峰时上千万。

多说几句:

库存是B2C的恶梦,库存管理相当的复杂。不信,你可以问问所有传统和电务零售业的企业,看看他们管理库存是多么难的一件事。不然,就不会有那么多人在问凡客的库存问题了。(你还可以看看《乔布斯传》,你就知道为什么Tim会接任Apple的CEO了,最主要的原因是他搞定了苹果的库存周期问题)对于一个网站来说,浏览网页的高负载很容易搞定,查询的负载有一定的难度去处理,不过还是可以通过缓存查询结果来搞定,最难的就是下单的负载。因为要访问库存啊,对于下单,基本上是用异步来搞定的。去年双11节,淘宝的每小时的订单数大约在60万左右,京东一天也才能支持40万(居然比12306还差),亚马逊5年前一小时可支持70万订单量。可见,下订单的操作并没有我们相像的那么性能高。淘宝要比B2C的网站要简单得多,因为没有仓库,所以,不存在像B2C这样有N个仓库对同一商品库存更新和查询的操作。下单的时候,B2C的 网站要去找一个仓库,又要离用户近,又要有库存,这需要很多计算。试想,你在北京买了一本书,北京的仓库没货了,就要从周边的仓库调,那就要去看看沈阳或 是西安的仓库有没有货,如果没有,又得看看江苏的仓库,等等。淘宝的就没有那么多事了,每个商户有自己的库存,库存就是一个数字,并且库存分到商户头上了,反而有利于性能扩展。数据一致性才是真正的性能瓶颈。有 人说nginx可以搞定每秒10万的静态请求,我不怀疑。但这只是静态请求,理论值,只要带宽、I/O够强,服务器计算能力够,并支持的并发连接数顶得住10万TCP链接的建立 的话,那没有问题。但在数据一致性面前,这10万就完完全全成了一个可望不可及的理论值了。

我说那么多,我只是想从业务上告诉大家,我们需要从业务上真正了解春运铁路订票这样业务的变态之处。



前端性能优化技术

要解决性能的问题,有很多种常用的方法,我在下面列举一下,我相信12306这个网站使用下面的这些技术会让其性能有质的飞跃。


一、前端负载均衡

通过DNS的负载均衡器(一般在路由器上根据路由的负载重定向)可以把用户的访问均匀地分散在多个Web服务器上。这样可以减少Web服务器的请求负载。因为http的请求都是短作业,所以,可以通过很简单的负载均衡器来完成这一功能。最好是有CDN网络让用户连接与其最近的服务器(CDN通常伴随着分布式存储)。(关于负载均衡更为详细的说明见“后端的负载均衡”)


二、减少前端链接数

我看了一下12306.cn,打开主页需要建60多个HTTP连接,车票预订页面则有70多个HTTP请求,现在的浏览器都是并发请求的(当然,浏览器的一个页面的并发数是有限的,但是你挡不住用户开多个页面,而且,后端服务器TCP链接在前端断开始,还不会马上释放或重要)。所以,只要有100万个用户,就有可能会有6000万个链接(访问第一次后有了浏览器端的cache,这个数会下来,就算只有20%也是百万级的链接数),太多了。一个登录查询页面就好了。把js打成一个文件,把css也打成一个文件,把图标也打成一个文件,用css分块展示。把链接数减到最低。


三、减少网页大小增加带宽

这个世界不是哪个公司都敢做图片服务的,因为图片太耗带宽了。现在宽带时代很难有人能体会到当拨号时代做个图页都不敢用图片的情形(现在在手机端浏览也是这个情形)。我查看了一下12306首页的需要下载的总文件大小大约在900KB左右,如果你访问过了,浏览器会帮你缓存很多,只需下载10K左右的文件。但是我们可以想像一个极端一点的案例,1百万用户同时访问,且都是第一次访问,每人下载量需要1M,如果需要在120秒内返回,那么就需要,1M * 1M /120 * 8 = 66Gbps的带宽。很惊人吧。所以,我估计在当天,12306的阻塞基本上应该是网络带宽,所以,你可能看到的是没有响应。后面随着浏览器的缓存帮助12306减少很多带宽占用,于是负载一下就到了后端,后端的数据处理瓶颈一下就出来。于是你会看到很多http 500之类的错误。这说明后端服务器垮了。


四、前端页面静态化

静态化一些不常变的页面和数据,并gzip一下。还有一个变态的方法是把这些静态页面放在/dev/shm下,这个目录就是内存,直接从内存中把文件读出来返回,这样可以减少昂贵的磁盘I/O。使用nginx的sendfile功能可以让这些静态文件直接在内核心态交换,可以极大增加性能。


五、优化查询

很多人查询都是在查一样的,完全可以用反向代理合并这些并发的相同的查询。这样的技术主要用查询结果缓存来实现,第一次查询走数据库获得数据,并把数据放到缓存,后面的查询统统直接访问高速缓存。为每个查询做Hash,使用NoSQL的技术可以完成这个优化。(这个技术也可以用做静态页面)

对于火车票量的查询,个人觉得不要显示数字,就显示一个“有”或“无”就好了,这样可以大大简化系统复杂度,并提升性能。把查询对数据库的负载分出去,从而让数据库可以更好地为下单的人服务。


六、缓存的问题

缓存可以用来缓存动态页面,也可以用来缓存查询的数据。缓存通常有那么几个问题:

1)缓存的更新。也叫缓存和数据库的同步。有这么几种方法,一是缓存time out,让缓存失效,重查,二是,由后端通知更新,一量后端发生变化,通知前端更新。前者实现起来比较简单,但实时性不高,后者实现起来比较复杂 ,但实时性高。

2)缓存的换页。内存可能不够,所以,需要把一些不活跃的数据换出内存,这个和操作系统的内存换页和交换内存很相似。FIFO、LRU、LFU都是比较经典的换页算法。相关内容参看Wikipeida的缓存算法。

3)缓存的重建和持久化。缓存在内存,系统总要维护,所以,缓存就会丢失,如果缓存没了,就需要重建,如果数据量很大,缓存重建的过程会很慢,这会影响生产环境,所以,缓存的持久化也是需要考虑的。

诸多强大的NoSQL都很好支持了上述三大缓存的问题。



后端性能优化技术

前面讨论了前端性能的优化技术,于是前端可能就不是瓶颈问题了。那么性能问题就会到后端数据上来了。下面说几个后端常见的性能优化技术。


一、数据冗余

关于数据冗余,也就是说,把我们的数据库的数据冗余处理,也就是减少表连接这样的开销比较大的操作,但这样会牺牲数据的一致性。风险比较大。很多人把NoSQL用做数据,快是快了,因为数据冗余了,但这对数据一致性有大的风险。这需要根据不同的业务进行分析和处理。(注意:用关系型数据库很容易移植到NoSQL上,但是反过来从NoSQL到关系型就难了)


二、数据镜像

几乎所有主流的数据库都支持镜像,也就是replication。数据库的镜像带来的好处就是可以做负载均衡。把一台数据库的负载均分到多台上,同时又保证了数据一致性(Oracle的SCN)。最重要的是,这样还可以有高可用性,一台废了,还有另一台在服务。

数据镜像的数据一致性可能是个复杂的问题,所以我们要在单条数据上进行数据分区,也就是说,把一个畅销商品的库存均分到不同的服务器上,如,一个畅销商品有1万的库存,我们可以设置10台服务器,每台服务器上有1000个库存,这就好像B2C的仓库一样。


三、数据分区

数据镜像不能解决的一个问题就是数据表里的记录太多,导致数据库操作太慢。所以,把数据分区。数据分区有很多种做法,一般来说有下面这几种:

1)把数据把某种逻辑来分类。比如火车票的订票系统可以按各铁路局来分,可按各种车型分,可以按始发站分,可以按目的地分……,反正就是把一张表拆成多张有一样的字段但是不同种类的表,这样,这些表就可以存在不同的机器上以达到分担负载的目的。

2)把数据按字段分,也就是竖着分表。比如把一些不经常改的数据放在一个表里,经常改的数据放在另外多个表里。把一张表变成1对1的关系,这样,你可以减少表的字段个数,同样可以提升一定的性能。另外,字段多会造成一条记录的存储会被放到不同的页表里,这对于读写性能都有问题。但这样一来会有很多复杂的控制。

3)平均分表。因为第一种方法是并不一定平均分均,可能某个种类的数据还是很多。所以,也有采用平均分配的方式,通过主键ID的范围来分表。

4)同一数据分区。这个在上面数据镜像提过。也就是把同一商品的库存值分到不同的服务器上,比如有10000个库存,可以分到10台服务器上,一台上有1000个库存。然后负载均衡。

这三种分区都有好有坏。最常用的还是第一种。数据一旦分区,你就需要有一个或是多个调度来让你的前端程序知道去哪里找数据。把火车票的数据分区,并放在各个省市,会对12306这个系统有非常有意义的质的性能的提高


四、后端系统负载均衡

前面说了数据分区,数据分区可以在一定程度上减轻负载,但是无法减轻热销商品的负载,对于火车票来说,可以认为是大城市的某些主干线上的车票。这就需要使用数据镜像来减轻负载。使用数据镜像,你必然要使用负载均衡,在后端,我们可能很难使用像路由器上的负载均衡器,因为那是均衡流量的,因为流量并不代表服务器的繁忙程度。因此,我们需要一个任务分配系统,其还能监控各个服务器的负载情况。

任务分配服务器有一些难点:

负载情况比较复杂。什么叫忙?是CPU高?还是磁盘I/O高?还是内存使用高?还是并发高?还是内存换页率高?你可能需要全部都要考虑。这些信息要发送给那个任务分配器上,由任务分配器挑选一台负载最轻的服务器来处理。任务分配服务器上需要对任务队列,不能丢任务啊,所以还需要持久化。并且可以以批量的方式把任务分配给计算服务器。任务分配服务器死了怎么办?这里需要一些如Live-Standby或是failover等高可用性的技术。我们还需要注意那些持久化了的任务的队列如何转移到别的服务器上的问题。

我看到有很多系统都用静态的方式来分配,有的用hash,有的就简单地轮流分析。这些都不够好,一个是不能完美地负载均衡,另一个静态的方法的致命缺陷是,如果有一台计算服务器死机了,或是我们需要加入新的服务器,对于我们的分配器来说,都需要知道的。另外,还要重算哈希(一致性hash可以部分解决这个问题)。

还有一种方法是使用抢占式的方式进行负载均衡,由下游的计算服务器去任务服务器上拿任务。让这些计算服务器自己决定自己是否要任务。这样的好处是可以简化系统的复杂度,而且还可以任意实时地减少或增加计算服务器。但是唯一不好的就是,如果有一些任务只能在某种服务器上处理,这可能会引入一些复杂度。不过总体来说,这种方法可能是比较好的负载均衡。


五、异步、 throttle 和 批量处理

异步、throttle(节流阀) 和批量处理都需要对并发请求数做队列处理的。

异步在业务上一般来说就是收集请求,然后延时处理。在技术上就是可以把各个处理程序做成并行的,也就可以水平扩展了。但是异步的技术问题大概有这些,a)被调用方的结果返回,会涉及进程线程间通信的问题。b)如果程序需要回滚,回滚会有点复杂。c)异步通常都会伴随多线程多进程,并发的控制也相对麻烦一些。d)很多异步系统都用消息机制,消息的丢失和乱序也会是比较复杂的问题。throttle 技术其实并不提升性能,这个技术主要是防止系统被超过自己不能处理的流量给搞垮了,这其实是个保护机制。使用throttle技术一般来说是对于一些自己无法控制的系统,比如,和你网站对接的银行系统。批量处理的技术,是把一堆基本相同的请求批量处理。比如,大家同时购买同一个商品,没有必要你买一个我就写一次数据库,完全可以收集到一定数量的请求,一次操作。这个技术可以用作很多方面。比如节省网络带宽,我们都知道网络上的MTU(最大传输单元),以态网是1500字节,光纤可以达到4000多个字节,如果你的一个网络包没有放满这个MTU,那就是在浪费网络带宽,因为网卡的驱动程序只有一块一块地读效率才会高。因此,网络发包时,我们需要收集到足够多的信息后再做网络I/O,这也是一种批量处理的方式。批量处理的敌人是流量低,所以,批量处理的系统一般都会设置上两个阀值,一个是作业量,另一个是timeout,只要有一个条件满足,就会开始提交处理。

所以,只要是异步,一般都会有throttle机制,一般都会有队列来排队,有队列,就会有持久化,而系统一般都会使用批量的方式来处理


云风同学设计的“排队系统”就是这个技术。这和电子商务的订单系统很相似,就是说,我的系统收到了你的购票下单请求,但是我还没有真正处理,我的系统会跟据我自己的处理能力来throttle住这些大量的请求,并一点一点地处理。一旦处理完成,我就可以发邮件或短信告诉用户你来可以真正购票了。


在这里,我想通过业务和用户需求方面讨论一下云风同学的这个排队系统,因为其从技术上看似解决了这个问题,但是从业务和用户需求上来说可能还是有一些值得我们去深入思考的地方:


1)队列的DoS攻击。首先,我们思考一下,这个队是个单纯地排队的吗?这样做还不够好,因为这样我们不能杜绝黄61阅读站崩溃确实是有客观的原因,但是就这样还好意思说什么客观条件?



项羽说天要亡我非战之罪情有可原,你一马谡自己不好好做事把自己弄死了,还怪王平不给力,好意思吗。




几点说明

前端的代码浏览器里都能看到,写的好坏大家一看便知。至于后台,不了解,不多说。对于某些对技术一无所知还来摆酸话的,我希望知乎能出一个自定义评论验证码。比如现在我就想弄一个"写一个超链接"的验证码,能过滤到很多没有价值的评论。重复:我真的没有在讨论任何和外观体验有关的话题针对“虽然前端硬伤但是不影响整体,后台多努力你造吗”——或者根本选择无视前端硬伤的:
我更关注的是开发团队的技术实力,而就其前端而言,选用的技术古旧体现出的落后,基本优化缺失体现出的毛糙业余,同一个页面使用不同技术方案体现出的毫无管理,都是伴随团队的整个开发过程的。
做出这样一个落后业余混乱前端的团队,是绝对没有实力做出一套好的解决方案的。
前端的性能问题或者别的问题相对于其数据问题确实不是一个大问题,但是前端落后业余混乱的硬伤表现出的开发者团队能力的问题,则比起数据来说是一个更具体更现实的问题了,除非有证据能证明后台开发的团队是另一个技术实力远强于前端的团队。
更何况以前端的业余程度来说,他们负责代码审查和白盒测试的团队恐怕也....竟然真的看到了类似于,出于高并发系统的难度,前端代码质量和水平要为其让路这样的神论断。我希望持有这个论断的知友能够把他的理论依据就事论事的和目前我们能看到的前端代码结合在一起。
简单的说,就是指出某一段具体的代码”为什么不能写成更高质量,而只能以目前这种水平完成“。talk is cheap


网友林布[12036]12306 外包给阿里巴巴、IBM 等大企业做是否可行?给出的答复:

四 : 大摩维持阿里巴巴增持目标价调高至101美元

大摩维持阿里巴巴增持目标价调高至101美元

新浪科技讯 北京时间10月29日晚间消息,摩根士丹利今日发布投资报告,维持阿里巴巴股票(NYSE:BABA)“增持”评级,将目标股价从98.70美元调高至101美元。

以下为报告内容摘要:

基于非美国通用会计准则,阿里巴巴2016财年第二季度每股摊薄收益同比增长28%。在全部核心指标上,阿里巴巴第二财季业绩均超出预期。商业化率出现了5个季度以来的首次同比增长,主要得益于PC商业化率的稳定表现,以及移动商业化率的提升。更好的B2C GMV组合意味着一个趋势的开始:天猫正成为零售商的核心品牌平台。为此,我们继续维持阿里巴巴股票“增持”评级。

商业化前景明朗:第二财季,阿里巴巴商业化率为2.42%,同比增长12个基点,高于我们预期的11个基点。这主要得益于移动商业化率的强劲表现,同比增长52个基点,而PC商业化率略微下滑。

需要指出的是,广告营收增长继续受竞价密度(价格)所驱动。将来,PC和移动平台的广告加载将继续推动营收增长。我们预计,在截至12月底的第三财季,广告营收涨幅将低于GMV涨幅。但由于商家提供更多折扣(更少的广告开支),佣金收入涨幅可能会加速(B2C GMV组合优化)。我们预计,阿里巴巴2016财年商业化率将达到2.44%,同比持平。2017财年将达到2.52%,同比增长8个基点。

B2C GMV组合优化、天猫品牌平台战略初见成效:第二财季,阿里巴巴GMV同比增长28%。阿里巴巴管理层相信,2020财年GMV将达到1万亿美元,意味着2015财年至2020财年间的年符合增长率为20%。

天猫GMV同比增长56%,贡献了整体GMV的39%,而一年前的该比例为32%。天猫正成为零售商的一个核心品牌平台,这一点从阿里巴巴此次“双11”促销活动的“全渠道战略”即可略窥一斑。

我们预计,在截至12月底的2016财年第三财季,B2C GMV同比涨幅将达到50%以上,占整体GMV的44%,主要得益于“双11”促销活动。我们认为,B2C GMV 2016财年将贡献整体GMV的41%,而2017财年将提高到44%。

估值:我们继续维持阿里巴巴股票“增持”评级,将目标股价从98.70美元调高至101美元。(李明)

本文标题:阿里巴巴:什么才是大数据思维-12306 外包给阿里巴巴、IBM 等大企业做是否可行?
本文地址: http://www.61k.com/1102819.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1