一 : 阿里云发布函数计算 毫秒级弹性伸缩
4月26日,在云栖大会·南京峰会上,阿里云宣布函数计算(Function Compute)启动邀测。这是一个事件驱动的无服务器计算平台。用户按需调用、按需付费,无需管理服务器等基础设施,特别适用于应用场景中有明显波峰波谷的企业。
函数计算的推出是阿里云在Serverless领域的重要产品。当人们想使用计算资源时,再也不用先买一台计算机。开发者通过函数计算即可获取巨大计算资源,发挥自己的创造才能,我们可以真正从计算机时代进入计算时代。
“我们希望函数计算可以让开发者能够更加轻量地利用计算,从而有更多精力聚焦在自己的核心竞争力上”,阿里云飞天研发负责人李津介绍,通过函数计算,开发者无需配置或管理服务器即可运行代码,轻松地操作和管理应用程序,如图像上传、应用内活动、网站点击或连接设备的输出等。
函数计算具备毫秒级的弹性伸缩能力和按需付费是函数计算的两大特点。
函数计算在一项事件需求触发后的数十毫秒,即可准备好计算资源进行处理。
计费模式不再以资源购买为计量起点,而只为代码实际运行时消耗的计算资源付费,这也能帮助企业以极低的成本轻松应对业务的峰值压力。
二 : 云计算之路-阿里云上:Linux内核bug引起的“黑色10秒钟”
一图胜千言,先看下图中Linux 3.2.0-39.62的Changelog:
截图来自:https://launchpad.net/ubuntu/+source/linux/3.2.0-39.62
Linux 3.2.0-39.62发布时间:2013年2月27日(我们是3月9日迁入阿里云的)
我们遭遇的“黑色10秒钟”问题详见:云计算之路-阿里云上:超级奇怪的“黑色10秒钟”。(www.61k.com)
本来准备硬啃内核代码证明是Xen的问题引起的“黑色10秒钟”,现在不用了。这是Linux内核中Xen paravirtualization spinlock实现的一个bug,Linux 3.2.0-39.62已经修复了这个bug。
我们是在一篇一篇阅读这个帖子(Kernel lockup running 3.0.0 and 3.2.0 on multiple EC2 instance types)的回复时找到答案的。
这个帖子中描述的问题现象与我们遇到的惊人的相似(连回复中提到的虚拟机跳时钟的问题我们也遇到过)。帖子是Amazon的工程师在2012年6月11日发现并提交的,通过Amazon工程师与Canonical工程师在回帖中的对话,可以看到老外对待问题的态度。正是他们对问题的执着才最终让Linux的这个bug得到了修复。
有些朋友质疑我们不务正业,浪费时间研究阿里云的东西。
我们的想法是:
首先,阿里云用的是Linux+Xen,这是开源社区的东西,不是阿里云的东西;
其次,我们团队只有一个人投入精力在阿里云的事情上,没有影响正业;
最重要的是,阿里云上有很多很多用户,我们遇到了这样的问题如果不去找出真正的原因,其他用户可能也会经历和我们一样的非常痛苦的折腾。这种折磨人的感觉真是刻骨铭心,我们不想让任何人再经历一次了。这就是我们坚守的最重要的原因!
关于这个bug的关键内容摘录
1. #65楼:From my tests it seems that the problem in the Xen paravirt spinlock implementation is the fact that they re-enable interrupts (xen upcall event channel for that vcpu) during the hypercall to poll for the spinlock irq.
2. 当时对spinlock.c中的xen_spin_lock_slow()部分的代码修改解决了问题:https://launchpadlibrarian.net/124276305/0001-xen-pv-spinlock-Never-enable-interrupts-in-xen_spin_.patch
3. #79楼:After finally having a breakthrough in understanding the source of the lockup and further discussions upstream, the proper turns out to be to change the way waiters are woken when a spinlock gets freed.
4. #86楼:There is currently a Precise kernel in proposed that will contain the first approach on fixing this (which is not to enable interrupts during the hv call). This should get replaced by the upstream fix (which is to wake up all spinners and not only the first found).
bug发生过程分析
来自Patchwork [25/58] xen: Send spinlock IPI to all waiters:
1. CPU n tries to schedule task x away and goes into a slow wait for therunqlock of CPU n-# (must be one with a lower number).
2. CPU n-#, while processingsoftirqs,tries to balance domains and goes into a slow wait for its own runq lock (for updating some records). Since this is aspin_lock_irqsavein softirq context, interrupts will be re-enabled for the duration of the poll_irq hypercall used by Xen.
3. Before the runq lock of CPU n-# is unlocked, CPU n-1 receives an interrupt (e.g. endio) and when processing the interrupt, tries to wake up task x. But that is in schedule and still on_cpu, so try_to_wake_up goes into a tight loop.
4. The runq lock of CPU n-# gets unlocked, but the message only gets sent to the first waiter, which is CPU n-# and that is busily stuck.
5. CPU n-# never returns from the nested interruption to take and release the lock because the scheduler uses a busy wait. And CPU n never finishes the task migration because the unlock notification only went to CPU n-#.
相关链接
Strange PVM spinlock case revisited
三 : 阿里云:计算将成DT世界引擎
阿里云:计算将成DT世界引擎
阿里云发起全球数据保护倡议
阿里云六年关键词: 数据保护、生态、一站式服务
阿里云集中发布11款新产品及50个行业解决方案
6年前,云计算创业“无人喝彩”。6年后的今天,阿里云已成长为全球领先的云计算服务平台,开始分享对于DT世界、云计算生态、数据保护以及未来核心技术等方向的判断。
7月22日,首届阿里云分享日×云栖大会北京峰会召开,吸引了海内外2000余名开发者、创业者及生态伙伴参与。会上,阿里云集中发布了11款新产品、50多个行业解决方案;向企业级用户开放互联网架构解决方案;首次披露云计算生态路线图全貌;并面向行业率先发起数据保护倡议,明确数据归属客户所有,平台方不得移作它用。
“如果说火代表农业世界,电代表工业世界,那么计算就是DT世界的标志。”阿里云总裁胡晓明在会上表示,全球已经步入DT时代,未来的一切都离不开计算和数据,阿里云要做的,就是把计算变得更简单,让计算成为世界的能力,让数据成为经济的动力。
11款新产品发布 技术拓展商业边界
六年技术沉淀,阿里云在云计算基础设施领域,覆盖了从域名、备案、解析、计算、网络、存储、数据库、安全、海量数据分析到互联网中间件等一站式服务,并已在多个领域进入全球TOP行列。
分享日当天,阿里云集中发布了11款新产品,并预告了即将推出的10大产品与服务。新品包括读写性能超群的SSD云盘、可一键搭建混合云的VPC服务、基于PostgreSQL并兼容Oracle的云数据库、支持Redis的KV数据库以及应用于基因测序与渲染等行业的批量计算等。
SSD云盘以每秒20000次读写、高达256MB的数据吞吐表现,一举扫清了读写密集型行业使用云计算的障碍。读写20万次的SSD本地盘也即将发布。VPC为搭建混合云提供了兼顾安全与便捷的最佳方案,浙江、贵州、海淀、中石化、海关等政府与国企已经在VPC+专线环境下高效运行。发布的十万核并发处理的批量计算,可应用于基因测序、新药研发与影视渲染、视觉计算等行业。
与此同时,阿里云还推出企业级互联网架构解决方案,提供应用框架、消息队列、分布式数据库等服务。
阿里云CTO章文嵩表示:“新技术和数据出现前所未见的指数级增长,并将加速更替。全新的科技商业机会由此诞生,使得很多行业的弯道超车成为可能,并对很多行业带来挑战。”他透露,“很快将推出基于GPU的高性能计算服务以及加速器,支持深度学习等领域的创新创业,让技术拓展商业边界。”
披露生态路线图 向DT世界转型
伴随着阿里云成长的6年间,不仅是计算本身在发生变革,整个生态也随之生长。
当天,阿里云正式发布了汇集产品和服务的云市场,并首次明确云计算与合作伙伴的定位,描绘出10大类IT服务商向DT世界转型方向,披露了阿里云生态路线图全貌。
自去年启动“云合计划”后,阿里云上已汇聚50多个行业解决方案,覆盖游戏、多媒体、政府、医疗、物联网、金融等八大领域。这些解决方案由200余家大型合作伙伴提供,未来三年全球合作伙伴将扩大至2000家。
“我们聚焦于基础设施,提供公共云、专有云、混合云。合作伙伴向客户提供行业应用、行业解决方案、IT服务、硬件等服务。”阿里云业务总经理刘松表示。
发起数据保护倡议 界定数据归属权
在DT世界,数据从沉睡中苏醒,开始流淌起来,成为新的基础能源。这意味着数据将成为最具价值的资产。
会上,阿里云全球率先发起“数据保护倡议”:“数据是客户资产,云计算平台不得移作它用,并有责任和义务帮助客户保障其数据的私密性、完整性和可用性。”据悉,这是中国云计算服务商首次定义行业标准,针对用户普遍关注的数据安全问题,进行清晰地界定。来自英特尔、数梦工场、浪潮、用友、新奥特等上千位行业人士见证并响应这一倡议。
目前,阿里云已践行这一承诺,构建了中国首个基于大数据的云计算安全体系,提供云盾DDoS防护、安骑士等全球一流的安全服务。刚刚推出的云计算保险,则为每一位客户提供了额外的保障。阿里云免费为每一个客户投保,消除后顾之忧。
云栖大会: http://click.aliyun.com/m/1381/
IT指的是Information Technology,即信息技术;
DT是指Data Technology,意即数据科技,是指全球正在加速从IT(Information technology)走向DT(Data technology)。数据从沉睡中苏醒,开始流淌起来,成为新的基础能源。阿里巴巴坚信,未来增长引擎燃烧的不再是石油,而是数据。
61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1