中油瑞飞 孙杰:企业云化2.0的深度考虑与实践
本文摘要:中油瑞飞 孙杰:企业云化2.0的深度考虑与实践随同着IT新技能的开展,像虚拟化、云核算和大数据对我们来说现已不再生疏了。在企业里边信息云化施行的时分,各种新的技能在优势闪现的同时,其实我们也发现随之而来带来的问题也比较多。 很快乐来到这个会场跟我
中油瑞飞 孙杰:企业云化2.0的深度考虑与实践 随同着IT新技能的开展,像虚拟化、云核算和大数据对我们来说现已不再生疏了。在企业里边信息云化施行的时分,各种新的技能在优势闪现的同时,其实我们也发现随之而来带来的问题也比较多。

很快乐来到这个会场跟我们共享我们企业在云化2.0的实践经历,这场共享我以技能的名义来一场真诚的共享。随同着IT新技能的开展,像虚拟化、和对我们来说现已不再生疏了。在企业里边信息云化施行的时分,各种新的技能在优势闪现的同时,其实我们也发现随之而来带来的问题也比较多。有的时分我们反而感觉上了云之后,我们面对的问题反而愈来愈多。有时分我们没有感觉到轻松反而更累了。问题呈现在哪儿?我们IT是变得简略仍是杂乱了。我们的思维是否还禁闭在传统的IT和传统的固化形式里边。下面我这片子将为您展示我们在云化过程傍边的考虑与实践。

我的共享分为三个部分,第一个就是企业云化演进的阶段分析。第二是我们在云化2.0面对问题与考虑以及我们的实践。第三是企业云化的未来展望。

我们看一下云核算,云核算其实从2006年呈现到现在现已阅历了大约10余年的时间,最早我们知道06年谷歌有一个101方案正式推出云的概念,当时是谷歌的克里斯朵夫(音译)向当时CEO斯密特提出自己的云核算的主见,得到了斯密特的认可,谷歌推出101,正式有了云的概念。我们后来看到KVM这种虚拟化是在07年进入到了Linux内核,我们又看到LXC是在2008年就发布了初版,我们看到现在的容器比较火,最早也是源于LXC。HyperV,微软虚拟化是在08年发布。紧接着VMware2009年推出Vsphere。我们再看到CloudStack于2010年开源,这个也是我们现在开源的一种。当然现在显着我们感觉势头没有Openstack火,Openstack是2010年由NASA和Rackspace发起。在这个时分,其实我们看到我国企业的商场,其实我们关于云还没有是完全的一种新的知道。我们可以看当时的报导,2011年的时分李彦宏说云核算是新瓶装旧酒,当时腾讯总裁说云核算完成像水电一样的根底设施至少上百年。当时马云说阿里假如不做云核算会死掉,可是我们现在看阿里云的开展在国内现已占到了云核算商场31%,成为我国的领军企业。这种开展趋势和我们对云核算知道直接抉择你在云核算商场开展的位置和你开展的远景。

技能落地期,从2010-2015年,云核算得到了飞速的开展。私有云开始兴起。中油2012年底提出要搞云核算,2013年正式起步云核算。现在我们规模现已达到了将近15000台虚拟机,5000台物理机的规模。这时候候如火如荼。第四个特点云端交融是一种新的趋势,看现在的移动化的互联网开展也对错常的迅猛,Openstack得到了广泛应用和推广,很多云核算立异企业大部分也就是带这个时分开始起来的。像神州云和其他立异企业,大部分都是在这个时分开始起步。软件界说成为共识,我们觉得都应该通过软件的方式可以更好把硬件管理起来,完成功率最佳化,完成资源使用的最大化。

我们看未来十年,从2016-2015年,这个期间又有什么样的特点?这期间我们发现国家出台了很多相应的一些文件。无论是习大大在一些会议上说,还包括最近出了云核算三年举动开展纲要都对这个事情给予了适当高的注重。第一开源技能生态将会成为职业技能打开的一种重要力气,云核算进入了一个新的昌盛开展期。第二,根本上现在我们都现已认可云了,很多单位和企业现已有了云的根底设施,这时候候有一个重要的特点就是由曾经的根底设施为主转向支撑云的应用和效劳为主这样一个主要的变化特点。第三现在的企业是云化的主角,职业云将成为云核算的主战场。你从什么样趋势可以看出来?我们看到现在很多曾经搞,像阿里云,AWS,再像其他一些有云都在向传统企业进军,因为传统企业是未来云化的主角。他现在在云方面的投入将会一年比一年多,并且远远比中小企业投入要更多。第四个特点就是人机物交融,并且万物互联年代到来。这样的年代云核算成为一种重要的基础,而大数据是一种提供重要的佐料。我们人工智能是建立在云核算和大数据这样的基础之上。

再来看企业云化演进的阶段分析,在我们从2013年开始建立自己的私有云到现在现已走过了三年,我们对以前三年用了六个字总结,就是由涣散到集中再到集成,在以往是涣散的。不论是在曾经的动力职业仍是在曾经的制造业事务体系都是涣散在各个部分,由不同的部分来进行主管你的事务体系。到了云之后,企业是强制各个事务体系都要上到云之上来,这个时分是完成了一种简略的集中。集中之后,还有一个有必要要走的路就是要集成,因为你的各个体系都上了云之后,怎么可以在云的大环境下可以让它更好的运转完成最佳的功率。你要把它进行统一调度,统一管理,这就有必要面对一个集成。包括你机房的集成,IT设备的集成。我们看我们把效劳器收归到一块完成核算资源统一管理,把存储设备收归到一块完成存储资源的统一管理。这些设备集成之后,我们在上来建立了自己的云渠道,进一步把下面的各种设备,各种资源池统一进行纳管。再往上面就要把企业内部的一些计费体系、视频会议体系还有其他一些可视化运维,包括一些数据彻底集成起来。这叫我们的CT才能的集成。再往上走就是事务平台集成,统一门户、虚拟桌面、OA、ERP、CRM和HR体系都要集成在整个云渠道之上,大致你回忆一下你的企业云化之路也是走过这三个阶段,从涣散、集中到集成。

在云化1.0里边,我们考虑通过评论总结了四点。第一个云化1.0这三年来我们究竟做了一些什么事。第一点就是统一规划,我们对软硬件资源完成了统一规划。企业的IT完成了高效管理和资源整合。在以往他各个事务部分都可以报自己的需求,我要收购多少效劳器,收购多少存储。往往他的需求都是超量,他的设备存在很多糟蹋。某的事务体系一下买了50台、100台效劳器,每一个效劳器使用率只有20%乃至10%以下。关于企业来说形成了巨大的糟蹋。在云上最主要一点是完成统一规划,第二点是按需分配,我们依照虚拟化的技能,通过云渠道的智能调度和均衡算法,我们按需分配。你这个事务体系需要多少资源我给你分配多少。提高资源全体使用率,完成资源价值最大化。我这个存储可以分给若干事务体系,我们可以合理规划自己的存储,云上统一监管你的资源使用率。第三点互联互通对错常重要一点,各个事务体系在云里边他们之间企业的事务体系之间都是有相互的联络,包括有的是前偶尔,有的是松耦合,都有很大的联络。这时候候资源完成互联互通之后,就为企业今后完成大数据和应用的集成打下了杰出的基础。第四点就是要统一管理,我们看到很多包括参加其他的会议,听到很多嘉宾的共享,做什么事?完成统一管理,统一监控,统一调度链,统一你的流程和工作管理平台,统一你事务的效劳。这个云上数据的统一管理,为企业的数据备份和容灾也提供了基础。也更加合适我们管理和扩展的要求。云化1.0主要就是这四点。

未来云化2.0,企业下一步将要完成什么?绿色运营 数据智能 开放架构。为何要提绿色运营?我们知道每一年IT根底设备我们就不说其他,我们就说它的电,这个电十分大的一个耗费,一台效劳器均匀一年制冷+用电费用一年需要一万块钱。你有五千台,就是五千万,这是多么大的一笔开支。第二是数据智能,你的IT与DT事务平台集成,机房数据体系集成,事务数据剖析体系,大数据剖析体系数据集成。都需要你做数据的智能分析更好使我们的事务体系最优化运转在我的云渠道之上。企业级云渠道要求你什么?要有很高的扩展性,药业很高的安全性,为何企业要建私有云,因为安全性相比你的自主可控要更加剧要。所以很多大型企业有必要要建自己的私有云,而不是把自己的事务悉数放在公有云上。

另外一点开放兼容,开源东西十分多,技能打开也十分快。企业曾经用的传统商业软件反而前进比较慢。现在很多传统企业积极拥抱开源和走向开源,开放架构也很重要。大致你来看企业云化2.0主要就是这三个方向。

我们看2.0面对的问题和考虑,第一是绿色运营,绿色运营现在我们知道环保是一个十分重要的课题,看国家重要很多领导人的说话都提到了绿色开展和绿色运营。在未来几年景本压力以及法规遵从以及社会企业职责推进下,企业IT必定走向节能减排的行列。并且还强调去炭化,去煤炭,今后走向清洁动力和走向太阳能。你看到动力企业面对压力十分大。效劳器虚拟化前后的耗电也也显着的区分,效劳器耗费额定功率通常为50-67%的电能。闲暇效劳器也要耗费30-40%的电能,这都是很大的开支。

我们看某数据中心用电量计算和相应的PUE。7、8月在比较酷热的季节可以看到它的PUE值比较高的。1.76、1.64,到9、10月向下降,1、12月比较冷的时分,PUE值是1.35到1.33。均匀每天用电量可以看到根本是一万多度。对企业来说是很大的开支。

业界探究有集装箱式的数据中心,还有微软的海底数据中心,包括Facebook在北极圈建立自己的数据中心。业界国内游阿里在千岛湖搞水冷数据中心。最近前期我们看到在微信朋友圈里边转的比较多的阿里的浸没液冷效劳器集群,PUE值可以迫临极限,1.0。这对错常好的探究,这些可以圆满完成,对数据中心节能来说是很大的福音。

企业级的PaaS云渠道,企业级的云渠道里边,我画了立体图,可以看到以最下面的核算、网络、存储到了上面这一层你要完成你的网络办理体系、核算办理体系和存储办理体系。云渠道这块不论是核算网络和存储,你在建立虚机的过程傍边它是统一效劳的过程。你建立虚机的时分分配网络资源,这些都是一体化一步到位,讲师讲我们的云可以一步上云,前期把这些资源做好了,一步上云是可以完成的。对传统企业来说你的PaaS平台设计需要什么功用?云化的要害点是什么?上云怎么进行改造,都是你在企业云化过程傍边有必要要考虑的问题。一种平台是否可以解决所有运用,有的是用VMware商业平台,有了Openstack之后,怎么把两种平台进行对接和交互。这里边临很多问题需要我们去考虑。

对企业来说你的平台设计需要什么样的功用,我们通过这些年的实践总结出来一个总的原则你要依据事务需求和企业的运用场景来抉择你的平台应该具有什么样的功用。很多时分你发现很多厂商在做产品的时分只想到自己的产品可能需要什么样的功用,他没有对企业的实践需求进行调研。你这样做出来的产品可能就不合适企业。我们知道有一个成语叫削足适履,你的产品能让企业削足适履吗?肯定是不可能的。你有必要要依照企业的足进行量身定制来做你的产品,你的产品才干最佳匹配企业需求,才干取得企业付给你的价值。

上云的次第,先外围后核心。一般没有哪一个企业敢把自己的中心体系先上云上,没有人敢轻率做。第二先新后旧,先把这两年新的事务体系可以考虑放到新的平台,包括Openstack这样的开源云渠道。可是曾经旧的事务体系,一些比较庞大的不论是技能人员仍是领导,都不敢去拍板说直接把它拿来放到开源云渠道上,企业要寻求最大的安稳性。

第三就是先小后大,先把小的体系放到云渠道上,来验证你的运转功率,然后再逐渐把大的事务体系依靠联系比较杂乱放到云渠道上。你的功用要完成界面个性化,云渠道的管理员和资源使用者包括事务的管理者,你看到界面应该是不一样的。我作为云渠道管理者,我看到这里边所有事务体系占用的资源包括你的核算和存储,你作为事务体系的管理员,只能看到你这个事务占用的核算资源、网络资源和存储资源,这是完全不一样的界面。

第二要支撑运转和开发中心件,很多事务有自己的中心件,你是否可以兼容。第三支撑开源的东西和软件,为何支撑开源的东西和软件?很多事务体系运用开源的数据库,曾经的商业事务体系比较多的使用Oracle。支撑多租户的SAAS引擎,支撑多种效劳的注册才能。在云渠道上都可以一键完成,统一监控、统一计费,统一用户权限分配。你感觉起来很简略,真正去做发现这里问题很多,不是你拿来一个产品就可以完全匹配企业的需求。很多产品我们都拿过来测试,包括阿里专有云,包括华为云,我们都拿来我们机房进行测试。我们发现很多问题,像阿里的专有云,是依据阿里的事务开展起来,是作为一种技能输出,对外提供一种专有云的效劳。可是他的专有云渠道依据他的事务开展起来,他是依据动力事务开展起来的吗?不是。所以会发现他有很多不同点。这里不同点在这里不逐个介绍,你真正测试过有很多,他的网络有吞吐限制,包括平台管理架构有很多虚机不可建,有很多问题。这些问题你看起来不是,他看起来不是问题,对我们企业的管理者来说,这些当地是问题。他不是完全合适我们的事务和我们的管抱负法。

下面我们看一下VMware和Openstack比照,为何我们尧趋比照这个东西?因为现在Openstack现已成为施行开源的云渠道规范,很多传统企业大型企业都在积极拥抱Openstack,可是原有VMware的事务,运转在VMware上现已很安稳,包括事务体系的人都没有特别大的动力想要换到Openstack上面来,你怎么完成事务体系的迁移?不同云渠道的迁移?我们需要做一个详细的测试和POC。通过这些测试和POC,我们得出以下的结论,第一个综合比较Openstack在设计方面七分,VMware九分,为何这样说?VMware是一个商业产品,它的各个性能是通过这么多年企业不同虚拟化场景完成,VMware产品09年有了,到现在有8年时间。而Openstack真实的推出应用到企业里边才几年时间,最多也就三四年的时间。它阅历场景考验肯定没有VMware多,VMware很多功用的设计是要超过Openstack的。第二是功用,功用上可以看到Openstack占6分,VMware9分,在运用场景上VMware和Openstack是持平。很多场景能够使用VMware,可以选择Openstack,这是完全没有问题。另外就是价值,从价值上看Openstack得了10分。怎么去看这个问题?Openstack是开源产品,它的各个组件更新和变化都比较快,它未来的生命力肯定对错常强的。从它的开展趋势和生命力上我们认为可以得10分,VMware是9分。功用看,我们看虚拟机生命周期管理十分重要,虚拟机从建立毁掉中心有一系列的管理,生命周期管理。至少我们看一下VMware和Openstack都有。可是虚拟机高档特性,VMware会比较丰厚一些,不论是它的HA的完成,DIS的完成等等都要好于Openstack,可以通过测试发现。Openstack的高档特性不能说没有,也有,可是比较少一些。包括虚拟机的高可用,你通过测试发现。动态资源办理VMware比较丰厚,Openstack有,可是比较少。

终究我们从可靠性上来看Openstack是中,VMware是高。我们得出这些结论不是说随意画一个表格放在这里给我们看,我们通过大约三到四个月比较详细的POC测试才得出这个表,另外安稳性VMware比较高,Openstack的运维杂乱度比较高。早年有朋友做Openstack的迁移工作、晋级工作,他当时跟我说一个消化,客户说晋级我在两小时给你搞定,客户说两小时少了,我给你五小时。成果这个晋级五小时都没做完,厂商花了10小时把晋级做完了。我们知道Openstack晋级和运维比较杂乱,没有VMware简略。VMware的晋级,大约只需要一个小时乃至半个小时晋级完,可是Openstack的晋级你半个小时能搞定吗?肯定搞不定。另外桌面云的支撑Openstack一般,VMware比较好。使用本钱Openstack是比较低。有时分也不低,你买商业产品,公司出产特别定制版也有比较高的费用。VMware主要是Lenss(音译)费用比较高,他每一年Lenss(音译)费用上千万,几千万,这上面来看它的费用比较高。

云化的要害点主要是五点,第一个体系的弹性伸缩,你的事务不断的变化和开展,弹性伸缩适当重要,我们可以自在在线扩展。另外应用集群化布置,我们尽量可以做到散布式而不是集中式,你一旦集中式,你某个资源比如你的存储资源呈现问题,你的应用就会大面积不可用。另外应用与数据别离,尽量不要绑缚在一同。数据散布式布置,我们现在都提散布式,不要把所有的事务体系都放在一个存储上,放在一个相应的区域之内,这样才干完成你的高可用。另外数据的平台化,你通过平台化之后,可以减少很多人工的没必要要的过错。很多时分我们做运维很多人肉,然后主动化脚本,把脚本放到平台里由平台统一操作和调度,减少很多中心环节,使用起来十分快,十分便利。怎么改造,将应用进行梳理,将不同应用分类,底层选用不同集群支撑。比如把事务分为核算密布型,IO密布型,同时综合考虑波峰波谷和事务特性依据这些来进行装备,你才干完成资源最合理的使用。

数据智能,我们通过一些部分专门的研讨发现,最重要你要是可以合理采集到不同的数据源,包括内部和外部的。像外部公开来自于淘宝、京东、公司网站、交际媒体数据。内部你们自己的行为数据、运维数据等等,把这些数据都采集过来之后抽取放到一个常识库里边,终究把这些数据进行相应的建模,再依据你的事务需要来做相应的数据发掘,终究把这些数据总结出来作为规律的知道作为价值的传递。这是将来云渠道建立之后需要重点做的一步,你各个事务上了之后,数据事务要集中,数据集中之后很多仍是层级。你怎么可以把数据资源调动起来,可以让它完成在流动过程傍边,在动态过程傍边可以完成资源最佳配比和优化使用。这里要通过一些数据剖析软件来让数据更加具有智能,这也是今后大数据要开展的方向。

我们看到市道很多企业的大数据产品,根本就是前端展示和监控类和日志剖析类,真正用到企业里边你发现没有特别好的产品,这一块还有很多技能点需要打破。

再有开放架构,兼容并蓄,软件界说,拥抱开源,联合立异,这是我们领导提出标语,我们跟开源企业积极合作。

架构云化2.0我们有几个考虑跟我们共享一下,第一架构角度再考虑突出问题,我们发现重点的问题就是产品堆积,缺乏架构规划。你建了云之后,不是简略把虚拟化,包括你监控这些东西堆积起来都放到云上就能够了,对你的事务和整个资源进行合理的架构规划。云衣服要有配比,上面穿什么,下面穿什么,鞋子穿什么,不是你随意穿就美观,它有一个适宜的搭配。在云渠道里边也是一样,我们买了很多产品,又买了VMware,买了这样那样的存储办理体系,我们发现这些商业产品都是各自依照厂商自己的主见设计。没有依照我们的需求来统一定制,我们也没有对他进行一个比较深的考虑。我们在云化傍边发现突出的问题,产品堆积,缺乏架构规划。假如有厂商你可以看到我们的问题,你设计的产品肯定就可以取得企业用户的喜欢。

那些架构里边踩过的坑,第一是虚拟机的跨渠道迁移。VMware的VSphere平台虚机跨渠道迁移到KVM环境中,发现问题呈现在哪些方面?像驱动,你在VMware里边很多驱动是专有,你把它放到Openstack平台里边会发现你的驱动完满是不习气的。你在VMware平台里边,在KVM平台里边跑不起来。另外快照,你把VMware里边虚机移到KVM环境快照丢掉,网络环境不一样。VMware里边有散布式和虚拟交换机,把它移到Openstack环境里边会发现网络很多地点需要自己从头配。不是买一个虚机移以前就能够了。再一个是磁盘文件,VMware可以建多个磁盘文件,迁移到Openstack把相应磁盘文件兼并,多个迁移以前十分慢,有时分会丢磁盘文件。像磁盘格局,像你的VMware是什么样的格局,你迁移以前因为你的磁盘不一样,极可能一下起不来。这些问题假如你认识不到,你做两种平台的交融中心会有很多问题你解决不了。

第二延时关于集群的影响,Rac的节点驱赶,OSD死掉有很多的问题,这里不说了。虚拟化大流量网络,巨型桢的开启。你在虚拟化的环境里,有时分为了进步功率,加强后端的功率需要改为9000,你不改你的测试功率和实践功率都会比较差。散布式的双活和容灾,Openstack的方案关于企业真实的双活和容灾相差较远,虚拟机上跑数据库,是否能跑数据库,我们通过很多评论。

去O的考虑,今天不在这说了。后边可以看我们的PPT。管理角度主要是关于CMDB的考虑,CMDB在大型数据中心里边对错常重要,很多时分你需要对它资源有一个合理的定位和评价,在这个时分像很多企业里边做的CMDB很停止,你更新比较麻烦,很多都是手工。我们期望完成一种主动采集和动态更新,包括你的裸机、虚拟机和容器,资源调度和组织,可以很好的交融在云渠道里边。

运维角度主要是主动化和规范化。开发角度主要是你的企业文化和流程再造,像DevOps在这阶段提的比较响,实践上它在传统企业里边不是一个抢手,因为你DevOps不光是开发和运营之间彼此交融过程,也要体现你流程和各种企业效劳改造上面才干很好的把DevOps用起来。

安全角度信息安全和自主可控对传统企业来说对错常重要的强新需求,这里有典型工作不再逐个说了,常常重视技能的人都会了解。近年网络阻隔,还有炉石传说,还有AWS宕机工作,愚人节的北邮机房之火。

企业云化的总结三句话,不以解决问题为意图的体系都是假装体系、耍流氓。第二搭建完善的企业IT体系需要多维度进行考量,绝非一蹴即至可以解决的事情。第三一种架构或一个云产品不能解决所有问题,你的产品都是有各自使用的场景。任何产品不可能解决一个企业所有的问题。

企业云化的未来展望,共享几张片子,大约考虑一下我们企业对它们的知道。第一个是根底设施云核算进入商业应用要害阶段。云核算高可用、容器技能和云端交融是将来开展的方向。其二传统企业的数字化和智能化上升到国家层面。现在中央领导们都在一些重要的会议上强调加速信息技能的建设,推进互联网和实体经济的深度交融,加速传统企业的智能化和数字化。其三我看到一句话,当时感触十分深,跟我们共享。他说即便你什么错都没有,错就错在你太老了。因为现在技能打开太快,传统企业有时分跟不上形势有时分也会死的很惨。企业在这个年代的焦虑和为难,无疑来自我们正在阅历各种商业革命和技能革命。以前不再建立,未来看不明晰。比被征服更为可怕是你不知道被谁征服。

时不我与,加强合作,提高才能。最近很多共享我们都看到我们强调一个知道IaaS公有云的时机现已完毕,现在很多开展私有云。解决私有云技能才能是要害,面对一个职业的垂直领域现在还在探究阶段,我们抓住机会,抓住企业的商场。

终究企业的未来是云核算+大数据+商业智能。终究我的完毕语未来已来,预见才干遇见,悟到才干有道,谢谢。


10:31:00 边缘核算 企业有必要进入云端吗?可以进入边缘核算 如今物联网的应用愈来愈广泛,但需要具有企业的视角。这意味着垂直职业运用程序、开发生态体系、产品规划、硬件、布置等。
10:19:00 云资讯 谷歌牵手VMware将虚拟化工作负载引入谷歌云 彭博社报导称,谷歌与VMware正在打开合作,协助企业更轻松地在Google Cloud Platform上运转VMware vSphere虚拟化软件和网络东西。
09:52:00 云资讯 谷歌与戴尔旗下云核算公司VMware建立新协作 试图追逐竞争对手 据国外媒体报导,当地时间周一,谷歌宣布与戴尔旗下的云核算公司VMware建立新的合作同伴关系,协助更多企业迁移到云端,从而试图追逐其竞争对手。