目前,OpenStack 社区成员已达到7万多名,来自185个国家,有656家企业支持,贡献项目代码超过2000万行,已然成为时下最热的云计算开源软件,甚至可以说,历史上还没有任何一个开源社区能够这么快的崛起。近日,2017 OpenStack Days China 在京召开,雷锋网受 Intel 之邀,见到了其投资的海云捷迅联合创始人兼 CTO 李华,聊了聊这门开源生意,是如何在传媒、教育、医疗、电信、政务等本土行业应用的。
严格算起来,海云捷迅创立已有7年,但真正有明确的方向,还得从2012年说起。
这一年,开源的 OpenStack 在云计算市场开始有了渐热的趋势,但当时风头正盛的还有 CloudStack;此外为了稳定和安全,大企业上云很谨慎,选择开源的方案少之又少。回过头看现在的“热闹”,CTO 李华认为这多少有“运气”的成分。毕竟在历史上,此前还没有任何一个开源社区能以如此快的速度崛起。
海云捷迅进入 OpenStack 的早期阶段,主要是和 IDC 合作,提供公有云进行联合运营,随着技术发展和市场形势的转变,海云捷迅发现企业级市场比公有云市场更有价值,所以在2014年完全切入到企业级市场,专门给企业客户提供基于 OpenStack 的私有云解决方案。
李华向雷锋网介绍说,刚开始做的时候,比较艰难,跟投资人讲 OpenStack 不受重视,只能做开源服务来支撑整个团队,当时国内也没有那么多大客户选择 OpenStack 建云,甚至在2016年前能够做到千万级别以上的 OpenStack 项目屈指可数,但是今年开始不一样了,就海云捷迅来说,接触到的千万级别预算的客户已经有很多家了,还不包括其他厂商。
更明显的是,相比中小客户对建云服务的简单需求,中大型客户想的更多一些。比如过程如何规划、如何上云、如何做业务迁移、整体业务如何云化、传统架构怎么向 Cloud Native 转变、容器如何迁移等。
进入2017年,对于传统行业想要建立私有云,默认只有两个选择:商业选择 VMware,开源选择 OpenStack,但在发展过程中,也正在遭遇一些挑战,基于 OpenStack 自建金融云,对技术能力要求非常高,其技术量大,代码会越来越臃肿,模块非常多,很多模块银行不一定能用得上。
但海云捷迅则比较乐观,李华认为,教育、医疗以及金融行业均已开始选择 OpenStack,比如四大行之一的工行选择的是移动的 OpenStack,这对整个行业而言是一个积极信号。
随着 OpenStack 被买方市场接受,在亚太地区遍地开花,海云捷迅在2013-2016年也获得资本市场的认可,分别获得宝德、英特尔以及腾讯云的战略投资。
在引入英特尔和腾讯的战略合作后,海云捷迅依然以 OpenStack 作为核心,针对 OpenStack 的特性,为企业客户提供两种方案:一种针对大型客户,提供定制化的行业云,其中主要包括传媒、医疗、教育、政务等四个行业;另一种则针对中小企业,提供标准化的产品。此外,海云捷迅也引入了腾讯云在 SaaS 层及上层的业务,打包在一起提供行业云的解决方案。
以下为采访李华实录,雷锋网在不改变原意的基础上做了删减:
关于技术
记者:海云捷迅底层平台架构的演进是怎么样的?
李华:OpenStack 社区每半年发布一个版本,这是它创新的过程,但是企业客户更多求稳。所以,海云捷迅是每两年一个版本,第一个版本是基于 OpenStack 的 E 版本,第二个版本是 H 版本,第三个版本是基于社区的,我们会针对主版本维护3-5年,保证企业不用频繁升级,这是我们从底层技术演进的选择。
大家以 OpenStack 作为底层核心,我们做了一个东西会反馈到社区,但是在差异化这个方面,开源里做差异化是非常不容易的事情,把内容回归到社区,大家会同质化,OpenStack 只是一个开源的项目,要真正把它应用到企业里面去还有很多工作要做。比如大家比较忽略的安装部署、运维、运营,这些社区是不会提供。我们为了给客户提供一个完整的云解决方案,就要把社区不具备的东西补齐。
针对客户的差异,我们做了一些比较特殊的优化,比如现在强调的产品化。OpenStack 还是蛮复杂的,涉及到服务器虚拟化,涉及到分布式存储和 SDN,我们要想招聘一个OpenStack工程师成本非常高。以前即使在安装部署这个层面,我们也要花费很长的时间,布10台20台需要花一周时间。我们在这里面做了一些创新,把 OpenStack 传统的管理结构做了一个变动,做了分布式的界面。原来10台服务器需要拿出3台机器做管理资源,另外3台机器做计算资源,真正有效的资源只有7台,我们现在去中心化,把管理界面去掉,10台机器全部用来可以跑资源,所有管理的任务通过分布式系统均匀地分布到不同的界面中去,这样可以尽量提升资源的利用率,同时提高整个系统的可靠性。
为了方便做在线升级,我们把所有 OpenStack 组件拿来做了容器,简化安装部署,尽量在未来的升级过程中平滑地升级。整个系统可靠性在没有人干预的情况下能够做到自愈,OpenStack 本身的模块都来自于社区,我们怎么样把 OpenStack 用起来用得更好,每个厂商都有不同的解决方案,我们针对中小客户尤其小规模的从10台到50台,剩下的可能是100台-1000台。我们通过这种手段安装部署不需要客户懂OpenStack,只需要有一些基本的网络知识,我们就可以把 OpenStack 运作起来,以前很难想象。我们希望 OpenStack 未来能服务更多的客户,有更多的合作伙伴进来做这个事情,一定要把它创造出来,否则没法大规模部署。
记者:在自动化向智能化过渡的阶段,海云捷迅在运维方面是怎么布局的?
李华:自动化运维和智能运维,引入 AI 的技术去做,其实 OpenStack 里面比较麻烦的是它的日志系统没法有一个全局的系统,每个模块都有自己的日志,各个模块之间没有关联。出现一个故障,需要找到五六个模块的日志,再通过一些关键字去搜索才能看到问题。这点我们通过人工去做,下一步希望能够引入智能的技术,分几个部分走。
第一个部分,我们已经做完了,利用现有的监控手段实时的判断整个集群的状态,动态修改整个集群的配置。最开始上10台机器,有个默认的配置可以并发处理100个问题,但是现在增加了50台服务器,这个配置我们相应要改变,以前是人工去做,现在我们会自动去算。我们有一套算法会算每个物理节点的负载情况和压力,以及现有的 OpenStack 本身各个模块之间的配置。当然我们有个数据库,从我们已有的环境里面积累下的经验,在什么样的规模下面什么样的参数是最合适的,我们会自动帮客户调整这个配置,根据负载自动调整整个管理平面的负载情况,把负载分担出去。
第二个部分,我们想在日志部分做得更智能化,这块还需要更多的资源投入,引入人工智能的算法怎么把这些日志聚合,一方面是经验的积累,一方面还需要对 OpenStack 本身做一些改造,能够让机器更明白地懂得这些模块之间业务的逻辑。
记者:OpenStack 比较擅长做私有云,在私有云这个市场里有很多大玩家小玩家,有人说基于 OpenStack 做私有云的不下200家,非常同质化,海云捷迅的特殊之处是什么?
李华:现在很难有一个别人无法复制的壁垒优势,尤其是在开源领域。
OpenStack 也会遇到同样的问题,大家现在觉得一个公司,投10个人进去把代码下载下来就能给客户提供解决方案了,这样去做确实没有任何问题,但是从实际运营的情况来看,真正上了一定规模、上了环境以后,你会遇到很多问题,遇到这些问题当中,原先你没有搞过你不知道,你去现场跟,这是一种模式。还有一种模式是找一个有经验的团队帮他前期做好规划,这样总体来讲效率更高。
对开源项目来讲,核心是解决问题的能力,出现任何问题都能帮助客户解决问题,这是首要的,要想达到这个程度没有持续长年累月的积累是很难做到的,有些难题不是今天才有的,是因为历史架构的设计导致的坑,如果没有在社区里有一个完整参与的话,你是不清楚的。
第二,对于不同规模的客户,架构设计需要有非常丰富经验的人去做,我们从10台到1000台的规模都帮客户做过沉淀,当然也踩过很多坑,都是一步步踩坑踩过来,现在的客户把不同的厂商叫过去,大家聊一聊,哪些厂商有经验哪些厂商没有经验客户非常清楚。
OpenStack 相对来讲会越来越成熟,我们很多客户会说你不要讲OpenStack,我已经很熟了,你告诉我这里面有什么需要注意的地方,怎么把这个东西运维好,这是他经常直接问你的问题,对于前期没有积累的新进入的厂商来讲他们很难有优势在这个领域里竞争。在这个领域未来慢慢沉淀一下,这个圈里就会只剩下那么几家,不会太多,可能会竞争,但不会形成一家垄断。OpenStack 肯定会存在几家有良性的竞争,社区也需要公司参与,参与的公司通过长期沉淀后,在架构设计、选型、经验、产品化方面做的努力会形成一定的积累,后面厂商进来的时候会很难超越。
关于营收和客户
记者:目前海云捷迅的营收状况怎么样?
李华:现在我们是千万级别的收入,前年基本已经盈亏平衡了现在需要继续努力。如果想要把这个业务做得更好,还需要更多投入。现在还是在投入期。
记者:客户有哪些?
从我们的经验来看,早期接触了偏大的客户,最开始是贵州的中小企业云、中国教育电视台、CNTV,中央级的媒体我们已经做了两个了,三大媒体我们都会进去。教育这块做了中国教育电视台、武汉大学、广东工业大学。我们有另外一个合作伙伴,将我们的产品推到了100所高校。电力行业的客户有国电;银行业做了保监会、中国银行;传媒业有金融时报,政务也做了几个客户。OpenStack 是一个比较通用的基础架构平台,各行各业要想着上云的时候基本都会考虑。
客户的形态有两种,第一种是大客户,偏定制化的需求,需要根据他的业务需求,我们做媒体行业,媒体行业有CDN、视频编解码、存储、视频在线编辑,会有不同业务的需求。教育行业更偏重你如何帮我更简单的部署我教育的业务,因为他们的IT能力水平相对来讲比较弱,最好能够帮我常见的东西点一个按纽就部署好了,有故障的时候能帮我做自动扩展和自动缩减。
第二种是中小客户,我们定位中小客户是10台-50台之间,他们的IT人员没有充足的资源聘用牛人,IT能力一般比较弱,要求很简单,易用、易运维,这是最核心的。这需要标准化的产品交付,做自动化的运维和自恢复的动作,超融合一体机,针对这种小微客户的全封闭式对称架构、容器,让他们遇到问题的时候能自愈。我们还做了一个SaaS的云管,服务器放到数据中心里面,但是管理的界面由我们帮你运营,当你出现问题的时候你所有的日志我们可以从后台帮你看,去做运维的操作,客户就不用管了,你把机器买回去只管用,出了问题我帮你解决,技术上已经实现了,但现在还有很多客户会有一些顾虑,虽然服务器放在我的数据中心了,但是运维在外面,会不会偷我的数据,就像公有云一样,三年前公有云是个什么样的市场,现在是个什么样的市场。但大家的观念也在转变,对于中小型客户未来 SaaS 云管的模式会逐渐被接受,尤其他们没有运维能力的时候,他们会逐渐接受通过第三方公司帮他做运维。我们看到这两类不同的客户。
大客户,我们在传媒、教育、政府有比较大的客户、中小客户,我们现在走一些渠道,现在已经有一些大的渠道商,通过他们的渠道铺到全国各地的客户那里去,我们现在看到两类不同的客户,也有不同的客户形态,大家的要求也是不一样的。
记者:对于金融客户,银监会和工信部都会对金融行业的安全有要求,客户会面临自己所有软件硬件的国产化的问题,海云捷迅面对现在的这种形势是怎么看待的?
李华:现在不仅金融行业,政府也有这种要求,我们在一些政府项目里客户要求要提供源码,我们原来做过可信云的认证,现在像等保三级我们也在努力做这方面的认证,我们基本可以保证所有的代码我们可控,必要的时候如果对安全要求比较高的客户也可以提供源码,让客户放心。其实很多客户也不会真的去看这个东西,他希望有问题你能帮我解决;
第二,我看有没有后门,金融行业和政府要求比较高,我们现在要努力尽量拿到安全认证,有国家认可的安政。最近刚刚通过了相关部门的安全认证。在安全这个领域里分不同的层级,原来的一些设计不合理的地方都要改,也是蛮痛苦的事情,我们肯定会去做,我们尽量满足国家安全的要求,我们在必要的时候可以提供源码给用户,保证他们放心。
第三,保证我们所交付的这些东西,除了 OpenStack 以外这里面还涉及到 Linux 操作系统,还有其他的开源软件里面,像 MySQL 数据库等,只要是我们交付出去的东西有任何问题我都保证能帮你解决。
记者:五年之内私有云采购的市场份额会逐渐超越传统 IT,五年之后公有云就会超过私有云,您怎么看?我们的产品是私有云到公有云,未来我们有产品方面或者服务领域的创新吗?
李华:现在私有云量会逐渐增加,公有云这几年飞速发展,基本每年2倍-3倍的速度增长。公有云成熟市场还是会大于私有云,这个趋势不会改变。现在美国的市场,去年亚马逊只是 AWS 就已经做了120亿美金,这还不算谷歌和微软的。另外一个有趣的现象,WMware 的收入还在持续增长,并没有完全降下去,增长的速度没有以前那么快,可能增长5%或者8%,没有像以前增长20%、30%。这说明公有云增长会很快,私有云还是有它固有的市场,IT这个市场是千亿级别的市场,私有云市场还会有持续的增长,到了某一个阶段以后大家会形成一定的品牌,公有云和私有云相对稳定的格局,但是公有云会偏大一些,这是我们的一个基本的判断。
基于这个判断,我们未来会基于 OpenStack 怎么去打通和公有云的整合,我们现在和腾讯云在黑石项目已经有了合作,可以在腾讯云的数据中心租物理机器,你需要自己装操作系统,我们现在一键安装 OpenStack,你可以把你的核心业务放到这个上面,他们基本在一个机房里,可能在不同的区域,要把数据备份出去,要在自己的数据中心里面,你的带宽就会成为瓶颈,如果公有云的机房里要备份,内部都是十几B以上的带宽,速度非常快。这是一种新的模式我们在探索,我们未来希望有更多新的业务模式探索出来。
关于竞争
记者:怎么看待中国的 OpenStack 各个主要竞争对手之间的关系,海云捷迅处在什么位置?
李华:这个问题问得很好,做 OpenStack 我们现在感觉压力越来越大,人家比你费用多、人员多,还非常努力,尤其是大型公司。但在策略上,海云捷迅是还是会聚焦在这个点上,在一些大的厂商进来了以后,这只是它其中一块的业务,我们不会分散我们的经历去做大数据或者 AI 的算法,短期内我们还是会聚焦以 OpenStack 为主,因为毕竟我们的资源是有限的,我们定位是我们是一个更专业的 OpenStack 厂商,同时我们也需要针对这些客户目前的需求延伸做相应的变化。比如大家讲的AI 很热,AI 再热也要一个底层平台的支撑,我们怎么支撑客户把 AI 的东西用起来,这块我们会提供相应的解决方案。
对 GPU 的支持,我们希望把 GPU 能够放到容器里面去跑AI的这些算法,这是我们可以做的,上层的某一个算法某一个框架,这些我们不会有具体的涉及,所以我们定位目前聚焦在 OpenStack 核心的层面,为上面的 AI、大数据平台提供底层平台的技术支撑。
公有云这两年发展得越来越快,我们能看到很多大客户有公有云的需求,一般来讲私有云一定会建,公有云也会用,希望能把公有云和私有云对接起来。我们会聚焦在 OpenStack 这个领域提供私有云,第二是混合云的需求,怎么和腾讯云对接起来,怎么把我的业务一部分放在外面一部分放在里面,怎么在内部资源不够的时候动态的扩展外部,这些是有技术挑战要去做的,接下来一段时间还会聚焦偏底层的OpenStack层面,加强对新技术的支持,比如GPU、FPGA,我们跟英特尔合作的 FPGA 和 GPU 的支撑,怎么支撑更上层的业务,怎么更好的给行业客户提供混合云。
我们现在毕竟是100多个人不到200人的企业,目前很难跟大公司正面竞争。但大公司有很多项目是不参与的,标准化的产品对应整个行业走的渠道这方面,大公司就没有产品,一般来讲10台机器20台机器他们就不做了,项目达不到千万以上大公司不会投入人进入这个市场。我们希望通过混合云的战略,通过和腾讯云的技术输出,把他们在上层架构以及AI 方面的技术能力引到 OpenStack 这个平台,形成和其他公司的差异化,交付给客户偏行业的解决方案。中小企业我们尽量做标准化产品,过去已经做了两年多了,以这种标准化的产品跟他们打开差异,这是跟大厂竞争的时候我们没法硬碰硬,我们要找到我们的生存之道,我们要找到我们的价值点。