技术开发 频道

专访百度郑建强:深度详解百度开放云

  【IT168 专稿】在中国的IaaS公有云服务市场,从市场份额上看,阿里云是当仁不让的国内一哥,腾讯云依托腾讯强大的游戏运营能力,也获得了相当不错的市场份额。而云计算创业企业青云、UCloud,在中国IaaS市场也获得了一定的份额。天生占据了BAT品牌的优势的阿里巴巴和腾讯,在曝光率和用户信任度上较云创业企业有优势。那么BAT阵营中的百度在Iaas市场的进度如何呢?

  如果说百度的产品线是一座大楼,那么承载超大规模数据存储、计算、挖掘的基础架构部就是这座大楼的最坚实地基。

专访百度郑建强:深度解密百度开放云

  在近日举办的2015中国数据库技术大会(DTCC)上,来自百度基础架构部高级技术经理郑建强为我们带来了百度开放云的消息,百度开放云4月7日已正式对外开放注册。

  百度开放云从哪里来?要到那里去?产品规划如何?有些什么创新?什么样的计费方式?带着这些疑问,老鱼专访了百度基础架构部高级技术经理郑建强就以上问题进行的解读。

  老鱼:建强,你好!先请你给我们的网友打声招呼,简单介绍下自己。

  郑建强:大家好,我叫郑建强,是百度基础架构部高级技术经理,主要负责百度存储系统的产品研发。

  老鱼:提到百度云,我们首先想到的是网盘,和PaaS的BAE,百度开放云归属那个部门?与网盘,BAE是个什么样的关系?

  郑建强:百度开放云是在百度基础架构部孵化的,主体业务在百度基础架构部。为什么是在基础架构部孵化?是因为百度开放云提供的服务正是基于基础架构部为了支持百度内部业务研发的各种分布式系统。

  从百度内部来说,其实一直在做私有云的建设,百度开放云诸多技术实现就是构建在百度私有云的基础之上,但对外开放一个完整的包含IaaS、PaaS、SaaS的开放云体系是始于2014年,去年下半年发布,今年4月7日才完全的开放注册。百度网盘是2C的产品,而开放云是2B的服务,原有的BAE服务已经融入了百度开放云。

  老鱼:我看到你今天的演讲中提到,百度开放云的产品规划涵盖传统的IaaS,SaaS,PaaS这3层,其中有自己研发,也有引入合作伙伴,能否给我们详细介绍百度开放云产品规划与行业云规划?

  郑建强:好的,百度开放云从2014年初开始计划实施,依托百度私有云的技术和系统着手进行云产品的规划,我们希望借助百度开放云,为客户提供一个完整的云到端的解决方案。目前百度开放云已经开放了在计算、存储、数据库、分析、BAE、云安全、云监控等服务,具有安全可靠高性能和高可扩展性的特性。

专访百度郑建强:深度解密百度开放云

  百度开放云的产品规划还是基于传统的IaaS,SaaS,PaaS这3层,我们集中精力从下往上做起,也就是从IaaS层做起,所以目前百度开放云的大多数服务都集中在这一层,而在SaaS服务上面我们也计划提供高级服务,比如整合地图导航,应用统计,语音识别,人脸识别,等,现在已经上线的服务包括Email、短信和视频转码服务,在PaaS层主要提供BAE等服务。

专访百度郑建强:深度解密百度开放云

  百度一直坚持走开放的道路,百度开放云的产品规划开放基础设施IaaS的能力,扩展PaaS平台能力,并以引入第三方应用软件为主,自有软件服务为辅,与合作伙伴共建SaaS生态。

  老鱼:作为BAT阵营的一员,相比阵营中的其他两位阿里云、腾讯云,百度开放云优势有那些?

  郑建强:百度的优势在于我们有非常深厚的技术积累,我们对我们的技术非常自信,百度开放云的许多技术实现就是构建在已经在百度内部服务多年的百度私有云的基础之上。虽然百度开放云现在才正式开放,但是百度私有云架构一直都在支撑百度用户产品和企业产品的发展,支撑20+用户过亿的产品,同时支撑上百万企业客户的不同业务需求。目前百度私有云技术支撑了百度总计近千PB的容量,而且还在以每日800TB的速度增长,时效性方面峰值实时处理能力达到50GB/S,并对多种层面的异构数据:内容(网页、广告、日志、UGC)、类型(文本、图片、视频)、形式(结构化、非结构化数据)做支撑。

  数据中心IDC方面,百度私有云建成了数十个IDC,满足近50万服务器大规模集群部署,并构建了遍布全国的CDN分发网络。同时在整机柜、自研万兆交换机与SSD、高温耐腐服务器等方面不断进行创新。

  今天,百度的规模已经非常大,所有规模数字下面都是非常多的机器,复杂的分布式系统平台,非常多的研发人员的汗水。百度总容量已经达到千P,每天新增的数量级都有1个P,每天处理的数据超过50个P,更重要的是,百度的业务非常复杂,各种类型的应用,各种各样的数据,都在我们的系统上跑。所以我们有信心,用户的复杂业务也一定可以运行在我们开放云之上。

  老鱼:百度开放云的计费方式是怎样的?

  郑建强:百度开放云的计费方式有两种:

  预付费方式,包年包月,当然如果你中途不用需要终止,我们也可以给你退结余的部分。

  按需计费方式,根据你使用的量来计费,用多少计多少,不用不扣费。

  老鱼:百度开放云4月7日开放注册,这个时间点有没有特别的含义?

  郑建强:我们对于开放的时间点没有刻意的选择,而按照产品计划和技术的成熟度进行,这个时间点更合适,没有别的意思。

  老鱼:你的演讲提到了百度开放云的几个创新,我印象深刻的有2个,“预制化集装箱”和“集群操作系统架构”,能否给我们描述下这2个创新?不是太理解。

  郑建强:传统数据中心建设,首先需要选址,建机房,定制服务器,定制机柜,然后搬迁进去,存在建设周期长、质量不可控、无法灵活扩展等问题,如果我需要一些灵活配置就很难做。

  所以我们就研究了集装箱的方式,当然这不是我们创新,国外也有在做,只是我们把这个想法做的更深入。主要的方式预先在集装箱内部放置全套服务器需要的配置和设施,包括电源、冷却,机柜,服务器,其他管理配置等,都在集装箱内部安装好,只要在集装箱外部接上电和必备的接口,用户就能进行使用了。用户可以按需定制,这样就很方便,更灵活,交付效率更高。

专访百度郑建强:深度解密百度开放云

  简单的说,预制集装箱的特点:产品化、快速交付、按需部署、更绿色。

  预制集装箱则以需求为前提做预先设计,借助产品仿真测试精准预测运行状态,集装箱运输到现场,以“搭积木”方式进行搭建,数据中心真正实现按需求容量进行精准投放,大大提升使用和运营效率。

  百度国内互联网公司中首个部署预制化集装箱数据中心的,经过测试,集装箱pPUE值降低到惊人的1.05,达到业界同类产品的顶尖水准。

  百度集群操作系统(Matrix),实际上是我们百度内部的一个集群操作系统服务,是国内业界第一个成功构建、并且大规模应用的基于轻量虚拟化技术的、可以实现机器共享的集群管理系统,是百度内部架构、业务平台的基石。类似的系统目前除了Google Borg/Omega外,在国内整个业界还没有成功案例。

专访百度郑建强:深度解密百度开放云

  目前Matrix已经托管了百度所有离线计算(包括代理计算)和分布式存储,以及搜索、广告系统、社区的大部分核心系统,目前规模超过30%的服务器。 在Matrix上已经实现了机器的全自动运维,以及大部分故障的无人介入处理。通过在/离线混布和优化代理计算,初期一年的成本收益已经达到5.175 亿。预计2015年公司80%的服务器将由Matrix托管,随着业务的搬迁和重布局,后期将持续带来硬件/人力成本收益。

  老鱼:阿里云被吐槽最多的是磁盘IO性能,最近采用临时SSD的解决方案,用户需要单独付费,百度开放云有没有考虑过这个问题,会怎么处理?

  郑建强:百度对性能一直放在非常重要的优先级,比如我们的云磁盘,我们在需要性能的地方使用SSD技术,速度非常快。不但快,我们的云磁盘都是三副本存储,不会出现磁盘出了问题数据就丢掉的情况,一个磁盘坏了,还有存储在别的磁盘的副本。云磁盘使用SSD或者hybrid的方案,比单纯的使用物理硬盘IOPS要高很多,可以保证有更高读写需求的服务运行。百度的云磁盘可以挂在云主机上,也就是云服务器。百度的云服务器,通过对虚拟机深度的内核优化来提高速度。刚刚也提到百度内网,我们使用万兆的交换机,所以内网访问,在开放云中访问百度的服务,你自己的机器或服务之间互通互联都非常快。开放云的外网是公网高速的BGP,你也不用再担心南北互联的问题。所以这些都是几个例子都说明我们在性能上非常地关注。

  老鱼:百度开放云售后服务采用什么样的形式?

  郑建强:百度开放云售后会有3种服务形式:

  1、工单:我们会根据工单内容和类型判断处理优先级,工单系统有专人24小时值守。

  2、发邮件

  3、打电话

  相对而言,我们更推荐工单形式,因为打电话可能还不如工单更容易将问题描述清楚,更高效。

5
相关文章