云智慧 CEO殷晋:APM 渐入佳境 未来又将如何?

2016-04-07 15:13:14来源:威易网作者:

如果说 2015 年科技行业的关键词是「O2O」的话,2016 年的关键词绝对是「企业应用和企业服务」,但是这个风口并不是无缘无故而来的,在过去的几年中,这些以发展技术能力为主的公司一直都在默默无闻地快速成长……

如果说 2015 年科技行业的关键词是「O2O」的话,2016 年的关键词绝对是「企业应用和企业服务」,但是这个风口并不是无缘无故而来的,在过去的几年中,这些以发展技术能力为主的公司一直都在默默无闻地快速成长,同时他们也用优秀技术人必备的冷静、精明而又有缜密的头脑时刻关注这个行业的变化并不断地推动技术的革新与进步,这些都为这个风口的到来奠定了坚实的技术能力。同时移动互联网的强劲增长为行业注入了一针催化剂,彻底改变了企业级的玩儿法,思维的改变带来应用的变革,而现实的改变同样离不开基础技术的变革。

我们可以看到,传统 IT巨头 IOE 正在瓦解和转型,以 Amazon AWS、Microsoft Azure、阿里云为代表的新的 IT 生产力成为这个时代的主力军。维系互联网和移动互联网行业的基础技术正在悄然改变,从「服务器」到「云」,从「机房」到「数据中心」,这些在外人看起来只是表面上的文字的变化,实际上是最本质的改变。

已经敏锐捕捉到这种变化的公司逐渐享受到变革带来的利益,而掌握着基础核心技术的、也是最早嗅到这种变革的企业应用和企业服务公司也已经走过了艰难的爬坡阶段,渐入佳境。也正是在这种「变革」的大背景下,TECH2IPO/创见记者采访了云智慧的 CEO殷晋。

\

一、始动

云智慧是一家以应用性能管理 (Application Performance Management,以下简称为 APM) 为核心业务的企业级解决方案服务商,我在比较早的时期就开始关注这家公司,这也是我第三次采访殷晋,每次采访的时间也正好是云智慧发展到一个关键节点的时刻。这三年来,云智慧按照自己的思路有条不紊地开拓自己的业务,发布新的产品。到了今年,监控宝、透视宝和压测宝这三个关键产品已经形成了云智慧企业应用性能管理整体解决方案的矩阵优势,正式对外发布。在回顾这些年的时候,殷晋说:“云智慧「三宝」的推出是顺应市场需求的不同发展阶段,也符合 APM的发展趋势”。

云智慧的第一个产品「监控宝」是在 2010 年左右推出的。那时的网络环境很多人还是有印象的,比如在很多下载站、很多游戏下载不好用的时候,要先问你是哪个移动运营商,在北方还是南方,在哪个省哪个市,看起来都是互联网,但因为网络接入服务的藩篱导致当时的全网互联互通只是个梦想。很多网站的服务器都放在不同地点和不同运营商的机房中,DNS 服务也不稳定,经常造成网络的瘫痪。这个时候网站站长和运维最痛苦的事就是,他不知道用户是否能够顺利访问到自己的网站,也许某个城市可以,而另一个城市就无法访问,或者联通用户访问速度很快,而电信用户却连不上。

所以当时的运维人员亚历山大,他们完全没有办法预测到什么时候或者是哪条线路会出问题,只能在问题出现后当「接盘侠」,一旦网站出现损失,而且还有可能变成「背锅侠」,小公司的运维同学经常会使用站长工具来 Ping 自己网络状况是不是好,有钱有实力的大公司则会在各个地方派出员工去实时测试网络情况,这种方法非常原始,而且成本高效率差。「监控宝」就是在这种因缘际和中产生,最初形态的「监控宝」把 Ping 这种需要频繁使用的一次性工具变成了自动化和周期化的监控产品,把运维人员从重复劳动中解救了出来。

「监控宝」籍此获得了第一批用户。很快,这种效率很高的工具在运维圈子里获得了很高的口碑并广为人知,通过微博等社交网络的扩散,监控宝的用户数快速增加。殷晋说,「监控宝」后面的功能就是按用户的真实需求来驱动产品的发展,从最初的网站监控扩展到服务器监控、服务监控以及自定义监控,几乎涵盖了运维工作最基本的需求,随着产品的成熟发展进入瓶颈期。

\

随后,监控宝开始了商业化,却发现一个问题:监控宝最初的产品设计并不适合企业用户,当企业的运维人员超过 3 个人的时候就会产生「协作」,而当时的产品模型无法支持企业级权限监控和协作,而上面说产品出现的瓶颈的那段时间就是在重构底层的用户模型。随着产品开始为企业提供服务,监控宝陆续增加了很多功能,如API 监控,网页性能监控,自定义监控、Docker监控等等。

二、进化

监控宝的定位是一种简单的场景,解决IT 基础设施监控的可用性问题,对于很多 IT 成熟度很高的公司来说,这种工具的价值还不够高,因为监控宝解决的问题他们已经解决的比较好了,IBM、HP、CA、Oracle、Compuware、Riverbed、Netscout 等公司已经给他们建立了非常完善的监控系统,云智慧的发展空间受到了限制,就在此时,移动互联网和云计算来了。

殷晋认为,移动互联网和云计算两个概念在分开的时候没有太大的感觉,而两者结合起来则可以产生颠覆性的作用,因为移动互联网+云计算带来了一个新的命题,叫做用户体验前置。什么是用户体验前置呢?我们看看传统的银行系统,如果你不去柜台,是不会接触到他们庞杂的 IT 系统的。

但有了移动互联网,一切都不一样了,通过各种App、H5应用或者微信公众号进行支付时,用户无缝的与他们的应用系统打交道,IT再也不是看不见摸不着的东西了。这是一个IT空白,云计算的发展更是给企业传统 IT架构带来了巨大的变化。用户体验前置,IT 应用架构变化,但是市场上没有一个很好的工具能够帮助用户解决他们在这方面的监管难题。

举个例子,曾经有一段时间,各个银行的 App 产品非常难用,用户叫苦不断,从而导致支付宝等第三方支付的崛起。而之所以银行自己的 App 让人感觉非常难用,是因为它是基于银行现有的 IT 架构开发的附属品,并不是根据移动互联网用户体验来设计的。用户之所以在以前没有感觉是因为有柜台人员替你进行了操作,当 App 把银行的 IT 系统直接呈现在用户面前,问题就出来了。

问题有了,意味着新的需求,也就有了新的方向。于是这个新产品从监控宝 2.0 中独立出来变成了「透视宝」。如果是「监控宝」解放的是运维人员,而「透视宝」则解放了运营人员。

「未来」对于很多人来说有些恐惧,而恐惧是来源于对未来的不可预知性和不确定性。对于一个互联网公司的产品运营、技术和 IT 工程师来说也一样,找到问题不难,难在如何去解决问题。如果更进一步,找到和解决现成的问题不难,更难的是从目前正常的状态中发现潜藏的问题和瓶颈。

对于产品运营人员来说,可以通过用户反馈找出产品的问题,但是这个问题为什么会出现,又该如何去解决往往是困难的。当用户反馈经过产品运营的筛选,再经由产品经理和技术人员之手在产品新版本里解决又需要花费更长的时间,这时用户很可能已经失去耐心走掉,而竞争对手却在这段时间里率先解决了这个问题。因此,如何比用户和竞争对手更早发现、解决问题就尤为重要了。

对于 IT 工程师来说,写代码并不麻烦,麻烦在于 bug 出在哪里、bug 如何改,如果能在 bug 还没有出现的时候就预测到代码的瓶颈,对于产品的快速迭代尤为重要,而这正是DevOps的目的所在。

如果你能够感受到上面所描述的问题,那么你就不难理解「透视宝」了。透视宝是新一代面向业务的端到端应用性能管理平台,不论是移动 App 还是 Web 应用,透视宝都能以真实用户体验的视角,进行实时的性能监控、分析与管理。帮助运维工程师快速定位故障查找问题提速 90%,协助开发人员定位到代码级的深层问题,不断优化性能瓶颈和 IT 架构,业务上线周期缩短 60%。借助透视宝运营和业务人员可以实时掌握关键事务、用户体验与性能的关联问题,降低运营风险 30%,简而言之,透视宝在降低运营成本,提高业务增长方面具有核心作用。

三、初成

殷晋认为,有了监控宝+透视宝,云智慧初步建立起覆盖 IT 成熟度较高企业用户需求的产品力,真正有能力来服务企业级客户,而这些产品的发展就构成了云智慧在 2015 年从 SMB 市场向企业级客户市场迈进的动力。

进入企业级市场之后,云智慧又发现了新的需求痛点,就是性能测试问题。在 SMB 客户那里,由于用户规模有限,产品上线之前不会做大规模的性能测试。而在 IT 成熟度高的企业级客户那里,压测是产品上线前的必备流程,甚至在很多 DevOps 实践比较好的企业里,压测不仅用于上线前的测试,而是和他们的 CI 系统集成,作为每次 Build 都要执行的常规监测手段,从而实现 Release Automation。

然而市面上的性能测试软件在这种新的变化面前大多是无能为力的。用户体验前置要求性能测试基于真实的场景和真实的链路来进行,而和 CI 系统的集成也不是那些传统测试软件能够搞定的事情。

云智慧基于全球分布式部署监控网络、公有云资源、客户私有云资源构建起全新的压力测试网络,根据真实用户在网站和 APP 上的使用场景进行测试,提供开放的 API 接口可以让 CI 系统驱动测试自动运行的「压测宝」就应运而生了,这也是云智慧发布的「第三宝」。

有了压测宝,云智慧的应用性能解决方案形成了一个闭环,能够帮助企业应对用户体验前置以及云计算的快速发展带来的挑战。

\

四、聚变

以「吉祥三宝」为基础构成的云智慧全栈性能管理解决方案出现后,标志着云智慧已经具备了为中、大型企业用户提供完整应用性能管理服务的产品和技术能力。

殷晋在采访中特别强调,令人意外的是传统企业对性能管理有着极强的需求,而且接受度非常高,在这方面甚至超过了互联网公司。在2016年春节过后的几周里,他一直奔波于南方的各个大型企业了解客户需求,他有一个很明显的感受就是上文所提到的「用户体验前置」,大型企业的产品和用户开始建立起直接关联,现有 IT 架构已经无法满足这种趋势的需求,也明显感受到了这些传统大型企业对转型的焦虑和迫切。当他们发现云智慧全栈性能管理解决方案可以帮助他们解决问题的时候,非常乐于接受而且不计成本。

基于 IT本身的特点,DevOps 非常适合传统企业 IT 部门的转型。这些企业大多都诞生在云大规模应用之前,主要基础设施仍以物理设备为主,随着移动互联网和云计算的不断深入,这些企业在转型中拥有一定优势,比如可以打造出比较强的应用交付体系和能力,能够支撑大型应用的发布和更新,但是这些企业内部经常会出现 IT 资源管理者和使用方发生冲突的情况,说的清楚一些就是懂产品、不懂技术的人大开脑洞,而懂技术、不懂产品的指责产品端提出一些不切实际的需求 。

云智慧的全栈性能管理解决方案可以有效洞察企业实际业务流程,把基于真实用户访问体验的应用性能数据与业务端的经营数据进行关联,并以可视化的方式呈现,在推动 DevOps 有效落地的同时,不断提升企业的 IT 运维能力、业务运维能力、业务运营能力、组织服务能力和商业决策能力,进而实现企业互联网+成功转型。

五、未来

在上一次采访殷晋的时候,有一句话让我感受很深,「哪个程序猿不想面朝大海,春暖花开,写写代码,自由自在?」这句话他和我说了三次。

在参加之前媒体沙龙的时候,殷晋讲过一个故事,他还没有创业的时候,所在的公司用百万美元收购了一个英国的小公司,与其说是个小公司不如说是一个夫妻店,丈夫是程序员,夫人是设计师。虽然代码写得很一般,但是两个人赚着年薪五十万英镑的收入,生活在一个非常舒适的小岛上,真正地「面朝大海,春暖花开,写写代码,自由自在」。于是问题来了,为什么中国的很多程序员虽然也都实现了高薪,但生活得却非常压抑和苦逼,技术能够改变世界,却为什么不能改变自己的工作和人生呢?

这句话和这个故事让我感触很深,我也没有想到外表很技术范的殷晋是一个非常有情怀、有生活情趣的人。从监控宝到透视宝,再到压测宝,这些产品把运维人员、运营人员以及测试人员从繁琐的日常工作中释放出来,真正提高 IT 生产力。

话说回来,马克思不就说过,人和动物最大的区别就在于人可以制造工具,而工具的产生不正是把人从繁杂的生活中解放出来的吗?

商业模式会死,但是技术永生。

关键词:云智慧APM