云计算大数据时代,从底层基础设施到上层应用IT资源和服务数量都急剧膨胀,提升数据中心运维效率和应用程序性能表现对于提高企业IT资源利用率,降低企业IT投资越来越重要,因此在世界范围对于应用性能管理便越来越重视。
2015年8月11日的2015Web性能与运维大会上,聚集了国内一大批领域内的主流厂商,其中以SaaS形式提供APM服务的云智慧作为大会的顶级赞助商参与了进来,并且做了两场主题演讲,会议进行期间,我们对云智慧的产品总监陆兴海和首席架构师高驰涛进行了专访。
采访中了解到,云智慧成立于2009年末,成立之初伴随着“IT监控神器监控宝”的问世,2013年获得戈壁A轮数百万美元融资,2014年透视宝问世,同年获得红杉1500万美元B轮融资,而最近正在进行C轮当中,伴随资本加速涌入云智慧的同时,是中国的APM行业从孵化、发展到初步成熟的过程。
完全自主研发的两大产品
云智慧旗下有两款完全自主研发的产品,一个是偏向于基础设施层面运营监控的监控宝,一个是侧重于应用层性能监控的 APM(Application Performance Management)产品透视宝,面向不同用户推行免费版、畅享版和企业服务,整体提供包括面向内网、外网、服务监控、数据库监控、应用监控和API监控的解决方案。
监控宝是业内有口皆碑的“IT性能监控神器”,完成从监控到分级报警的工作,与国内主流的安全厂商合作,提供整体的监控解决方案。据陆兴海介绍,如今有125个遍布各地的监测点,今年将扩展到240个左右。
透视宝作为面向业务,基于端到端的一体化解决方案,为移动和网站应用提供全面的性能监测、分析和管理解决方案,通过应用性能调优,持续交付加速,用户体验优化,降低投资风险,最终提高生产效率。比较来说,监控宝更加成熟,透视宝如今更热一些,2014年以来用户的接受度逐步提高,从市场和资本的反应来看,APM市场也是被看好的,在这次大会上我们看到了几乎所有国内主流APM厂商,从数量上来说APM行业的参与者并不多,或许这跟APM存在诸多技术难点有直接关系。
APM产品的难点和关键点所在
部署产品前要打消用户的核心顾虑,目前用户最关心的问题是抓取数据时对系统运行有什么影响?凭借云智慧在APM领域长时间的技术积累,这一问题已不是问题。
APM的第一个难点主要在数据采集,需要在各种编程语言及其运行时环境中采集数据。用户环境中的编程语言不但种类庞杂,而且版本间也有许多差异,从不同的代码里将用户性能数据提取出来的工作就会变得非常复杂,并且要考虑各种运行时容器、数据库,过程中尽量不影响用户系统本身的性能,这实际上难度是非常大的。
数据采集的部分在技术上的难点集中在“探针(agent)”技术上,透视宝解决方案在初始化部署时提供三个插件,随后经过探知需要别的语言插件时会进行自动补充。各家厂商在探针种类的多样性、敏捷性和处理效率上就能一见高下。
这些难点和要求需要产品的开发人员掌握多种语言和相应的优化算法,工作量非常大,云智慧现在有60-70人的研发团队夜以继日的进行工作,即使这样,开发工程依然很浩大。
采访中高驰涛也表示未来将陆续开放接口,允许第三方插件的接入,云智慧所采用的也正是技术上开源,靠服务寻求生存的SaaS模式。笔者认为一定程度上这也是云智慧向行业标杆New relic看齐的表现。
另外一个难点在于后台的大数据性能指标分析,现在开源的大数据框架有许多,在实际使用中存在效率上的差异。在APM领域应用大数据分析,还必须要考虑到用户体验等因素,只有用的好,才可以提升服务价值,为客户的应用优化提供有价值的参考意见和性能分析报告。
用户的价值
得益于在业内的多年积累,新的透视宝自上线以来就得到了用友、海南航空等企业的积极参与,如今云智慧的用户已经达到30多万,除了像小米、暴风影音、滴滴打车、高德地图等对IT技术非常敏感的互联网客户外,还有包括银行、电信、金融、电力等十二个行业几乎所有涉及到IT设施的行业用户。对于一些对安全隐私比较敏感的公司,云智慧还提供定制化的服务,或者直接为用户提供私有云服务。
写在最后:当天大会上感受到许多参会用户对于APM的热情非常高,因为企业的IT规模会越来越庞大,提升IT资源管理和使用效率将为公司节省许多开支,最终获得竞争优势。对于APM的投资是一个能有效提升IT运维效率,降低企业运营成本的举措,这应该是APM行业红火的根本原因。