正常运行时间和性能监控由Site24x7 Director解释-编程之家

Site24x7是Zoho Corporation推出的一款基于云的性能监控解决方案,Zoho Corporation是一家印度软件开发公司,最近刚刚庆祝了其成立25周年。我坐下来与Site24x7的主管Rajalakshmi Srinivasan进行了一次鼓舞人心的谈话,讨论了IT管理员不断变化的需求以及帮助解决这些需求的技术。

请描述公司背后的故事:是什么激发了这个想法,以及到目前为止它是如何发展的

2006年,随着云技术的发展,我们开始全天候使用Site。最初,它更像是一家实验性初创公司,用于监控我们自己的网站和基础设施。我们很快意识到,我们发现了很多公司都想利用的东西。这就是我们开始将Site24x7捆绑为面向外部用户的产品的方式。

我们在Zoho的第一个需求是监控我们网站在全球不同地区的可用性和性能。然后,我们继续添加基础设施和全球存在监控所需的所有其他监控功能。

从那时起,我们一直在it之上添加解决方案和功能,以增强功能并与最新技术保持一致。Site24x7是一款成熟的产品,已经上市近15年。

如果你有一个国际网站,它需要从印度、美国和全球所有其他地方进行监控,以确保前端的性能、正常运行时间和良好的用户体验,无论在哪里。但网站并不是你唯一需要监控的东西。人们希望监控他们的基础设施和云架构,这有许多不同的层,也都需要监控。因此,我们在同一产品中添加了服务器监控功能,然后是应用程序性能和实际用户监控。后者会让你知道用户是谁,他们从哪里访问,以及他们如何体验你的平台。

当云服务开始好转时,我们添加了云成本管理工具,以帮助企业避免过度支出。作为一家企业,透明对我们来说非常重要。你需要让用户知道你所有功能的状态。所以我们推出了StatusIQ作为一个子产品。

所有这些加在一起,Site24x7现在是一个完整的堆栈、一体式监控套件。

这里是对Site24x7

的简要介绍,您的典型客户是谁

几乎所有主要行业,从零售、金融、医疗保健、教育到政府部门,如果想要拥有一个网站或基础设施,都需要一个监控工具。这些就是我们合作的行业类型。

对于我们的目标受众来说,使用该产品的人通常是管理IT基础设施的IT管理员,以及从事该产品工作的任何人,如DevOps和Site Reliability Engineers(SRE)。通常,任何开发和维护网站和基础设施的人都需要一个监控工具,而Site24x7就是这样做的。

IT团队面临的一些挑战是什么,Site24x7如何提供帮助

作为SaaS和云提供商的主要挑战是正常运行时间和可用性。这一点非常重要,因为业界预计99.999%的可用性。请注意,期望值已从99.9%上升到现在的5个9。为了达到这个水平,你需要把所有的资源都投入使用。说到资源,我不仅仅指网站,而是指你的整个云架构。它可以是你的网站,它是终端层、应用层或平台层,在那里你有你的微服务、数据库以及平台和基础设施的各种组件;它可能是您的物理和虚拟服务器、云服务器和网络防火墙交换机。所有这些组件都必须启动并运行。如果其中一个发生故障,整个系统都会受到影响。

当出现问题时,您会立即得到提醒。我们从全球100个不同地点对收集到的所有指标进行监控。这是Site24x7要解决的主要挑战。第二个挑战是性能。我们生活在一个数字时代,我们希望一切都非常迅速。如果这些资源执行缓慢,那么启动并运行它们是没有意义的。人们没有耐心坐着等待页面加载。同样,在搜索引擎中搜索产品时,我们不会跳过第一页,我们只会满足于在第一页上找到的内容。出于所有这些原因,性能非常重要。

一些研究和调查表明,人们期望页面加载的标准时间是两秒。这个数字是用微秒和纳秒测量的。如果你的页面需要10秒钟才能加载,那么你就过时了。你必须找出问题所在并加以解决。

Site24x7将帮助您确定哪些资源导致延迟。它可能是后端的某个东西、数据库查询、浏览器问题或前端的一个沉重图像。你需要确切地知道是什么导致了延迟,并对其进行优化。这就是提高应用程序性能的方法。当然,在云中意味着你必须确保你所有的用户数据都是安全的,所以这是你需要监控的另一个重要因素。你不应该等着有人来入侵你的系统。作为一家企业,你可以通过建立定期审查和审计来自己做这件事。自我审核和自我测试非常重要。企业应该牢记这一点,并对所有员工进行适当的培训。

你的平台产生了什么样的见解

根据您监控的资源,指标会有所不同。如果是服务器,您将监视CPU、内存、磁盘空间以及服务器上运行的进程。如果它是一个应用程序,那么度量标准将有所不同。

Site24x7自动发现资源,收集相关指标,进行所有关联,并在出现问题时立即提醒用户。报告和仪表盘随时可用,我们还将人工智能引擎应用于这些指标之上,以使其更进一步。当然,用户不必自己配置所有内容。该工具将进行自动配置,并相应地调整阈值。例如,如果你知道你的网站需要五秒钟才能加载,那么你可能不想被提醒。因此,根据我们收集的历史数据,可以针对不同的用户调整阈值。这是使用人工智能能力带来的。

此外,我们还提供日志管理。原木在业内被认为是当今可观察性的支柱之一。必须收集和监控不同数据中心的日志。云成本管理也很重要。现在,云计算正在兴起,人们只是购买工具,而没有意识到他们已经做出了承诺。一旦您提供了信用卡信息,无论您是否使用该工具,您都将收到账单。你不应该为没有使用的资源买单。我们的云成本管理工具为您提供了对不必要支出的分析,以便您可以削减这些成本或根据这些工具的使用指导您的团队。

同样,当出现问题时,你不希望收到成千上万的罚单,说网站关闭了。取而代之的是,他们可以在一个公共页面上订阅,并查看出了什么问题或进行了一些定期维护。这被称为公共状态页面,用于与客户进行透明的沟通。与其说人们不知道发生了什么,不如说你告诉他们这个问题正在得到解决,赢得了信任和信誉。这些是该平台可以提供的一些见解。

您的系统如何与第三方应用程序交互

通常,任何临时集成都可以与Site24x7进行。我们生活在定制产品的时代。没有人愿意接受产品并按原样使用。他们希望做出一些调整,并构建自己的仪表板,因此定制和集成选项非常重要。我们的工具与所有标准的第三方提供商集成。

所有监控工具都带有警报,因此当您收到警报时,可以将其转发到PagerDuty或Slack,例如,如果您有其他警报工具,则可以将其警报全天候转发到Site。

同样,您可以使用我们的API支持获取数据进行分析。您可以获取rest API来构建自己的客户端。如果人们想与IT服务管理工具(如ServiceNow和其他票务软件)集成,这种集成也是可能的。对于沟通和协作,人们希望与微软团队集成,这当然是可能的。有时,人们希望与Jira这样的项目管理工具集成,他们希望任何问题都能在Jira中被提出,所以这也是可能的。

您还可以从其他工具中引入指标,您可以从我们的工具中获取指标,并将其放入您拥有的任何其他工具中,并作为一个生态系统进行发展。

关于免费版的Site24x7,你能告诉我们什么

通常,任何拥有网站或从事基于SaaS的开发的人都需要一个监控工具,而Site24x7是一个可以终身免费使用的工具。免费版本最多支持五个网站,资源有限,但如果您是一家小型提供商,或者您的个人博客或网站托管在一个公共领域,它应该足以监控您的统计数据、性能指标、访问日志、流量源和全球性能,我们的团队可以在任何请求中提供帮助。

IT/Dev/Ops会犯哪些典型错误,如何避免这些错误

Site24x7最初是作为监控Zoho服务的工具,甚至在今天,我们的整个基础设施都是使用Site24x7监控的。多年来,我们从自己的IT团队中吸取了很多教训,这些经验可能与其他企业的经验类似