监控的背景和意义:随着单页应用(SPA)和渐进式网页应用(PWA)的流行,前端应用变得复杂,用户对网页加载速度和交互响应的要求提高,同时面临多样化的设备和网络环境。敏捷开发和持续部署(CI/CD)要求快速响应问题并持续改进产品。
监控的类别:分为实时监控和定时任务巡检。实时监控通过集成SGM集团内部监控平台和SDK,实现对100+应用程序的实时监控。定时任务巡检通过自动化设置,定期执行自动巡检并上报检测结果。
监控整体架构:包括实时监控的整合、告警策略的设计、分级告警机制、持续优化告警规则、明确责任分配、培训和意识提升等关键经验和建议。
WEB端用户体验:监控页面加载时间、交互时间等性能指标,优化代码,提升用户体验。特别关注Largest Contentful Paint (LCP)、Cumulative Layout Shift (CLS)、First Contentful Paint (FCP)、First Input Delay (FID) 和 Time to First Byte (TTFB) 等性能指标。
页面性能:追踪页面加载性能相关指标,如加载总时长、DNS解析时长等,并通过白屏时间监控优化首次加载体验。
JSError监控:通过配置错误关键词匹配控制台报错信息,特别避免"Script error"这类无用信息的错误。
API请求监控:关注HTTP状态码和业务错误码,快速响应应用可能遇到的问题。
自定义监控:实施关键节点或核心功能的专门监控措施,捕获接口异常详细信息,准确追踪用户行为导致的错误。
小程序端与原生应用:介绍了小程序和原生应用的基础监控和业务监控,如崩溃监控、启动耗时、网络监控等。
定时巡检:通过UI啄木鸟平台和自启动巡检工具,确保项目核心流程的稳定性。
监控后的效果:通过监控系统,问题发现和处理从被动变为主动,显著提高了响应速度和服务质量,优化了应用性能。
规划:持续优化应用性能,深化监控细节,升级巡检工具,确保系统的稳定性和安全性。