24好玩日志&监控平台 v1.0
目前主要分为日志分析、监控两部分内容,为了提高效率,1.0.0版本会优先采用开源系统或者云服务。
文件版本
20170918
主要目的
- 快速定位报错日志
- 方便查看系统运行日志(主要是文件日志)
- 主动发现系统问题并及时解决
- 为之后性能优化提供数据参考(主要是利用数据分析报告)
日志分析 【v1.0.0版本】(5d)
暂定使用splunk / logstash 开源软件来进行日志分析,目前需要分析的内容如下:
Apache日志 【4d】
需要分析的参数
- 客户端IP
- 客户端useragent
- 请求链接与参数
- 返回数据大小
- 响应码
- 服务器处理时间
- 访问量
需要做的工作
- 研究日志分析工具的部署、使用
- 同步各个节点之间的日志文件
需要做的工作
- 同步各个节点之间的日志文件
监控&报警【v1.0.0版本】(3d)
系统错误日志监控&报警(sentry) 【2d】
目前在用的是sentry官方服务(有部分功能限制)
需要做的工作
- 搭建、测试sentry服务
阿里云数据库监控
需要做的工作
- 制定定期排查规则(例如固定时间去检查慢日志,并进行优化)
数据结果处理规则
sentry报错日志
- 后端每两天处理一次报错日志,前端处理时间【待定】
Mysql数据库慢日志
- 后端每两天处理一次慢日志记录
日志分析报告
每两周出一份报告数据, 暂定报告需要包含的内容:
- 日志分析(apache日志、应用日志)的统计结果
报告需要包含的内容
- 需要指定包含的指标、各类指标的参考数据、之后优化的目标