2
1
1
0
专栏/.../

尝鲜 TiDB 企业管理器TEM 2.1.3 新版本

 数据源的TiDB学习之路  发表于  2024-04-17
原创监控

TiDB的很多用户可能都非常熟悉TiUP工具,它承担着包管理器的角色,管理着TiDB生态下的众多组件,如TiDB、PD、TiKV等。用户想要运行 TiDB 生态中任何组件时,只需要执行 TiUP 一行命令即可,极大地降低了管理难度。TiUP提供了非常丰富的管理功能,比如集群部署、扩容缩容、在线升级等等,然而TiUP毕竟是一款基于命令行的管理工具,对TiDB的初学者来说有一定的门槛要求。

一.什么是TEM

在企业版本中,TiDB提供了一款配套的图形化工具TiDB Enterprise Manager(简称“TEM”)。TEM是一款以 TiDB 为核心的企业级数据库管理平台,兼容 TiDB 所有 LTS 版本。TEM 提供了对 TiDB 的集群部署、性能诊断、告警监控、备份恢复等全生命周期管理,帮助用户更加高效的管理 TiDB 集群,降低企业 IT 管理成本,提升管理效率。

当前最新发布的TEM版本为2.1.3,后续大约会按照3个月一个大版本来发布。TEM的部署需要有一个后台元数据库(MySQL 8.0.X或者TiDB 6.5.x/7.1.x)用于存储元数据信息,因此在部署TEM之前需要事先准备好元数据库。TEM当前不仅支持单节点部署,也支持高可用部署,且能够支持国产软硬件部署,如ARM+Kylin操作系统。

二.TEM的架构介绍

TEM 主要包含任务子系统TEM核心服务,并通过 TiUP、Agent、SSH 对部署在物理机或虚拟机上的 TiDB 集群进行管理。任务子系统主要负责管理 TEM 系统需要执行的各类任务,包括周期性任务、一次性任务等。TEM核心服务包含了集群管理、备份恢复管理、告警管理、主机管理等功能模块。用户可以通过图形化用户界面来访问 TEM,完成对 TiDB 集群和其各个组件的管理。

image.png

三.TEM的功能展示

TEM部署完成后,可通过任意一台TEM的IP:PORT来访问TEM页面,以下通过实际测试环境来展示 TEM(v2.1.3) 具有哪些功能模块。

首页

image.png

登录到TEM界面后自动进入首页,欢迎界面提供集群管理、备份管理以及SQL编辑器的链接入口。集群管理和备份管理会跳转到后续将介绍的集群管理和备份恢复页面,SQL编辑器跳转到TEM文档中相应模块。

集群管理

image.png

集群管理页面主要包含三部分内容:

  • 新建集群、纳管集群功能。点击相应按钮可以进行新集群的创建或者是纳管已有的TiDB集群。
  • Top3 集群图表。展示Top3 QPS 集群、Top3存储容量集群以及告警Top3集群。
  • 集群展示列表。无论是TEM创建的集群还是纳管的集群都会显示在这里,以列表形式展示。每个集群显示集群名称、集群ID、集群版本、状态、创建时间、性能概要、告警概要、标签以及操作按钮。可以针对每个集群进行停止、重启、重载、丢弃、销毁操作。

点击集群名称可以跳转到这个集群的详情页面,集群详情页面具体又包含以下几部分模块内容。

集群概览

image.png

如上图所示,集群概览包含以下部分:

  • 集群基本信息。包括版本、状态、创建时间、副本个数、CPU架构、TiUP中控机地址、集群标签。
  • 告警概览。展示紧急、严重、警告三种级别的告警个数,另外通过“告警规则”链接可以跳转到告警规则页面。
  • 集群拓扑。展示本集群中包含各个组件的总计算资源、节点数信息。通过“详细信息”链接可以跳转到集群拓扑页面。
  • 监控指标。展示一些概览性的监控指标,如QPS、CPU、Memory等。通过“详细信息”链接可以跳转到监控指标页面,方便查看更多的监控指标。
  • 连接功能。连接按钮展示使用MySQL客户端连接集群的命令行,如mysql --connect-timeout 15 -u 'root' -h x.x.x.x -P 4000 -D test -p<your_password>。
  • 扩容集群功能。扩容集群将跳转到集群拓扑页面再进一步进行集群扩容操作。

监控指标

显示集群图表(包括数据库时间、应用连接、SQL相关、延迟与解析、事务、核心流程耗时等)、主机图表(包括TiDB、TiKV、TiFlash节点)、巡检报告(可以发起巡检并生成巡检报告)。在集群图表显示上,支持选择时间范围、设置刷新时间以及采集粒度;另外可以通过“更多监控指标”跳转到Grafana界面查看更多图表。

image.png

image.png

image.png

性能诊断

可以查看TopSQL、慢查询、诊断报告、日志检索、SQL审计。

TopSQL可以查看Top排名的SQL信息,包括累计耗时、运行次数、平均耗时等,也支持设置最大收集SQL个数、时间窗大小、时间窗个数、SQL保留时长等;

image.png

image.png

慢查询显示查询时间范围内的慢SQL,包括总执行时间、最大内存等,慢查询也支持TopSQL中的设置;

image.png

image.png

诊断报告用于生成并查看性能诊断报告;

日志检索可以基于时间范围、日志信息类型、实例、关键字来进行日志查看并下载;image.png

SQL审计用于安全审计用途,如需使用需要提前安装审计插件,之后便可以创建过滤器规则指定对哪些表及操作进行审计。

image.png

image.png

备份恢复

此处的备份恢复是单个集群级别的备份恢复页面,主目录中提供的备份恢复页面是针对所有集群。此页面主要提供三部分内容:备份基本信息(备份策略、是否开启日志备份、最近一次备份时间、最新日志备份时间点、备份文件尺寸、日志备份延迟、失败备份告警)、集群所有备份任务及历史、用于手动备份/备份设置/恢复的按钮。

image.png

在备份列表模块,点击任意任务ID可以查看到此备份的详细信息,如

image.png

手动备份是指手动执行一次全量备份,需要设置备份名称、备份目的地以及相关备份选项

image.png

备份设置一般是在集群未设置备份时设置定时备份任务,如是否开启日志备份、备份目的地、调度周期、调度时间、备份保留时间等。如果已经有备份任务,那么备份设置就可以查看到配置的备份任务。

image.png

恢复是指将本集群的某一个备份恢复到远程集群中,具体分为是按某一个备份集来进行恢复还是按照时间点来进行恢复(即PITR)。

image.png

参数管理

参数管理用于修改集群的参数,包括全局变量和系统配置。

全局变量一般修改后可以直接生效,而系统配置修改后通常需要对集群进行reload重载操作。由于参数比较多,可以基于变量名称或组件名称对参数进行筛选匹配。

image.png

image.png

image.png

image.png

集群拓扑

此页面主要展示集群具体组件信息,并提供针对具体组件进行停止、重启、下线(相当于tiup scale-in)等操作。

image.png

同时页面右上角也提供了扩容集群按钮,当有空闲主机时可以进行任意组件的扩容操作,相当于tiup scale-out功能。

image.png

SQL编辑器

通过预设置的用户密码连接到集群,此界面主要用来执行SQL语句,另外数据库和用户旁边的+可以用来创建新的database和user。

image.png

值得称赞的是,TEM 2.1.3版本中还引入了SQL审核的功能,对于delete、truncate等危险性操作会弹出提示框,防止用户误操作删除数据。

image.png

告警管理

告警管理在TEM 2.1.3版本中提供两个子页面,分别是告警事件和告警规则。

告警事件显示当前产生的告警信息,以列表方式展现,包括告警事件、告警对象、告警状态、告警级别、告警时间及恢复时间。由于告警可能较多,可以基于告警级别、告警时间、告警状态及关键字进行搜索。

image.png

告警规则页面在TEM 2.1.3版本中需要先指定是哪个集群,然后展示此集群设置的告警规则。

image.png

备份恢复

image.png

备份恢复页面展示TEM管理所有集群的备份恢复信息,主要分为三部分内容:

  • 备份概要信息。包括占用备份空间Top3集群名称及备份文件尺寸、备份恢复告警Top3集群、未指定备份策略Top3集群。
  • 备份恢复任务列表。TEM管理所有集群的备份与恢复任务,包括任务ID、任务类型、任务状态、集群名称、开始时间、结束时间、备份目的地、备份尺寸及操作。
  • 备份操作。支持手动备份、手动恢复、管理备份策略。这块与上述集群管理中的备份恢复页面功能一样,只不过这里的操作需要选择对哪一个集群进行操作。

主机管理

image.png

主机管理界面主要包括两部分内容:

主机操作

支持脚本管理(使主机运行相关脚本)、添加主机(添加一台主机)、批量添加主机(添加多台主机)、主机规格管理。

image.png

image.png

image.png

image.png

主机列表显示

显示所有维护的主机,当主机较多时,可以基于IP、规格、机房、集群、名称、标签来进行主机的筛选。

审计日志

此处的审计日志与集群管理->性能诊断->SQL审计有所不同,它需要在TEM右上角设置->系统审计中启用审计功能,主要用于审计登录TEM用户的操作。

image.png

image.png

image.png

任务流

image.png

所有TEM中的操作都以任务流的形式执行,比如扩容集群、添加主机、重载集群等,所有任务都可以在任务流界面查看到,包括任务状态、开始时间和结束时间,对于失效的任务,当解决相关问题原因后也可以直接重启任务执行。

系统管理

image.png

TEM 2.1.3版本中增加了系统管理->中控机管理,即对tiup的管理。TEM安装完成后默认会自带一个本地的tiup,然而有些时候tiup和TiDB集群是在部署TEM前已经存在的,而且不同的TiDB集群也有可能使用不同的tiup。由于TEM本身就用于管理多套TiDB集群,因此有可能也需要管理多个tiup。

2
1
1
0

版权声明:本文为 TiDB 社区用户原创文章,遵循 CC BY-NC-SA 4.0 版权协议,转载请附上原文出处链接和本声明。

评论
暂无评论