计算机化系统生命周期-计算机系统监测

Kc305 · 发表于 2025-12-27 19:18:46

您需要登录才可以下载或查看，没有帐号？立即注册

x

本帖最后由 Kc305 于 2025-12-27 19:22 编辑

常见计算机化系统生命周期均通常可以理解为 - 概念阶段 -项目阶段 - 生命周期运维阶段- 退役阶段，几个很常见的概念。然后每个阶段均可以拆分出各自子内容。

但计算机化系统生命周期其本身作为一个庞大的概念，在实际实施和执行过程却通常很难执行到位，这类风险通常来自多个维度，企业的IT人员数量，IT专业程度，没有专业的CSQA存在监督漏洞。

在近期的审计中我经常发现这类问题，抛开其他我以其中关于生命周期中，计算机化系统服务管理与性能监测和预维护这个维度进行分析。

在生命周期中，系统服务管理与性能监测这个话题通常被提起的很少，即使有也仅限于数据中心服务器层面，很少在末端系统中提起，但是这并不是该被忽视的一环，忽视并不是他不重要，相反其在PIC/S或者GAMP5指南中均有要求。

[size=16.6667px]

2.1 在审计期间发现计算机化系统时间并不一致，公司内配置有NTP服务器，同时配置有AD域策略强制同步时间，但是实际情况中仍然出现时间自动校准失败，该现象存在在实验室单机仪器计算机和网络版色谱AIC均乃至AD服务器本身均存在（具体原因不做展开）

2.2 网络版色谱检验异常失败，经调查CDS服务器仅配置32GB运行内存，实际使用过程中在无检验状态下CDS服务器内存长期处于满负荷占用状态（具体原因不做展开）

2.3 夏季工程注射用水工控系统异常掉电式关机。经调查其承载海德控制系统的Windows工控机CPU温度在冬季仍然处于90°高温状态。

结果我给他们开了两个严重偏差，倒不是这对这个问题，而是问题背后暴露出的两个体系风险

A：计算机化系统生命周期中巡检和监测完全没有执行到位。

B：IT部门没有给出计算机化系统预防性维护，且目前企业不具有任何预防性维护支持数据。

这些案例相对指南来说更具有说服力，这时答案就很好得出了，如果企业在执行良好的巡检这类风险是否可以有效避免？当然答案显而易见，不会发生。

这时候现实的问题就产生了，而且还是一个很常见的问题，要花资源。企业需要多少资源去执行这件事情？或者把这件事情执行到位避免风险？

现实情况：

96余台3类以上计算机化系统的企业配置IT仅配置2人，其中1人主要负责企业OA ERP Helpdesk，另一人身兼管理，开关账号，U盘备份，看机房等等一大堆其他事务。

IT组挂在工程部门下，其部门负责人出于职业惯性，仅对工程类事务专业和关心。

其公司QA不具备监管计算机化系统专业能力。

这类情况在我审计和支持的项目中60-70%中小型制药企业均有该问题。IT不受重视甚至可以说是行业一个简单通病也不为过。结局就是头疼医头脚疼医脚。审计提什么再改什么，偏差出什么再研究什么，现实几乎指南和法规的预防和规避风险理念相悖。

但面对这个问题怎么解决是关键，我很相信你这时候和企业负责人说加人加大巡检力度他会瞪你一眼。大部分企业负责人仍然想花一次性投入的钱，和请顾问一个逻辑。

回归正题，生命周期中监测和预维护是一个话题，因为你有监测数据才能做出正确的预维护计划，有数据才能正确的规避风险，别和我说你用每年偏差再去做预维护，你都叫预维护了。。。高低点提前准备。

我提倡的仍然是系统的事情系统解决，单纯加入确实不是一个明智的选择，其实也很好解决，目前市面上有很多计算机监测类系统，而我们大部分实验室和车间使用的3类或以上系统其底层均为Windwos或者Linux，监测类软件可以轻松捕获Windwos状态Linux系统状态以及其数据库状态。乃至其硬件状态。

如果企业实在不想花钱，但有一个不错的IT 那么开源监测平台也是个不错的选择，项目最终交付就包含一套开源监测预警平台也解决了问题。

分享下项目中主要包含的监测内容，

每一项都对应有各自关联的风险项目，如磁盘IO长期高负载，在这个SSD为主流情况下还有长期大IO有很大概率为磁盘故障，CPU温度，在高温状态触发到温度保护计算机即刻掉电关机。这些在监测系统的风险评估中每一项可以体现，大家也可以补充。

[数据完整性] 计算机化系统生命周期-计算机系统监测