欢迎您注册蒲公英
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 Kc305 于 2025-12-27 19:22 编辑
常见计算机化系统生命周期均通常可以理解为 - 概念阶段 -项目阶段 - 生命周期运维阶段- 退役阶段,几个很常见的概念。然后每个阶段均可以拆分出各自子内容。
但计算机化系统生命周期其本身作为一个庞大的概念,在实际实施和执行过程却通常很难执行到位,这类风险通常来自多个维度,企业的IT人员数量,IT专业程度,没有专业的CSQA存在监督漏洞。 在近期的审计中我经常发现这类问题,抛开其他我以其中关于生命周期中,计算机化系统服务管理与性能监测和预维护这个维度进行分析。 在生命周期中,系统服务管理与性能监测这个话题通常被提起的很少,即使有也仅限于数据中心服务器层面,很少在末端系统中提起,但是这并不是该被忽视的一环,忽视并不是他不重要,相反其在PIC/S或者GAMP5指南中均有要求。
- GAMP 5 Guide: Compliant GxP Computerized Systems指南4.3.2和4.3.3
- 但在指南中可能相对来说说的模糊,也没有实际案例来说明该项任务的重要性,说白了,没有说服力,以下是我在某项目驻扎审计期间,发现几个偏差。
[size=16.6667px]
2.1 在审计期间发现计算机化系统时间并不一致,公司内配置有NTP服务器,同时配置有AD域策略强制同步时间,但是实际情况中仍然出现时间自动校准失败,该现象存在在实验室单机仪器计算机和网络版色谱AIC均乃至AD服务器本身均存在(具体原因不做展开) 2.2 网络版色谱检验异常失败,经调查CDS服务器仅配置32GB运行内存,实际使用过程中在无检验状态下CDS服务器内存长期处于满负荷占用状态(具体原因不做展开) 2.3 夏季工程注射用水工控系统异常掉电式关机。经调查其承载海德控制系统的Windows工控机CPU温度在冬季仍然处于90°高温状态。
结果我给他们开了两个严重偏差,倒不是这对这个问题,而是问题背后暴露出的两个体系风险 A:计算机化系统生命周期中巡检和监测完全没有执行到位。 B:IT部门没有给出计算机化系统预防性维护,且目前企业不具有任何预防性维护支持数据。
这些案例相对指南来说更具有说服力,这时答案就很好得出了,如果企业在执行良好的巡检这类风险是否可以有效避免? 当然答案显而易见,不会发生。 这时候现实的问题就产生了,而且还是一个很常见的问题,要花资源。企业需要多少资源去执行这件事情?或者把这件事情执行到位避免风险? 现实情况: 96余台3类以上计算机化系统的企业配置IT仅配置2人,其中1人主要负责企业OA ERP Helpdesk,另一人身兼管理,开关账号,U盘备份,看机房等等一大堆其他事务。 IT组挂在工程部门下,其部门负责人出于职业惯性,仅对工程类事务专业和关心。 其公司QA不具备监管计算机化系统专业能力。
这类情况在我审计和支持的项目中60-70%中小型制药企业均有该问题。IT不受重视甚至可以说是行业一个简单通病也不为过。结局就是头疼医头脚疼医脚。审计提什么再改什么,偏差出什么再研究什么,现实几乎指南和法规的预防和规避风险理念相悖。
但面对这个问题怎么解决是关键,我很相信你这时候和企业负责人说加人加大巡检力度他会瞪你一眼。大部分企业负责人仍然想花一次性投入的钱,和请顾问一个逻辑。
回归正题,生命周期中监测和预维护是一个话题,因为你有监测数据才能做出正确的预维护计划,有数据才能正确的规避风险,别和我说你用每年偏差再去做预维护,你都叫预维护了。。。高低点提前准备。 我提倡的仍然是系统的事情系统解决,单纯加入确实不是一个明智的选择,其实也很好解决,目前市面上有很多计算机监测类系统,而我们大部分实验室和车间使用的3类或以上系统其底层均为Windwos或者Linux,监测类软件可以轻松捕获Windwos状态Linux系统状态以及其数据库状态。乃至其硬件状态。 如果企业实在不想花钱,但有一个不错的IT 那么开源监测平台也是个不错的选择,项目最终交付就包含一套开源监测预警平台也解决了问题。
分享下项目中主要包含的监测内容, 每一项都对应有各自关联的风险项目,如磁盘IO长期高负载,在这个SSD为主流情况下还有长期大IO有很大概率为磁盘故障,CPU温度,在高温状态触发到温度保护计算机即刻掉电关机。 这些在监测系统的风险评估中每一项可以体现,大家也可以补充。
- CPU负载
- 内存负载
- 磁盘各分区使用量百分比
- CPU温度。
- 网络通信中断次数
- 当前时间
- 数据库负载
- 磁盘IO状态
|