0引言
在云计算和移动互联网技术普及的大背景下,数据流量的爆炸式的增长,交换机的端口速率?交换容量在不断提高,已经进入40G?100G的时代?客户对交换机的长期稳定运行?节能方面提出了更高的要求?作为交换机的风扇系统,必须将交换机内聚集的热量及时带走,使交换机不会出现过热现象,延长交换机的使用寿命?风扇系统的可靠运行为交换机长期稳定运行提供了有力保证?
1风扇散热系统控制电路组成以及工作原理
风扇系统作为交换机的一个子系统,主要由控制板和风扇组成(如图1所示)?其中控制板可细分为接口部分?电源部分(为控制电路与风扇提供电源)?主控部分(MCU?风扇控制?转速反馈)?其工作过程:控制板通过通信接口实现与主控板的信息交互及控制命令接收,并根据管理板的控制命令及风扇的实际转速计算出风扇的控制参数,对风扇进行转速调节控制?
风扇系统中的控制电路及风扇中的任何部分故障都会造成交换机运行产生的热量无法及时带走,系统温度升高,严重时造成交换机客户断网?
2控制电路可靠性分析
失效模式与影响分析法(FailureModeandEffectsAnalysis,FMEA)是一种可靠性设计的重要方法?FMEA主要目的是发现?评价产品/过程中潜在的实效及其后果;找到能够避免或减少潜在失效发生的措施并且不断完善?
2.1FMEA定性分析
利用控制电路的组成原理,对其进行失效模式与影响分析(FMEA),定性分析控制电路的各种故障原因?模式?影响,并给出设计的改进措施,以保证在各种故障情况下都能满足系统的散热要求?
控制电路正常工作时,能够根据环境和系统温度调整风扇的转速,已达到给系统散热的目的?如果不能实现散热功能,就认为是功能失效故障?
功能失效故障根据严酷程度可以分为I类?II类?III类?IV类?(1)I类:这种故障会导致主要功能受到严重影响;(2)II类:这种故障会导致系统主要功能受到影响或存在较大的故障隐患;(3)III类:系统次要功能散失或下降,须立即修理,但不影响系统主要功能实现的故障;(4)IV类:部分次要功能下降,不对功能实现造成影响?对控制电路各组成分进行FMEA分析,分析结果如表1所示?
2.2FMEA结论
严酷度为I?II类的潜在故障比较多,需要对电路设计上进行改进,以保证整机的散热?其中接口连接器通过器件选型来改进?其他部分可以通过电路改进来提高可靠性?(1)单片机最小系统单片机?时钟?电源?复位中的任何一个器件失效,将使整个控制电路无法正常工作?此时应该将控制部分隔离,让风扇以最高转速继续工作?(2)控制电路一般控制多风扇,如果其中一个风扇发生短路,不能引起风扇盘掉电,影响控制电路及其他风扇工作?
3控制电路可靠性设计
风扇的具体类型及数量通过热仿真确定?本设计选用四线风扇,额定电压为12V?额定电流为3.6A?最高转速为6000r/min?当风速PWM控制线为高电平时,风扇处于全速转的状态?3.1单片机最小系统电路设计
MCU由一路3.3V电源供电,一个12M晶振提供时钟源?当出现晶振?电源?复位信号?单片机等异常,会引起整个风扇盘通信失败,使整个风扇盘失效?当风扇盘和管理板之间的通信失败,管理板先拉低复位信号,让风扇PWM控制信号一直输出高电平,风扇全速转动?管理板复位信号,通过三极管反向后,与MCU输出的PWM控制信号取或后,输出到风扇的PWM信号引脚(如图2所示)?在正常情况下,管理板的复位信号为高,不会影响到MCU对风扇转速的控制?
3.2风扇供电电路设计
板上12V直接给风扇供电,为了防止其中一个风扇出现短路故障时,造成整个风扇盘掉电?每个风扇的12V输入端串接一个5A快熔断保险丝,在风扇短路时保险丝首先熔断,把故障风扇隔离(如图3所示)?
4测试结果
为了验证电路设计的效果,采用故障插入测试(FIT测试)来验证?根据前面FMEA的分析结果来构造FIT测试用例,模拟控制电路上出现器件出现相应失效模式,观察这些失效是否对散热系统产生影响?测试结果表明(如表2所示),经过可靠性设计之后,可以保证在出现失效能够让风扇继续运转,保证整机散热?
5结语
利用失效模式与影响分析法(FMEA)对风扇散热系统控制电路的失效点进行分析?针对造成高严酷等级的失效点,给出了改进设计,能对失效点进行隔离,让风扇散热系统能带故障运行?最后通过故障插入(FIT)测试,证明改进设计提高了电路的可靠性?
本文来源:创新应用 版权归原作者所有,转载仅供学习交流,如有不适请联系我们,谢谢。