总结
用于 PCIe* SMART(自我监控、分析和报告技术)的Solidigm 固态硬盘数据中心 (Solidigm Solid State Drive Data Center for PCIe* SMART) a 属性。
注意:Solidigm 在 2022 年发布的产品可能修改了 SMART 属性。
请查看 Solidigm 网站 ,了解每个产品的其他文档。
概述
SMART 是驱动器和主机用来监控驱动器运行状况和报告潜在问题的开放标准。本文档列出并介绍了适用于 PCIe* 的 Solidigm 数据中心固态硬盘 (SSD) 支持的 SMART 属性。
SMART 属性
下表列出了适用于 PCIe* 的 Solidigm 数据中心固态硬盘支持的 SMART 属性。
| 聪明 属性 (LoByte)  |        # 字节数 | 属性  |        描述  |       
0  |        1  |        严重警告:如果设置了这些位,则标记各种警告源。 位 0:可用备件低于阈值 位 1:温度已超过阈值 位 2:由于介质过多或内部错误导致可靠性下降 位 3:介质置于只读 模式 位 4:易失性内存备份系统出现故障(例如,增强型功率损耗电容器测试 失败) 位 5-7: 保留  |        任何严重警告都可以与异步事件通知相关联。在设置严重警告标志时,在 Identify Controller 的字节 3095-3076 下定义的驱动器运行状况指示器可能仍指示“健康”状态。  |       
1  |        2  |        温度: 整体设备当前温度(以开尔文为单位)。  |        这将报告介质 温度。 对于 AIC,它报告 NAND 温度,对于 2.5“ FF, 是情况 温度  |       
3  |        1  |        可用 备件: 包含剩余可用备用容量的标准化百分比(0 到 100%)  |        可用备件将设置为 100% 并 递减 | 
4  |        1  |        可用备用 阈值  |        可用备用阈值将设置为 0% | 
5  |        1  |        使用百分比估计值(允许超过 100% 的值)  |        值为 100 表示设备的估计耐久性已消耗,但可能不表示设备故障。该值允许超过 100。大于 254 的百分比应表示为 255。此值应每通电一小时更新一次(当控制器未处于睡眠状态时)。如果该值达到或超过 105,驱动器将进入写保护模式,写入带宽达到 <10MB/秒 | 
32  |        16  |        读取的数据单位(以 LBA 为单位)  |        包含主机从控制器读取的 512 字节数据单元数;此值不包括元数据。此值以千为单位报告(即,值 1 对应于 1000 个单位的 512 字节读取),并四舍五入。当 LBA 大小不是 512 字节时,控制器应将读取的数据量转换为 512 字节单位。 | 
48  |        16  |        数据单元写入(以 LBA 为单位)  |        包含主机已写入控制器的 512 字节数据单元数;此值不包括元数据。此值以千为单位报告(即,值 1 对应于 1000 个单位的 512 字节写入),并四舍五入。当 LBA 大小不是 512 字节时,控制器应将写入的数据量转换为 512 字节单位。对于 NVM 命令集,作为写入操作的一部分写入的逻辑块应包含在此值中。“写入不可更正”命令不会影响此值 | 
64  |        16  |        主机读取 命令  |        包含向控制器发出的读取命令数 。 | 
80  |        16  |        主机写 入命令  |        包含向控制器发出的写入命令数 。  |       
96  |        16  |        控制器繁忙时间(以分钟为单位)  |        包含控制器忙于 I/O 命令的时间量。当 I/O 队列有未完成的命令时,控制器将处于正忙状态(具体而言,命令是通过 I/O 提交队列尾部门铃写入方式发出的,并且相应的完成队列条目尚未发布到关联的 I/O 完成队列)。此值以分钟为单位报告。 | 
112  |        16  |        电源 循环  |        包含电源 循环次数。  |       
128  |        16  |        开机 时间  |        包含开机小时数。这不包括控制器通电和处于低功耗状态的时间。 | 
144  |       16  |       不安全 的关机  |       包含不安全关闭的次数。当断电前未收到关机通知 (CC.SHN) 时,此计数会递增。  |      
160  |       16  |       介 质错误  |       包含控制器检测到未恢复的数据完整性错误的次数。此字段中包含无法纠正的 ECC、CRC 校验和失败或 LBA 标记不匹配等错误。 | 
176  |       16  |       错误信息日志条目数  |       包含控制器生命周期内错误信息日志条目的数量。 | 
192  |       4  |       警告 复合温度 时间  |       包含控制器运行的时间量(以分钟为单位),并且复合温度大于或等于“警告复合温度阈值 (WCTEMP)”字段,并且小于“识别控制器”数据结构中的“临界复合温度阈值 (CCTEMP)”字段。(P3100页) | 
196  |       4  |       临界复合温度 时间  |       包含控制器运行的时间量(以分钟为单位)。并且复合温度大于标识控制器数据结构中输入的临界复合温度阈值 (CCTEMP)。 | 
其他 SMART 属性(日志标识符 CAh)
成功