当前位置: 代码迷 >> 综合 >> 基于阿里巴巴(cluster data v2018)数据集对表格machine_mate进行简单处理
  详细解决方案

基于阿里巴巴(cluster data v2018)数据集对表格machine_mate进行简单处理

热度:104   发布时间:2023-11-14 16:02:00.0

通过对前一篇文章进行总结,整合为一个函数,对数据去除重复数据,并且进行重排序和进行ID重置等。

def __machine_new__():# 数据对应的列名columns =['machine_id','time_stamp','failure_domain_1 ','failure_domain_2','cpu_num','mem_size','status']machine_mate = pd.read_csv("D:\\experiment\\machine_meta\\machine_meta.csv",names=columns)# 删除重复数据machine_mate.drop_duplicates(subset='machine_id', inplace=True, keep='first')# 对数据进行重新排序machine_mate.sort_values(by='machine_id',inplace=True,ascending=True)# 对机器ID进行重置j = 1for i in machine_mate.index:s1 = str(j)j += 1machine_mate['machine_id'].at[i] = 'm_' + s1# 对时间戳置为0# machine_mate['time_stamp'] = 0machine_mate.to_csv("D:\\experiment\\machine_meta\\machine_meta_new.csv",index=False,header=False)

故障域
参考网址:https://book.51cto.com/art/201701/529696.htm
当Virtual SAN启用故障域时,存储策略从主机级别转移到故障域级别。要配置Virtual SAN故障域,Virtual SAN集群至少需要3个故障域。每个故障域中至少要包含1台ESXi主机。这样在其中一个故障域出现故障时,也可以确保Virtual SAN的正常运行。VMware推荐使用至少4个故障域以支持全数据迁出模式和数据保护配置,如图3-52所示。本小节实验演示根据VMware推荐,使用4台主机建立4个故障域。

  相关解决方案