本发明涉及一种基于数据筛选的数据存储方法,该方法包括获取待存储数据,待存储数据包括多个层级数据,在每个层级数据下还包括有数据信息;在中央处理器内还设置有层级矩阵G(G1,G2,G3,G4,G5)和数据相似系数矩阵K(K1,K2,K3,K3,K5),在进行数据相似性比较时,若同为任意层级的两个数据的相似性大于等于该层级对应的系数,则表示该层级的两个数据相似性较高,判定为重复数据;否则不进行数据筛选,将筛选的层级数据以及该层级数据下对应的数据信息进行存储,作为当前数据层级的异地备份数据。通过对存储的数据按照特定的格式进行划分,并且对每个层级设置不同的相似系数,便于对数据的相似性进行准确的判断,要采用相似性系数较高的参数,提高数据比较的准确性。