本发明涉及一种基于聚类分析的影响大数据系统性能的关键参数查找方法及装置,其中方法包括:将大数据系统定义为由参数(w,p, t)组成的结构,其中w为应用层的负载程序向量,p为平台层的配置参数向量,t为程序运行所需时间;提取历史工作数据,根据应用层的负载进行分类,将负载程序向量w相同的数据样本分成- -类;在每类负载相同的数据样本中,按照程序运行所需时间t从大到小进行排序,得到配置参数向量p的排序,对比t值最大的n个参数向量和最小的n.个参数向量,找出全部参数向量组中维度差别最大的前q%的参数。本发明采用聚类分析的方法.对大数据计算系统中的参数进行排序,避免了人工寻找影响参数的难题,不仅节省了人工查找参数的时间,而且方法简单快捷。