南京大学PASA大数据实验室是国内最终从事大数据技术研究和教学的团队之一。早在大数据还鲜为关注的2009年,本实验室已经进入大数据技术研究领域。实验室自2009年以来在大数据技术领域开展了一系列系统深入的研究开发工作,在分布式大数据存储和查询、分布式文件系统、大数据并行计算模式与系统、Hadoop/Spark性能优化与功能增强、 并行化机器学习和数据挖掘算法、大数据机器学习系统、大规模Web信息挖掘集成、大规模文本语义分析、并行机器翻译算法、大数据行业应用等方面,开展了广泛的研究,积累了系统的研究和技术基础,近6年来课题组在国内外学术期刊和国际会议上发表了大数据相关研究论文30多篇,