从统计学科与计算机科学的性质认知,大数据是指那些超过传统数据系统处理能力、超出经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新的统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。
《大数据:统计理论、方法与应用》共分五章,其内容包括大数据下的统计理论体系、大数据下的数据集整合分析、大数据下的高维变量选择方法、大数据下的统计方法并行计算和大数据下的统计方法应用——网络舆情分析。
本书内容新颖,取材国内外资料,同时认真总结了作者近年来的科研成果,重点反映统计学对大数据发展的影响,突出五大特点:
(1)充分体现学科融合;
(2)拓展统计研究对象;
(3)丰富统计计算规范;
(4)改进统计研究方式;
(5)扩展统计应用范围。
本书对从事大数据挖掘、机器学习、人工智能和数据分析的科技人员具有重要的参考价值,可以用作统计学、计算机技术、人工智能和大数据管理等专业或研究方向博士生、硕士生的教材。