大数据时代统计学重构研究中的热点问题剖析
引言
进入21世纪以来,科学技术尤其是互联网和计算机技术的迅猛发展,促使大数据时代快速到来,大数据是堪比黄金石油的致富新思路,会给社会方方面面带来很深远的影响和变化,在生活中,农业工业等很多领域都会运用到统计学,统计学之于现代社会有着较为重要的意义,因此,在这种情况下,对大数据时代背景下统计学重构进行研究是非常必要也是非常重要的。
一、大数据时代统计学重构的价值与意义
1.是前沿科研领域
伴随着科学技术的发展,大数据时代科研的进步会带来很多领域的发展和超多超复杂的数据,面对这样的挑战,我们应该不断增强自身获取信息的能力,就统计学而言,这门学科应该具有分析这些庞大数据的能力,并且通过分析能够研发出合理的分析工具以及相应的分析研究理论,来通过科学的理论解决一些更为前沿、复杂的现实问题[1]。显而易见,当前很多造诣深厚的学者都将研究领域转向了数据分析上来。
2.是交叉科研领域
统计学是一个与众多学科都有交叉的一个学科,比如与数学有交叉关系,与经验科学如天文学中假设估计参数有关系。在现代社会,统计学的使用已经不止局限在政府或者国家事务中使用,而将应用领域延伸到了商业、社会科学以及自然科学中来,由于统计学具有广泛的应用性和深厚的历史,因此,它不只是与数学有亲密的关系,更是与数学本身的哲学有着亲密的联系。伴随着领域的增多和数据的复杂程度的加重,统计学家一直进行着跨领域、跨学科的研究,随着研究数据的不断增多,所研究的领域也在不断拓宽,统计学家面临着越来越多的机遇,统计学的发展也面临着越来越多的机遇,同时,统计学的发展也推动着很多前沿科学的发展。
3.具有非常重大的意义
我们可以在进行统计学研究时形成一套完整的统计学研究理论和方法,推动大数据时代多元复杂数据分析朝着国际化方向发展;可以将数据化研究理论成果运用到经济和社会发展中去,比如可以运用在金融风险管理与控制上;还有很多金融领域的人运用大数据分析可以挖掘出市场信息,据此判断市场走势,会获得高收益,这些都是大数据时代中统计学在发挥作用[2]。
4.抢占制高点
国外很多研究表明,大数据时代统计学工程需要从各个领域挖掘有用的信息,并将这些信息融合,提取出有用的因素,发展相应的研究理论。目前,已经有很多研究结果表明,现如今的大数据研究方法和理论已经相对成熟,我们应该牢牢把握住这次机会,不畏挑战,迎难而上,尽快研究出具有独立知识产权、具有创新性的数据分析理论和软件,为我国的数据分析发展提供动力。
二、大数据时代统计学重构的热点问题研究
1.大数据统计学的理论和方法
过去的统计主要将重心放在概率分布的指数族方面,在上世纪70年代以来,指数族分布研究及其在高维贝叶斯和像图模型的应用中的研究居多,我们知道,由于指数族包括了所有已知概率的分布,因此,指数组的应用十分广泛,它是统计学的核心,并且在概率论方面的作用也在不断加强。这一研究方向旨在运用指数族来对庞大的数据进行初步的简化,利用Bootstrap方法对大多数统计和概率方面的贝叶斯数据进行应用[3]。
2.大数据数据建模
随着大数据的不断变化和发展,线上算法被研究出来,大数据的形式多种多样,因为多样化的应用、庞大的数据和针对大数据所开发的技术,这项研究会产生深远广泛的影响。该研究的方向是将数据建模相应的领域进行推广,将这些数据能够统一运用在大数据中,运用理论和公式对实际应用进行辅助。
3.并行迭代蒙特卡罗方法
日常生活和科学研究与计算机技术的结合让大数据的收集不再是幻想,要想分析这些数据,要运用并行和分布结构。并行和分布结构是拥有存储和处理大数据功能的,但是目前的技术还不能将现代的统计算法应用到大数据中去,并且在日益增多的数据中,我們需要更加复杂的结构和模型来进行解释。尽管迭代蒙特卡罗方法已经被相关研究证明是非常强大的,但是它仍然不能够用于大数据的分析,该研究旨在将迭代蒙特卡罗方法融入到一个通用理论中去发展,另其适应大数据的发展环境,并且让其也能够适用并行和分布结构,即从并列的样本中算出蒙特卡罗值,一这个数值来近似最初需要的数据量,这个理论能够有效避免在算法迭代中的重复扫描数据问题,与此同时,这一算法的应用也可以另数据研究中的问题得出具有统计学意义的解[4]。
三、结语
大数据时代下统计质量得到提高,统计成本降低,统计学发挥作用的领域增多,并且让统计学能够发展延伸,提高了统计学的地位,面对统计学发展过程中可能遇见的问题,要通过大数据的时代背景,顺应当今的发展潮流,不断进行思维和技术上的进步与提升。