非参数统计分析在多样本研究中的应用论文[5篇范文]

今天给各位分享非参数统计分析在多样本研究中的应用论文[5篇范文]的知识，其中也会对为学生毕业走向社会进入职场打下坚实的基础进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文导读目录：

　　一、研究背景

　　当今经济研究领域，运用传统的参数统计进行实证分析非常广泛。然而，在现实生活中，传统参数统计方法对总体分布的假定常常难以满足，比如数据并非来自所假定的分布，或者数据根本不是来自一个总体，又或者数据因为种种原因被严重污染等。这样，假定总体分布的情况下进行推断的做法就可能产生错误的结论，影响决策。为此，人们希望在不假定总体分布的情况下，尽量从数据本身来获得所需要的信息，这就是非参数统计的宗旨。

　　二、实证分析

　　以小白鼠为对象研究正常肝核糖核酸（RNA）对癌细胞的生物作用，试验分别为对照组（生理盐水），水层RNA组和酚层RNA组，分别用此3种不同处理方法诱导肝癌细胞的果糖二磷酸酯（FDP酶）活力，数据如表1所示.3种不同处理的诱导结果

　　处理方法诱导结果

　　对照组2.792.693.113.471.772.442.832.52

　　水层RNA组3.833.154.703.972.032.873.655.09

　　酚层RNA组5.413.474.924.072.183.133.774.26

　　从上表可以看出，对照组的诱导的平均FDP酶活力最小，水层RNA组次之，酚层RNA组的最大。因此可以初步认为，3种诱导作用的效果有显著差异。

　　（二）、正态性检验

　　对样本做假设检验则首先必须知道总体服从的分布，本文针对3个总体分别进行正态性检验，原假设为H0：样本所来自的总体分布服从正态分布，备择假设为H1：样本所来自的总体分布不服从正态分布。具体检验结果如下：

　　显然，通过Kolmogorov-Smirnov检验可知，在给定的显著性水平0.05的条件之下，在3个总体所得P值均小于α，故拒绝原假设，可以认为出这3个总体均不服从正态分布。且从现阶段所知的分布来看，无法断定其到底属于何种分布，故采用非参数方法对该问题进行统计分析。

　　（三）、尺度参数检验

　　本文中尺度参数的检验采取Mood检验。原假设X和Y同分布，即H0：b=1，备择假设H1：b≠1。通过R软件检验结果如下：

　　Z检验统计量的值P值

　　对照组与水层RNA组-1.39560.1628

　　对照组与酚层RNA组-1.43490.1513

　　水层RNA组与酚层RNA组-0.410.6818

　　表4

　　结果显示，对于分布函数形状的检验，在给定的显著性水平0.05的条件之下，对照组与水层RNA组、对照组与酚层RNA组和水层RNA组与酚层RNA组的尺度参数检验均全部通过，接受原假设。即3个总体的分布函数（以及密度函数）的形状完全相同，若有不同仅有可能的是位置参数不同。

　　（四）、位置参数检验

　　1、Kruskal-Wallis检验

　　由于本文样本为3个独立同分布的总体，因此对于位置参数的检验采取Kruskal-Wallis检验。根据题意有，原假设H0：试验中3种诱导作用的效果无显著差异，备择假设H1：试验中3种诱导作用的效果有显著差异。结果显示p=0.01895，故在给定的显著性水平α=0.05条件之下，拒绝原假设。

　　2、Wilcoxon秩和检验

　　为了进一步检验3中诱导作用中产生显著性差异的是哪一种，本文对其进行两两的Wilcoxon秩和检验。其中，原假设H0：试验中某两种诱导作用的效果无显著差异，备择假设H1：试验中某两种诱导作用的效果有显著差异。通过R软件编程检验，结果如表5所示。

　　W秩和检验统计量的值P值

　　对照组与水层RNA组100.02067

　　对照组与酚层RNA组8.50.01564

　　水层RNA组与酚层RNA组270.6454

　　结果显示，在给定的显著性水平0.05的条件之下，对照组与水层RNA组、对照组与酚层RNA组的位置参数检验没有通过，因此拒绝原假设，认为对照组与水层RNA组、对照组与酚层RNA组的诱导作用效果有显著性差异。但是水层RNA组与酚层RNA组的Wilcoxon检验结果显示，在给定的显著性水平0.05的条件之下，不能拒绝原假设，即没有证据表明水层RNA组与酚层RNA组的诱导作用效果之间存在显著性差异。

　　三、结论

　　通过本文可以看出，在生物医学领域，非参数统计具有非常广泛的应用前景。非参数统计方法不仅可以像参数统计方法一样用于处理定距、定比数据，更适合处理定类、定序数据。参数方法对数据要求较多，而非参数统计方法则不同，研究的出发点是假定研究总体的理论分布是未知的，是一个待检验的假设，实际应用中这种问题是非常普遍的。非参数统计方法减少了实际应用中对假设条件的依赖，进而使得对多样本问题的研究更加客观，不受样本分布形式限制的，应用范围、发生模型错误的可能性较小，有较大的稳定性，同时方法简便易行，直观性强，易于接受和理解。此外，在本文的实证研究中，所有检验均为应用R软件编程运算，因此R软件具有实现比较非参数统计分析的强大功能。

　　0、前言

　　所谓的数据统计分析，是以现代信息化技术和互联网技术为基础，对相关的数据进行收集汇总，然后根据需求对这些数据进行不同方式、不同范围、不同深度的统计和分析，以从中获取到有价值的信息。当前，全球各行业领域都开始认识到了数据统计分析的重要性，并将其应用到了社会生产、建设当中。

　　1、数据统计分析在煤炭销售中的重要性

　　煤炭销售是煤炭企业实现价值、获取利润的一个主要途径，同时涉及煤炭销售的相关数据也非常之多，以往这些数据只是被简单的用作反映煤炭销售业绩，为企业的核算等提供基础信息等，对于未来的销售工作没有任何的参考、指导作用，之所以会出现这样的情况，其一是受技术条件的限制，其二是受思想认识的限制。当前，在信息化技术和互联网技术的支持下，可以对与煤炭销售相关的数据进行大量的收集汇总，根据需求快速的对其进行统计分析，这不仅仅能够简单的反映出煤炭销售业绩、为核算提供基础信息，更能以客观数据为基础，对销售前景进行预测，发现销售工作当中各环节可能存在的问题，为销售工作提供决策参考，这就可以提高煤炭销售工作的科学性、合理性，促进煤炭销售业绩的提升，增强煤炭企业的市场竞争力，为企业获得更高的利润，这对企业在现代市场当中的长远、稳步发展来说具有非常重要的意义[1]。因此必须要树立正确的思想认识，认清数据统计分析在煤炭销售中的重要性，并加强研究、探讨及应用。

　　2、数据统计分析在煤炭销售中的应用

　　2.1扩大数据来源

　　数据统计分析在煤炭销售中的应用首先需要有大量的数据作为基础，所以煤炭企业必须得要扩大数据的来源。在这里企业应当认识到，煤炭销售数据统计分析不只是需要与销售直接有关的数据，其他的一些间接性数据也应当被纳入到煤炭销售数据统计分析中来。因为在实际的销售工作当中，可能多个部门都会对销售情况造成影响，这些部门看似独立，但实际上都与销售工作存在间接的联系，为此企业在煤炭销售数据统计分析的过程当中，应当将这些部门的相关数据纳入进来，对数据来源进行扩大，形成“大数据”效应，使数据更加的完整，更加具有系统性，这样通过对数据的统计、分析，企业才能从中获取到更加全面、更加准确的信息，以更好的指导煤炭市场销售工作开展。另一方面，为了掌握市场的整体情况，还应当将外部相关的数据纳入进来，内外结合进行数据统计分析，以进一步适应市场现状。

　　2.2完善煤炭销售数据统计分析体系

　　煤炭销售数据统计分析体系直接关系着统计分析的质量和有效性，为此煤炭企业必须要对煤炭销售数据统计分析体系进行完善。该体系应和煤炭企业的员工考核密切相关，以约束以激励的双重效果的体现为目的。在煤炭销售统计结算中，煤炭企业的整体销售情况应该基于销量、煤炭结算收入与运费、煤炭质量等指标进行全面了解。煤炭销量统计和煤炭结算清单关系密切，必须要保管好原始数据，不断核实统计情况。在煤炭质量方面，不但要对商品煤、原煤的质量情况进行计算，还需要质量台账，包括各类型的客户、各批次的、不同类的煤种，然后对各自的价格、收入以汇总的方式进行分析。在煤炭结算收入中，核算各自既要包括合同价格，还需要和财务部的数据进行对接，管理好台账，保证企业经济效益。在煤炭结算运费中，台账的详细必须包括车辆的使用、路运、存场，甚至还要综合对比分析煤炭产量、各品质的销售以及盈亏情况等等，并将相关的结论反馈给相关管理者，为销售工作的精细化打下基础。但是，煤炭销售统计体现还需涉及到统计的全面性，比如员工考核之类的和销售指标相关的也应体现在体现中。当煤炭销售数据统计分析体系完善了，煤炭企业的员工积极性才会更高[2]。

　　2.3实现按需统计分析

　　煤炭销售数据统计分析工作不应当是一个程式化的过程，而应当要具有动态性、针对性，要能够针对当前的市场发展情况、发展需求进行按需统计，这样才能为煤炭销售工作提供最有价值的参考、指导。这要求煤炭企业应当做到以下几点：第一，要考虑到宏观的煤炭市场现状，如国内外的市场需求、供需关系以及竞争情况等，要能够从整体上认清、把握煤炭市场的变化、发展动态。当然，要想分析得出这类型的信息，必须要有真正的大数据支持，从各种途径获取各类与煤炭市场相关的数据，如行业报告、國家统计等等，这样才能够尽可能真实的了解到市场现状；第二，由于企业的市场战略规划、安排，所有煤炭销售工作在不同的时间段可能有着不同的要求和关键点，针对这样的情况，企业的统计分析工作必须要根据要求和关键点有序的展开，尽量高效获取对当前销售工作有利的信息；第三，重点分析获取敏感信息，在煤炭销售工作当中，有一些数据信息是非常敏感的，也非常受企业的管理层重视，因为这些数据信息往往对企业的整体发展战略规划都有着影响，如某时间段的销售平均数、同比增长速度、市场销售趋势预测等等，这些数据往往是相当重要的，所以必须要做到准确和及时、动态的更新[3]。

　　3、结语

　　在当前的煤炭销售工作当中，煤炭企业应当加强对数据统计分析的研究、探讨及应用，从中获取对煤炭销售工作有价值的参考信息，指导煤炭销售工作的开展，以提升煤炭销售业绩，保障企业的市场发展。

　　主要参考文献

　　[1]米子川，姜天英.煤炭大数据指数编制及经验模态分解模型研究[J].统计与信息论坛，2016（8）：71-77.[2]上官晓慧.大数据时代，统计分析成为煤炭企业的参谋[J].市场研究，2014（4）：6-7.[3]李红梅.煤炭企业统计数据质量控制分析与探讨[J].企业技术开发，2014（11）：40-42.

　　一、信息技术的概念

　　信息技术的基本概念可以从广义、中义、狭义3个层面来解释。就广义而言，信息技术是指能充分利用与扩展人类信息器官功能的各种方法、工具与技能的总和；就中义而言，信息技术是指对信息进行采集、传输、加工、表达的各种技术之和；就狭义而言，信息技术是指利用计算机、网络等各种硬件设备和软件工具与科学方法，对图文声像等各种信息进行获取、加工、存储、传输与使用的技术之和。

　　信息技术的内涵包括两个方面：一是手段，即各种信息媒体，如印刷媒体、电子媒体、计算机网络等，是一种物化形态的技术；二是方法，即运用信息媒体对各种信息进行采集、加工、存储、交流、应用的方法，是一种智能形态的技术。信息技术就是由信息媒体和信息媒体应用的方法两个要素组成的。

　　二、信息技术在英语教学中应用的必要性

　　面对信息技术的发展，英语教学必须改革。可以从以下六个方面入手。

　　（1）要转变传统的教学观念。英语教学应该由向学生传授知识的被动形式转变为发展学生自主学习的主动形式。

　　（2）要转变传统的教师观念。教师角色应该由原来中心地位的知识讲解员、传授者转变为学生学习的指导者、学生主动构建意义的帮助者、促进者。

　　（3）要转变传统的学生观念。学生由被动接受者转变为主动参与者，成为知识的探究者和意义建构的主体。

　　（4）要转变传统的教学媒体观念。以前的教学媒体都是教师用来上课的辅助工具，现在转变为帮助学生学习的认知工具，既作为感知的对象，又作为认知的手段。

　　（5）要转变传统的教学方法。教学方法应该由原来单纯的基于归纳或演绎的讲解转变为基于“合作学习”、“情境创设”、“主动学习”、“协作探索”和“意义构建”等多样新型教学方法的综合应用。

　　（6）要转变教学手段。要从学生使用语言进行交际的角度出发，使课堂里学到的知识能在实际生活中运用。

　　英语教学的目的是培养学生的创造性、有目的地使用语言交际的能力。英语作为一种交际工具，只有通过英语交际活动和有趣的课堂教学活动才能更好地被学生所掌握。具体来说，这不仅要求教材真实且接近生活，也要求教师在教学中创造性地利用教材进行交际性教学。此外，教师还要善于营造出使用英语的环境，鼓励学生勇于运用英语学习和思考。英语教学要改革，我们没有理由不使用英语教学数字化，没有理由不依赖于现代信息技术，尤其是以计算机为核心的多媒体技术。因此，现代信息技术与英语教学的整合是英语教学改革的必由之路。

　　三、信息技术在英语教学中的作用

　　1、有利于教授者与学习者之间完成知识信息的转移

　　（1）教师向学生传授知识的目的有两个：一是给学生传授书本内容；二是促进学生有效地学习。

　　（2）面对教学信息，学生必然有两种反应：一是学生将理解的知识转换为自我能力的提升；二是构成反应。在课堂教学中，运用现代教学媒体，能把图像、声音、文字的教学材料融合在一起，向学生提供多种刺激，使学生获得视听等多种感觉通道的信息，同时大容量的多媒体信息极大地丰富了学生的学习资源，增大了教学容量，充分调动了学生的学习积极性、主动性和创造性，促进学生思维能力的发展，并提高教学质量和教学效率。

　　（3）信息技术的交互性，可使学生根据自己的能力、兴趣选择适合自己学习的内容，安排学习进程，解决实际问题。它不仅能引导学生主动参与知识形成的过程，充分发挥主体作用，让不同程度的学生都有所收获，而且能给予学生更多的交流评价机会，促进学生敢于发表自己的见解，变过去的被动学习为主动参与和实践操作，有利于学生逐步养成独立思考、多向思维的品质。

　　（4）从教育科学的视角看，现代社会所必需的信息已经远远超出了个人所能掌握的知识限度。学生所要学习的不仅有以课本为载体的信息，声音、图像等多元化的信息也都将作为教学内容被引进课堂。这种教学内容的更新，必将极大地拓展学生的知识面，学生不再接受单一的知识。

　　对于学生来说，教材不再是唯一的知识传递渠道，而仅是本学科知识的压缩与精选，以多种媒体组合成的教学资源，必须通过多媒体教学方式进入课堂和学生的认知体系。在教师的引导下，学生可以更广泛地涉猎学科空间，甚至可以通过互联网了解各学科的最新知识。对教学内容的更新，将会大大提高学生适应社会的能力。

　　（5）从教学理论的视角看，由于学生对课本的学习兴趣本来就不是很高，再加上传统的填鸭式教学模式，学生的学习主动性往往被满堂灌式的教学方式所遏制。而在多媒体学习中，学生是学习的主体，学生对授课的接受程度将直接体现教学效果。运用现代信息技术中的多媒体进行教学，将变单纯的说教为情景的熏陶，是一种以图文声像并茂的方式提供知识、示范练习、边演示边讲解的多层次启发性教学方法。这种启发式教学必将调动其积极性，使其主动参与到教学过程中来。课堂上学习的内容基本上不能满足学生的求知欲，教师可引导他们上网进行再次学习，通过互联网络实现教师、媒体、学生的自主交流，使学习向完全个性化的目标靠近。在这种方式下，学生完全成了学习的主动者，其学习效果不言而喻。

　　2、有利于在英语课堂教学中调节注意，提高记忆

　　注意是学生掌握知识的重要心理条件，良好的注意品质是学生获取知识的保证。刚开始上课时，学生的注意力往往容易分散，而且带有浓厚的情绪色彩，如果教师能精心选择和制作视听教材，用具体形象的事物唤起学生的兴趣和疑问，把学生带人生动活泼的学习气氛中，就能吸引学生的注意力。在教学过程中，当学生遇到难点或比较抽象的问题时，往往因感触不深，产生厌烦情绪而走神。教师若能以多样化的电教手段作用于学生的多种感官，使抽象的材料变得具体，使枯燥的事物变得有趣，可以有效地防止学生走神，起到集中和稳定学生注意力的作用。3。有利于优化英语课堂教学

　　（1）教育过程最优化的含义是：在一定的条件下，在同样的时间内，使学生学得多些、快些、好些，能使更多的人受到教育。

　　（2）最优化的标准有两个：意识效果最大；时问最少。要使学生在有限的时间内掌握更多更新的知识，做到既增加教学内容和知识容量，又不增加教学时间和学生负担，只有依靠现代化教学方法和手段才能实现。它能把许多抽象的难以理解的概念转化成看得见摸得着的知识，从而大大提高学生的学习兴趣，开拓学生的视野，缩短教学时问，达到事半功倍的效果。

　　4、有利于在英语教学中开展研究性学习

　　研究性学习是指在教师的指导下，由学生自己选择和确定研究的课题或项目，自己收集、分析并选择信息资料，应用知识去解决实际问题的一种学习方式。它要求教育工作者放手让学生自己探索、求知，使之在亲身的实践中获得知识、发展能力。研究性学习的实质是一种对教育的理解，对学生的认识。它要求教师充分调动和保护学生自我探索、求知的欲望和热情，这种欲望和热情是学生毕生学习和发展的原动力。因此，研究性学习的观念应该始终贯穿于教学过程，融汇于学生学习的任何方面。其基本内核是倡导学生学习中的主体研究精神，促使基础教育以学生的自主性、协作性、创造性为基础，培养学生的创新和实践能力，为全面推进素质教育创造条件。信息技术对在英语教学中开展研究性学习的促进作用主要体现在以下三个方面。

　　（1）信息技术为英语研究性学习资源的开发、利用提供了理论指导和技术方法。研究性学习是学生在比较广泛的教育资源背景下所开展的自主、开放、探究式的学习活动，必须综合开发和利用图书馆、实验室、多媒体电子教室、校园网、互联网、教师等校内外教育资源，为研究性学习创造条件。

　　（2）信息技术为研究性学习提供了信息化、开放性的教学环境和资源。随着科学技术的迅猛发展，学习资源从文字教材、音像教材、多媒体课件、资源库到互联网，不断发展、丰富，学习突破了空间和时间的限制，从局限于课堂的教与学活动发展到了可以选择任何时间、任何地点进行学习。

　　（3）信息技术为研究性学习评价提供了理论指导和评价工具。研究不是目的，只是完成培养目标的一种手段和方法，通过这种手段和方法，让学生亲自经历探究过程，获得感受和体验，积累知识和方法，培养创新精神和创新能力。在研究性学习中，我们所关注的并不是学生探究的课题有多大的价值，他们的探究方法有多少科学性，探究的结果是否有社会效益，而是学生是否有了探究的意识，是否参与了探究的过程，是否获得了积极的体验，是否学会了认识世界的一些方式。教师要把对学生的评价与指导紧密结合起来，通过评价鼓励学生发挥自己的个性特长、施展才能，学会尊重和欣赏他人，鼓励学生积极进取、勇于创新，并要求学生走出课堂、走出校门，积极地开展社会调查研究与实践活动。同时，信息技术还为研究性学习提供了过程性记忆和评价工具。学生可以利用计算机多媒体技术，将研究成果制作成多媒体课件，在网上与其他同学进行交流，便于教师、学生进行评价。

　　四、结束语

　　以多媒体和网络技术为核心的信息技术已经成为拓展人类能力、促进经济发展的创造性工具，它在教育领域中的广泛应用必然对教育的改革与发展产生重大影响。学与教是人类教育中的永恒现象。特别是在学校教育中，课堂教学活动更是实现教育目的、任务的主渠道。因此，信息技术在英语教学中的应用，能够促进教学改革，正确发挥信息技术在教学中的重要作用。

　　信息技术在体育教学中应用的研究

　　关键词：信息技术；应用

　　二十一世纪是信息技术占主导地位的世纪，计算机的普及应用给社会和科技带来了一次空前的发展，也给教育教学改革带来了历史的飞跃。多媒体计算机集文字、图形、图象、视频等多媒体于一身，是一种全新的教学手段，多媒体教学引入课堂，将教学过程与娱乐融为一体，教育信息技术已经成为教育教学中的基本组成要素。

　　在体育教学中合理应用信息技术，是对现代体育教学工作提出的一个新问题。在体育教学中有机地结合实际，充分利用信息技术进行辅助教学，是提高体育教学质量和教学效率的手段和途径之一。

　　一、在体育教学中融入信息技术十分必要

　　多媒体教学手段的实现是要依靠多媒体教学平台来实现的，也就是说它的教学场地是需要在室内进行，而小学体育课的大部分教学场地是在户处，也就是说体育课是无法在室外运用多媒体进行教学，这就给体育教学工作者提出了一个自身完善信息素质的问题。

　　多年来，本人尝试通过光盘、网络等途径获取文字、图像、声音、动画、视频等多方位信息应用于体育多媒体信息技术课件制作，使教学内容图、文、声、像相结合，教学效果更明显。并且，应用信息技术还可以对备课过程发现的问题随时修正，课后可以针对教学实践中所遇到的问题进行研究讨论，并进行修改补充，达到优化、提升教学质量的目的。

　　本人运用信息技术制作完成了两个课件，一个是《篮球简介》这是一堂理论课，运用多媒体技术介绍篮球的起源、发展及比赛场地、规则、竞赛要求。通过运用多媒体信息技术，把枯燥乏味的教学内容变成图、文声、像相结合的内容，将启发性、趣味性、知识性、针对性融为一体，使学生们更直观地感受到所学知识，比以前在教室里只靠教师讲，粉笔写，是两种完全不同的效果。另一个是《篮球行进间变向换手运球》这是一堂室外课的内容，通过先期给学生们进行多媒体信息讲解、演示，在上实践课时，学生们掌握技术的能力大大增强。经过这两次的教学，笔者感受到体育教学中运用信息技术教学的优点。在理论课上，利用多媒体信息技术，把一些抽象的具体化，把一些枯燥的生动化。通过视频、音效、动画让学生在娱乐的心情下增长知识。

　　在实践课上，利用多媒体信息技术，可以把学生对动作的认识由感性认识提高到理性认识。例如：在教学“鱼跃前滚翻”时，学生很难把握“跃”的感觉，同时，滚翻时容易塌身。而教师先期通过多媒体课件，把“鱼跃前滚翻”的动作分解成跃起、手撑低头、团身翻、蹲立四个连贯的动作演示给学生看，让学生进行比较、分析、在脑子中形成动作的概念。这样在实践中，教师再稍加讲解示范，便会取得比较明显的效果。

　　二、在体育教学中合理运用信息技术

　　在现代教育改革趋势下，信息技术已广泛应用于教育教学各个领域。它的出现与运用正冲击着传统的教学模式、教学观念，引发教学方法与教学手段的改革。

　　近几年来，大家都在探讨信息技术在各学科中的运用，而体育这门学科有着与其它学科不同的特性，这就要求在体育教学中运用信息技术更应考虑它的辅助性、合理性。

　　其一，在进行教学计划的制定时，体育教师可以根据理论课与实践课的比例，根据天气的变化，在课时计划中合理应用信息技术。例如，在实践课中，如遇到雨天，可以改上室内课，用多媒体教学，把一些准备好的课件或通过网络下载的教学内容放给学生看，这样可以避免传统教学中体育课遇上雨天就成为枯燥的自习课。

　　其二，在体育运动中，有许多运动技术不仅结构复杂，还需在一瞬间完成一连串复杂的技术动作。例如：投掷项目中，铅球的最后用力顺序；跳跃项目中，挺身式跳远的展体，俯卧式跳高的转髋等动作，这给教学带来一定难度。一方面教师的示范动作受到一定限制，另一方面学生的观察角度和时机也受到很大的局限性。由于动作转瞬即逝，综合难度较高，因此很难清楚地观察到教师是如何按动作要求作示范的，这必然对学生的学习带来一定的影响。应用多媒体课件把教学中难点技术环节，用课件中的动画或影像，采用慢动作、停镜、重放等教学手段结合讲解、示范表现出来，这样就能够帮助学生看清楚每一瞬间动作的技术细节，教师讲解各分解动作的要领也比较容易抓住动作的关键，突出重点、难点，从而达到提高教学效率，缩短教学过程的目的。同时，学生练习的时间得到保证，可达到事半功倍的成效。

　　其三，在体育教学中运用信息技术辅助教学，可以让学生接触更加广阔的知识面，学生的视野更加开阔；同时，让学生更加直观地理解体育知识不再是单一的，有利于帮助学生树立“健康第一，终身体育”的理念。

　　当然，在体育教学中融入信息技术还有许多地方需要完善，比如部分体育教师对现代信息技术掌握的水平参差不齐，影响着信息技术在体育教学中的应用；室内体育活动场地的缺失，也影响着信息技术融入体育教学的进程。但是，有一点是可以肯定的，信息技术已走进校门，进入课堂，只有明确信息技术教学与传统体育教学的关系，在体育教学中运用好信息技术，使之成为一种教学工具，一种教学手段、一种教学形式，才能适应当前现代化体育教学新形势的需要。

　　三、对信息技术与体育教学整合优化的思考

　　1、转变传统教学观念

　　体育教师教学观念的改变，不仅是时代发展的要求，而且也是教育发展与改革的需要。教师通过合理、高效的利用信息技术资源，通过信息技术的强大功能探索新的教学模式，从而提高教学效率与教学质量。因此，体育教师需要转变传统的教学观念，最大限度的发挥网络资源的功能，培养终身体育锻炼的良好习惯，达到全面育人的目的。

　　2、处理好信息技术与教学内容的主次关系

　　信息技术对教学的作用可以理解为在传统教学模式的基础上增添了信息技术这一特殊工具，是一种为了更好完成教学目标而使用的教学手段，而这并不等于说抛弃了传统的教学手段，实质上是在体育教学作为传统教学的一种有益补充而并存。所以，利用信息技术进行辅助教学时，需要在设计教学内容和使用教学方法时把握好信息技术应用的方法和时机，避免“为用而用”、“过渡使用”所造成的主次不分合影响目标完成。

　　3、制定优化政策，推进信息技术在体育教学中的应用

　　各级有关部门应顺应时代潮流，加强管理，建立起相适应的约束和激励机制，促进体育教学改革的顺利进行。具体来说，在体育教学的信息化建设中，要从体育教学的实际情况和课程目标出发，做好教育资源的优化整合，逐步使信息技术在体育教学中的应用中达到科学与规范的要求，全面推进体育教学的信息化，提高体育教学质量。

　　参考文献

　　（1）谈多媒体在体育教学中的应用来源。甘肃教育、2013（2）关于小学体育教学的讨论。小作家选刊、教学交流、2013

　　信心技术在体育教学中应用的研究

　　姓名：单位：盘锦市大洼区新兴学校电话：刘帅 ***

　　统计分析工作法在教育教学管理中的应用

　　河北外国语学院国际商学院：张静

　　近几年随着高等教育的不断发展，高校毕业生的人数不断增加，毕业生就业压力也是越来越大。然而，河北外国语学院的毕业生却在就业大潮中逆势而上，创造了令社会瞩目的“用人单位‘抢人“的就业现象。河北外国语学院以与众不同的人才培养理念和教育教学方法培养出了一批又一批“用得上，留得住，能力强，有道德”的准职业人，赢得了用人单位的好评。究其背后的原因，河北外国语学院在教育教学实践中探索出了一套有效指导教育教学工作的方法即统计分析工作法。这种工作方法有效地运用在了对学生做人、做事、育德以及社会责任意识的培养上面，取得了令人满意的效果。

　　一、什么是统计分析工作法

　　河北外国语学院校长孙建中教授曾经在指导工作时强调：对于老师所管辖的任何一项事务性的工作都要做到“一天一登记，一周一统计，一月一对比，一年上个新台阶。”用数据化评比促进工作的进展。在学院的任何一个岗位上，每位教师都要把每一天的教育教学工作数据实事求是地进行记录。把记录的数据定期进行分类整理和横向、纵向的比较，通过对比发现工作中存在的问题和需要改进的地方。所有的工作成绩都拿数据来说话，拿数据图去展示。不管是在教学管理工作中，还是学生教育管理工作中，乃至就业工作、培训管理工作中等等，统计分析工作法都是无处不在的。

　　在教学管理上，学生管理上，还是在就业管理工作上等哪个部门做得好，哪位教师做得好，这些依据从何而来？从平时的“一天一登记，一周一统计”中得来，而且都是最为客观、公正的佐证材料。一个学生的成绩和表现，一个班级的成绩和进步，一个学院的发展和成绩等都会通过数字、数据直观的反映出来。只要把统计前后的数字进行对比，就能够一目了然。我们在教育、教学管理中运用统计分析工作法是基于数据统计的基础上，对同类工作中的数据进行明确计量、科学分析、精准定性，从而对数据反映出来的现象进行概括、总结和分析，从而发现问题，有针对性地提出解决办法，最后达到改进工作，提高效率的目的。

　　河外的每一位学生都有自己的成长档案。里面记录了同学们在每一天、每一个星期、每一个月、每一个学期、每一个学年的到课率、各门课程的平时成绩、宿舍卫生评比结果、学生的社会工作参与情况、实习实践活动的表现等等，通过对这些数据的分析和研究，我们不难发现学生的思想状况以及他们的优点和不足，从而给辅导员的工作提供了科学的依据。老师们根据每一位学生的定期表现，有针对性的找每一位同学进行座谈，帮助他们把自己的优点保持下去，同时也帮助同学们客观地认清自己的不足，在以后的学习和工作中扬长避短，取得更大的成绩。

　　在教育教学工作中应用统计分析工作法可以把同一类工作的不同时期的数据进行记录、搜集、整理、对比、分析，从而可以找出我们教育教学工作中存在的问题和不足，针对这些问题和不足老师们开会进行研讨找出原因，并思考解决的办法。使我们的各项教育教学工作更加条理化、科学化，从而更好地为学生提供教育教学服务。

　　二、统计分析工作法的流程

　　第一、把每一位学生在大学生活中每一天学习生活的点点滴滴都用数字记录成册

　　我们在教育教学的各项工作中，以学生的成长为核心，以学生的全面发展和能力提高为目标，每天把每一位学生在学校的生活、学习、活动、实践、任职工作、课堂出勤、内务等情况的所有数据都详实地记录在提前设计好的工作表格中，形成常规的工作数据化档案。比如在教育教学管理工作中我们每天记录的数据有：学生西点出勤表、任课教师点名表、辅导员点名册、实训室日志、语音室日志、学生宿舍内务日志、宿舍住宿登记表、西点教官出勤日志等等。这些表格数据记录了学生在大学点点滴滴的成长历程。

　　河北外国语学院的每一位学生都有成长记录跟踪档案，他们每天的生活、学习情况都实事求是地进行记录，分为电子档和纸质档两种形式进行数据保存，形成系统的档案。以纸质和电子档案两种形式进行保存和备案。这些数据形成了学生在大学学习和生活的青春足迹。

　　第二、对每一位学生学习和生活方方面面做到一周一统计，一月一总结

　　学校所记录的各类教育教学管理的数据，都是由一线的教师和工作人员填写完成记录，定期有相关处室的管理人员进行检查和收集。各职能处室所收集上来的数据都是真实的、准确的、具有时效性的。

　　学校的老师们对每一位学生每天的教育教学情况进行数据记录，然后这些数据要一个星期进行一次统计，一个月进行一次总结，包括学生出勤、公寓管理、多媒体使用等教育、教学、管理的方方面面的统计数据都是按同样的流程，进行每天的记录，定期的汇总，学校管理部门定期督查和收集一手数据资料。

　　通过统计分析工作法要让数据在教育教学的过程中发挥有效的作用。要让数据活起来，在学生管理和教学管理中发挥其作用，要让数据成为我们工作的依据和动力。

　　第三、对每一位学生的各门学科学习情况实行一月一考核目前大部分学校实行传统的学生评价机制，实行每个学期进行一次期末测试，河北外国语学院打破了这种传统的评价机制，对所有年级各个专业的学生实行开放性评价，各门学科每一个月进行一次阶段性考核。

　　考核方式也是百花齐放、形式多样的。比如外语类专业的学生可以通过外语配音、翻译、外语剧展演、外语演讲等形式汇报这一个月的学习成果。专业性强的专业可以通过完成一个项目或者设计一个作品等形式来展现自己一个月的学习成果。

　　对于学生每个月的考核成果，任课教师都会认真整理数据，进行系统分析，查找学生在知识系统和能力系统的漏洞和不足，对学生进行针对性的辅导，提高和巩固教学成果。同时，教师也会反思自己的教学方法和教学手段，进行有针对性地改进达到优化课程教学的目的。

　　第四、对每一位学生所进行统计、总结的数据进行详细的分类分析

　　学校的相关职能处室和管理部门把定期收集上来的数据，进行归类，对真实、有效的数据进行分类统计。有关工作的管理部门在整理数据时非常注重数据的真实性和时效性，对有疑问的数字会及时找到负责的老师进行核对并矫正。

　　在分类整理教育教学的数据时，把学生出勤、内务管理、教学评比、实践课考核等等各方面的数据用柱状图、线状图、饼状图以及各种对比的图表进行形象的描述。这样可以直观、形象的表达数据反映的教育教学中的问题。

　　第五、通过分析数据发现学生的问题并找到学生进行反馈、座谈、指导学生更好的发展

　　把教育教学各项工作统计的数据利用数据表格、数据图示进行数据展示。经过直观、形象的对比分析，我们不难发现每一位学生在这一时期的各种表现以及所反映出来的问题。比如，通过出勤率汇总会发现有的同学这一周出勤不是很好，那么辅导员会及时找到这位同学进行座谈，看看这位同学是身体不舒服的原因，还是这段时间思想、情绪上有什么波动影响到了学习。通过一对一的座谈帮助学生解开心结，解决问题，指导学生今后的学习和生活。

　　通过对数据的统计分析，老师能随时关注到每一位同学，做到不让任何一位同学掉队。

　　第六、通过学生集中所反应出来的问题来改进教育教学管理工作在学校教育教学各个环节中广泛应用统计分析工作法，把教育教学工作以数据图表的形式直观展现，反映出学生管理存在的各种问题和教育教学工作中存在的各种问题。

　　通过集中反映出来的问题，我们通过教研会认真总结和讨论，积极进行工作反思，从而挖掘出我们教育教学工作的不足之处，针对自身存在的问题进行科研和整改，使工作更加调理化、科学化。

　　我们把数据化作为教育教学工作的水银镜，通过数据化分析出来的问题，使我们时时客观地掌握教育教学的不足之处，并以此作为提高教育教学水平的不竭动力。

　　三、统计分析工作法的意义

　　河北外国语学院将统计分析工作法广泛应用到教育教学的各个环节。对每一位学生进行档案跟踪管理。根据数据档案所反映出来的问题对每一位学生进行人性化、个性化、多元化教育。致力于每一位学生的成人、成才。

　　学校工作广泛采用统计分析工作法可以帮助每一位教师从学生集中反映的问题上，看到自身教育教学存在的不足，从而对自身工作进行不断反思和及时调整，有效提高了学校教育教学效果和质量，促进了学校教育教学工作的整体进步。

　　统计分析工作法指导我们的教育教学工作形成规范、系统、科学的档案。在教育教学的路程中不断“回头看”总结工作中成功的经验继续发扬光大，同时更要吸取工作中失败的教训，找出不足及时弥补。从而实现微笑式管理、影响式教育、引导式批评。对每一位学生的成长负责，对一位学生的前途负责，对每一位学生的家庭负责。

　　学校的一切教育教学管理工作最终都以实现每一位学生的成人成才为目标，以数据化为依据，统计分析为手段，实现教育教学的优化管理和持续发展。

　　四、统计分析工作法的具体应用

　　河北外国语学院在就业工作中也一直坚持不懈的运用统计分析工作法。我们对每一届的每一位毕业生都进行跟踪调查统计。包括：学生所在学院、班级、专业、曾经任职情况、毕业后就业单位、从事的岗位、现任职务、月薪、联系方式等等。通过对这些数据的统计，我们分类整理、比较、分析，发现在学校做过学生干部的同学，组织能力、工作能力都比较好，毕业后的就业情况也非常乐观，受到单位的重用和提拔的机会也非常多，发展空间很大。

　　通过就业一系列数据反映的问题，河北外国语学院的领导高度重

　　视，在教育、教学的实践中积极探索出了“龙凤计划”——就业导向型的人才培养模式。“龙凤计划”的宗旨是让我院100%的学生接受组织能力和干部能力的锻炼。学院各个部门为全院学生提供了千余个岗位。每一名学生在一个学期内都有机会得到为期两周的实习实践锻炼。

　　河北外国语学院通过“龙凤计划”培养学生的忠诚吃苦能力、语言表达能力、与人沟通能力、社会交际能力、动手能力、竞争能力、适应环境能力以及团队合作能力。为学生毕业走向社会进入职场打下坚实的基础。这些能力是无法单纯依靠书本学习而获得的。学院首创的就业导向型的培养模式，每个学期都会分批给每位学生提供轮岗实习的机会。让他们在校就读期间就成为准职业人。培养他们全方面的综合实用能力，为学生们将来毕业以后进入职场增加了竞争力。所以，河外的毕业生深受广大用人单位的青睐。　　非参数检验篇1

　　关键词：模糊数据；反模糊化变换；模糊非参数统计检验；老龄化社会

　　中图分类号：F24 文献标志码：A 文章编号：1673-291X（2017）17-0001-10

　　一、刻画模糊性的模糊理论

　　1.模糊理论

　　模糊理论源于1965年美国伯克利（Berkeley）大学L.A.Zadeh教授在《信息与控制（Information and Control）》期刊上所发表的论文。模糊集合（Fuzzy sets）理论至今已有60多年的发展历史。

　　模糊理论是以模糊集合为基础，其基本思想是以模糊现象为研究对象。如何使用明确的数学方式表达模糊性呢？Zadeh简单地将具有0与1两个值的特征函数 IA（x）扩展成 [0，1]区间，称此函数为隶属度函数（membership function）。隶属度函数在模糊理论上扮演着中心角色，它是从传统集合的特征函数所衍生来的，以此刻画元素对模糊集合的隶属度，其范围介于0到1之间。对于元素和集合的关系，传统集合用特征函数描述，即当x∈A，则I（x）= 1；当x？埸A时，则I（x）= 0。Zadeh提出，当元素属于某集合的程度越大，则其隶数度值越接近1，反之则越接近0。这样方法可将介于“是”与“不是”之间的所有状态表示出来了。

　　2.隶属度函数

　　用传统集合定义具有模糊性的语言变量时，常会造成许多不合理的现象。假如今天假设A、B、C三人，年纪各为59、60、75岁，其中A、B两人虽只差1岁，只有B算老人，A却不属于老人。很明显，这样相当不合理。对于传统的二分法与人类思维格格不入的问题，利用隶属度函数能得到较合理的答案。如果某人认为70岁绝对属于老年，则其隶属度函数值自然为1，而59岁几乎可算是老人，则其隶属度函数值为0.9，此表示59岁属于老年的程度有0.9。这样，可绘出模糊集合老年人的隶属度函数图（图1）。

　　和传统集合的特征函数比较，隶属度函数是将特征函数平滑化了。而且，隶属度函数让每个年龄层都拥有一个介于0到1之间的值，来代表人年老的程度。相较于传统集合的特征值，在刻画具有模糊性的事物概念时，用模糊集合的隶属度函数来解释更为适当。

　　通常，隶属度函数可分为离散型与连续型两类。离散型隶属度函数是以穷举法直接给定有限模糊集合内每个元素的隶属度。而连续型隶属度函数则是利用几种常用的函数形式（s函数、z函数、Π函数、三角形函数、梯形函数、高斯（钟型）函数）来描述模糊集合。在连续型隶属度函数的形式中，以三角形、梯形、钟形等隶属度函数容易理解，并且能满足大部分的研究设计。梯形隶属度函数，因计算方便且贴近语意的模糊性，是本文所采用的。

　　隶属度函数的设计与建立并不具有唯一性，关于年老概念的模糊集合用以如下的隶属度函数描述之：

　　这样的隶属度函数可以完全表达出模糊集合，如μ年老表达出年老模糊集合的含义。

　　隶属度函数是模糊理论最基本的概念，它不仅可描述模糊集合的性质，更可对模糊集合进行量化，并利用精确的数学方法来分析和处理模糊信息。要建立足以表达模糊概念的隶属度函数，并不是一件容易的事。原因在于`属度函数的建立脱离不了个人主观意识，故没有通用定理或公式，一般是根据经验或统计来加以建立。

　　二、模糊数与反模糊化变换

　　当统计参数为模糊数或模糊区间的情况时，很难利用传统统计检验方法处理。当收集到模糊数或模糊区间样本时，想要利用传统统计检验方法，首先要定义模糊样本的排序问题。利用模糊理论，说明模糊问卷调查以及模糊数的建立，并提出反模糊化转换，以解决统计检验中数据排序的问题。

　　1.模糊数

　　一般地说，模糊数可分成两大类。一类是离散型模糊数，由离散型隶属度函数所定义；另一类是连续型模糊数，由连续型隶属度函数所定义。连续型模糊数，依其隶属度函数的形状可分为：（1）实数区间模糊数；（2）三角形模糊数（Triangular fuzzy number）；（3）梯形模糊数（Trapezoidal fuzzy number）；（4）钟形模糊数（Bell shaped fuzzy number）；（5）不对称模糊数（Non-symmetric fuzzy number），分别由各自的隶属度函数所定义。

　　三角形模糊数虽有计算简单的优点，但梯形模糊数更接近于实际情况，也为大多数逻辑系统所接受。当考察前三者关系时，可将梯形模糊数看成是实数区间模糊数及三角模糊数的特例（梯形的上底近于0）。下面，首先定义模糊数。

　　定义2.1 模糊数

　　设U是论域，令{A1，A2…，An}为论域U的因子集，μ是一个将[0，1]映射到实数的函数，即μ：U[0，1]。设有论域U的陈述句X，其相对于因子集隶数度函数用{μ1（X），μ2（X），...，μn（X）}表示，则陈述句X的模糊数可表示成：

　　当 b=c，X是三角形模糊数。

　　当 a=b，c=d，X是实数区间模糊数。

　　例 2.1 离散型模糊数的表示法

　　设X是某老人一天出外活动时间（小时），用模糊数表示为μn（X），论域U可看成整数论域，即出外活动时数。设U={1，2，3，4，5，6}，老人一天出外走动的时间的隶属度函数为 {μ1（X）=0，μ2（X）=0.2，μ3（X）=0.5，μ4（X）=0.2，μ5（X）=0.1，μ6（X）=0}，则老人一天出外活动时间的模糊数可表示为

　　例2.2 连续型模糊数的表示法

　　（1）如果老人一天晚上的睡觉时间约6―8小时，可得到一组实数区间模糊数，记为[6，8]，如图3所示。

　　其对应的隶属函数关系如下：

　　μx（x）=1， 6≤x≤80， x8

　　（2）如果老人一天的晚上睡觉时间约6小时且不少于5小时，不多于8小时，则我们可得到一组三角形模糊数（图4），记为[5，6，8]。

　　（3）如果老人晚上睡觉时间通常约为5～8小时且不少于4小时，不多余10小时，则我们可得到组一梯形模糊数（图5），记为[4，5，8，10]。

　　实际上，上述（1）实数区间模糊数与（2）三角形模糊数，可被看成是梯形模糊数的特例，即分别标记为[6，6，8，8]与[5，6，6，8]。

　　2.模糊数问卷调查表设计

　　在调查时，有别于传统问卷设计的模糊问卷设计决定了抽样的模糊数是离散型还是连续型。下面运用事例说明，如何设计与收集模糊数问卷调查的方法及技巧。

　　例2.3 离散型模糊数问卷调查

　　某个项目要调查6位老人，对生活津贴、医疗体系、休闲联谊活动、无障碍设施、交通方便、宗教等事项所感重要性的隶属度进行选择，可各予以十枚硬币，令其依心中感受的重要性将不定数量之硬币放置各个项目上，同时必须全数用完。于是得到6组离散型模糊数的结果，如表1。

　　如果利用传统问卷调查形式，也就是定每位受访者只能勾选一意愿最高项目，则对受访者而言，所勾选选项应是心目中的隶数度最高者。其结果如表2。

　　比较以上两种调查形式，由传统问卷调查可知，六种选项中以医疗体系（众数最高）最为老人所关切。利用模糊问卷调查的结果，则是交通方便（模糊众数最高）最被关切。实际上，传统问卷调查方式会舍弃许多信息，不如模糊问卷接近现实情况。

　　例3.4 连续型模糊问卷调查

　　连续型模糊语意量表是另一种形式的模糊问卷调查。由于其易于理解，也适用于老人议题的社会调查。比如，某个项目要调查以前从科学研究的老年人，问询他们什么年龄段是最容易探索出成果的“黄金年龄”，这可设计如下形式的量表（图6），请受访者以签字笔将最确切的“黄金年龄”部分以粗线段涂黑，随即令受访者在粗线段左、右分别画上左括号、右括号表示或可称得上“黄金年龄”。从而，得出一组梯形模糊数。

　　注意，当询问的内容是类别变量时，则只可能设计为离散型模糊问卷（如例2.3）。当询问的内容是连续尺度或序列尺度时，则可设计为离散型模糊问卷，也可设计为连续型模糊问卷（参看例3.1）。至于采取何种方式，这时要视所研究的问题或受访者能否依指示操作而定。

　　3.反模糊化变换

　　反模糊化变换是将模糊数转变成实数的一种方法。不论离散型模糊数（类别变量的离散型模糊数除外）还是连续型模糊数，都通过反模糊化变换转变为反模糊化值。定义如下。

　　定义2.3 离散型模糊数的反模糊化值

　　例2.5 求离散型模糊数的反模糊化值

　　设X为老人一天出外走动时间（小时），其论域U={1，2，3，

　　4，5，6}，其隶属度函数分别为{μ1（X）=0，μ2（X）=0.2，μ3（X）= 0.5，μ4（X）=0.2，μ5（X）=0.1，μ6（X）=0}，则老人一天出外走动时间的反模糊化值为：

　　1×0+2×0.2+3×0.5+4×0.2+5×0.1+6×0=3.2 小时

　　至于连续型模糊数的反模糊化变换，则考虑代表连续性的模糊集合，即代表不确定事件之一的梯形模糊集合。当获得梯形样本时，我们感兴趣的是它在实数直线上所代表的值，即反模糊化值。在实际应用时，采取一个普遍化的非线性单位间变换，而非原始的线性单位间的变换。

　　当将梯形数据合理且有意义地转化成实数时，需要确定两件事，即变换数据必须是（1）有限维度的；（2）此类参数的相依性必需是平滑的（即可微分的）。用数学语言表示，就是此转换群是一个李群（Lie group）。

　　当决定变换并实施后，要有一个新值y= f（x）取代原始梯形数据。在理想条件下，这个新量y是正态分布的。当决定如何变换时，由于可能再次变换单位，代表量x的数值变换并非唯一。

　　定义2.4 梯形模糊数在实数直线的反模糊化变换

　　3.3反模糊化转换的一些性质

　　对于梯形模糊数的反模糊化变换，可将其性质归纳如下：

　　性质3.2 模糊数A趋近精确数，是反模糊化变换后值RA 趋近于重心cx的充分且必要条件。

　　性质3.3 模糊数A趋近模糊数，是反模糊化变换后值RA 趋近于重心cx + 1的充分且必要条件。

　　性质3.4 考虑两梯形模糊数Ai，Aj。其重心（cxi与cxj）距离 >1，是“重心（cxi与cxj）的排序与反模糊化变换后值（RAi与RAj）的排序方向不变”的充分但非必要条件。

　　性质3.5 考虑两梯形模糊数Ai，Aj。其反模糊化变换后值（RAi与RAj）距离 >1，是其反模糊化转换后值（RAi与RAj）的排序与重心（cxi与cxj）的排序方向不变”的充分但非必要条件。

　　三、中位数检验

　　1.模糊中位数

　　当样本数不多或数据数有序数据或数据的测量值不稳定但大小关系仍存在时，我们可用中位数代替平均值探讨总体的集中趋势。非参数统计法经常探讨具有这类特性的总体的中位数关系。当样本为模糊数而非精确数时，可推广传统的中位数为模糊中位数。模糊中位数和传统中位数相同，不会受到样本极端值影响，因此是稳健性的集中趋势估计量。

　　下面分别针对离散型与连续型两类模糊中位数做进一步探讨。连续型模糊中位数较离散型复杂，其隶数度函数常以区间均匀分布或不对称梯形分布两种情形表达。而区间分布可视为不对称梯形分布的特例，本文仅对不对称梯形分布做深入研究。

　　定义3.1 离散型模糊中位数

　　例3.1 离散型模糊中位数应用于银发族每月基本生活费的调查

　　政府为老人提供多项的福利政策，比如中低收入老人生活津贴、照顾高龄老人特别照顾津贴等。考虑到最近时期市场上各种食品价格出现上涨，某个课题组想要了解老人一个月基本生活费用大致需多少钱？这个调查采用模糊中位数方式收集数据。以下是针对6位银发老人，利用离散型模糊问卷调查表所得的关于每月基本生活费的隶属度选择，如表4。

　　由于样本数n=6为偶数，x （3）f= 13000，x （4）f= 16000 而对应x （3）f，x （4）f的样本值为：

　　注意，离散型模糊样本的中位数仍是离散型模糊数。若利用传统的问卷调查方式，也就是规定每位受访者只能勾选一个意愿最高的选项，则对于受访者而言，所勾选的选项应是心中的隶属度最高者。其结果如表5。

　　从表5数据中，可以得到6位受访者的选择价格，依小到大排序是：8 000，10 000，10 000，15 000，20 000，25 000元或8 000，10 000，10 000，15 000，20 000，25 000元。而利用传统中位数的取法，取出结果是10 000元。可以知道，当用传统问卷方式进行调查，无法真正反映受访者完整的想法。因为传统中位数只能考虑受访者最高意愿，所以利用模糊样本中位数，结合模糊众数的理论来思考，更能合理又真实地分析这类问题。

　　定义3.2 连续型模糊样本中位数

　　设Ai=[ai，bi，ci，di]，i =1，2，…，n，是一组梯形模糊数。根据在实数直线的反模糊化值定义，计算Ai=[ai，bi，ci，di]的反模糊化值RAi，令RA （i）为将RAi排序后而得到的有序样本值，则定义梯形模糊样本中位数为：

　　例3.2连续型模糊样本中位数应用于回味人生岁数的探讨

　　苏格拉底说过，“不经过反省的人生，是不值得活的。”回味是人在午夜做梦时，时常会梦到的念头，如儿时父母的呵护、与朋友相处的时光、工作的现实和理想，在各阶段的人生际遇等。下面是连续型模糊问卷调查表，是对9位受访者“回味人生的岁数”的梯形模糊数，并依定义计算出其反模糊化值，如表6。

　　从表6数据中，可以得到9位受访者对回味人生岁的数梯形模糊数的反模糊化值，由小到大的排列为16.5，18.6，32.1，

　　40.9，59.1，60.7，72.1，72.7，73.2。根模糊样本中位数定义，当 n=9时，中位数为第5位，可得模糊梯形中位数是59.1。由此可知，9位受访者所代表的总体认为值得的回味的人生岁数约为59.1岁。

　　2.中位数检验法

　　当抽取元素的总体是非正态分布，其分布形式未知或样本数少时，如采用传统统计检验法，将导致过多推论，使结论变得不可信。此时可采用非参数统计方法。非参数统计经常利用中位数代表数据的集中趋势。

　　非参数统计的中位数检验有多种方法。而由Mood所提出的中位数检验法，采用卡方检验法的统计量，可用于检验两组独立样本来自的总体是否具有相同的中位数，应用非常广泛。模糊数的中位数检验，不论是离散型还是连续型模糊数，都要使用各模糊数的反模糊化值。此检验方法是将两组独立样本混合后，找出共同中位数，再分别算出两组样本大于或小于共同中位数的个别次数，制成2×2联立表，如表7。

　　检验的假设形式为：

　　双尾检验：H0：两组样本所来自的总体的中位数相等，当χ2

　　这个检验法的理论基础是，当两组样本来自的总体具有相同中位数，则依共同中位数划分的大于或小于共同中位数的实际次数，必与单纯因概率所造成的大于或小于共同中位数的理论次数相去不远。因此卡方值不应超越临界值，所以当卡方值大于临界值时，应拒绝H0。

　　例3.3 检验A、B两小区的老者每周去公园次数是否相等

　　设有A、B两小区邻近公园，想要检验A、B两小区的老者每周去公园次数是否相等。由A、B两小区分别抽取13、12位老者，得各人每周去公园的次数模糊数，并计算其反模糊化值，整理成表8、9及10。

　　当取α=0.05，检验A、B两小区老人每周去公园次数之中位数是否相等？具体方法如下：

　　假设为H0：两小区每周去公园次数之中位数相等H1：两小区每周去公园次数之中位数不相等

　　混合后共同中位数是5.4，整理得联立表，如表11。

　　用中位数次数的联立表（表11），计算统计量

　　即差异显著，故拒绝接受H0。这表示A、B两小区老人，每周去公园次数之中位数有可能不相等。由前例可知，此中位数检验法并不限制A，B两组的样本数必须相等。

　　例3.4 检验男、女银发族所认为的每月基本生活费用是否相等

　　某个项目想要检验男、女银发族所认为的每月基本生活费用是否相等，由女、男银发族各随机抽取10人所认为的每月基本生活费用，得其基本生活费用模糊数及反模糊化值，整理成表12、13及14。

　　现以α=0.05，检验女、男两组银发族老人每月基本生活费用之中位数是否相等？具体方法如下：

　　假设为H0：女、男两组银发族老人每月基本生活费用之中位数相等H1：女、男两组银发族老人每月基本生活费用之中位数不相等

　　即差异不显著，故接受H0。这表示男、女两组银发族老人每月基本生活费用之中位数可能相等。

　　3.方差检验法

　　此检验法由Mood所提出，用于检验两个具有相同平均水平之总体是否具有相同的方差。采用此法检验通常有下面几个假设条件：

　　（1）两个独立样本的抽取皆为随机的。

　　（2）资料的尺度至少为序列尺度。

　　（3）两总体除了变异程度外，其他性状皆一致。

　　Mood方差检验法的假设形式可分为双尾检验，亦可为单尾检验。双尾检验的假设形式为：

　　H0：σ12=σ22即第一M之变异与第二组无不同H1： σ12≠σ22即第一组之变异与第二组不同

　　其中，σ不仅指总体的标准差，而泛指离散程度数。这里仅对于双尾检验给出阐述，单尾检验的原理相同。

　　当求出M值后，查表得两临界值M'或M*。双尾检验时，当M居于两临界值之间，即M'

　　这个检验的理论基础是：若两总体的变异程度不同，则由变异程度大的总体抽取的样本，在混合排列后会趋向两端，使等级太大或太小，并使统计量M太大或太小。所以，当检验统计量M大于等于大的临界值M*或小于等于小的M'时，应拒绝H0。

　　例3.6 检验男、女老者所认为人生中“回味的人生岁数”变异度是否相等

　　已知某个大学教师男、女老者所认为人生中“回味的人生岁数”相等。某个项目要检验这所大学的男、女老者所认为人生中“回味的人生岁数”变异度是否相等，访问19位老者（男10位，女9位）对人生中“回味的人生岁数”的看法，得到其模糊数，并计算其反模糊化值，整理成表16、17及18。

　　当取α=0.05，检验回首人生岁月中的男、女，其所认为值得回味人生的岁数，是否变异程度不同？具体方法是：

　　采双尾检验H0：σ12=σ22即男、女组所认为‘回味的人生岁数’变异度无不同H1： σ12≠σ22即男、女组所认为‘回味的人生岁数’变异度不同

　　利用排序后的数据，表19，求其统计量M

　　α=0.05，n1=9、n2=10

　　M =（1-10）2 +（2-10）2+（3-10）2+（4-10）2+（6-10）2+（7-10）2+（9-10）2+（10-10）2+（15-10）2=281

　　查表得出，临界值M'=154，M*=386，M'

　　这表示，回首人生回味的岁月，男、女测试结果变异程度有可能相同。由前例可知，此方差检验法并无不限制受检验的两组样本数必须相等。

　　四、结论

　　本文研究设计模糊数据的调查表，提出反模糊化转换的定义，建立模糊中位数检验方法，对社会科学中涉及老年人有模糊特性的表述结果的模糊数据，给出了非参数统计分析，并举例说明，得出更为准确的符合实际情况的分析和检验。同时，对结果进行方差检验，可以发现，这些信息对国家和政府制定政策及决策是十分重要的。因此，本文针对中国人口老龄化的有关信息的收集及统计分析，提出了一种有效的模糊统计分析与非参数检验方法，具有广泛的应用价值和前景。

　　参考文献：

　　[1] 王忠玉.模糊数据与统计分析[J].中国统计，2009，（9）：56-57

　　[2] 王忠玉，吴柏林《模糊数据统计学[M].哈尔滨：哈尔滨工业大学出版社，2008.

　　[3] 王忠玉，吴柏林.模糊数据均值方法及应用研究[J].统计与信息论坛.2010，（10）：13-17.

　　[4] 王忠玉，吴柏林.模糊数据问卷调查表的设计及应用[J].经济研究导刊，2012，（14）：174-178.

　　[5] 王忠玉，吴柏林.一类模糊数据的相关系数研究[J].经济研究导刊，2015，（2）：248-251.

　　[6] Klir，G..J.，Yuan，B.Fuzzy Sets，Fuzzy Logic，and Fuzzy Systems[M].NJ： World Scientic.Publishing Co.Ltd.1995.

　　[7] Zimmermann，H.J.，Fuzzy Set Theory and its Applications，4 edition[M].北京：世界图书出版公司，2011.

　　非参数检验篇2

　　关键词：出生率死亡率 Spearman秩相关系数检验 Mann-WhitneyU统计量检验

　　一、引言

　　非参数统计的一个基本思想：用数据的秩代替数据，构造统计量进行统计推断。非参数统计与总体的分布无关，但和秩以及它们统计量的分布密切相关。非参数检验则不依赖于总体分布，检验条件比较宽松，适应性强，可以弥补参数检验的不足，同时检验方法比较灵活，用途更广，计算简单。

　　本文主要研究总体分布情况，调研目标总体的分布是否与已知理论分布相同，各样本所在的分布位置是否相等。这一类方法不涉及总体参数，显然为非参数统计方法。主要采用Spearman秩相关系数检验与Mann-WhitneyU统计量检验两种非参数检验方法，分别进行出生率和死亡率相关性检验，及两类地区出生率和死亡率的差异性检验。

　　二、实验与方法

　　（一）1Spearman秩相关系数检验与Mann-Whitney U统计量检验原理

　　Spearman秩相关系数是一个非参数性质（与分布无关）的秩统计参数Spearma在1904年提出，用来度量两个变量之间联系的强弱。Spearman秩相关系数可以用于R检验，同样可以在数据的分布使得Pearson线性相关系数不能用来描述或是用来描述或导致错误的结论时，作为变量之间单调联系强弱的度量。

　　Mann-Whitney U检验又称“曼-惠特尼秩和检验”，是由H.B.Mann和D.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体，目的是检验这两个总体的均值是否有显著的差别。由于Mann-Whitney U检验明确考虑了每一个样本中各测定值所排的秩，它比符号检验法使用了更多的信息。

　　三、结果与讨论

　　（一）Spearman秩相关系数检验

　　选取1995年发达地区和欠发达地区所有地区的出生率和死亡率组成成对数据，不妨假设他们的总体（X，Y）是连续型随机变量，以及在中都没有重复的观察值。X与Y之间独立还是相关的检验问题的原假设和备择假设分别为。计算新的成对数据矩相关系数其中。计算得在显著性水平α=0.05条件下，所以我们认为出生率和死亡率没有线性相关性。

　　（二）2Mann-Whitney U统计量检验

　　分析两类地区出生率、死亡率是否存在显著差异，分析指标采用中位数。中位数反映了总体的分布位置，若分布对称时，中位数在该数上下出现的概率均为1/2处，现在对整理后的数据，两类地区出生率的中位数进行检验，建立如下假设：两类地区的中位数相同，说明两类地区收入无显著差异；两类地区的中位数不同，说明两类地区收入有显著差异。

　　检验步骤：

　　（1）把两类地区出生率按统一顺序排列，计算出中位数14.17，然后计算每一个值与中位数的带有正负号的差额，将差额取绝对值按大小顺序排列并赋秩；（2）给每个等级恢复差数原来的正负号，分别极端正负秩和；（3）设定显著水平故拒绝原假设接受备择假设，说明两类地区死亡率的中位数有显著差异，即发达地区和欠发达地区在死亡率上也有显著的差异。

　　四、结论

　　非参数检验篇3

　　关键词：股票走势;随机游走;游程检验

　　一、问题的背景

　　由于股票的走势总是难以预测，类似于随机游走，若市场是有效市场，则任何对股票的预测都是徒劳的。如果一个市场的证券价格总是能够“充分反映”所有可得到的信息，则该市场就是“有效的”。国内许多学者通过对股票价格指数进行游程检验，普遍认为我国的股票市场是一个弱有效市场。

　　在对股票进行游程检验时，大多数的做法是检验上证指数收益率与其中位数的差值正负作为检验的对象。股票走势是时间序列数据，前一天或许会对后一天的走势产生影响，如果是随机游走的，则股票涨跌之间应该是随机的，不会出现很多的上涨，也不会出现很多的下跌，因此对股票涨跌情况作为检测对象，也能够判断其是否是随机的。

　　为了检验股票走势是否随机，分别选择上证指数、深证指数2014年7月1日至2014年10月31日的数据，若上涨为1，下跌为0，进行随机性的检验。这里，我们列出部分数据，见表1：

　　二、方法的选取

　　对随机游走的假设检验方法很多，有Box -Pierce Q 检验、Ljung- Box Q 检验、游程检验、D ick-Fuller检验、Phillipsk - Perron 检验等。游程检验是非参数方法，不用考虑数据的总体分布，使用简便有效，只要对数据的类别进行检验就行。游程检验主要思想为：将取自某一总体的样本的观察值按从小到大顺序排列，找出中位数（或众数），大于小于中位数的两个部分。用上下交错形成的游程个数来检验样本是否是随机的。即通过序列的实际游程数同随机序列游程数的期望值做比较，来判断观察序列是否是随机的。例如检验次品的出现是否随机、时间序列是否平稳等，都可以用游程检验的方法进行检验，原假设H0为样品出现是随机的，备择假设H1是样品出现是非随机的，可以是双侧，也可以是单侧。连续出现的具有相同特征的样本点为一个游程。当过程是随机时，其游程的总数应在一定的范围内，既不能太小，也不能太大。在H0为真的情况下，两种类型符号出现的可能性相等，其在序列中是交互的。在这里原假设H0是指数的涨跌是随机的，备择假设H1是指数的涨跌不是随机的。相对于一定的各类个数，序列游程的总数应在一个范围内。若游程的总数R过少，表明某一游程的长度过长，意味着有较多的同一符号相连，序列存在成群的倾向;若游程总数过多，表明游程长度很短，意味着两个符号频繁交替，序列具有混合的倾向。检验统计量即为游程总数R，m、n为各类的个数，且

　　因此，统计量R有渐进分布：

　　三、软件分析

　　（一）SPSS软件分析

　　在SPSS软件中有非参数检验的一些方法，如卡方检验、二项分布检验、单样本K-S检验、游程检验等，操作简便。在SPSS中分别输入数据，并完成变量设置，选择分析工具的非参数检验中的Runs Test，涨跌选为检验变量，得到结果如表2：

　　从该表可以看出，上证指数涨的天数有50天，跌的天数有33天，一共是83个检验数据，游程总数是37个，统计量的值为-0.867，相应的渐进显著性（双侧）即值为0.386，接受原假设，即上证指数的涨跌是随机的。深证指数涨的天数是52天，跌的天数是31天，与上证指数相近，说明两个股市在中国的宏观经济环境下，会受到相同方向的经济影响。深证指数的游程数是39，检验统计量的值为-0.199，值为0.842，接受原假设，即深证指数的涨跌也是随机的。

　　（二）R语言分析

　　利用R中游程检验函数runs.test（），得到结果如表3：

　　从表可知，上证指数和深圳指数二者的检验统计量分别为-0.8671、-0.1992，值分别为0.3859、0.842，表明在0.05的显著性水平下，均接受原假设，即上证指数和深证指数的涨跌都是随机的。

　　四、结果分析

　　该实验结果说明国内上证指数、深证指数在近期内的涨跌是随机的，即股票的走势是随机游走的，不能有效预测股票的涨跌情况，因此通过技术分析等手段进行股票的分析是无效的。但是实际中，还是有很多人会利用基本面分析、公司价值分析、K线理论等方法，对股市进行预测。我国的证券市场还不是很完善，还存在信息不对称，上市公司的信息披露也存在一定不完全性，股票的走势也不是完全随机的，股民们追涨杀跌的行为也会影响股票的随机性，而带来一定的趋势性。

　　参考文献：

　　[1]陈明智.股价（期货）分析预测学.北京：教育科学出版社， 1993.

　　[2]俞乔.场有效、周期异常与股价波动.经济研究，1994（4）.

　　[3]罗捍东.证券动态投资策略.预测，1992（2）.

　　[4] 李晓静.中国股票市场有效性实证检验.企业文化.2006.

　　非参数检验篇4

　　Abstract： With the continuous promotion of the lottery， a lot of books and software about predicting the winning number have attracted eyes， and whether these numbers predict are scientific rationality？ The paper takes the double chromospheres as a example to test the random of the ball’s number. Eventually， run test proves that the winning number is random by using SPSS. It is recommended that lottery buyer do not believe the various forecasts number software and books， and should be rational betting.

　　关键词：随机性检验；双色球；游程检验；SPSS

　　Key words： random test；the double chromosphere；run test；SPSS

　　中图分类号：O212 文献标识码：A 文章编号：1006-4311（2014）15-0208-02

　　0 引言

　　近年来，随着的不断推广，巨额诱惑使越来越来多的人加入到 “彩民” 的行列，目前流行的主要有 “传统型” 和 “乐透型。我国人口众多，销售量巨大，彩民人数也很巨大。为此对中国目前的市场的运作情况进行研究和评价是有必要的，目前对销售模式的研究主要集中于游戏规则的改进和优化设置，即对已有的方案进行改进或是对多种方案按照某种规则找出最优方案。但是只对销售方案进行设置，而对彩民的行为不太了解可能会导致市场的不健康发展，因此在提高对彩民吸引力的同时，应注意避免出现病态的参与，对彩民的购买心理进行合理引导。

　　近些年，各种中奖号码预测的书籍、软件纷纷上市，究竟的中奖号码是否可以预测如何预测，这些问题一直困扰着彩民。以往人们在检验时，通常是利用卡方检验的方法来判断中奖号码出现的概率，而本文主要针对的随机性问题，利用非参数统计中的游程检验对双色球中奖号码的出现是否随机进行检验。

　　1 游程检验方法简介

　　1.1 游程检验的思想一般对于随机性的检验，从参数的角度来看是比较困难的，而从非参数的角度来看，若数据有上升或者下降的趋势，或者呈现周期变化的规律等明显特征时，均可以说明数据不是随机出现的。

　　游程检验是非参数统计中的一个较为重要的检验方法，主要用于检验随机性，比如期货价格的变换是否随机，奖券的购买是否随机等等，如果事件的发生并非随机的，而是有一定规律可循的，那么找出这个规律有助于人们理解事件的本质，所以这里将游程检验这个方法用于双色球中奖号码的检验中以判断其号码的出现是否是随机的。

　　游程主要是针对一个二元0-1序列里，一个由0或者1连续构成的字符串，其长度由游程里面的数据个数来决定，比如说一个0-1序列：11000111110001共14个数，其中共有5个游程（记为U），3个1游程，2个0游程。显然，游程的取值如果太大，说明0和1不集中，若游程个数太小，则说明0和1较集中，因此数据如果是随机的，则游程总数U既不能太大也不能太小，这里就以游程的取值作为检验的标准。

　　1.2 游程检验的步骤游程检验主要是针对游程提出的，为了保证其随机性，则游程总数不至于太大也不至于太小，因此游程检验主要分为下面几个步骤：

　　①提出H0：x1，x2，…，xn是随机取出的，这里先假设样本是由一系列的0，1构成的数，记0的个数为m，1的个数为n。

　　②取U的检验函数，Z=■N（0，1）

　　③给定水平？琢后，可以用近似公式得到拒绝域的临界值为：r1=■[1+■]，r2=1+■[1-■]。

　　④检验P值，考虑双边检验，给定水平？琢后，设r是由样本算出来的检验统计量的值，则：

　　P值=2min{P（U？叟r），P（R？燮r）}

　　2 的随机性检验

　　由于游程检验最主要的是针对于二元的0-1序列，而双色球的号码产生并非是0-1，为了能让游程检验适用于双色球号码的随机性检验，本文主要针对双色球中的蓝号进行检验，由于蓝号的号码是在0-16内进行选取，因此在这里可以将蓝球中奖号码先进行0-1转化处理，分16次进行检验，检验每个号码的出现是否是随机的。比如在检验蓝球的1号是否随机时，可将每期蓝球出现1记为1，不是1的记为0，这样即可以成功的把蓝球中奖号码成功的转换成0-1序列，并且知道蓝球中奖号码是服从二项分布的，当考虑的期数足够多的时候即n足够大时，知道该二项分布是服从正态分布的，所以这里可以用前文的游程检验来对蓝球中奖号码进行检验。

　　实际上统计软件SPSS可以直接进行游程检验，SPSS利用游程构造Z统计量，并且依据正态分布表给出相应的相伴概率值，如果相伴概率小于或等于用户给定的显著性水平？琢，应该拒绝零假设H0，则认为样本值的出现不是随机的；如果相伴概率值大于显著性水平，则不能拒绝零假设H0，认为变量值的出现是随机的。

　　本文选择了2003001期到2009048期的蓝球号码，运用SPSS软件中的非参数游程检验进行检验，表1，表2是蓝球号码1的随机性检验，其中给定显著性水平？琢=0.05。

　　显然根据表1可以看出，在这873期中奖号码中，中奖号码为1出现的频率约为6.2%，而若这些号码出现是随机的，则1号出现的概率大概为1/16=6.25%，因此可以看出1号出现的频率与其出现的概率很接近，而在根据表2，可以看到双尾检验得到的概率为0.064，显然大于0.05，所以这里不能拒绝原假设，认为蓝球号码1的出现确实是随机的。

　　同样的对于蓝球号码2-16，可以在SPSS中运用类似的方法进行检验，可以得到表3、表4（根据SPSS运行结果）。

　　根据表3与4可以看出，蓝球号码2-16的双尾检验都是大于0.05，根据游程检验的方法可以知道蓝球号码的中奖号码都不能拒绝原假设，因此蓝球号码的出现是随机的。

　　根据表5可以看出，虽然号码的出现都是随机的，但是蓝号的出现频率在过去的873期仍旧会存在有些号码出现的频率高，有些低，但是大部分号码都是集中在6.25%左右。

　　3 结论

　　从席卷整个中华大陆以来，各种预测中奖号码的书籍软件、专家层出不穷，本文针对此现象，对的中奖号码的随机性进行检验，观测的蓝球中奖号码是否是随机的，是否是有规律可循的。在之前的研究中，许多人采用了卡方检验，而这里我们引入游程检验来进行检验，最终对蓝球号码的出现的检验过程中，发现虽然在短期内号码的出现有些出现的频率较高，有些号码出现的频率较低，但是游程检验的结果显示篮球的号码出现完全是随机的，而在概率中的随机性是很难掌控的，所以对于广大彩民而言，购买时还是应该理性，不要过分依赖于所谓的中奖号码的推测。

　　参考文献：

　　[1]王静龙，梁晓筠.非参数统计分析[M].高等教育出版社，2005：28-35.

　　[2]郝黎仁，樊元等.SPSS实用统计分析[M].中国水利水电出版社，2002：251-256.

　　非参数检验篇5

　　建模步骤:A,理论模型的设计: a,选择变量b,确定变量关系c,拟定参数范围

　　B,样本数据的收集: a,数据的类型b,数据的质量

　　C,样本参数的估计: a,模型的识别b,估价方法选择

　　D,模型的检验

　　a,经济意义的检验1正相关

　　2反相关等等

　　b,统计检验:1检验样本回归函数和样本的拟合优度, ,

　　2样本回归函数和总体回归函数的接近程度:单个解释变量显着性即t检验,函数显着性即F检验,接近程度的区间检验

　　c,模型预测检验1解释变量条件条件均值与个值的预测

　　2预测置信空间变化

　　d,参数的线性约束检验:1参数线性约束的检验

　　2模型增加或减少变量的检验

　　3参数的稳定性检验:邹氏参数稳定性检验,邹氏预测检验----------主要方法是以F检验受约束前后模型的差异

　　e,参数的非线性约束检验:1最大似然比检验

　　2沃尔德检验

　　3拉格朗日乘数检验---------主要方法使用F 分布检验统计量分布特征

　　f,计量经济学检验

　　1,异方差性问题:特征:无偏,一致但标准差偏误。检测方法:图示法,Park与Gleiser检验法,Goldfeld-Quandt检验法,White检验法-------用WLS修正异方差

　　2,序列相关性问题:特征:无偏,一致,但检验不可靠,预测无效。检测方法:图示法,回归检验法,Durbin-Waston检验法,Lagrange乘子检验法-------用GLS或广义差分法修正序列相关性

　　3,多重共线性问题:特征:无偏,一致但标准差过大,t减小,正负号混乱。检测方法:先检验多重共线性是否存在,再检验多重共线性的范围-------------用逐步回归法,差分法或使用额外信息,增大样本容量可以修正。

　　4,随机解释变量问题:随机解释变量与随机干扰项独立----------对OLS没有坏影响。随机变量与随机干扰项同期相关:有偏但一致-----扩大样本容量可以克服。随机变量与随机干扰项同期相关:有偏且非一致--------工具变量法可以克服

　　二、

　　参数估计量性质的分析:a小样本和大样本性质

　　b无偏性

　　c有效性

　　d一致性

　　e Gauss-Markov定理

　　三、

　　A虚拟解释变量问题

　　a,加法方式:定性因素对截距的影响

　　b,乘法方式:定性因素对斜率项产生的影响

　　c,加法与乘法结合方式:定性应诉对截距和斜率项同时产生影响

　　B滞后变量问题

　　a,分布滞后模型:经验加权法,Almon多项式法,Koyck方法---来减少滞后项的数目

　　b,自回归模型:工具变量法,OLS法

　　C模型设定偏误问题

　　非参数检验篇6

　　由于中国期货市场起步较晚,选取大连商品期货市场的黄大豆一0907的价格指数(记为dd)和郑州商品期货市场的硬麦连3的价格指数(记为ym)从1999年1月4日至2008年6月30日的数据,上海期货交易所的铜3月的价格指数(记为cu)从1995年7月14日至2008年6月30日的数据。数据全部来源于Wind资讯金融终端。传统的有效市场理论认为对数收益率满足正态分布,本文使用对数收益来检验我国证券市场的非线性性,能更好体现非线性性对传统经典金融理论的冲击。资产的连续复合收益或对数收益定义为:(式略)三、BDS统计量对非线性结构的检验BDS统计量对嵌入维数k和维数距离ε的选取很敏感,Brock等(1993)检查了BDS统计量的有限样本分布发现:当样本有500或者500以上个观测值,嵌入维数k为5或者更低时,ε为0.5、1.0、1.5和2.0倍数据标准差时,渐近分布能够较好地估计统计量分布[6]。Kanzler(1999)的研究认为,嵌入维数k从2取到15,ε为1.5倍标准差时,检验效果较好[5]。本文选取的样本数大多都大于2000个观测值,所以,对样本进行BDS检验时,嵌入维数k从2取到15,维数距离ε取1.5倍标准差,可以达到较好的检验效果。Eviews5.0软件根据Kanzler(1999)的算法设计出了BDS检验工具,本文用此软件进行实证研究。可以看出BDS统计量均大于正态分布在5%显着性水平下的临界值1.96和1%显着性水平下的临界值2.58。BDS统计量提供了拒绝独立同分布(i.i.d.)的原假设的证据,说明我国证券市场的非线性结构。日数据的BDS统计量大于周数据,反映出日数据具有更为显着的非线性特征;股票日数据的BDS统计量大于期货日数据的BDS统计量,说明股票的非线性结构更为显着。BDS检验的不足在于不能判断存在何种类型的非线性结构。Hsieh(1991)通过模拟,BDS检验具有较好的功效来判断四种类型的非i.i.d.行为:线性依赖、非平稳、混沌和非线性随机过程,那么拒绝原假设,说明我们所研究的序列可能会是四种情形的任何一种[2]。以下内容就对这四种非线性结构进行分析。四、平稳性分析在经济上,非平稳是和结构性变化同步的,能够引起结构发生变化的原因有多种,可以是技术和金融创新,还可能是政策改变等其它原因。中国的证券市场也经历了许多次的深层次的结构变化,显然需要进行平稳性分析。对于平稳性检验,我们这里考虑的主要是协方差平稳,即弱平稳。检验一个序列的平稳性,传统的检验方法是增广Dickey-Fuller检验(ADF检验),然而由于被分析的价格序列可能会包含异方差,这时我们借助于考虑到序列相关和异方差的Phillips-Perron(PP检验)的非参数检验。ADF和PP都用单位根作为原假设。通过ADF检验和PP检验,

　　检验值都很大,对应的p值都近似为0.00,有较强的证据拒绝单位根的原假设,说明所检验序列都是平稳的,这就排除了由非平稳引起的非线性结构的可能性。经AR(p)模型线性过滤后的BDS检验为了排除BDS检验显着拒绝i.i.d.是由证券收益率的线性依赖这一因素引起的可能,我们先用AR(p)模型对原始收益率序列进行线性过滤后,对其残差进行BDS检验,并与过滤前的BDS检验进行对比。用经典的AR(p)线性模型对证券市场收益率序列进行拟合,滤去线性相关的成份,拟合结果如表3,阶数p的选取可以用偏自相关函数(PACF)方法,对一个AR(p)模型,间隔为p的样本的PACF不应为零,而对所有大于pp的参数应接近于零。用Ljung和box的Q统计量对收益率序列的线性相关性进行检验,通过过滤前后Q统计量的对比,来检验线性过滤的效果[7]。Q统计量首先由Box、Pierce(1970)提出的,后来,Ljung、Box(1978)提出一个在小样本条件下具有更好近似性质的修正Q统计量。k阶滞后的Q统计量的零假设是序列没有k阶的自相关,即:ρ1=ρ2=…=ρk=0。如果序列不是以ARIMA估计的结果为基础,在原假设下,Q统计量是渐近χ2(k)分布,即:(式略)用Ljung-Box的Q统计量检验线性过滤效果如表4,因限于篇幅,表中只给出了部分滞后阶数的检验结果。表中可以看出证券收益率的原始序列的Q统计量对应的p值大部分为0.00,有较强的理由拒绝没有k阶的自相关的原假设,说明收益率原始序列存在强较的线性相关性。而经过AR(p)线性模型过滤后,其残差序列的Q统计量均小于临界值,其p值大部分都超过20%,说明AR(p)模型已经过滤掉了证券收益率序列中的线性相关成份。对AR(p)模型过滤后的残差进行BDS检验,如表5的结果,在5%和1%的显着性水平下,检验临界值分别为1.96和2.25。

　　相比,线性过滤前与过滤后的BDS统计量相差不大,并且都是远远大于临界值,可以排除BDS检验显着拒绝i.i.d.是由证券收益率的线性依赖这一因素引起的,表明证券市场收益率序列的非线性结构是由混沌或者非线性随机过程引起的。其中ARCH和长期记忆模型都是随机模型,影响它们的因素很多,这些因素相互作用,造成复杂的价格行为;而混沌则不然,混沌是一种确定性的过程,这种过程是由几个变量所形成的简单函数所产生的[8]。这三种非线性模型哪种更能反映我国证券市场的非线性结构,这是本文进一步的研究方向。

　　非参数检验篇7

　　【关键词】实验数据计量经济分析挑战

　　为了评估环境、制度和激励政策的相对有效性，在不以承受与之相关的社会和私人成本为代价的情况下，实验经济学有助于收集相关、可靠的经验数据，并可以评估在人们的决策中每个特定动机（增益研究、互惠需求、对体制变革的反应等）的重要性。

　　从应用计量经济学的角度来看，实验经济学最大的优势就是可以立即地和不受限制地访问所掌握的整个数据。此外，通过控制实验数据，减少测量误差和错误。实验室实验也用于研究用调查数据很难去观察或推断的行为。但是，这些实验数据的统计有效性怎样呢？许多经济学家就实验结果对现实经济的可转换性提出了一些疑问。实验经济学家对这一质疑的反驳是，参与者是活生生的、有认知的人，他们被要求做出直接影响到他们收入或福利的决策，研究行为和动机的实验数据的可靠性补偿了此类数据的缺乏代表性。

　　本文的目的是要回答与实验数据的经济计量相关的几个问题：实验数据的特点是什么？为了更好地利用实验数据，挑战是什么？

　　一、实验数据特征

　　1、决策变量

　　根据实验中，参与者被要求对连续或离散变量做出决策。例如，在公共物品实验中，参加者是否捐助公共物品，如果他们决策捐助，希望解释他们的捐助数额。连续或离散形式的决策往往在限定空间和截尾空间，导致托比模型（Tobit）或泊松模型（Possion）。此外，例如，通过使用Probit类型和有序Probit类型的潜变量模型，还可以解释参与者合作或不合作的效用以及合作强度。

　　2、保留什么样的计量方法

　　（1）非参数方法

　　历来，实验分析给予了非参数分析重要的地位，这经常发生在心理学、医学和生物化学领域，例如，实验室的研究协议是很重要的。这种做法究竟是什么呢？

　　曼-惠特尼（Mann-Whitney）的U检验是非参数检验中功效最强的检验之一。它可以评估同类实验的处理结果之间是否存在差异。例如，给定处理是否导致对公共物品的自愿捐助优于其他处理。因此，这就涉及到要去比较两个独立观测序列。对于这种检验，要求不少于6个独立的观测值，意味着至少要有6次处理。有时使用曼-惠特尼U检验以查看在给定的处理期间，第一阶段提供的结果是否不同于上次阶段的。注意，这意味着早期的观测不影响以往的观测。这并非总是如此，本次检验的使用者并不总是考虑此约束。更一般的，Kruskal-Wallis秩和检验检验零假设，即K个样本或处理来自具有相同位数的同一群体。

　　（2）参数方法

　　参数方法通过假定决策变量遵循一个精确的概率密度函数，对数据强加一定的约束（一个例外：普通最小二乘法在参数估计时对数据强加的较少）。作为补偿，除了在计量模型中引入直接与实验相关的变量外，参数方法还允许在计量经济模型中引入被观测者的个体变量，如参与者的性别、年龄、研究专业、是否曾参与过实验等。如果参与者在实验中分别进行了几次测试，未观察到的异质性被面板数据的个体效应所控制。

　　3、保留方法的选择

　　在特定情况下，Keser和Montmarquette（2005，2008）在非参数二项式检验上没有发现任何相互效应，但对相互项的测度，他们使用如下定义的偏差：如果参与者i的捐助小于上一期小组其他成员捐助的平均值，那么除了增加其在下一期的捐助，他没做其他回应。

　　这两种方法之间存在互补性的另一个方面是与以下问题有关：应该通过分化处理来分析数据，还是应该聚集呢？对单一方程的参数回归能够很容易地检验处理是否导致决策或不同的结果，足够证实处理变量的参数之间是否有显著差异。瓦尔德检验（Wald tests）和极大似然比检验（通过施加等于系数的约束）用于验证治疗之间是否存在差异。如果是联立方程，处理之间差异的检验是更复杂的。此外，由于不是相同的人参与不同的处理，单一方程暗含着单个随机变量的假设，这也许是很有争议的。注意，高的或t检验统计值并不意味着处理之间显著的差异效果。还需要进行一些模拟来区分潜在效果和实际效果。

　　二、实验数据有效利用的其他挑战

　　1、实验方法对数据拟合的问题

　　模型对数据的拟合问题（拟合优度）是计量经济分析的一个重要因素。参数方法提供了可决系数R2或伪R2。但是，数值多大才适合呢？例如，在二元Probit模型中，如果主导决策代表了至少60%的情况，几乎不可能比预测主导决策做得更好了。为了更好的预测，必须实现R2（或伪R2）为60%，但是对于微观数据，是一种罕见的情况。事实上，必须要问在实验分析中最大化R2是否是可取的？一般经济学家们希望无论经验或个体特征如何，行为能对激励做出回应。经济学对人们行为做出的贡献是证明了他们会对激励做出反应，而不管他们的个性特征如何！例如，如果要促进合作行为，就必须找到使所有人合作的正确的激励机制。也就是说，理想的情况是社会经济控制变量的估计参数在统计上是不显著的。

　　2、实验方法验证理论的应用

　　如何衡量理论模型解释实验数据的价值？预测数据的一阶统计矩是结构模型的一个基本问题。但实验方法是一种结构性的办法。成功实验方案的背后，往往存在一个重要的理论结构。其目标不是从根本上解释决策的方差，而是检验模型的理论预测或实验方案依据的基本思想，必须证实与实验相关的理论预测的有效性。在文献中可以看到许多处理这一问题的有关技术。例如，量子响应模型这种方法的目的是为了衡量检测是否受试者是或不按照他们的理论进行决策，而不是采取随机决策。从计量经济学的视角，量子响应模型对应于多项Logit模型，在m个可能方案中选择的概率与多个不同选项的预期利润的指数函数成正比：

　　注意到，如果？滋∞，那么Pi=1/m。这意味着随机和非战略决策。此外，？滋0，表明参与者们对他们决定带来的利润相对敏感。一些研究已经使用这种方法来确认参与者的战略决策（Goeree，Holt和Palfrey，2002）。但似乎基础参数？滋并不独立于计量单位，多项Logit意味着假设不相干的替代品之间相互独立。

　　另一种实现起来相对简单、但稳健性尚待观察的技术是群集分析（聚类分析）来确定参与者所使用的主要策略。一些变量被用于确定分区数：例如，在自愿捐助实验中，非零捐助的频率、捐助额的平均值和标准偏差自然就是这类变量。事实上，它似乎有理由认为，非零捐助数较少、弱的捐助额的平均值和标准偏差表明非合作的战略。与此相反，正捐助的频率较高表示合作策略。正捐助的标准偏差识别战略或多或少的恒定性质。沃尔德分层方法（the hierarchical method of Ward）的应用通过总结参与者的策略识别集群。通常，为了对比不同的策略，两到三个集群已足以了。通过计算各群选定变量的描述性统计（平均数、标准偏差、中位数），可以根据处理识别参与者使用的主要策略。注意存在处理参与者利用不同策略问题的另一种方法，即在计量经济模型直接引入具体方程来对这些策略建模。例如，在公共物品的情况下，可以先验区分搭便车者和合作者。通过极大似然法估计参与者是搭便车者或合作者的概率，可以得到参与者不可观测的异质性。允许选择使模型的统计似然性最大化的权重。Bardley和Moffatt（2005）提供了适用于实验数据的这种方法的一个很好的例子。

　　3、如何调和理论和计量经济学：实验经济学在这个问题上的重要作用

　　正如所看到的，所面临的挑战在计量经济学方面是显著。在理论层面，需要更好地了解动态的选择。逆向感应是动态理论的一种形式，但基本上达到了极限。机器学习这种模型对于这些问题提供了一些积极的期望。如何教导参加者？哪些机构让他们学得更快？因此，Vernon Smith认为，经验使没有先验经济理论知识的个人去发现和寻找模型的平衡。几项研究采用不同的竞争模型对这个问题进行了研究。例如，依赖于支付和过去的决策效率（向后看）的“强化”模型。也有信念模型（信念学习模型），它是经济学家中颇为主要的方法，基于能够预测其他受试者在实验中怎样决策的一种信仰（前瞻性）。最后，混合模型（经验加权吸引力）更新每个时期的观念。对于以上模型的详细细节，可以查阅Chong、Camerer和Ho（2006）。

　　三、结论

　　总之，实验经济学将在经济学和计量经济学的进展中发挥根本性作用。事实上，实验经济学能够产生数据，这对热衷于在各种环境中传播知识的经济学家来说，这样的性质是有相当大的吸引力的。在实践中，相对于纯粹的理论，管理者们总是更愿意接受数据事实。总之，选择实验经济学方法能使经济学家们像医生一样掌握事物的核心。毫无疑问，这解释了实验经济实验室为什么在全球丛生和为什么经济学院系对实验经济学家有强劲需求。

　　必须知道对一个好的实验经济学家教育的成本。发展实验方案的技术必须以基础理论知识和好的计量经济教育为支持。

　　可得出以下三个使用规则：第一，在考虑模型和估计方法之前，应该找到一个好的问题，形式不应该凌驾于内容之上。第二，了解他们的实验数据。从事计量经济分析时，以目前现有的IT工具非常人性化为借口，没有关注数据，是一个错误，有可能错过了真正的问题和好的结果。第三，避免过于纯粹：有时承认存在偏差好过试图依据太多的假设和要求太多的数据校正。

　　【参考文献】

　　[1] Bradley N. and Moffatt P.G：The Experiments of Public Goods：Inferring Motivations from Contributions Working Paper[D].University of Nottingham and University of East Anglia，2005.

　　[2] Chong J.-K，Camerer C.F. and Ho T.H.A：Learning-Based Model of Repeated Games with Incomplete Information[J].Games and Economic Behavior，2006（2）.

　　非参数检验篇8

　　关键词: FAR(p，d)模型；局部线性回归；带宽；GLR；自助法；AR(p)模型

　　中图分类号:F830

　　文献标识码:A文章编号:1672-8513(2010)03-0162-04

　　Empirical Analysis of the Return Rate of Shanghai Stock

　　Market Based on the Nonparametric Model Method

　　HE Shuhong，CHEN Hao

　　(School of Mathematics and Statistics，Yunnan University，Kunming 650091，China)

　　Abstract:

　　This paper makes use of the functional coefficient autoregressive model to model the daily revenue of Shanghai stock market. Then, the generalized likelihood ratio and condition of the nonparametric bootstrap method are adopted to test the model. Lastly，an appropriate nonparametric model is used to analyze the non-linear characteristics of the daily revenue of Shanghai composite stock index.

　　Key words:

　　FAR(p，d) model；local linear fit；bandwidth；GLR;bootstrap;AR(p) model

　　经典的参数模型有许多优点，但它需要很强的假定条件，非线性时间序列模型可以反映一些重要的非线性特征，如非对称的商业周期、股票市场波动性等，但是非线性模型形式有无穷多种可供探索，不可能一个又一个地进行尝试，一个自然的选择就是利用非参数方法.因此，运用与模型设定无关的非参数方法或许是解决问题的有效途径.在国内关于非参数FAR(p，d)模型主要应用在医学领域，国内学者惠军等［1］应用FAR(p，d)对上证指数收益率进行了分析和预测，但他们只是用有限个点作预测来说明FAR(p，d)模型比AR(p)模型更好，此法有很大的局限性，基于广义似然比非参数的条件自助法［2］就可以运用于此，从而能更有力地说明FAR(p，d)模型比AR(p)模型更好地拟合和预测了数据.

　　由Chen和Tsay［3］引入的函数系数自回归模型具有以下形式

　　Xt=a1(Xt-d)Xt-1+a2(Xt-d)Xt-2+…+ap(Xt-d)Xt-p+σ(Xt-d)εt，(1)

　　其中{εt}为均值为0和方差为1的随机变量列，且εt与Xt-1，Xt-2，…独立.系数函数a1(•)，…，ap(•)为未知，变量Xt-d称为模型依赖变量，此模型记为FAR(p，d).该模型为Priestly（1981）状态依赖模型的特例，它是门限自回归限模型TAR［4］的一个自然推广，它使得系数函数随变量Xt－d的值变化而逐渐地变化.当系数函数a1(•)，…，ap(•)均为常数时，模型FAR(p，d)退化成自回归模型AR(p).下面引入独立变量Yt作为当前观测值Xt，第i个独立变量Xti作为延迟i的变量Xt－i，以及U作为延迟d的变量Xt－d.这些诱导变量的第t－p个观测值为:

　　Yt=Xt， Xt1=Xt－1， …， Xtp=Xt－p， Ut=Xt－d， t=p+1， …， T，

　　则FAR(p，d)模型(1)可以表示成随机回归模型的形式

　　Yt=a1(Xt-d)X1+a2(Xt-d)X2+…+ap(Xt-d)Xt-p+σ(Xt-d)εt.（2）

　　对于上面这种模型，Cai等［5］应用局部多项式给出了函数系数估计，并讨论了其渐近正态性.

　　1 函数系数的估计

　　在(2)式中的未知系数可以通过局部线性回归技术［2，5］来估计.对于任意给定的u0和u0的一个邻域内的u，由Taylor展开得

　　aj(u)≈aj(u0)+a′j(u－u0)aj+bj(u－u0)，（3）

　　其中aj和bj为局部的截距和斜率，分别对应于aj(u0)和a′j(u0).利用u0附近Ui的相应的数据和局部模型(3)，进行下面的局部线性回归:对于{aj}和{bj}，最小化

　　∑ni=1Yi－∑pj=1{aj+bj(Ui－u0)}Xij2Kh(Ui－u0)，（4）

　　其中Kh(•)=h－1K(•/h)，K(•)为核函数，本文核函数均采用Epanechnikov核函数，即K(u)=075(1－u2)+，h为带宽.令{（j，j）}为局部最小二乘估计，则局部线性回归估计即为：j(u0)=j，j=1，…，n.设βj，2p为2p×1单位向量，其中1位于第j个位置上，X~表示一个n×2p矩阵，其中(XTi，XTi(Ui－u0))为矩阵的第i行，且Y=(Y1，…，Yn)T.令W=diag{Kh(U1－u0)，…，Kh(Un－u0)}，则局部回归问题(4)可以写为Y－X~βTWY－X~β，其中β=（a1，…，ap，b1，…，bp）T局部最小二乘估计为 =（X~TWX~）－1W（X~TWY），从而aj(u0)=j=βTj，2p

　　何树红，陈浩：基于非参数模型对上海股市收益率的实证分析

　　2 带宽h和模型依赖变量d以及阶数p的选择

　　本文带宽h和模型依赖变量d以及阶数p的选择是利用Fan等［6］提出的一种改进的多重交叉核实准则方法，该方法基本思想是令m=［01n］(n为样本个数)，Q=4，先用长度为n－qm(q=1，…，Q)的Q个子序列估计未知系数函数，然后基于估计的模型来计算时间序列下一个长度为m部分的一步预测误差，一直进行下去.设{j，q(•)}为用第q(q=1，…，Q)个子序列{(Ui，Xi，Yi)，1≤i≤n－qm}，带宽h为n/(n－qm)1/5所估计的系数.利用第q个子序列所得的平均预测误差为

　　APEq(h)=1m∑n－qm+mi=n－qm+1Yi－∑pj=1{j，q(Ui)Xi，j2，

　　总的平均预测误差为

　　APE(h)=1Q∑Qq=1APEq(h)，

　　使得APE(h)达到最小的带宽h就是我们所需要的带宽.另外选择一个适当的模型依赖变量U是非常重要的，对于依赖变量的选择，可以让h在某个范围内，d在集合1，2，…，p上同时使得APE(h，d)最小化，也可以选择阶数p使得APE最小化，APE达到最小时的p和d即为模型FAR(p，d)的阶数和依赖变量的d值.

　　3 模型的检验

　　所拟合的模型是不是合理需要作进一步的检验，要确定系数函数aj(u0)是否是变化的，等价于检验假设

　　H0:a1(•)=a1，…，ap(•)=ap,（5）

　　其中参数a1，…，ap是不确定的，在零假设下，序列{Xt}服从AR(p)模型，这样，检验问题就等价于检验时间序列是服从AR(p)模型，还是服从FAR(p，d)模型，基于这种更为明确的特殊备择模型构造，我们可以在区别零假设模型和备择模型方面获得较高的功效.本文使用广义似然比(GLR)非参数的条件自助法［2，7］来实现模型的检验，这比文献［1］中直接用有限个点做预测来比较2个模型优劣要更合理.

　　在利用局部线性拟合得到FAR(p，d)模型估计的系数函数1(•)，…，p(•)后，定义残差平方和为

　　RSS1=∑nt=p+1Xt－1(Xd－1)Xt－1－…－p(Xt－d)Xt－p2

　　类似地，令1，…，p是在AR(p)模型下用极大似然法所得的系数估计.定义残差平方和为

　　RSS0=∑nt=p+1Xt－1Xt－1－…－pXt－p2

　　广义比似然统计量(GLR)为((n－p)/2)log(RSS0/RSS1)，通过泰勒展开，有如下的近似表达：

　　log(RSS0RSS1)=log1+RSS0－RSS1RSS1≈RSS0－RSS1RSS1，

　　因此可以定义检验统计量为：

　　Tn1=n1(RSS0－RSS1)2RSS1，其中n1=n－p.

　　由于在{Xt－d}的分布的尾部，j(•)并不能很好地估计，可以把计算RSS1和RSS0限制在使得Xt－d落在事先指定的集合Ω内的那些情形，依据文献［2］中的定理91有：

　　rKTn1～χ2rKcKp|Ω|／h，

　　其中rK为正态化因子，cK=k(0)－k22/2，|Ω|为U支撑的长度，k(•)为Epanechnikov核函数，h为带宽.该定理揭示了渐进零分布不依赖于诸如σ2以及协变量(U，X1，…，Xp)的密度函数中的参数等讨厌参数，换句话说，渐进零分布与讨厌参数是独立的，因此条件自助法能够用来逼近检验统计量Tn1的零分布.

　　非参数的条件自助法［2，7］的算法步骤如下：

　　第1步：从FAR(p，d)模型所得的中心化残差{i－}n1i=1的经验分布生成自助法残差{ε*i}n1i=1

　　，其中是{i}n1i=1的平均值.自助法样本构造如下：X*t，1=Xt－1，…，X*t，p=Xt－p且对t=p+1，…，n，Y*t=1Xt－1+…+pXt－p+ε*t，

　　第2步：基于自助法样本{(X*t，1，…，X*t，p，Y*t)，t=p+1，…，n}，计算检验统计量T*n1即通过应用线性回归技术到自助法样本就可以获得零假设下的残差平方和RSS*0；再应用(4)中的局部线性回归方法就获得在非参数模型下的残差平方和RSS*1，这里U*t=Xt－d，这就给出统计量

　　T*n1=(n－p)(RSS*0－RSS*1)2RSS*1.

　　第3步：重复上2个步骤B(B≥1000)次，用{T*n1}的经验分布作为GLR统计量Tn1零分布的近似，

　　第4步：用{T*n1}大于统计量Tn1的百分比作为检验的p值的估计.

　　若取显著水平为5%，当用非参数的条件自助法所得到的GLR检验的p值小于5%时，拒绝零假设，否则接受零假设.

　　4 实证分析及结果

　　本文采用上证综合指数为研究对象，时间跨度为200615~2009821，数据来源于湘财证券金禾版，收益率指数采用对数收益率，即rt=ln xt－ln xt－1，xt和xt－1分别是第t日和第t－1日指数收盘价格，收益率指数数据共有883个.先对收益率数据作一个简单的统计分析（见表1）.

　　表1 收益率统计结果

　　样本标准差偏度峰度J-B统计量/P

　　8830024-01574938141765/00000

　　从表中可以看出收益率数据具有明显的尖峰后尾现象，这是许多金融时间序列数据所共有的基本特征，根据J-B统计量说明此数据并不服从正态分布，因此无需进行分布假设的非参数方法更合理些.

　　取正整数m=［01×883］=88和Q=4用以选取参数p，d，然后再利用前面所提到的选择带宽和模型依赖变量的方法得到不同p值对应的d值和APE值，结果见表2.

　　表2 对于收益率r所选取的FAR(p，d)

　　P234567891011

　　d2133333333

　　APE2988300430202978299830163010300830143015

　　表中APE的值比实际值扩大了1000倍

　　可见整体最优模型为p=5，模型依赖变量为延迟d=3，此时的平均预测误差APE值达到了最小，为0002978.因此拟合的FAR(5，3)模型为

　　rt=a1(rt-3)rt-1+a2(rt-3)rt-2+a3(rt-3)rt-3+a4(rt-3)rt-4+a5(rt-3)rt-5+εt.

　　再应用具有m=88和Q=4的APE准侧来选取带宽h，我们用S-PLUS软件绘出在网格点hj=0137+005j(j=1，…，27)上函数APE对带宽h的图1，由图可以明显的看出图的最低点处对应的横坐标的值即为最优带宽h=00543.下面利用此带宽和局部线性回归来估计FAR(p，d)模型中的非参数系数函数ai(rt-3)5i=1估计的函数系数如图2～6所示.从图可以看出拟合的函数的非线性是非常明显的，即上证综合指数的收益率呈现明显的非线性特征.

　　最后我们用广义似然比条件自助法对所拟合的模型进行检验，用相同的数据拟合模型FAR(5，3)的零假设模型AR(5)

　　rt=-000756rt-1-001325rt-2+003085rt-3+006028rt-4+000699rt-5+εt.

　　应用前面提到的检验方法可以得到备择模型FAR(5，3)的残差平方和为RSS1=048322，备择模型AR(5)的残差平方和为RSS0=050635，因此其广义似然比(GLR)统计量Tn1的值为

　　Tn1=n(RSS0-RSS1)2RSS1=2102066.

　　用非参数的条件自助法计算{T*n1}大于Tn1的百分比即作为检验的p值估计值，基于1000个自助法样本，最终得到的p值的估计值为01%，这就提供了非常强的证据来拒绝AR(5)模型，即FAR(5，3)模型对数据的拟合要比AR(5)模型更合理，若再取点进行一步预测也可以得到同文献［1］中相同的结论，同时这也进一步佐证了上证综合指数收益率数据的非线性特征.

　　参考文献:

　　［1］惠军，武志辉，缪柏其.改进的函数系数自回归建模方法对上海股市实证分［J］.运筹与管理，2007，16（4）：107-110.

　　［2］范剑青，姚琦伟.非线性时间序列［M］.陈敏,译.北京：高等教育出版社，2005.

　　［3］RUEY S T.金融时间序列分析［M］.潘家柱，译.北京：机械工业出版社，2006.

　　［4］田铮.时间序列的理论与方法［M］.2版.北京：高等教育出社，2003.

　　［5］TAKEZAWA K.Introduction to nonparametric regression［M］.John Wiley & Sons，Inc，2005.

　　［6］CAI Z，FAN J，YAO Q.Function-coefficient regression models for nonlinear time series［J ］.American Statist Assoc，2000，95 (451)：941-956.

　　［7］FAN J，ZHANG C，ZHANG J.Generalized likelihood test statistic and Wilks phenomenon［J］.The annals of Statistics，2001，29，153-193.

　　［8］FAN J，ZHANG J T.Funcational linear models for longitudinal data［J］.Journal of the Royal Statistical Society，Series B，2000，62：303-322.

　　［9］KRAUSE A,OLSON M.The Basics of S-PLUS ［M］.Fourth Edition.New York:Springer，2005.　　非参数检验篇1

　　[关键词]假设检验非参数检验 Excel

　　近年来,非参数统计技术得到迅速发展,已成为现代推断统计的重要分支。因此,在高校经济与管理类统计学的教学中,非参数检验成为一项重要的教学内容。在讲授非参数检验时,老师们会详细讲解其理论基础与算法,但并没有介绍如何使用相关统计软件进行计算与分析。这样的教学方式存在一些明显的缺陷:首先,理论教学与实践相脱节,学生们虽然熟知算法,但动手能力不强;其次,由于没有实际动手,一些同学对理论的理解不透彻。这些都是实际教学中确实存在的问题。为此,我们完全可以在教学中增加一定的实践课时,给同学们讲解使用相关软件进行非参数检验的方法,以弥补现有教学方式的缺陷。

　　那么,应选用何种软件呢?虽然一些专业的统计软件(如SPSS)能够很容易地实现非参数检验,但根据笔者的经验,在实践教学中,最好选用Excel进行讲解。主要的考虑是,利用Excel中进行非参数检验的计算时,基本上是利用其公式与数学函数、统计函数等功能,逐一实现理论算法的每一步骤,能够加深学生对非参数检验的理解;而SPSS是直接给出结果,并没有中间的步骤,学生往往是知其然,不知其所以然,不能通过实践来巩固对理论的理解。此外,目前Office软件已经普及,大部分同学能够比较熟练地操作Excel,讲解时学生也比较容易接受。

　　针对经管类统计学教材中常见的非参数检验,本文拟以实例来介绍这些检验在Excel中的具体实现过程,而各种检验的理论背景请参见相关的统计学教材。

　　一、单样本符号检验

　　例1.设有20个工人,他们一天生产的产品件数,抽样结果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170,164,150,152,156,174,178,180,168。试以0.05的显著性水平,判定总体中位数是否是160。

　　解:首先提出假设:

　　H0∶η=160H1∶η≠160

　　利用Excel求解步骤如下:

　　1.输入数据,见图1。A、B列为原始输入数据,样本数据存放在A2:A29单元格区域,图中未完全显示出来,D、E列为计算得出的结果。

　　2.计算样本观察值大于中位数的个数(即正号的个数)。在E1中输入如下的公式

　　=COUNTIF(A2:A29,“>90”)

　　COUNTIF函数计算区域中满足给定条件的单元格的个数。

　　3.计算样本容量n(不含0差数)。在E2中输入公式

　　=COUNT(A2:A29)-COUNTIF(A2:A29,“=90”)

　　4.计算检验统计量Z。在E3中输入公式

　　=(E1-0.5*E2)/SQRT(0.25*E2)

　　5.计算临界值Zα/2

　　。在E4中输入公式“=ABS(NORMSINV(B2/2))”。

　　根据以上计算结果,由于2.75 > 1.96,检验统计量的样本值落在拒绝域,故拒绝原假设,即不能认为总体中位数是90。此外,也可通过求二项分布的临界值进行断断。

　　二、配对样本的符号检验

　　试用符号检验法检验这两位裁判裁定的成绩是否有显著性差异(显著水平0.05)。

　　解:提出假设:

　　5.计算临界值。二项分布临界值可用Excel的分布函数求得。在E7中输入公式“=CRITBINOM(F3,0.5,1-F2/2)+1”即可。其中第一个参数存放的是n;第二个参数是一次试验中成功的概率,根据二项分布临界值表的要求,固定为0.5;第三个参数是概率保证度的临界值,对于单侧检验,它等于1-α,对于双侧检验,它等于1-α/2。因为CRITBINOM返回的是使累积二项式分布概率大于等于1-α(或1-α/2)的最小值,所以根据符号检验的要求,应在上述公式中加1。

　　由于r=6

　　=9,所以不能拒绝原假设,即不能认为两位裁判的裁定成绩有显著性差异。

　　三、威尔科克森配对符号秩检验

　　该检验也是用于检验配对样本情形下,两总体分布在位置特征上是否有差异。与上一检验不同的是它考虑了配对观测之间差别的大小。首先,将配对观测值之差di

　　的绝对值按大小递增排列,并从1至n给以秩次。其次,对每个秩次按照di

　　的正负号赋以正负号。再次,分别对正号秩与负号秩计算秩和,所得之秩和不带正负号,记作∑秩(+)与∑秩(-)。为检验两总体平均水平是否有差异,可建立下列原假设H0∶∑秩(+)=∑秩(-)。两个秩中较小的一个,作为威尔科克森T统计量,将其作为检验统计量(例3略)。

　　四、卡方独立性检验

　　该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。

　　例4.抽样调查某地区500名待业人员,这些人员中文化程度为高中及以上的有104人(男44人),初中的有96人(男36人),小学及以下的有300人(男140人)。问此调查结果能否说明待业人员中的文化程度与性别是相互独立的。

　　解:提出假设:

　　这些待业人员文化程度与性别是相互独立的这些待业人员文化程度与性别不是相互独立的Excel的计算过程如下。

　　1.构造工作表,见图3。图中的文字以及方框之内的数字为原始输入数据,其他为公式计算所得。

　　2.建立期望值表。

　　(1)计算实际数表中的行合计与列合计

　　在E4中输入公式“=SUM(B4:D4)”,并将该公式复制到E5:E6单元格区域。在B6中输入公式“=SUM(B4:B5)”,并将公式复制到C6:D6区域。

　　(2)计算期望值

　　在B9中输入公式“=$E4*B$6/$E$6”,然后选定B9:D10区域,按Ctrl+R组合键,再按Ctrl+D组合键,即可将公式复制到B9:D10区域中的其他单元格。

　　(3)期望值表中的行列合计可以参照(1)中的方法,也可以将实际数表中的行列合计公式直接复制到期望值表中。选定E4:E6区域,按Ctrl+C,再单击E9单元格,按Ctrl+V,即可计算出行合计;再选定B6:D6区域,按Ctrl+C,再单击B11单元格,按Ctrl+V,即可计算出列合计。

　　3.建立卡方统计表,并计算卡方统计量。

　　在B14中输入公式“=(B4-B9)^2/B9”,并将公式复制到B14:D15区域的其他单元格。最后计算行列合计。此时,卡方统计表右下角的E16单元格中的数值即是所要求的卡方统计量。当然在卡方统计表中,卡方统计量可以直接用公式“=SUM(B14:D15)”求得,这样就不一定要计算行列合计了。

　　4.计算临界值。显著性水平为0.05,自由度为2,在B18中输入公式“=CHIINV(0.05,2)”即可得到临界值。

　　根据以上结果,卡方统计量为2.633小于,小于自由度为2的卡方临界值5.991,所以我们不能拒绝原假设,也就是待业人员中的文化程度与性别之间没有显著的关联性。

　　参考文献:

　　[1]曾五一,肖红叶.统计学导论[M].北京:科学出版社,2006.

　　[2]曾五一.统计学[M].北京:金融出版社,2006.

　　[3]黄良文.统计学(修订第三版)[M].成都:四川人民出版社,2006.

　　[4]曾五一.统计学概论[M].北京:首都经济贸易大学出版社,2003.

　　非参数检验篇2

　　（安徽科技贸易学校安徽蚌埠 233080）

　　摘要：板书教学和多媒体教学是课程教学的重要手段。以电子商务概论课程为例，通过对板书教学和多媒体教学手段下电子商务概论课程教学效果的非参数检验和偏相关分析，明确不同教学手段与电子商务概论教学效果之间关系及其差异性。结果表明，板书和多媒体教学手段与电子商务概论教学效果之间存在强正相关关系，多媒体教学手段的教学效果较板书教学手段好。

　　http://

　　关键词：教学手段；教学效果；非参数检验；PCA分析

　　中图分类号：G710 文献标识码：A 文章编号：1672-5727（2015）05-0017-04

　　作者简介：刘晓艳（1985—），女，硕士，安徽科技贸易学校讲师，研究方向为电子商务、教育管理。

　　基金项目：安徽省职业与成人教育学会2014年度教育科研规划课题“中职学校会计专业人才培养质量的影响因素及提升路径研究”（项目编号：BBB14008）；“中职毕业生就业能力培养的路径及对策研究”（项目编号：BBB14007）

　　教学手段的优劣对课程教学效果具有十分重要的影响。板书教学和多媒体教学是目前常用的两种教学手段。随着计算机和信息技术的广泛运用，多媒体教学已经逐渐替代板书教学成为课程教学的主流。多媒体教学手段的引入旨在提高课程教学效果，但从现有的文献来看，相关的研究主要集中在多媒体教学效果的调查分析、影响因素、评价体系及优化策略等方面。周媛以西北师范大学、兰州大学、甘肃政法学院和兰州交通大学4所学校为例，从多媒体课件质量、教室硬件、教师水平、学生满意度等方面开展了问卷调查，以分析影响多媒体教学效果的因素；魏文忠等人对多媒体教学的学校普及情况、学生适应程度与评价等进行了调查，设计了包括22个项目的测量量表，并采用因子分析法将影响多媒体教学效果的因素归纳为教学节奏、教学效率、教学课件、教学设施、教学技术等5大类；王娟则认为师生对多媒体教学的认知不足、教师信息技术能力不强、多媒体教学技巧和方式单一、共享资源匮乏等是影响教学效果的主要因素；张芝花建立了一个包括科学性、技术性、教学性、学习性、艺术性及教学活动组织性等6个二级指标30个三级指标的评价体系，设定了各指标的权重系数，并以英语多媒体教学效果为例开展了综合评价；王淑芬通过正交实验设计方法分析，认为有利于提高财经管理类多媒体课程教学效果的因素是学生学习能力水平、教师授课时间和课堂互动次数的最佳组合；薄红英从政策体系、培训体系、多媒体资源体系及教学评价体系等方面，探索了提高多媒体教学效果的策略。

　　关于板书教学与多媒体教学效果的比较研究，尤其是关于具体课程教学效果的计量实证研究成果较少。鉴于此，笔者拟以安徽科技贸易学校的电子商务概论课程为例，通过对板书教学和多媒体教学手段下电子商务概论课程教学效果的非参数检验和偏相关分析，探讨不同教学手段与电子商务概论教学效果之间的关系及其差异性，旨在为提高课程教学效果和人才培养质量提供参考。

　　一、研究方法

　　（一）非参数检验

　　非参数检验是在无法或无需获悉两独立样本总体分布形式的条件下，通过统计学方法和数学技巧等建立统计量，挖掘数据样本背后隐藏的信息，从而比较样本分布位置和形状等是否存在显著差异的一种重要的统计分析方法，其中Mann-Whitney U检验是最主要的方法之一。

　　（二）PCA分析

　　PCA分析（Partial Correlation Analysis）即偏相关分析，是通过控制其他变量的影响来分析两变量之间关联程度的分析方法。采用如下公式计算偏相关系数：

　　建立零假设H0，即两样本的PCA分析与零无显著差异，选择如下偏相关分析检验统计量，通过计算检验统计量的观测值和概率p值，并比较概率p值与显著性水平的差异。

　　二、教学手段与电子商务概论课程教学效果的关系实证分析

　　为分析板书和多媒体两种教学手段与电子商务概论课程教学效果之间的关系，并尽可能减少其他因素的影响，笔者分别选取安徽科技贸易学校2012—2013学年和2013—2014学年第一学期2012级、2013级两个独立样本，以上两个样本时间上跨度较小，且电子商务概论课程由同一名专业教师授课。考虑到研究的需要，剔除同一学期电子商务概论、语文、数学、计算机基础期末综合成绩不全以及调查问卷未收回或无效的学生，共得到2012级、2013级两个样本容量分别为31和45的样本。学校期末综合成绩是由期末考试、平时成绩、学习态度和出勤四个部分加权得到的综合成绩，为更准确地分析多媒体和板书这两种教学手段与电子商务概论课程教学效果之间的关系，笔者选取了综合成绩中的期末考试和平时成绩来衡量教学效果。

　　安徽科技贸易学校电子商务概论课程2013年起采用多媒体教学，而此前采用板书教学。为了比较两种不同教学手段的优劣，需要分析2012级、2013级电子商务概论教学效果两个独立样本数据分布是否存在显著的差异性。将两个独立样本数据混合，按照升序进行排列，并得到每一个数据相应的秩，分别求出两个独立样本数据的平均秩次及秩和，如表1所示。

　　从表1来看，在2012级、2013级电子商务概论教学效果中分别抽取31个和45个样本，两独立样本的秩和分别为1 036.00和1 890.00，平均秩分别为33.42和42.00。从平均秩次可粗略地看出，2012级、2013级电子商务概论教学效果的秩和存在一定的差异，为检验其差异是否具有统计学意义，通过两个独立样本Mann-Whitney U检验和Kolmogorov-Smirnov检验进行了分析，如表2所示。

　　从表2来看，取2012级电子商务概论教学效果的秩综合为W统计量，Mann-Whitney U统计量及Z值540.00和-1.666，双尾（2-tailed）近似概率值为0.096，小于显著性水平0.10。因此，2012级、2013级电子商务概论教学效果的分布存在显著差异。

　　Kolmogorov-Smirnov检验也表明，2012级、2013级电子商务概论教学效果的累积概率最大绝对差、D观测值分别为0.312、1.336，概率p值为0.056，小于显著性水平0.10。因此，拒绝零假设，即2012级、2013级电子商务概论教学效果的分布存在显著差异。

　　在对相关研究成果进行归纳的基础上，构建以下模型来分析教学手段与电子商务概论课程教学效果之间的关系：

　　y=α+β1x1+β2x2（5）

　　其中，y为电子商务概论课程教学效果，x1为教学手段学生满意度，通过建立包括信息量、生动性、互动性、启发性等4个二级指标11个问项的测量量表，并采用李克特LIKERT五分量表法在学生无意识的条件下进行调查并得出；x2为学生基础、学风、班风等综合变量，用语文、数学、计算机基础期末综合成绩表示，如表3所示，α、β1、β2为待定归系数。

　　为剔除2012级和2013级学生基础、学风、班风等方面的影响，避免出现变量间的虚假相关性，将x2作为控制变量，进行偏相关分析。

　　表4为剔除了学生基础、学风、班风等方面的影响之后教学手段与电子商务概论的偏相关系数方阵，其中相关系数为0.774，自由度为73，显著性概率p值为0.000，表明两者之间存在强正相关关系。

　　三、结论及建议

　　教学手段、学生基础、学风、班风等因素会影响课程教学效果，进而影响人才培养质量。为分析教学手段与课程教学效果之间的关系，笔者首先采用Mann-Whitney U检验和Kolmogorov-Smirnov检验等两独立样本非参数检验方法。以电子商务概论课程为例，分析了安徽科技贸易学校2012级板书教学和2013级多媒体教学这两种不同教学手段下课程教学效果分布存在的显著差异性。在此基础上，通过控制学生基础、学风、班风等方面的影响，分析了教学手段与电子商务概论课程教学效果之间的关系，结果表明：板书和多媒体教学手段与电子商务概论教学效果之间存在强正相关关系，多媒体教学手段的教学效果比板书教学手段的教学效果好。

　　基于以上结论，提出如下建议：

　　首先，要加强对教师的多媒体教学培训。许多电子商务教师入职前未接受过专业的多媒体教学培训，对多媒体教学的理解较为狭隘。作为一种新型的、重要的教学手段，多媒体教学集文字、色彩、图形、音像等于一体。要利用好多媒体，就需要强化教师对多媒体教学的认知，教师要明确影响多媒体教学效果的因素，了解学生对不同教学手段的接受程度及差异，掌握多媒体教学的特点，熟练地利用Authorware、Power point、flash、3DMAX、Premiere等软件，进行文本编辑、动画制作和图像处理，科学地管理多媒体硬件教学设施，并探索性地在电子商务概论教学过程中将不同教学手段结合起来，创新教学模式，提高学生学习的积极性和主动性。

　　其次，要实现多媒体教学资源共享。多媒体教学需要充足的软件、数据、图表、图片、动画、影像、网页、课件等资源，建立多媒体教学资源库，实现对这些资源的共享，是提高课件质量、降低制作成本的有效途径。电子商务概论课程教师要加强沟通与协作，对多媒体教学课件制作和教学中遇到的主要问题和主要困难展开讨论，积极协作，寻求解决方案。学校要鼓励教师借鉴国家精品课程资源，积极申报精品课程，通过精品课件建设平台，形成由电子商务教师和电化教育专业人员共同组成的团队，设计出教学内容和教学环节符合教学目标的优秀多媒体课件，在全校开展课程建设经验交流，并实现多媒体教学资源共享。此外，要增加对多媒体馆藏建设和多媒体资源库的投入。

　　再次，要完善多媒体教学激励机制。目前，学校电子商务概论多数采用传统板书形式进行教学，少数采用多媒体教学的教师，其课件也是以文字为主，仅将多媒体当作电子屏幕这种“单媒体”使用。一份优秀的多媒体课件，是顺利实现教学目标的重要工具，其字体、颜色、大小、行距、段落、标题需要合理设计，信息量需要合理安排，为提高学生的学习兴趣，还需要适时加入动画、声音、图像等元素，插入超级链接，并且每年要根据情况更新相应的多媒体素材，这需要投入大量的精力。此外，多媒体教学的采用对教师的教学互动、课堂管理、重点难点管理和学生逻辑思维能力培养等都提出了更高的要求。因此，学校要完善相应的激励机制，如可定期举行多媒体教学课件比赛，给予多媒体教学较传统板书教学更高的工作量系数，将多媒体教学与评优评先挂钩，引导教师积极开展多媒体教学。

　　最后，要构建多媒体教学评价体系。多媒体教学作为一种重要的教学手段，将在中职课程教学中长期存在。要鼓励教师革新教学手段，开展多媒体教学，制定多媒体教学课件制作、教学方法和教学质量评价标准，并构建科学合理的教学评价体系。每学期期初和期末应由教务处统筹、各个系牵头进行教学课件审查，对于教学内容消极、不符合教学要求的，应要求进行整改。要不定期地安排同行和督导对多媒体课件制作质量、教学方法和教学质量等进行评价，期末组织学生进行教学评价，从课件内容与教学大纲的吻合度、课件制作质量、课程考核、专家评教、同行评教、学生评教等方面进行综合评价并形成长效机制，以此促进教师提高对多媒体教学效能的认知和使用的动力，激发教师开展多媒体教学研究与创新的主观能动性，从而有效地提升教学效果。

　　http://

　　参考文献：

　　[1]郭晓光.多媒体教学与板书教学的再认识[J].中国教育学刊，2014（2）：71-74.

　　[2]周媛.高校多媒体教学效果调查分析与策略研究[J].中国大学教学，2010（2）：86-88.

　　[3]魏文忠，王寄鲁，吴玉阁.对多媒体教学效果的调查与分析[J].现代教育技术，2007，17（9）：35-37.

　　[4]王娟.影响高校多媒体教学效果的因素分析与建议[J].电化教育研究，2009（5）：96-99.

　　[5]张芝花.大学英语多媒体教学效果的模糊综合评价与分析[J].教育理论与实践，2010（11）：54-55.

　　[6]王淑芬.基于学生角度的高校财管类多媒体课堂教学效果的优化[J].中国教育信息化，2011（21）：65-67.

　　非参数检验篇3

　　关键词协方差；U统计量；渐近正态性；假设检验；渐近相对效率

　　中图分类号O212.7 文献标识码A 文章编号10002537（2013）05000106

　　众所周知，U统计量检验法是解决非参数统计结构中检验的一种有效方法.关于U统计量的研究目前已取得一些成果[115].本文利用U统计量构造了这类问题的一种检验方法，同传统方法相比，适合于更加宽泛的场合：不仅适用于总体分布类型已知但含有未知参数的参数统计结构，而且也适用于总体分布完全未知的非参数统计结构.当总体服从二维正态分布时，与经典Pearson矩相关系数检验法相比，渐近相对效率为1.

　　给出了一个检验总体分布协方差差异的U统计量检验方法，自然要研究其功效，但由于其备择假设是复合假设，求出功效有一定困难.此时可以与已知这类问题的典型方法进行比较.方法是首先使得比较的两个检验取相同的水平α，并且取得相同的功效β，比较如果要达到水平α和功效β时所需要的样本容量，所需要的样本容量比较小的那个检验为好.而Pitman渐近相对效率[7]就是两个检验所需样本容量之比的极限.

　　因为当（X，Y）是二维正态分布时，Pearson矩相关系数检验法是最典型的检验两个变量线性相关关系的参数检验方法.所以本法应与相关系数检验法进行比较.

　　即当总体为二维正态总体时，U统计量检验法与传统的经典的Pearson矩相关系数检验法相比渐近相对效率为1.

　　综上，可以看出，本文所给出的U统计量检验法同传统的Pearson样本矩相关系数检验法相比，适合更加宽泛的场合，不仅适用于总体可以是任意分布甚至是总体分布未知的情形，而且在总体服从二维正态分布时，还有相同的功效，确实是一种检验二维总体协方差的实用办法.同时也说明用样本协方差检验相关性对于是否是正态总体具有稳健性.

　　参考文献：

　　[1]YOSHIHARA K. Limiting behavior of Ustatistics for stationary， absolutely regular processes[J]. Probability Theory Related Fields， 1976（35）：237252.

　　[2]宋立新，赵志文，陈鲲. 两总体分布均值相等的U统计量检验法[J].吉林大学学报：理学版， 2010，48（6）：957960.

　　[3]陆媛媛，宋立新.单个总体方差差异的U统计量检验法[J].吉林大学学报：理学版， 2011，49（6）：10641067.

　　[4]王芳，崔恒建，金蛟.分布对称中心的U检验方法[J].北京师范大学学报：自然科学版， 2009，45（1）：1721.

　　[5]张奕. U统计量一矩不等式及其应用[J]. 杭州大学学报：自然科学版， 1995，22（4）：352358.

　　[6]周慧，林正炎.U统计量对数律的精确渐近性[J].数学物理学报， 2012（1）：4154.

　　[7]王敏.两总体方差差异的U统计量检验法[J].汕头大学学报：自然科学版， 2013（1）：16.

　　[8]陈希孺，方兆本，李国英，等.非参数统计[M].上海：上海科学技术出版社， 1989.

　　[9]孙山泽.非参数统计讲义[M].北京：北京大学出版社， 2002.

　　[10]陈希孺.数理统计引论[M].北京：科学出版社， 2007.

　　[11]王静龙，梁晓筠.非参数统计分析[M].北京：高等教育出版社， 2006.

　　[12]张尧庭，方开泰.多元统计分析引论[M].北京：科学出版社，1997.

　　[13]宋立新.二维正态总体相关性的假设检验[J].吉首大学学报：自然科学版， 2011，32（3）：2426.

　　非参数检验篇4

　　关键词：Friedman检验；Spearman秩相关系数检验；基金公司

　　中图分类号：F27文献标识码：A文章编号：1672-3198（2008）07-0229-02

　　1 样本、数据和操作方法

　　国内现在共有59家基金公司，我们根据其旗下基金数目选取排在前十位的基金公司，它们分别是：华夏、国泰、华安、博时、嘉实、大成、富国、易方达、南方、鹏华十家基金管理有限公司。

　　本文使用的大部分数据均来自Wind资讯，同时采用年几何平均风险收益率来度量各家基金公司的投资绩效，计算公式是：

　　n为根据时间频度决定的收益率个数。

　　2 具体检验过程

　　2.1 Friedman区组检验

　　Friedman分析方法是一种用于有交互作用的双因子方差分析的非参数统计方法。它在检验中考虑到了不同区组（即本例中不同年份）的影响，将处于同一区组的样本观测值由小到大排列求其相应的秩，并计算秩的组间平方和。本例中，由于不同年份的几何平均风险收益率有一定的联系，所以可用Friedman分析方法进行分析，以判断十家基金公司是否存在不同的风险收益率。

　　同样由P值可以看出，对公司因素来说，F=3.26，P=0.005

　　2.2 Spearman秩相关检验

　　既然各家基金公司的投资绩效有显著的不同，那么投资者可能就会关心一个企业的年平均收益率到底受到什么因素的限制。对于这个问题，很多人会不假思索地认为规模越大的基金公司带来的收益率也越大，为了说明这个看法是否正确，我们拟定使用非参数统计分析中的Spearman秩相关方法进行检验。

　　Spearman相关系数检验不同于参数统计中的相关检验，它是利用两变量的秩次大小作线性相关分析，对原始变量的分布不作要求，属于非参数检验。它的检验统计量是：

　　可以发现，2003-2006各年度各基金公司总资产净值与收益率并不存在相关性，这也就间接说明了在短期内，各家公司的投资绩效与其投资规模并没有相关关系。

　　3 结论

　　从以上通过非参数统计方法得到的结论可以看出，目前中国国内的各家基金公司的投资绩效存在着明显的差异，这可能与各家基金公司的管理水平、管理方法等因素有关，但我们不能认为它们的差异会受到自身规模的影响，因为通过Spearman秩相关系数检验得到P值都表明我们没有足够的理由拒绝原假设：两者相互独立。

　　希望国内投资基金的中小“基民们”，在选择投资哪支基金时，不能仅仅考虑基金公司的规模大小，一定要综合考虑基金公司的管理能力、风险规避能力以及当时的市场状况，这样方能使自己的投资立于不败之地。

　　参考文献

　　［1］王静龙,梁小筠.非参数统计分析［M］.北京：高等教育出版社,2006.

　　非参数检验篇5

　　[关键词]区间估计的精度枢轴量 UMAU

　　[中图分类号]O212.1 [文献标志码]A

　　引言

　　基于统计数据对未知的参数进行统计推断在实践中有着广泛的应用，其理论基础就是数理统计的两个重要分支，即参数估计和假设检验。参数估计问题又包括点估计和区间估计，其中区间估计问题相对于点估计而言有着独特的优势，它不仅给出了参数的存在范围，而且还给出了该范围包含参数的可信度。区间估计问题不仅和参数的假设检验密切相关，而且，当参数的置信区间收缩为一个点时区间估计就退化成了点估计，即区间估计问题也可以视为点估计的推广。众所周知，刻画一个参数的区间估计优劣的指标是精度和信度，信度是指置信区间包含参数真值的概率，而区间估计的精度可通过置信区间的长度（长度越小精度越高）或置信区间包含参数非真值的概率（概率越小精度越高）来表示。人们自然希望参数区间估计的精度和信度都越高越好。然而，一定条件下，提高了区间估计的精度就会降低区间估计的信度，反之亦然。所谓最优置信区间，就是在一定的置信水平下，精度最高的置信区间，然而这样的区间一般并不存在。于是，人们转而探求在选定枢轴量或附加无偏性等前提下的最优区间估计问题。文献中对参数区间估计的精度问题已有许多的讨论，提出了不同的算法。比如，对均匀分布中参数最优置信区间的讨论[1]，[2]，伽马分布中参数的最优区间估计的研究[3]，正态总体方差最优置信区间的算法[4]，[5]，对非对称分布参数置信区间的讨论[6]，对参数区间估计问题与假设检验的关系的研究[7]，以及关于最优风险无偏区间估计的讨论[8]等。本文基于枢轴量方法讨论了区间估计精度的两种不同表示，及其与对应的双边检验问题的关系问题，证明了当选定的枢轴量为参数的线性函数时求解平均长度最小的置信区间问题可简化为确定最小接受域的优化问题，最后，通过实例说明了用数值算法求解最短置信区间的基本思想。

　　置信区间精度的讨论

　　参数的区间估计问题和参数的假设检验问题密切相关。一般说来，参数的假设检验问题也可以通过区间估计的方法来处理。然而，这两个问题又不完全等价。为了说明区间估计的精度以及区间估计与对应假设检验问题的关系，我们首先引入几个相关的基本概念。

　　求解参数的区间估计问题有枢轴量方法，信仰分布方法，似然比方法，渐进分布方法，Bootstrap自助法等许多的方法。其中，枢轴量方法是求解参数区间估计问题最常用的一个方法。借助枢轴量方法来求解正态总体参数的区间估计问题时，涉及到的枢轴量的分布可能是标准正态分布，卡方分布，F分布，或T分布，这些分布的密度函数有一个共同的特点，就是他们都是单峰函数。事实上，当所选取的枢轴量的分布具有单峰密度函数形态时，可以证明，一定置信水平下置信区间长度最小的置信区间一定是存在的而且是唯一的。

　　引理[11]设，x1，x2，…，xn是来自总体ξ的样本，总体ξ的分布函数为F（x，θ），θ，为未知参数，枢轴量T=（T1，…，Tn；θ）的分布密度函数为p（x），假定p（x）与θ无关，且是单峰一阶可微函数，则θ的最优置信区间存在而且是唯一的。

　　参数的区间估计问题与参数双边假设检验问题密切相关，如果区间估计的精度用包含非真值的概率最小为标准，那么与参数θ的置信水平为1-α的一致最优无偏（UMAU）区间估计问题对应的就是关于原假设H0∶θ=θ0的水平为α的双边一致最优势无偏检验（UMPU）问题。即参数θ的置信水平为1-α的所有无偏区间估计中，包含非真值概率最小的置信区间可以由对应的UMPU检验问题导出。尽管这个导出的置信区间的长度不一定是最短的，但在θ所有无偏置信区间中它一定是平均长度（置信区间长度的数学期望）最小的。

　　若选取的枢轴量不是或不能变换成参数θ的线性函数，此时要寻找一定置信水平下长度最短的置信区间，可借助数值算法来实现。其基本思想是若a≤T（X，θ）≤b等价于

　　最后，我们用一个正态总体方差区间估计的例子来对比说明，优化算法与教材中传统的等尾截取方法得到的置信区间长度的差异。设已知正态总体容量为n的一个样本，样本方差S2=0.5419。对于不同的样本容量n（5～20），分别用传统等尾截取方法和黄金分割优化算法求得的总体方差置信水平为95%的置信区间，结果如表2所示（Text_Chi2表示运用传统方法的解，New_Chi2表示优化算法的解）：

　　如表所示，样本容量越大，优化算法对σ2置信区间的精度提高的就越小。这是因为随着样本容量的增加根据中心极限定理，枢轴量的分布越来越趋近于正态分布。但当样本容量较小时，相比于优化算法用传统的等尾截取的方法得到的置信区间精度较低，即教材中一般采用的等尾截取的方法只适用于样本容量较大的情形。

　　结论

　　围绕提高参数区间估计的精度问题，讨论了区间估计精度的两种不同表示及与之相关的双边检验问题的关系。证明了基于参数的线性枢轴量求解平均长度最小置信区间的问题可简化为最小接受域的优化问题。最后，通过一个实例说明了用数值算法求解总体方差最短置信区间的基本思路，揭示了传统等尾截取方法的使用范围。

　　[参考文献]

　　[1]曾艳.均匀分布参数的最短置信区间[J].赤峰学院学报（自然科学版），2011，9.

　　[2]潘高田，胡军峰.小样本的均匀分布参数的区间估计和假设检验[J].数学的实践与认识，2002，32（4）.

　　[3]姜培华.伽玛分布参数的最优区间估计和最佳双边检验[J].安庆师范学院学报，2010，16（2）.

　　[4]王建华，张来成.正太总体方差的最短区间估计和最佳双边检验[J].数学实践与认识，2003，33（2）.

　　[5]姜培华.两正太总体方差比的最优区间估计和最佳双边检验[J].菏泽学院学报，2011，33（2）.

　　[6]张庆平.非对称分布置信区间的分析[J].统计与决策，2007（9）.

　　[7]陈乃辉.关于区间估计与假设检验的最优性[J].工科数学，2002，02.

　　[8]崔雅莉.最优风险无偏区间估计探究[J].时代教育，2011，8.

　　[9]刘剑平，朱坤平，陆元鸿.应用数理统计[M].上海.华东理工大学出版社，2012.

　　[10]茆诗松，王静龙.高等数理统计.第二版[M].北京：高等教育出版社，2006.271-300.

　　[11]孙慧玲.用非线性规划证明最短置信区间存在性与唯一性[J].北京联合大学学报，2008，22（4）.

　　[12]E. Rozeta， S. Rudazb， R.D. Marini， E. Ziémons， B. Boulanger， Ph. Hubert. Models to estimate overall analytical measurements uncertainty：Assumptions， comparisons and applications[J]. Analytica Chimica Acta，2011，702，160-171

　　[13]Albert Vexler ， Sergey Tarima. An optimal approach for hypothesis testing in the presence of incomplete data[J]. Ann Inst Stat Math，2011，63，1141-1163.

　　非参数检验篇6

　　关键词： TAR与M-TAR模型；Monte-Carlo模拟；非对称性；检验势

　　中图分类号：F224.0 文献标识码：A 文章编号：1003-5192(2008)06-0067-06

　　Research into the ADF and PP Methods in Asymmetric Unit Root Test

　　LIU Han-zhong1, LI Chen-hua2

　　(1. College of Economics and Commerce, Hunan University of Commerce, Changsha 410205, China; 2. Academe of Economics and Management, Hunan University ofCommerce, Changsha 410205, China)

　　Abstract:Economic theory often predicts that some economic variables display asymmetric threshold autoregressive adjustments towards their long-run equilibrium, but standardADF and PP test methods are misspecified in this case, consequently, may suffer from a lack of power against such alternatives. This paper aims to study the power of ADF and PP against such alternatives as TAR or M-TAR, and analyse some reasons for that. Mont-Carlo experiments demonstrate that the Asymmetry and mean-reversion of the data plays a important role in the power of ADF and PP methods; and when the Asymmetry and mean-reversion is very strong, the power of ADF and PP test falls dramatically, but the PP method is less powerful than the ADF test.

　　Key words:TAR and M-TAR model; Monte-Carlo simulation; asymmetry; test power

　　1 引言

　　在现代经济学的数量分析中单位根检验已经成为不可缺失的重要方法，众所周知许多经济变量呈现出非平稳的数据生成过程（DGP），其中单位根过程（即I(1)过程）无疑是最主要的数据形式，因此对变量进行单位根检验可以避免经典回归分析中的“伪回归”问题，因为如果对相互独立的单位根过程进行回归分析时，回归方程往往会通过所有的显著性检验。目前ADF和PP法已经成为了单位根检验的最主要方法，但是ADF［1］和PP［2］都是基于线性自回归模型而构造的，对非线性自回归模型的单位根检验并不适用［3~5］，同时在非线性自回归模型中应用最广泛的是阈值自回归模型［6］，刻画了自回归“衰减”随着一些变量值的不同而呈现不同的“衰减”速率；冲量阈值自回归模型(Momentum-TAR，简记为M-TAR)是由Enders和Granger［7］引入到经济分析，刻画了自回归“衰减”随着一些变量变化程度的不同而呈现不同的“衰减”速率。Perron［8］认为当时间序列数据在任何时候发生突变时，即使变化前后的两段都各自表现出平稳性，仍会使单位根检验的检验势大大下降。虽然Perron首次发现了这个问题，但是他只是对时间轴上发生的结构突变情况进行了研究，而本文是对TAR或M-TAR下的单位根检验势进行系统研究。Balke和Fomby［3］运用Engle-Granger［9］的两步协整检验法，对ADF和PP分别在EQ-TAR、Band-TAR与RD-TAR三种阈值自回归误差下的检验势进行了模拟研究，但是没有对ADF和PP检验在非对称单位根检验中的适用性进行研究，因此本文将对ADF和PP方法在非对称TAR和M-TAR模型下的检验势进行模拟研究与原因分析。

　　2 TAR、M-TAR模型和单位根检验

　　2.1 TAR模型

　　根据Tong对TAR模型的描述，TAR模型的定义如下

　　在以上模型中，每个Ai上拟合一个线性自回归模型，分割由转换变量Xt-d来确定，通常由下式来决定：Ai=（γi-1,γi］，-∞=γ0＜γ1＜…＜γk=∞，在这里γi是阈值（Threshold Value）。事实上该模型是自激励阈值自回归模型（Self-exciting Threshold Autoregression，简记为SETAR）的一种特殊形式，它可以广泛用于不同领域的各种非线性建模，包括经济学、环境科学、金融学以及人口动力学等。在这个模型中，我们假定阈值是不连续的（Discontinuity），如果阈值是连续的，则此时的模型被称为光滑转换自回归模型（Smooth Transition Autoregression,简记为：STAR），这个模型已被Granger和Terasvirta［10］详细讨论过，国内许多学者［11］也对该模型在我国货币政策中的应用研究作了详细的讨论。在本文中由于简单起见我们只讨论当阈值是不连续的情形。

　　2.2M-TAR模型

　　冲量阈值自回归模型（Momentum Threshold Autoregression，简记为M-TAR）由Enders和Granger引入到经济分析中，与TAR模型的主要区别在于转换变量不同。在TAR模型中以滞后的时间序列作为转换变量。而在M-TAR中，转换变量不再是滞后的时间序列，而是滞后的时间序列变化量，其它变量含义与TAR模型相同。即

　　（3）式和（1）式的唯一区别在于：在（1）式的TAR模型中转换变量是Xt-d，而在（3）式表示的M-TAR中转换变量不再是Xt-d，而是ΔXt-d。Enders和Granger认为TAR模型可以捕捉时间序列中的“深”的特征，而M-TAR模型可以捕捉时间序列的“尖”特征。时间序列的“深”和“尖”特征是由Sichel［12］在研究美国的GNP、失业率与工业总产值的周期波动过程中，发现它们的周期波动呈现“深”(Deepness)和“尖”(Sharpness)的非对称特征，所谓“深”是长期趋势以下的周期成分和长期趋势之上的周期成分的“衰减”(decay)速度不一样。所谓“尖”是指上升的周期成分与下降的周期成分呈现不同的“衰减”速度。Enders和Siklos［13］也对TAR模型和M-TAR模型的性质作了详细的比较研究。

　　2.3 单位根检验

　　传统的单位根检验假定时间序列是线性和具有对称调整机制，即基于以下的回归模型

　　ΔXt=θXt-1+εt(4)

　　其中εt是白噪声序列或具有自相关的随机项，对(4)式进行对称单位根检验的主要方法是DF、ADF和PP检验。如果接受原假设即θ=0，则认为Xt是单位根过程，反之认为是对称调整的平稳过程。即ADF和PP检验的原假设和备择假设为

　　H0：单位根过程H1：对称调整的平稳过程

　　而随着经济理论的发展，许多经济变量呈现出非对称的调整行为，这种非对称调整机制可以通过阈值自回归模型（即TAR）或冲量自回归模型（即M-TAR）来刻画，且在交易成本等经济分析中具有非凡的应用价值。因此具有非对称调整行为的单位根检验中，原假设和备择假设分别为

　　H0：单位根过程

　　H1：非对称调整的平稳过程（TAR或M-TAR模型）

　　如果采用传统的ADF对以上原假设进行检验是不适用的，因为ADF方法是针对线性自回归模型而构造的，对非线性自回归模型并不适用［14］，但是Pippenger和Goering并没有对PP单位根检验法在非对称单位根检验中的适用性进行研究，因此本文采用Monte-Carlo模拟来揭示ADF和PP方法在非对称单位根检验中的适用性；同时由于经济分析中普遍存在异方差，所以也对ADF和PP法在异方差下的检验势进行了MC模拟研究。

　　3 ADF和PP检验在TAR与M-TAR模型下的检验势研究

　　3.1 在TAR下的检验势研究

　　为了进行MC模拟研究，我们特构造以下的Two-Regime的TAR模型

　　Xt=ρ1X

　　首先根据(5)式和（6）式分别生成Two-Regime或Three-Regime阈值自回归模型Xt。为了应用ADF和PP检验，对随机误差项εt施加自回归条件：εt=0.6εt-1+ηt，其中ηt是相互独立的N（0,1）。如果是异方差情形，对随机变量ηt的方差施加GARCH(1,1)的异方差，其表达式为：σ2t=1+0.12t-1+0.85σ2t-1，在模拟中样本容量T=50、100、200，每种情形模拟1000次，所有初始值都设为0，方差的初始值设定为1，因此为了消除初始值的设定对检验所带来的影响，模拟中去掉数据列的前200个数据。显著性水平分别为5%、10%，利用AIC准则确定最佳滞后阶数。

　　从表1得出如下结论：首先，不论是同方差还是异方差，ADF和PP检验会随着模型的非对称性程度越大(即在Two-Regime的TAR模型中，不同Regimes中自回归系数相差越大或在Three-Regime模型中，除中间Regime之外的自回归系数相差越大)，则检验势都呈下降趋势，但是PP法的检验势比ADF的检验势下降幅度要大，如在样本容量为200、5％显著性水平下，随着非对称程度的加大，同方差下ADF的检验势由1.0下降到0.304，而PP的检验势由1.0下降到0.203；在异方差下ADF的检验势由0.995下降到0.301，而PP的检验势由1.0下降到0.210。这主要是因为当非对称程度越大，ADF和PP法具有越严重的设定误差，会导致检验势下降；而另一方面由于非对称程度加大使得数据的均值回复时间发生变化而导致检验势发生变化，两种效应叠加使得ADF和PP检验势下降。其次，在每一种情形中，两种方法的检验势都随样本容量的增大而增大，但是PP法的检验势随样本容量增大而增加的幅度在大多数情形比ADF法要大，可能的原因在于PP法是一种非参数方法，要求更多的样本；第三，在Three-Regime的TAR模型的检验势要低于Two-Regime的TAR模型的检验势，这主要是因为在Three-Regime的TAR模型的中间Regime服从单位根过程，增大了数据过程的均值回复时间；第四，是否存在异方差对ADF和PP的检验势没有明显的规律性影响。第五，在Three-Regime的TAR模型的检验中，随着中间Regime的单位根过程的加宽，ADF和PP检验势呈现出没有规律性的变化，原因在于加宽中间Regime的单位根过程的不同设定具有不同的均值回复时间，因而ADF和PP检验势也会发生变化。

　　3.2 在M-TAR下的检验势研究

　　首先生成冲量阈值自回归模型Xt，数据生成过程同（6）式，只是此时的转换变量为ΔXt-1，参数的设定、显著性水平、样本容量以及GARCH异方差形式与TAR模拟相同，表2为模拟结果。

　　从上面的模拟结果来看，首先，ADF和PP在检验M-TAR时比检验TAR时具有较高的检验势，可能的原因在于在其它条件(自回归系数都是大于0的正数，在经济时间序列中往往如此)都相同的情况下，M-TAR模型的“持久性”(persistence)一般要小于相应的TAR模型，因而在M-TAR模型中的均值回复时间往往要小于TAR模型的均值回复时间，这样M-TAR模型的ADF和PP统计量比TAR模型的ADF和PP统计量要更加左偏，拒绝单位根原假设的概率也增大。“持久性”反映了数据的均值回复时间的长短特征，如在一阶线性自回归即AR(1)模型中，当一阶自回归系数(大于0的正数)较大时，则数据的均值回复时间较长，“持久性”也较强，当一阶自回归系数(大于0的正数)较小时，则数据的均值回复时间较短，“持久性”也较弱；其次，在Two-Regime和Three-Regime的M-TAR模型中，随着非对称程度的增加，ADF和PP的检验势都呈上升趋势。究其原因在于随着M-TAR的非对称程度加大，一方面检验式的设定误差会导致ADF和PP检验势下降，而另一方面非对称程度加大使得数据的均值回复时间发生变化而导致检验势发生变化，两种效应叠加使得ADF和PP检验势上升。这与TAR模型下的ADF和PP的检验势变化趋势正好相反。第三，在异方差下两方法的检验势影响不明显。第四，在Three-Regime的M-TAR模型中，随着中间Regime的单位根过程加宽对ADF和PP法的检验势影响也不明显，具体的原因在于中间Regime的单位根过程加宽的数据设定的不同也是影响ADF和PP检验势的主要原因。

　　4 结论

　　ADF和PP检验虽然已经成为单位根检验的标准化方法，但是近年来随着经济学理论的发展，许多经济变量具有非对称自回归非线，因此新的非对称单位根检验方法论的研究已经成为目前时间序列计量经济学的重要领域之一。显然传统的ADF和PP单位根检验法由于检验式的设定误差已经不能适应非对称单位根检验。本文的模拟结果也显示了随着序列的非对称程度的加大，在TAR模型下ADF和PP的检验势都呈下降趋势；而在M-TAR下ADF和PP的检验势都呈上升趋势。究其原因：随着TAR或M-TAR的非对称程度加大，一方面ADF和PP检验式的设定误差也增大，因而其检验势也下降；而另一方面非对称程度加大使得数据的均值回复时间发生变化而导致检验势发生变化，两种效应叠加使得ADF和PP检验势在不同的模型下具有不同的变化规律。其次，在非对称程度保持不变，而转换变量不同，此时M-TAR的检验势要高于TAR模型的检验势，究其原因：TAR模型比M-TAR模型回复均值的时间要长(即“持久性”较大)，因而M-TAR模型的检验势要高于相应的TAR模型的检验势。再次，在非对称程度和转换变量都相同的情况下，Three-Regime的TAR或M-TAR比相应的Two-Regime的TAR或M-TAR模型的检验势要低，究其原因：在Three-Regime中由于中间Regime中数据呈单位根过程，所以数据序列的均值回复时间比Two-Regime数据序列的均值回复时间要长，因而“持久性”也较强导致检验势下降。另外由于ADF和PP检验式的设定不同，ADF法的检验式是根据信息准则来确定滞后阶，不同的信息准则就有可能得到不同的滞后阶数，因而有可能得到不同的结论。因此在同一模型的单位根检验中，在检验式的设定上PP法比ADF法具有优势，原因在于：PP检验通过非参数方法可以全部剔除干扰项自相关对检验所带来的影响(检验式中不包含被解释变量的滞后项)，而ADF只是通过增加滞后项来减弱自相关的影响，不同的信息准则具有不同的滞后阶数。但是在我们的MC模拟中反映出大多数情况下ADF检验势要高于PP检验势，其中可能的原因在于样本容量较小。由于PP是非参数方法，它的有效性要求样本容量较大，所以随着样本容量的增大PP的检验势增加较ADF法快，这一点在我们的结果中得到了充分的反映。最后，ADF和PP法在非对称单位根检验中，异方差对两方法的检验势不存在明显的规律性影响。还有一点需要说明的是在理论上随着Three-Regime的TAR或M-TAR模型中间Regime的单位根过程加宽，会导致ADF和PP的检验势下降，而在模拟中表现不明显，原因在于加宽中间Regime的单位根过程的不同设定具有不同的均值回复时间，因而ADF和PP检验势也会发生变化。

　　参考文献：

　　［1］Dickey D A, Fuller W A. Likelihood ratio statistics for autoregressive time series with a unit root［J］. Econometrica, 1981, 49: 1057-1072.

　　［2］Phillips P C B, Perron P. Testing for a unit root in time series regression［J］. Biometrika, 1988, 75: 335-346.

　　［3］Balke N S, FombyT B. Threshold cointegration［J］. International Economic Reviews, 1997, 38(3): 627-645.

　　［4］刘汉中.Enders-Granger方法在协整检验中的应用研究［J］.数量经济技术经济研究,2007,24(8):137-144.［5］刘汉中.具有GARCH(1,1)-正态误差项的非对称单位根检验研究［J］.统计研究,2007,24(11):74-79.

　　［6］Tong H. Threshold models in non-linear time series analysis［M］. New York: Spinger-Verlag, 1983.

　　［7］Enders W, Granger C W. Unit-root tests and asymmetric adjustment with an example using the term structure of interest rates［J］. Journal of Business & Economic Statistics, 1998, 16(3): 304-311.

　　［8］Perron P. The great crash,the oil price shock and the unit root hypothesis［J］. Biometrika, 1989, 57: 1361-1401.

　　［9］Engle R F, Granger C W J. Cointegration and error correction: representation, estimation and testing［J］. Econometrica, 1987, 55(2): 251-276.

　　［10］Granger C W J, Terasvirta T. Modeling nonlinear economic relationship (advanced texts in econometrics)［M］. Oxford University Press, New York, 1993.

　　［11］王少平,彭方平.我国通货膨胀与通货紧缩的非线性转换［J］.经济研究,2006,(8):35-44.

　　［12］Sichel D E. Business cycle asymmetry: a deeper look［J］. Economic Inquiry, 1993, 31(2): 224-236.

　　非参数检验篇7

　　关键词：中小企业；财务风险；因子分析；多项logistics分析方法

　　世界经济尚未从危机中回复，企业的生存条件恶劣，而中小企业更是由于经济基础差、技术管理水平低、规模小、发展时期短、融资困难以及经验不足等问题的限制，面临着更为严峻的生存压力。这种情况下，建立一个更具个性化的有效的财务风险预警模型满足中小企业上市公司财务风险预警工作的实际需要。

　　1、我国中小企业上市公司财务风险预警模型的提出

　　我国中小企业上市公司财务风险预警模型应在中小企业自身一些特定条件下运用会计要素及其结构指标针对风险因素进行描述、分析、预测，最终形成具有中小企业上市公司自身特点、特色的中小企业上市公司财务风险紧急预案。

　　1.1财务风险预警模型的几个前提

　　（1）中小企业上市公司的特异性是通过某项指标进行统计学分析后获得的，并以此作为中小企业上市公司的特异性的来源，本文以行业细分作为代表，在实际应用中可以再用资本额、所属地域等指标进行细分，目的是保证中小企业上市公司的特异性具有实际上的比较意义。

　　（2）模型形成的变量不是一个判断值则只是一个描述值，描述值的目的是为了满足中小企业上市公司财务风险紧急预案在数值描述上的需求，避免仅靠判断值分析公司财务风险，而转化为序列描述值的综合判断。

　　（3）中小企业上市公司财务风险紧急预案是中小企业上市公司财务风险预警模型数据序列描述值的实际预警值启动程序。

　　1.2模型分析方法

　　一是采用多个独立变量非参数检验方法，用于判定不同行业间的差异是否存在，为下一步模型检验提供依据。二是多项Logistic模型分析，用于在多个独立变量非参数检验方法判定行业差异化后，进行财务模型指标的选择。

　　2、实证测算分析

　　2.1中小企业上市公司财务数据来源

　　从A股市场选取中小企业上市公司77家，数据报告取自国泰安数据库官方网站，为了研究的方便，本文将制造业作为基准行业，即行业4，房地产、综合定义为行业1，IT、电力、化工、纺织、服务定义为行业2，其他类别定义为行业3，通过4个行业的分析，分析与基准行业4制造业的差异。

　　2.2变量选择

　　从企业财务报告中披露的偿债能力、营运能力、盈利能力、成长能力、现金流量指标五个方面选取了资产负债率等20个财务指标作为自变量进行分析。

　　2.3多个独立变量非参数检验

　　以行业为分组变量进行检验，采用Kruskal-Wallis H检验和中位数检验。

　　由分析结果可见，流动比率、速动比率、营运资金比率与行业相关。

　　以中位数检验，可以得到利息保障倍数、总资产净利润率、销售净利率、计算结果。可以得到利息保障倍数、总资产净利润率、销售净利率与行业有关。

　　所以在之前的研究中以中小企业上市公司财务数据来源中ST、非ST分类，事实上是具有局限性的，尽管在研究中数据出现了Kruskal-Wallis H检验和中位数检验不一致的原因，但是可以明确的是针对不同的行业进行的我国中小企业上市公司财务风险预警模型研究更具有针对性，更适合企业进行序列描述性工作。

　　2.4多项Logistic模型分析

　　选定了20个变量进行非参数检验以判断与行业的关系，实际上在多项Logistic模型分析过程中，变量自身也存在着相关性，指标包含的信息可能存在许多重叠部分或冗余部分，容易使真实信息被扭曲进而导致做出错误的判断。所以首先进行数据简化分析工作，采用因子分析来进行此项工作。

　　先对量表进行KMO测量和Bartctt球体检验， KMO值为0.629，大于0.6，表明适合进行因素分析； Bartlett’s球形检验结果P值小于0.001，拒绝相关系数矩阵为单位阵的原假设，说明各指标间的相关性较强，可以进行因子分析。因子分析结果表明六个因子基本上符合了要求，六个因子（即：流动比率X1、速动比率X2、现金比率X3、营运资金比率X4、资产负债率X5、股东权益比率X6）共解释总方差72.042%，基本能代表原变量方差的信息。所以在多项Logistic模型分析过程中，选取6个主成分带入后向逐步法引入变量，回归方程，模型显著。

　　所以参照行业4，行业1、2、3有以上回归方程，通过研究77家中小企业上市企业运用多项Logistic模型实证分析出了以行业为特异性代表的中小企业上市公司财务风险预警模型。由于本文是根据方程最终拟合值计算指标数，所以多项Logistic回归未进行显著性剔除，目的是结合多个独立变量非参数检验分析结果更为直接的反映中小企业上市企业实际模型计算数值，提高拟合度。

　　变量中流动比率X1、速动比率X2、营运资金比率X4、资产负债率X5显著，预警模型方程为：以行业4为基准

　　Logit[P(行业=1|X1,X2,X4,X5)]=-1.904+1.557X1-2.931X2-0.509X4-0.395X5

　　Logit[P(行业=2|X1,X2,X4,X5)]=-1.441-1.171X1+2.061X2-0.485X4-0.379X5

　　Logit[P(行业=3|X1,X2,X4,X5)]= 2.352-6.896X1+5.312X2+0.315X4-0.730X5

　　由此可见，不同情境模式下（本研究以行业为基准）是不同的，所以在之前的研究中以ST、非ST分类是存在一些欠缺的。

　　7.1 研究结论

　　1. 非参数检验过程说明，针对不同情景，财务指标的差异性是存在的，以上虽然采用Kruskal-Wallis H检验和中位数检验，所提示的财务指标项目并不相同，甚至没有交集，主要原因是数据，个别行业的样本数太少，更大规模的数据验证工作可以完成更为准确的行业公司财务风险预警模型设计工作。

　　2. 多元Logistic模型与一般的ST、非ST分类不同在于，情景模式的多元使得多元Logistic模型代替了二元Logistic模型，增加了数据计算量，同时财务指标的选择成为了更重要的内容，以上选择了20个指标，因子载荷分析后，形成了6个，在Logistic模型以这6个指标建立了涉及4种行业情景模式的Logistic模型回归方程。

　　3. 提出了解决公司财务风险问题需要有系统的预警预案机制，即公司财务风险预警模型起到的仅是数据描述作用，不应该放大公司财务风险预警模型成为判断作用，公司财务风险预警预案机制来保证公司财务风险预警成为一个系统的财务管理方法，公司财务风险预警模型是具有公司个性化特点的一个重要组成部分，整体体系需要有一个综合预防方法。

　　参考文献

　　[1] 王艳.基于Logistic回归方法的上市公司失败预警模型研究[D]，合肥:合肥工业大学.2006；

　　[2] 梁娟.我国中小企业板上市公司财务风险预警的探讨[J].科技情报开发与经济,2007（16）；

　　[3] 郭志等.我国上市公司财务困境预警研究[J].当代经理人,2006（3）；

　　非参数检验篇8

　　关键词：上证综合数据；风险测量；VaR；GARCH族模型

　　中图分类号：F830.91文献标志码：A文章编号：1673－291X（2008）16－0049－02

　　近年来，伴随着金融一体化趋势，全球金融市场在迅速发展，同时，金融市场风险也在不断增大，金融机构所面临的风险日趋复杂，主要风险已从信用风险转向了市场风险，表现为利率风险、股价风险和汇率风险的综合。针对这种情况，金融监管当局、金融机构近年来一直在不断强化市场风险的管理与监管。在险价值(Value at risk , VaR) 作为重要的金融风险管理工具之一, 在国际上已获得广泛认可。

　　国内学者在20世纪90年代引入了VaR分析方法，对某些理论和实际问题进行了深入的分析和探讨，其中，比较有代表性的有：郑文通（1997）、姚刚（1998）等介绍了VaR的内涵和度量方法；杜海涛（2000）在沪深股市的指数都服从正态分布的前提下计算了95%置信度下资产的VaR值，并进行了模型检验，其结论是VAR模型对风险的拟合结果较好；陈守东等（2002）认为中国股市并不服从正态分布，存在明显的尖峰厚尾现象和非对称性，所以建立了t-分布、GED分布假设下的GARCH模型用以计算VaR值，并和正态分布假设下得到的值作比较，认为更好反映了收益的风险特征，但该文没有用返回检验法来检验VaR值。本文在对收益率序列分布作三种不同假设的基础上，分别用GARCH、EGARCH方程来分析和度量沪市的潜在风险和波动性特征，并用返回检验法检验，从而得出了符合沪市波动特征的VaR估值模型。

　　一、VaR定义及计算方法

　　1.VaR的概念

　　VaR的字面含义是“处于风险中的价值”，具体来说，VaR是指在一定的持有期及置信度内，某一证券组合所面临的最大潜在损失，用数学公式来表示：

　　Prob（P＞VaR）=1-?琢

　　其中，P为证券组合在持有期t内的收益，VaR为在置信度?琢下的在险价值。我们用参数法来计算上证指数的VaR值。若r为证券组合持有期内的连续复利回报，则：

　　2.VaR计算的参数方法

　　（1）一般自回归条件异方差（GARCH）

　　GRACH（p，q）能够很好地刻画收益的丛集效应、非对称性等特征。但此模型对参数系数的非负性约束太强，过度限制了条件方差的动态性，且不能对证券价格的上升和下降带来的非对称性冲击作出非对称的反映。指数GRACH模型可以捕捉这种正负干扰反映的不对称性，从而更准确刻画股票的波动性。

　　EGARCH模型中条件方差采用了自然对数，且引入参数?酌，若?酌≠0，说明信息作用非对称。当?酌

　　本文采用Kupiec于1995年提出的似然比检验统计量LR来验证模型的有效性。

　　二、实证分析

　　本文使用了1997年1月2日至2007年9月28日期间上证指数每个交易日的收盘价，共2 593个样本数据（数据来源于“大智慧”）。

　　1.数据基本分析

　　由沪市股指对数收益的偏度、峰度以及检测值可知，上证综指不符合正态分布，存在明显的尖峰厚尾特征。而由上证综指的对数日收益率可看出，沪市股指收益率存在丛集效应。由于GARCH类模型能够很好地刻画收益的丛集效应、非对称性等特征，所以，本文将应用GARCH模型在正态分布、t-分布和GED分布假设下计算上证综指的VaR值。接下来用单位根方法检验时间序列的平稳性，可知上证综指对数日收益率在5%标准下是显著平稳的。

　　2.上证综指实证结果

　　从上面分析可知，日收益率序列平稳，且有尖峰厚尾等特征，因此，选用GARCH族模型来计算VaR值。根据对数似然准则、AIC准则与SIC准则，可以判断用GARCH（1，1）比较合适。

　　（1）GARCH-正态分布假设

　　从以上估计结果可知，各模型参数均在5%置信水平下显著。EGARCH模型的参数显著为负，反映了上海股票市场的杠杆效应似乎是显著的，即利空消息引起的波动比同等大小的利多消息引起的波动要大。对两模型残差作ARCH-LM检验，发现不存在显著的异方差现象，以上模型较好地刻画了上证指数对数收益率异方差现象。表格右边三列是各模型在5%显著性水平下估计的VaR值的统计结果。可以看出，两模型计算得到的VaR均值无显著差别，EGARCH模型估计的标准差要小于一般GARCH模型。估计天数相差不大，失败率均接近5%。利用LR统计量检验，在5%显著性水平下均不能拒绝原假设，所以这两个模型计算的VaR值比较准确。

　　（2）GARCH-t分布假设

　　从以上估计结果可知，各模型的参数均在5%置信水平下显著。EGARCH模型的参数显著为负。对两模型残差作ARCH-LM检验，发现不存在显著的异方差现象，所以，以上模型能较好地刻画上证指数对数收益率异方差现象。上证综指日VaR值的统计结果见表格右边三列。可以看出，在t-分布下这两个模型得到的结果无显著差别，EGARCH模型估计的标准差要小于一般GARCH模型。从返回检验结果看，t-分布下估计的VaR比较保守。利用LR统计检验，拒绝了原假设，所以，在t-分布假设下的VaR高估了风险。

　　（3）GARCH-GED分布假设

　　在GED分布下模型估计的尾部参数为1.19左右，说明收益率不服从正态分布，GED模型很好地捕捉了厚尾现象。对两模型残差作ARCH-LM检验，发现不存在显著的异方差现象，所以，以上模型能较好地刻画上证指数对数收益率异方差现象。上证综指日VaR值的统计结果显示，从失败天数与失败率来看，在GED分布假设下的GARCH模型能比较好地刻画股市波动。这三种模型计算得到的VaR均值无明显差别，估计标准差EGARCH小于一般GARCH模型。估计失败天数相差不明显，失败率接近5%。利用LR统计量检验，在5%显著性水平下均不能拒绝原假设，所以这两个模型计算的VaR值比较准确。

　　本文在对上证综指的日对数回报率分别作正态分布、t-分布和广义误差分布的假设基础上，采用了GARCH和EGARCH模型来度量沪市的风险和波动性，寻找出了拟合最优的EGARCH模型，得出了以下结论：（1）EGARCH模型在正态分布和GED分布假设下都很好地描述了各指数收益的丛集效应、非对称性和杠杆效应等特征，计算的VaR值都是有效的，VaR计算值基本涵盖了绝大部分交易日的损失；而在t-分布假设下计算得到的VaR值过于保守，除非在一些对风险值要求特别严格的场合以外，不适合用来计算值。正态分布在样本数据较多的情况下，因为其性质良好，计算简单，不失为计算VaR的好方法。（2）通过对VaR估计值序列的分析，得出我国的证券市场风险很大部分来源于政策变动的结论，管理层监管力度的加强也促使了股市风险呈下降趋势。今年，我国金融市场全面放开以及资金的流动性过剩等问题，导致资金涌入股票市场，直接导致沪深两市的风险有了较大提高。

　　参考文献：

　　[1]Bollersley,T.,Generalised Autoregressive Conditional Heteroskedasticity[J].JournalofEconometrics，1986，（311）：307-27.

　　[2]陈守东，俞世典.基于GARCH模型的VaR方法对中国股市的分析[J].吉林大学社会科学学报，2002，（4）：11-17.

　　[3]王春峰.金融市场风险管理[M].天津：天津大学出版社，2001.

　　[4]龚锐，陈仲常，杨栋锐.GARCH族模型计算中国股市在险价值分析的比较研究与评述[J].数量经济技术经济研究，2005，（7）.

　　[5]戴国强，徐龙炳，陆蓉.VaR方法对我国金融风险管理的借鉴及应用[J].金融研究，2000，（7）.

　　非参数检验篇9

　　【摘要】随着新药临床试验的开展越来越多，也越来越规范，等效性检验、非劣效性检验和优效性检验被广泛地提出，但也常遇到以传统显著性检验代替非劣效、等效和优效性检验的错误。因此，本文从样本均数的抽样分布出发，就它们的适用条件、检验目的、假设形式、公式的区别和联系进行了阐释。

　　【关键词】非劣效检验; 等效性检验; 优效性检验; 显著性检验; t检验

　　【Abstract】 Along with more and more development and standard of clinical trials of new drugs，equivalence，noninferiority test and superiority test are widely introduced.However，wrong replacements of non  inferiority，equivalence and superiority tests with traditional significance test are often encountered.Therefore，based on theoretical derivation of the sampling distribution of twosample mean difference，this article explained the applicable conditions，test purposes，hypothesis，and difference and association among the formulas of these three tests.【Key words】 equivalence test; noninferiority test; superiority test; difference test; t test

　　随着新药临床试验的开展越来越多，试验的设计和统计分析也越来越规范。根据目的不同，临床试验设计可以分为常见的差异性设计、标准阳性对照试验中的等效性和非劣效性设计，以及安慰剂对照试验中的优效性设计，其假设检验方法也随之被广泛地提出。t检验在差异性检验、等效性检验、非劣效性检验和优效性检验中都有应用，虽然其形式不尽相同，但都是t分布在假设检验检验中的应用，因此它们之间既有区别，又有密切的联系。本文将从样本均数的抽样分布出发，讨论差异性检验、等效性检验、非劣效性检验和优效性检验中t检验的区别和联系。

　　1 样本

　　均数差的抽样分布[1]设X11、X12、…、X1i、…、X1n1和X21、X22、…、X2j、…、X2n2分别是取自方差相等的总体N(μ1，σ2)和N(μ2，σ2)，且相互独立，可分别记作:X1i ～ N(μ1，σ2)，i=1，2，…，n1;X2j ～ N(μ2，σ2)，j=1，2，…，n2。则其样本均数的抽样分布分别为:

　　X1～N(μ1，σ2n1)，X2～N(μ2，σ2n2)(1)同时根据χ2分布的定义有:

　　(n1-1)s21σ2～χ2(n1-1)，(n2-1)s22σ2～χ2(n2-1)(2) 根据随机变量和的分布定理，样本均数差的分布可记为:

　　X1-X2～N(μ1-μ2，(1n1+1n2)σ2)(3)对(3)式标准化后有:

　　u=(X1-X2)-(μ1-μ2)σ1n1+1n2～N(0，1)(4)目前，如果用u作为枢轴量，以样本的信息推断总体均数之间的关系，即总体均数的情况未知时，按照枢轴量只能有一个未知参数的要求，σ就必须已知，此时便是两样本均数的u检验。但一般情况下σ是未知的，故需进一步推导。由式(2)，根据χ2分布的可相加性有:

　　(n1-1)s21+(n2-1)s22σ2～χ2(n1+n2-2)(5)依据t分布的定义:设X～N(0，1)，Y～χ2(n)，且相互独立，则t=XYn～t(n)，带入式(4) (5)可得:

　　t=(X1-X2)-(μ1-μ2)σ1n1+1n2(n1-1)s21+(n2-1)s22σ2(n1+n2-2)

　　=(X1-X2)-(μ1-μ2)(n1-1)s21+(n2-1)s22(n1+n2-2)·(1n1+1n2)～t(n1+n2-2)(6)

　　式中(n1-1)s21+(n2-1)s22(n1+n2-2)为两样本合并方差，常用S2c表示;

　　(n1-1)s21+(n2-1)s22(n1+n2-2)·(1n1+1n2)为两样本均数差值的标准误，记为SX1-X2。由推导过程不难发现，样本均数差的分布要转换到t分布必须满足3个条件:①样本必须来自正态总体，这里要补充说明一下的是:虽然中心极限定理能保证在样本例数足够大的情况下，不管其是否服从正态，只要是从相同分布的总体中进行的抽样，其样本均数的分布服从如式(1)的正态分布，但不能得到式 (2)，故也不能推导出式(6)的结论;②样本之间相互独立;③两组样本对应的总体方差必须相同。

　　2 t检验

　　假设检验的实质就是，直接或间接的(基于一定的分布形式)在概率的基础上，依据小概率反证法的原理，完成利用样本信息进行总体之间比较的目的。小概率反证法原理也就意味着在假设检验中，推翻假设(P≤α)更有利于做出正确的结论，因为这时犯错误的可能性是“小概率”，而且这个标准是人为事先设定的，是已知的，而且是可以控制的[2]。因此所检验的目的不同，所提出假设的形式也就不一样。t检验是t分布在假设检验中的应用，就本次讨论的问题而言，就是用成组设计得到的样本信息完成两总体均数之间的比较，根据其分析的目的和设计方法不同，也就出现了常见的差异性检验，标准阳性对照试验中的等效性检验和非劣效性检验，以及安慰剂对照试验中的优效性检验[3，4]。其目的、假设形式和检验统计量如表1所示。表1 各种t检验的目的、假设形式和检验统计量

　　3 讨论

　　假设检验的实质就是，直接或间接的(基于一定的分布形式)在概率的基础上，依据小概率反证法的原理，完成利用样本信息进行总体之间比较的目的。t检验也不例外，它是在t分布的基础上进行的一种假设检验，因此无论何种形式的t检验，其应用条件就必须和t分布由来的3个条件一致，即在σ未知的情况下要求资料正态、独立、方差齐[2]。差异性检验和等效性检验、非劣效性检验和优效性检验根本区别在于差异性检验是和0做比较，即两总体均数是否完全不等，而不管这种差别是否有专业意义;等效性检验、非劣效性检验和优效性检验是和Δ做比较，即检验在一定允许范围内的是否相等或不等，不仅要检验差别是否存在，而且更关注这种差别是否具有专业意义。在等效性检验、非劣效性检验和优效性检验中的Δ，即认为在一定范围内相等/等效的允许值，也叫等效临界值，一般认为应从专业角度反复论证并结合成本效益加以估计[2]。根据以往经验[5]，较为公认的Δ值如血压可取为0.67 kPa(5 mmHg)，胆固醇可取为0.52 mmol/L(20 mg/dl)，白细胞可取为0.5×109/(500个/mm3) 等;当Δ难以确定时，可酌取1/5～1/2个标准差，或对照组均数的1/10～1/5等，在生物利用度的等效性评价中，Δ一般取标准参照品均数的1/5，两组率的等效性检验取对照组样本的1/ 10 左右。对于等效检验来说，多采用Schuirmann[6]提出的双向单侧检验的方法(two onesided tests)，即分别对下限和上限做两次单侧的t检验。因此，为了保证总体I型错误的发生概率控制在一定水平(常用0.05)以内，是否需要利用Bonferroni方法[7]进行调整还有待进一步的考察和讨论。若需调整，两次单侧检验所得出的P1和P2则需与调整后的α水准进行比较。

　　参考文献

　　[1] 刘定远.医药数理统计方法[M].第3版.北京:人民卫生出版社，1999:6267.

　　[2] 倪宗瓒.医学统计学[M].北京:高等教育出版社，2003:8.

　　[3] 黄圣凯，韩可勤.生物等效性评价的几种统计方法[J].中国临床药理学杂志，1993，9(1):4346.

　　[4] 黄钦，赵明.对临床试验统计学假设检验中非劣效、等效和优效性设计的认识[J].药政管理，2007，23(1):6367.

　　[5] 刘玉秀，杨友春.临床试验疗效的等效性评价[J].中国临床药理学与治疗学杂志，1999，4(3):220223.

　　非参数检验篇10

　　【关键词】 VAR模型;协整检验;VEC模型;Granger因果检验

　　一、数据来源和模型

　　本文搜集了从1984年到2009年度的国内生产总值(单位为亿元)、外商直接投资实际使用金额(单位亿美元,按当年汇率的平均值转化为人民币)、和各项税收(单位为亿元),建立VAR模型分析他们之间的关系。数据来源清华金融研究数据库,使用的软件是eviews6.0。向量自回归(VAR)模型是根据数据统计的性质来建模的,其思想是把每一个外生变量作为所有内生变量的滞后值的函数来构造模型。由于VAR模型中的各个方程的右边都是滞后的内生变量,能用OLS估计可以得到一致且有效的参数估计量。VAR模型是一种非结构化的模型,即变量之间的关系并不是以经济理论为基础的。其一般形式为:

　　Yt=A1Yt-1+A2Yt-2+…+ApYt-p+B0Xt+…+BrXt-t+?着t t=1,2,3,...,n

　　其中,Yt是k维内生变量向量,Yt-p的P阶滞后内生变量向量,Xt-i(t=1,2,...,r)是d维外生变量或滞后外生向量,p,r分别为内生变量、外生变量滞后的阶数,Ai是k×k维的系数矩阵,Bi是k×d维的系数矩阵,系数矩阵为呆估计的参数矩阵。?着t是k维随即误差扰动项向量,其元素之间可以同期相关,但不能与各自滞后项相关,也不能与模型的变量相关。

　　不含外生变量的VAR模型可以写成:

　　Yt=A1Yt-1+A2Yt-2+…+ApYt-p+?着tt=1,2,...,n

　　对于多个变量非平稳的时间序列,假如他们之间存在协整关系,即一种长期的均衡关系,则可以对他们建立向量误差修正模型。VEC可以看成是包含协整关系的VAR。如果不含外生变量的Yt,若所含的k个I(1)内生变量存在协整关系,则VEC模型可以写成:

　　Yt=?琢ECMt-1+■?酌iYt-i+?着t

　　其中,ECMt-1=?茁'Yt,称为误差修正项,所以上式中的每个方程都是一个误差修正模型。误差修正模型反应了变量之间长期均衡关系即协整关系,也就是对长期均衡的偏离可以通过一系列的短期调整而得到修正。?酌i是滞后差分项的系数,Yt-i反应各短期波动对Yt的影响。

　　二、实证结果及其分析

　　为防止时间序列数据异方差现象,在此把所有的数据取自然对数。用LGDP表示取对数后的国内生产总值,用LFDI表示外商直接投资的对数值,用LTAX表示税收的对数值。

　　1.ADF检验。一般的时间序列数据都存在趋势,即是非平稳的,对于非平稳的数据进行计量模型统计推断时,参数指标的统计分布将不再服从标准的正态分布,所做的回归是一种伪回归。很明显,GDP,FDI,TAX都有增长的趋势,都是非平稳的,在建立模型之前对这三个时间序列数组进行ADF检验,ADF检验的结果如下所示:

　　表1ADF检验的结果

　　(注:D(LFDI)表示LFDI一阶差分后的统计量)

　　从ADF检验的结果可以看出LFDI,LGDP,LTAX均存在单位根,但是LFDI和LTAX的一阶差分在1%的显著水平下是平稳的,LGDP的一阶差分值小于10%检验水平下的临界值,这三个时间序列都是一阶差分平稳。

　　表2VAR模型最佳滞后阶数检验结果

　　2.建立VAR模型。由于VAR模型的滞后阶数是未知的,因此要首先确定最佳滞后阶数。根据Sims和Toda等的研究,确定VAR模型滞后阶数的方法是由一般到特殊,即从较大的滞后阶数开始,通过对应LogL,AIC,SC等参数值则由确定。由表2的评价指标可知,VAR的最佳滞后阶数为2,故在此建立VAR(2)模型。

　　对LFDI、LTAX、LGDP序列建立一个2阶VAR模型,其结果为:

　　对此VAR模型的平稳性检验,其AR特征多项式的根中有一个大于1,说明在单位圆外,此模型是非平稳。对于平稳的VAR模型可以利用脉冲响应函数来进行分析,不平稳的VAR模型进行协整检验,若存在协整关系,可以利用误差修正模型对VAR进行误差修正。

　　3.协整检验。ADF检验的结果表明这三个序列都是I(1)过程,满足协整检验的条件。在此使用的协整检验方法是Johansen和Juselius提出的基于VAR模型的协整系统检验。假设协整方程含有截距项不含有时间趋势项。协整检验的结果如图所示:

　　协整检验是按照协整关系的个数r=0到r=k-1顺序进行,直到拒绝相应的原假设。“不存在协整关系”假设的迹统计量为41.6953大于5%下的临界值,因此拒绝原假设,表明至少存在一个协整关系。再看假设“至多存在一个协整关系”,此假设的迹统计量为10.0842,小于5%的临界值15.4947,从而不能拒绝原假设,即迹统计量在5%的水平下存在一个协整关系。

　　协整方程为:

　　LFDI=0.9313LGDP+0.0308LTAX+^ut

　　在此所写的协整方程为长期均衡方程,ut为误差扰动项。

　　4.建立VEC模型。协整检验的结果表明序列FDI、GDP、TAX存在一个协整关系,建立VEC模型对施加了协整关系约束条件的向量自回归模型进行估计。VEC模型估计的结果为:

　　其中:

　　5.Granger因果检验。由于这三个变量存在协整关系,需要对建立的VEC模型进行因果关系检验,以判断这几个变量之间的因果关系。其Granger因果检验的结果如下所示:

　　EVC 模型与VAR模型Granger检验的结果相似,都是给出了每一个内生变量相对于模型中的其他内生变量Granger因果关系检验统计量和相应的概率值。表3给出了模型中的3个内生变量的检验结果,在此以变量FDI为例稍作分析,FDI相对于内生变量GDP的统计量为12.3947,相对应的概率为0.0023,变量FDI相对应的方程中GDP的因素不能排除,即GDP是FDI的Granger原因。TAX相对于变量GDP的的统计量为4.0708,相对应的概率为0.1306,TAX在FDI对应方程中的因素可以忽略,故TAX不是FDI的Granger原因。由表3的结果发现,内生变量GDP和FDI互为因果关系,GDP和TAX互为因果关系,TAX不是引起FDI的Granger原因,但FDI是引起TAX的Granger原因。

　　表3Granger因果关系检验的结果

　　三、结论

　　本文根据向量自回归的原理利用统计分析软件分析了外商直接投资、国内生产总值、税收之间的关系,协整检验的结果表明外商投资、国内生产总值和税收之间存在长期均衡关系,即存在协整关系。结合Granger因果检验的结果,我们发现外商投资和国内生产总值的关系为正相关的,且互为因果关系,境外投资者为我国经济的发展提供了大量的资本,在互利双赢的情况下促进了我国的经济发展;另一方面我国经济的迅速发展,为外商提供了投资环境,加上良好的招商引资政策,吸引了更多的海外投资商。结果还表明外商直接投资和税收的单向的因果关系,外商直接投资是税收增加的Granger原因,税收不是外商直接投资增加的原因。外商投资能促进外商独资企业、中外合资企业和股份制公司的发展,由于企业规模的扩大,利润增加,将为我国税收做出更多的贡献。

　　参考文献

　　[1]王川,任宏,余菊.建筑业与经济增长_基于VEC模型的经验证据[J].重庆大学学报(社会科学版).2010(2)

　　[2]樊欢欢,张凌云.EViews统计分析与应用:赢在职场第一步[M].北京:机械工业出版社,2009:352～353

　　[3]扬得前.基于VEC模型的我国税收收入与GDP动态关系的实证研究:1990～2007[J].税务与经济.2009(4)

非参数统计分析在多样本研究中的应用论文[5篇范文]的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于为学生毕业走向社会进入职场打下坚实的基础、非参数统计分析在多样本研究中的应用论文[5篇范文]的信息别忘了在本站进行查找喔。