因子分析法的用途是什么?

 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
基于FMEA 法的电器附件产品质量影响因子分析及应用
下载积分:760
内容提示:
文档格式:PDF|
浏览次数:16|
上传日期: 23:54:34|
文档星级:
该用户还上传了这些文档
下载文档:基于FMEA 法的电器附件产品质量影响因子分析及应用.PDF
官方公共微信因子分析应用中一些常见问题的解析_林海明70
上亿文档资料,等你来发现
因子分析应用中一些常见问题的解析_林海明70
因子分析应用中一些常见问题的解析;林海明a,;(广东商学院a.国民经济研究中心;b.华商学院,;摘要:因子分析的应用十分广泛,据归纳,应用中有模;或困惑经常出现,为此,这里应用近期改进的因子分析;关键词:因子分析;应用;常见问题;解析中图分类号;(1)因子分析的模型有传统的因子分析模型和近期改;1因子分析应用中的一些常见问题;因子分析是多元分析中降维的一种方
因子分析应用中一些常见问题的解析b林海明a,(广东商学院a.国民经济研究中心;b.华商学院,广州510320)摘要:因子分析的应用十分广泛,据归纳,应用中有模型选择、因子是否旋转、因子个数确定等8个问题或困惑经常出现,为此,这里应用近期改进的因子分析模型L的理论,逐一解析了这些问题,提出了因子分析的一个应用步骤,以实例说明了它的有效性,该应用步骤的特点是:给出的结果、结论、建议具有决策相关性,分析较深入。由此,提出了因子分析应用中的一些建议。关键词:因子分析;应用;常见问题;解析中图分类号:O212文献标识码:A文章编号:(5-05(1)因子分析的模型有传统的因子分析模型和近期改1因子分析应用中的一些常见问题因子分析是多元分析中降维的一种方法[1]。在心理学、教育学、社会学、经济学、管理学、自然科学等众多领域的多指标(变量)体系中,如员工绩效指标体系、学生课程指标体系、节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、对外投资环境指标体系等,因子分析常应用于综合评价与监控。传统的因子分析模型是[2]:有p维的可观测随机向量X=(X1,…,Xp)′,E(X)=μ=(μ1,…,μp)′,Cov(X)=∑=(σij)p×p,要求X是线性依赖于几个不能观测的称之为公因子的随机向量F=(F1,…,Fm)′和附加的称之为误差(或特殊因子)的随机向量ε=(ε1,…,εp)′。具体是:ìX1-μ1=l11F1+?+l1jFj+?+l1mFm+ε1??X2-μ2=l21F1+?+l2jFj+?+l2mFm+ε2í?????????????X-μ=lF+?+lF+?+lF+εpp11pjjpmmp?p进的因子分析模型L(见第二部分),使用哪个模型更好?(2)因子分析解不唯一,有初始因子、旋转后因子,何时使用初始因子更好?何时使用旋转后因子更好?(3)初始因子与旋转后因子的计量值能混合使用吗?(4)现行因子个数的确定方法有时会失去一些原始变量的解释,如何确定因子个数更好?(5)因子如何命名、正向化,能保持原始变量与因子的内在关系?(6)前k个因子能加权综合的条件是什么?(7)用综合因子对样品进行分类客观吗?(8)综合评价结果,如何能深入到决策相关性程度?有关文献并没有清楚地阐述上述问题,以至应用因子分析时,不易把握。本文应用近期改进的因子分析模型L的理论,逐一解析了上述问题,给出了因子分析应用中的一个综合评价步骤,以实例说明它的有效性,并给出了因子分析应用中的一些建议。2因子分析应用中8个问题的解析问题(1)解析:传统的因子分析模型没有优化条件,参照主成分分析能降维[1],是因为主成分有方差最大化的条件,故传统的因子分析模型要能降维,没有优化条件是一个缺陷。文[3](1982)指出:因子分析的模型和理论是很不完善的,还存在许多问题。为此,文[4](2006)用因子对变量的方差贡献和最大化替代误差项方差阵为对角阵的条件式(1.3),提出了改进的因子分析模型L;文[5](2007)用因子分析模型L求出了传统因子分析模型的解,得出:传统因子分析模型的公因子解不能降维,且有时会丢失一些变量或矩阵表示是:X-μ=LF+εL=(lij)p×m是公因子载荷阵,且设:Cov(ε,F)=0,E(F)=0,Cov(F)=Im(单位阵),E(ε)=0?ψ10?0??0ψ2??÷÷(ψi称为误差方差)Cov(ε)=Ψ=??????0÷÷è0?0ψp?上述关系与假设构成传统的正交因子分析模型。因子分析的估计方法与理论较多,但实际上,因子分析的应用并没有达到较成熟的状态,据归纳,一些使用者在应用因子分析时,常出现以下8个问题或困惑:基金项目:教育部人文社会科学研究规划基金项目(2009YJA910002);教育部人文社会科学重点研究基地重大项目(2009JJD910001);广东省普通高校人文社科研究项目(10WYXM020);广东商学院科学研究重点项目(08ZD11001);广东商学院华商学院院级重点项目(HS2011047)作者简介:林海明(1959-),男,湖南宁乡人,教授,研究方向:多元统计学模型与应用。65统计与决策2012年第15期?总第363期的解释,故使用传统的因子分析模型不是更好的,同时,传统因子分析模型解的求出,为因子分析更好模型的确立提供了深入和充分的理论依据;文[6](2009)用标准化主成分法等证明了:因子分析模型L的因子解是前k个标准化主成分或其旋转。因为前k个主成分能降维,故前k个标准化主成分或其旋转能降维,能解释所有变量(见问题②、问题④解析),有:结论1因子分析模型L有因子对变量方差贡献和最大化的条件,其因子能降维、能解释所有变量,故因子分析模型L是更好的。为了便于应用,这里给出近期改进的因子分析模型L及其解:因子分析模型L[4]有p维的可观测随机向量X=(X1,…,Xp)′,E(X)=μ=(μ1,…,μp)′,Cov(X)=∑=(σij)p×p,要求X是线性依赖于少数几个不能观测的称之为因子的随机向量f=(f1,…,fk)′(k&p)和附加的称之为误差的δ=(δ1,…,δk)′,即Xi-μi=bi1f1+bi2f2+?+bikfk+δi,i=1,?,p.矩阵表示是X-μ=Bf+δ(1)B=(bij)p×k称为因子载荷阵,bij称为变量Xi在因子fj上的载荷,且E(δ)=0,E(f)=0,Cov(f)=Ik,Cov(δ,f)=0(2)求B、f,使:tr(B′B)达到最大(tr是方阵的迹)(3)式(1)~(3)称为正交因子分析模型L。设∑的特征值为λ1、…、λp,λ1≥…≥λp≥0,相应的单位正交特征向量为e1,…,ep,记:B0=(λ112e12-1/21,…,λkek),f0=[λ1e1′(X-μ),…,λ-1/2kek′(X-μ)]′(前k个标准化主成分),称B0为初始因子载荷阵,f0为初始因子。设Г是使B0Г达到方差最大化的正交旋转阵[3],记BГ=B0Г,fГ=Г′f0(前k个标准化主成分f0方差最大化的正交旋转),称BГ为旋转后因子载荷阵,fГ为旋转后因子。引理1[6]因子分析模型L的解:B=B0,f=f0,max{tr(B′B)}=∑kj=1λj。引理2[6]因子分析模型L的解:B=BГ,f=fГ,max{tr(B′B)}=∑kj=1λj。为了优化现有因子分析理论,为了能用流行统计软件计算因子分析模型L的解,文[6]建立了因子分析模型L的解与传统因子分析模型中主成分法估计、回归法估计的关系:引理3[6]设L是主成分法的前k列公因子载荷阵(含旋转后),F是L回归的因子,则因子分析模型L的解:B=L,f=F。即引理3说明:统计软件中,计算因子分析主成分法的前k列公因子载荷阵L*及其回归的因子F*,是因子分析模型L的解。66统计与决策2012年第15期?总第363期注:因为主成分法误差项的方差阵不是对角阵,故主成分法估计的因子载荷阵L及其回归的因子F,不是传统因子分析模型的解。由结论1,因子分析模型以下指的是:因子分析模型L;由引理3,因子分析模型的解以下指的是:主成分法的因子载荷阵L及其回归的因子F。问题(2)解析:因子分析是用因子f解释变量X的,故要求每个变量Xi(i=1,2,…,p)仅在某个因子fj(1≤j≤p)上有高额的载荷bpij[2]。由式(2.3),tr(B′B)=∑k2j=1∑i=1bij达到最大,非零载荷bij的绝对值―bij―总体上会更大,故因子分析模型L解释所有变量是更好的,由引理3,主成分法的因子载荷阵是更好的。变量X标准化时,因子载荷阵B是变量X与因子f的相关阵,载荷bij是变量Xi与因子fj的相关系数,考虑到降维,该要求用因子载荷阵B描述是:B的每行有一个高额载荷的绝对值较靠近1,B的列数较小,称此为结构简化。因此,有:结论2变量X标准化时,主成分法下,多个不同列旋转后因子载荷阵中选出的因子载荷阵B0Г达到结构简化,B0Г与B0比较(见注2)。(1)如果B0Г达到更好的结构简化,则使用相应的旋转后因子;(2)如果B0达到更好的结构简化或B0Г、B0都是差异不大的结构简化,则使用相应的初始因子。注2旋转后因子载荷阵B0Г是逐次对初始因子载荷阵B0每两列元素进行方差最大化正交旋转的结果,初始因子载荷阵B0是列元素平方和(因子方差贡献vj)降序排列达到最大化的结果[3],即B0Г、B0的最大化方向不同,故一般情况下B0Г、B0的结果是不同的。问题(3)解析:由注2,一般情况下B0Г、B0的结果是不同的,故初始因子、旋转后因子解释的变量一般都发生了变化,这使得两者因子的计量值、方差贡献都不一样,故有:结论3初始因子、旋转后因子有最大化方向不同的条件,结果不同,故初始因子、旋转后因子不能混淆、不能混合使用。问题(4)解析:现行因子个数的确定方法有时是不合理的,如用累计方差贡献率达到85%确定因子个数,有时会失去一些原始变量解释。因为因子分析中是用因子解释变量,故选取的因子应该与变量有显著相关性(大样本时至少应达到中度相关),于是有:结论4记达到更好结构简化的m列因子载荷阵是B1212m,若(Bm,λm+1em+1,…,λpep)前k列元素绝对值大于显著相关的临界值(大样本取0.5-0.8),则因子个数为k,相应因子载荷阵记为Bk。问题(5)解析:变量标准化时,因子载荷阵Bk是变量X与因子f=(f1,…,fk)′的相关阵,Bk的第j列bj是变量X与因子fj的相关系数,绝对值大于显著相关临界值(大样本取0.5-0.8)的对应变量与fj相关性高,因此有:结论5在Bk的第j列bj的元素中,选出绝对值大于显著相关临界值(大样本取0.5~0.8)的对应变量,归为因子fj一组,由这组变量的内在关系对因子fj进行命名及其正向化,这样的因子分析能保持一些变量与因子的内在关系。正向化后因子载荷阵及其因子记为B、f。问题(6)解析:因子是标准化的、彼此不相关,参照普通中学学生,语文、英语、数学考试成绩可总分的条件:标准化、不相关、同方向,有:结论6如果因子f=(f1,…,fk)′是正向的,则因子可进行相应方差贡献率的加权综合。问题(7)解析:综合因子是前k个因子方差贡献率的加权平均。综合因子的样品值反映的是n个样品在综合因子中的综合相对位置(样品相应的优势、劣势、差距状况等),前k个因子的样品值反映的是n个样品在前k个因子中的相对位置。仅用综合因子进行分析会失去前k个因子的特征,仅用前k个因子进行分析会失去综合因子的特征,这样是不客观的,因此,有:结论7因子分析中既要进行综合因子的样品分析,又要进行前k个因子的样品分析,两者的结合分析才是较客观、较可靠的。样品数量较多,逐个样品分析看不出共性规律。仅按综合因子值给出分类结果,失去了前k个因子的多因素特征,事实上,样品的共性规律表现在前k个因子的样品值中,对前k个因子样品值进行聚类分析(前k个因子是标准化,不相关的,选取欧式距离的聚类分析效果较好),并按综合因子值相应顺序给出分类,便找出了样品之间较为客观、可靠性的共性规律,故有:结论8对前k个因子样品值进行系统聚类分析,按综合因子值相应顺序给出样品的分类,能较客观、可靠地反映样品之间的共性规律,便于进行样品的共性分析。问题(8)解析:因子分析、聚类分析给出了样品客观、可靠的个性与共性特征。但因子fj有综合性,决策的相关性有待与原始指标结合起来,由结论5,因子fj是按与其显著相关(大样本时达到中度相关)的原始变量归为因子fj这一类命名的,故将相应原始变量对应替换为因子fj进行联系性分析,便得出了较为可靠的决策相关性结果。结论9将因子fj对应替换为与其显著相关(大样本时达到中度相关)的原始变量,对这些联系性的原始变量逐组(当作因子fj)和综合地进行数据分析,得出的是较为客观、可靠的决策相关性结果。3因子分析的一个综合评价步骤现行论文和文献中,应用因子分析的步骤大部分是:指标的标准化;求变量样本相关阵R、初始因子载荷阵、旋转后因子载荷阵、旋转后因子;用因子方差累计贡献率确定因子个数;旋转后因子的命名。以下步骤增加了:指标的正向化,指标高度相关性的判定,因子是否旋转的确定、因子的正向化,更新了因子个数确定方法,更新了因子命名方法,建立了因子、综合因子与原始变量的对应关系,因子中变量的内在关系,能进行深入的数据分析。(1)指标正向化[7]、标准化;(2)指标间高度相关性判定:用变量相关阵R判定,若变量间有高度相关,因子分析继续,否则,直接进行逐个指标分析,用∑pi=1xi进行综合分析(xi是正向化、标准化的);(3)选取用于比较的因子载荷阵:主成分法下(引理3),对多个旋转后因子载荷阵,找出结构简化的旋转后因子载荷阵B0Г:即B0Г每行有一个元素的绝对值较靠近1、列数较小;(4)确定因子是否旋转:B0Г、B0比较,若B0Г达到更好的结构简化,则用旋转后因子(结论2);若B0达到更好的结构简化或B0Г、B0都是差异不大的结构简化,则用初始因子(结论2);记达到更好结构简化的m列因子载荷阵是Bm;(5)确定因子个数k:若(B1212m,λm+1em+1,…,λpep)前k列元素绝对值大于显著相关的临界值(大样本取0.5-0.8),则因子个数为k(结论4),相应的因子载荷阵记为B12k[(λm+1em+121,…,λpep)是p列初始因子载荷阵后面的p-m列];(6)因子的命名及其正向化:在Bk的第j列bj的元素中,选出绝对值大于显著相关临界值(大样本取0.5-0.8)的对应变量,归为因子fj一组,由这组变量的内在关系对因子fj进行命名(结论5);正向化是:如果归为因子fj一组变量的内在关系是越大越好,则因子fj取正号,否则,取负号。正向化后因子载荷阵及其因子记为B、f=(f1,…,fk)′(k≥m时,f的前m个因子是Bm回归的正向化因子,第m+1、…、k个因子是p列初始因子载荷阵回归的第m+1、…、k个正向化初始因子;k&m时,f是Bm前k列因子载荷阵回归的正向化因子,引理3);(7)构造综合因子:综合因子f综=∑ki=1(vi/p)fi(vi是因子fi的方差贡献,结论3,结论6);(8)对前k个因子f1,…,fk的样品值、综合因子f综的样品值进行排序;(9)用前k个因子f1,…,fk的样品值做系统聚类分析(如类平均法),按综合因子f综样品值顺序给出样品相应的分类结果(结论8);(10)结合前k个因子样品值的聚类分析结果,因子、综合因子样品值和排序,因子、综合因子与原始变量的对应关系,因子中变量的内在关系,进行优势、劣势、潜力状况和原因等的综合评价,给出较客观、可靠的决策相关性建议(结论7、结论9)。4应用实例为验证上述因子分析综合评价步骤的有效性,用广东省2008年规模以上9大产业发展水平的数据进行综合评价。指标选取为:X1-企业科技活动人员(人)、X2-当年科技活动经费支出总额(千元)、X3-企业单位数(个)、X4-工业总统计与决策2012年第15期?总第363期67产值(亿元)、X5-工业增加值(亿元)、X6-全部从业人员年均人数(万人)、X7-主营业务收入(亿元)、X8-利税总额(亿元)、X9-全员劳动生产率(元/人)、X10-百元固定资产原价实现利税(元)。9个行业为:1-电子信息业、2-电气机械及专用设备、3-石油及化学、4-纺织服装、5-食品饮料、6-建筑材料、7-森工造纸、8-医药、9-汽车及摩托车,数据见表1。业人员年均人数、X3-企业单位数显著正相关,因子f1Γ称为产值人力因子;f2Γ与X9-全员劳动生产率、X10-百元固定资产原价实现利税、X8-利税总额显著正相关,因子f2Γ称为效益因子;f3Γ与X1-企业科技活动人员、X2-当年科技活动经费支出总额显著正相关,因子f3Γ称为科技水平因子。因子f1Γ、f2Γ、f3Γ是正向化的;⑺以旋转后方差贡献率vip为权数构造综合因子(xi是Xi的标准化):Γf综=(4.863f1Γ+2.252f2Γ+1.914f3Γ)/10=0.12x8+0.106x5+0.097x7+0.091x9+0.086x4+0.082x3+0.059x6+0.054x2+0.038x10+0.031x1⑻旋转后因子、综合因子样品值及排序见表4;⑼用系统聚类分析类平均法,选用欧氏距离,通过表4三个旋转后因子f1Γ、f2Γ、f3Γ的样品值对样品进行聚类。取分类阈值为1.68时,分成五类,结合综旋转后因子、综合因子样品值及排序f1Γ0.8-0..752-0.761-0.562-1.156序f2Γ2.361-0.446-0.452-0.575-0.4-0.686-0.327序f3Γ-0.235-0.9-1..078-1.098-0.375序f综Γ0.9-0.122-0.204-0.222-0.240-0.638-0.708序资料来源:广东省2009年统计年鉴、广东省2009年科技统计年鉴⑴指标都是正向的,仅对变量进行标准化;⑵由表1数据,用SPSS软件计算得,X4与X7的相关系数为0.972,X5与X7的相关系数为0.974,变量间有高度相关性,因子分析继续;⑶多个不同列的旋转后因子载荷阵挑选得,m=3时,旋转后因子载荷阵B0Г达到结构简化(见表2),旋转后因子方差贡献v1=4.863、v2=2.252、v3=1.914;表2变量x1x2x3x4x5x6x7x8x9x10初始因子载荷阵B0f100.60.70.4-0.271f200.010-0.101-0.080-0..342-0.40.890f300..021-0.236-0.178-0.244-0..因子载荷阵旋转后因子载荷阵B0Гf1Γ0.6*0.943*0.938*0.**合因子样品值排名顺序给出相应共性分类结果如表4:表4行业f2Γ0.024-0.40.220-0.1*0.928*0.850*f3Γ0.955*0.810*0.50.4-0.088-0.027第一类:3-石油及化学;第二类:1-电子信息业;第三类:2-电气机械及专用设备:6-建筑材料;第四类:4-纺织服装、7-森工造纸;第五类;5-食品饮料、8-医药、9-汽车及摩托车。(10)结合前3个旋转后因子样品值的聚类分析结果,因子、综合因子样品值和排序,因子、综合因子,原始数据,原始变量名称的意义,进行优势、劣势和影响因素等的综合评价,给出客观、可靠的决策相关性建议。Γ第一类:3-石油及化学综合因子f综值排第1,高于平0..388*表示显著水平5%下相关显著⑷初始因子载荷阵B0(见表2)与B0Г比较:由表2得表因子载荷阵每行载荷最大绝对值靠近1对比表因子载荷区间0.9以上0.8-0.90.7-0.8合计频数初始44210旋转后541103,表3表明,B0Г达到更好的结构简化,故用旋转后因子;表3均水平。其产值人力因子f1Γ值排第3,高于平均水平,有较大优势;效益因子f2Γ值排第1,优势明显;科技水平因子f3Γ值排第5,低于平均水平。即该行业是效益优势明显,产值人力较高,科技水平有待提高的行业。原因及问题:效益因子f2Γ中X9-全员劳动生产率、X8-利税总额、X10-百元固定资产原价实现利税均排第1,产值人力因子f1Γ中X7-主营业务收入排第3、X4-工业总产值排第3、X5-工业增加值排第3、X6-全部从业人员年均人数排第5、X3-企业单位数排第3,科技水平因子f3Γ中X1-企业科技活动人员排第3、X2-当年科技活动经费支出总额排第5。建议:3-石油及化学行业在继续保持效益因子f2Γ中X9-全员劳动生产率、X8-利税总额、X10-百元固定资产原价实现利税均排第1优势;产值人力因子f1Γ中应保持和提高X7-主营业务收入排第3、X4-工业总产值排第3、X5-工⑸前3个旋转后因子,变量正态分布下,取显著水平为5%,显著相关的临界值是r(7)=0.666,由BГ和r(7)判[8] 断,前3个旋转后因子与变量显著相关;其它因子与变量没有显著相关,故因子个数k=3,前三个因子的累计方差贡献率为90.29%;⑹因子命名与正向化:由B0Г和r(7)判断,f1Γ与X7-主营业务收入、X4-工业总产值、X5-工业增加值、X6-全部从68统计与决策2012年第15期?总第363期业增加值排第3、X3-企业单位数排第3、X6-全部从业人员年均人数排第5的较好优势;科技水平因子f3Γ中,适当增加X1-企业科技活动人员和发挥好他们的作用,加大X2-当年科技活动经费的投入,必然产生更强的优势。第三类:2-电气机械及专用设备、6-建筑材料,综合因子fΓ综值依次排3、4,2-电气机械及专用设备高于平均水平,6-建筑材料略低于平均水平。其产值人力因子f1Γ值依次排2、5,2-电气机械及专用设备高于平均水平,有较大优势,6-建筑材料低于平均水平;效益因子f2Γ值依次排6、7,低于平均水平;科技水平因子f3Γ值依次排1、2,高于平均水平。即该类行业是科技水平高,但效益较差的行业。原因及问题、建议,与第一类行业的分析类似。第二类行业综合评价、建议方法与第一类行业类似,第四类、第五类行业综合评价、建议方法与第三类行业类似,此略。以上分析及结论,找到了研究对象的共性、优势、不足、潜力状况和原因等,用具有可控性的原始指标给出了较可靠的决策相关性建议,验证了因子分析模型L方法的有效性。5结论与建议(1)模型选择。传统的因子分析模型没有优化条件,公因子解不能降维或会丢失一些变量(指标)的解释,即传统因子分析模型不是更好的。因子分析模型L有优化条件,能降维、能较清晰地解释所有变量,是因子分析更好的模型,故应用因子分析解决实际问题时,建议使用近期改进的因子分析模型L和方法。(2)初始因子或旋转后因子的确定。因子载荷阵达到更好的结构简化时,因子解释所有变量是更好的。因子分析模型L的解(主成分法的因子载荷阵及其回归的因子或它们的旋转)是更好的,建议对主成分法因子载荷阵及其旋转进行比较,用达到更好结构简化的因子载荷阵确定相应的因子。(3)因子应用的一致性。初始因子与旋转后因子的计量值不同,建议应用中不要混淆。(4)因子个数的确定。因子是解释变量的,选出的因子应该与变量显著相关(大样本时至少达到中度相关,下同)。故建议用与变量显著相关因子的个数,确定为因子个数。(5)因子的命名、正向化。因子是解释与其显著相关的变量的,故建议用与因子显著相关的变量对该因子进行命名、正向化。(6)因子综合。因子是标准化、互不相关的,建议对这些因子正向化后进行加权综合。(7)样品的分类。样品的共性特征表现在前k个因子样品值中,建议用前k个因子样品值作系统聚类分析进行分类。(8)综合评价。因子及与其显著相关的原始变量有对应关系,综合因子是原始变量的线性组合,因子中与其显著相关的原始变量有内在的相关关系,建议用这些关系,对综合因子、逐个因子的变量组进行深入的数据分析,尽可能深入到决策相关性程度。参考文献:[1]方开泰编著1989..实用多元统计分析[M].上海:华东师范大学出版社,[2]Johnson,Analysis(R6th.EditionA.,Wichern,)[M].NewD.York:PublishedW.,AppliedMultivariatebyPearsonEducation,Statistical[3]2007.[4]张尧庭[5]林海明,林海明.方开泰著,因子分析精确模型及其解.多元统计分析引论王翊.因子分析模型L及其解是更好的[J].[M].统计与决策北京:科学出版社[J].(理论版,1982.统计研究),2006,(7).(8).,2007,[6]林海明(6)..因子分析模型的改进与应用[J].数理统计与管理,]陈军才息论坛.,2005,(2).主成分与因子分析中指标同趋势化方法探讨[J].统计与信[8]2000.峁诗松等编著.概率论与数理统计[M].北京:中国统计出版社,(责任编辑/浩天)统计与决策2012年第15期?总第363期69包含各类专业文献、高等教育、专业论文、中学教育、各类资格考试、应用写作文书、幼儿教育、小学教育、因子分析应用中一些常见问题的解析_林海明70等内容。
 因子分析模型 L 的优良性和应用①林海明 (广东商学院国民经济研究中心,广东商学院华商学院) 【摘要】传统的因子分析模型,公因子解不能降维或失去一些变量解释,故...   因子分析优化模型及其精确解? 因子分析优化模型及其精确解 精确林海明 1 金华 ...理论、方法和应用方面,因子分析模型的估计解存在不可行的状况。如常用方法中,主...  ―献给我的母亲林淑霞女士林海明 (广东商学院 1....了一些变量的解释,故因子分析需要找出更好的模型,更...更好的模型,给出了初始 因子和旋转后因子的应用条件...  一些传统的品牌 营销管理明显跟不上市场发展的要求,存在着品牌竞争附加值低等问题...[12] 林海明.因子分析模型的改进与应用[J]. 数理统计与管理,),...  【3】 林海明: 《因子分析模型的改进和应用》 ,数理统计与管理,28,2。 5 【4】 林海明: 《对主成分分析法运用中十个问题的解析》 ,统计与...  因此航天电器公司财务状况最好, 而山东威达公司状况差 [参考文献] [1] 林海明,张文霖.主成分分析与因子分析的异同和SPSS软件――兼与刘 玉玫、卢纹岱等同志商榷...  林海明: 《因子分析模型的改进和应用》 ,数理统计与管理,28,2。 林海明: 《对主成分分析法运用中十个问题的解析》 ,统计与决策,16,...  林海明: 《因子分析模型的改进和应用》 ,数理统计与管理,28,2。 林海明: 《对主成分分析法运用中十个问题的解析》 ,统计与决策,16,...  子分析优化模型及其解林海明 1 金华 2* 蔡敬衡 3...因子分析模型,公因子不能降维或失去一些变量的解释,...[6](1995)给出了标准化主成分法的部分公式和应用...SPSS 調節模型_多因子變異數_交互作用分析篇/一般線性模型應用 統雄-統計神掌 Statistics/SPSS Canon: Moderation Model, Multifactorial ANOVA, Interaction Effects Analysis and General Linear Model,GLM, By Sean TX Wu
統雄-統計神掌調節模型分析篇
&主要效果與交互作用效果一般線性模型GLM的應用Moderation Model/ Interaction EffectsMultifactorial ANOVA and GLM神掌打通任督二脈?易筋經以簡馭繁
調節模型_交互作用分析特色交互作用(Interaction)就是2個以上自變項之間不相互獨立、也不互具共線性,而存在增強或互逆作用之效果,可經由一般線性模式(GLM)與多因子變異數分析(ANOVA)進行檢定。交互作用的概念模型,近年習稱為調節模型(Moderation Model)通常以:「變項A × 變項B」表示。同理,3個以上自變項的交互作用就包括:A×B, A×C, B×C, A×B×C。其他均可類推。若變項B沒有主要效果(沒有獨立自變能力),卻能導出A×B交互作用效果,則B特稱為調節變項M (Moderator),A×B也可稱為調節作用(Moderation)。中文語意的「交互作用」實在比「調節作用」清楚,所以本系列講義,盡量以「交互作用」一詞解說。交互作用可以用2種方式分析:(1)一般線性模式(GLM)與多因子ANOVA(2)多元迴歸。第一種著重「差異」分析,第二種重視「相關」分析。通常以第一種為優先。In statistics and regression analysis, moderation occurs when the relationship between two variables depends on a third variable. The third variable is referred to as the moderator variable or simply the moderator. The effect of a moderating variable is characterized statistically as an interaction[1]; that is, a qualitative (e.g., sex, race, class) or quantitative (e.g., level of reward) variable that affects the direction and/or strength of the relation between dependent and independent variables. Specifically within a correlational analysis framework, a moderator is a third variable that affects the zero-order correlation between two other variables. In analysis of variance (ANOVA) terms, a basic moderator effect can be represented as an interaction between a focal independent variable and a factor that specifies the appropriate conditions for its operation.理論概念模型分析方法與其說明又稱調節變項分析或交互作用分析因子間關係:彼此不一定獨立,且不平行有時可用目的交互作用(Interaction)係指變項間是否存在增強或互逆關係,亦即在幾何上的不平行關係,呈「八」或「X」型。若某些自變項沒有獨立主要效果,卻能導出交互作用,則稱為調節變項(Moderator)。交互作用又稱調節作用,英文Moderation 與以下中介模型 Mediation 十分容易產生混淆。A與B對Y可能有差異,也可能無差異。但A*B卻對Y有有差異,就是交互作用,亦即以A觀察值與B觀察值的乘積,為「調節變項」之值,或稱為「積項(Product term)」。SPSS 工具自變項為類別資料:一般線性模式(GLM)之多因子ANOVA。自變項為連續資料:多元迴歸分析。交互作用的簡化概念模型也有文獻使用過以下的簡化模型表現交互作用:模型中的M (Moderator),其實表示的是 M 對 Y 沒有效果,而 A×M 對Y有交互作用效果。這個模型其實容易與「中介模型」混淆,在各只有1個自變項、1個調節變項時,尚可達意。但在自變項、或調節變項超過2個時,有多種交互作用的可能性,這個模型呈現的意義會很不清楚,統雄老師不建議在此情況下使用。&交互/調節模型之統計模式交互/調節模型之統計模式,一貫相承變異數分解的觀念,以2自變項為例如下。Moderation analysis in the behavioral sciences involves the use of linear multiple regression analysis or causal modeling. To quantify the effect of a moderating variable in multiple regression analyses, regressing random variables Y on X, an additional term is added to the model. This term is the interaction between X and the proposed moderating variable.Thus, for a response Y and two variables x1 and moderating variable x2,:Y = b0 + b1X1 + &b2X2 + &b3(X1 * X2) + e對「」而言,是沒有誤差項 e的多元一次方程式。對「」的統計思想而言,就必須包括誤差項 e。有些文獻b作β,e 作 ε。&以上模式可發展為多自變項,每1個Xi 必須是彼此獨立的,幾何學上的意義就是必須是彼此兩兩正交(pairwise orthogonal)的。交互作用理論實例-「動機」的作用統雄老師經驗中,這個方面最具「知識論」基礎的研究發現,就是「能力」「動機」與「滿意度」的關係。統雄老師是在作資訊系統導入研究時,過去文獻指出以下2個可能的理論:使用系統「能力」→使用系統「滿意度」使用系統「動機」→使用系統「滿意度」但經過實證後發現,以上第2個模式並不存在(即ANOVA 差異分析不顯著)。倒是以下交互作用效果存在:「能力」×「動機」→「滿意度」存在的方式是在「高動機組」內,如果同時「能力高」,則「滿意度」高;而「能力低」,則「滿意度」低。為何這個研究發現最具「知識論」基礎呢?因為它也回應了中華傳統智慧的發現:「其進銳者其退速」。它指出了人類態度與行為中,「動機」的「一般性」作用:如果對取用某事物的動機低,其實對結果沒有任何滿不滿意可言;但如果動機高,再配合高能力,可能有極高的滿意成果;當然,如果動機高,偏偏能力不足,可能特別的不滿意。我們發現這個模式可以解釋許多人類現象,包括:追求異性朋友、對公共事務的參與、對偶像的崇拜、對特定目標的追求…等等。所以,「動機」不是自變項,但配合「能力」,卻是對「滿意度」有力的交互作用變項,或稱為影響自變項「能力」對應變項「滿意度」作用關係的調節變項。交互作用與框架知識統雄老師在對各種行為研究後,發現交互作用分析,經常可以協助我們辨識「框架知識」。人類行為經常存在「框架現象」的相關關係,但如果沒有框架存在,則沒有相關關係。譬如在臺北市,我們會發現以下理論成立:房屋總坪數 → 房屋單位價格房屋總坪數愈大、房屋單位價格愈高,但這種現象只在臺北市存在。如果我們把觀照放大到全臺灣地區,我們會發現以下修正的理論:都會化程度 → 房屋單位價格兩者合在一起作交互作用分析,會發現「房屋總坪數」會變成調節變項,沒有都會化因素,可能坪數愈大、房屋單位價格愈低。所以真正存在的是以下交互作用理論:都會化程度×房屋總坪數 → 房屋單位價格下載SPSS範例SPSS 應用範例我們希望同時研究「性別」與「教育程度」是不是都是「消費力」的自變項?其間有無交互作用效果?類別資料:調節模型/交互作用/多因子變異數分析一般線性模式之應用調節模型的建構、交互作用分析的工具,如果自變項為類別資料,則使用多因子變異數分析(Multiple Factorial ANOVA),屬於一般線性模式分析(General Linear Model Analysis, GLM)的一種。理論敘述網路消費額因性別、教育程度、與兩者交互作用產生差異而構成調節模型。或可使用概念模型表現。〉分析〉一般線性模式(GLM)〉單變量注:學術術語與軟體中文化常有混淆不清的情形,這裡的「單變量」是指「單應變項」,而非「單變項(Univariate)」(同理「多變量」是指多應變項),但下一個介面又譯為「依變數」,同一件事情,連續用了2個不同、且會產生困擾的名稱。設定應(依)變項、自變項(固定因子)〉模式設定模式設定有2類:完全因子設計模式包含所有的交互作用。亦即:2個因子,模式項目包括2個主要效果項、1個2向(2-way)交互作用項。A, B, A×B 3個以上自變項的交互作用就包括3個主要效果項、3個2向(2-way)交互作用項、1個3向(3-way)交互作用項。:A, B, C, A×B, A×C, B×C, A×B×C。同理,其他均可類推,因子增加,交互作用項會更呈「排列式」快速增加。自訂模式設計可以自訂模式中包括那些:主要效果項、交互作用。批次變異數分析進行批次變異數分析時,如果是單因子,就在〈建立效果項〉中,選擇〈主要效果〉即可。如果是雙因子,就再增選&All 2-way&。使用〈自訂〉,可避免批次多因子分析時,輸出過於龐大。在雙因子時, 完全因子設計和自訂其實差不多,但我們還是採用「自訂」,以練習建立效果項的步驟。〉自訂將自變項、應變項都分別選取,計算主要效果。&Ctrl& + Click 連續選取「應變項 * 調節變項」,以建構「交互作用效果項」,其乘積即為交互作用之值,其理論定位,相當於1個自變項(因子)。以上自訂 3 項,和「完全因子設計」其實相同。「包括截距」的幾何意義表示迴歸線沒有通過原點,即沒有Y﹦0的情形。其代數意義,即線性模式中之「常數」(β0),而其理論意義,即為「誤差」。多因子變異數分析?模式設計的策略多因子分析時,不宜立刻跑〈完全因子設計〉。因為多因子設計,細格 cells 眾多,樣本數必須足夠,否則無法統計與輸出。變異數分析的「思想基礎」就是「假設各細格的(母群)平均數」相同,但樣本平均數不同時,就要比較其平均變異數-即「均方 MS」,MS 的分母為自由度 df ,df& 之值為細格內樣本數 -1。當雙因子,且因子水準僅為 2 時,至少有1列(或1欄)有 2 細格、3 因子時,至少有 3 細格…以此類推。所以在雙因子分析時,某 1 因子水準中僅有 1 樣本時,其 2-way 細格內最多只有 1 個樣本,其 df =0,即分母為0或 3 因子分析,某 1 因子水準中僅有 1 樣本時,至少有1列(或1欄)有 2 細格、3 因子時,至少有 3 細格…以此類推,所以進行批次變異數分析時,如果是單因子,就在〈建立效果項〉中,選擇〈主要效果〉即可。如果是雙因子,就再增選&All 2-way&。,可避免批次。〉圖形設定性別的值只有2,而教育程度的類別較多,所以選擇教育程度作水平線,而性別作個別線,只有2條,較利視覺辨識。記住:要按〈新增〉。〉Post Hoc:事後多重比較設定因為「性別」只有2類水準,所以不必再作分組多重比較,只選「教育程度」檢定即可。Bonferroni法,是最容易產生組間差異顯著的;相反的,Scheffe法,是最不容易產生組間差異顯著的,所以統雄老師通常會選這2個,以比較參考。組間比較,一般應以組間變異數同質為前提;而如果不同質,也有檢定方法,統雄老師建議選擇Games-Howell檢定。〉選項設定所以自變項與交互作用都應計算其平均數,並作敘述統計與同質性檢定。&報表詮釋基本資料同質性檢定檢定為.085,大於.05,組間差異不顯著,亦即組間變異數同質,符合分析的前提。變異數分析(效應項檢定)2個自變項主要效果,與交互作用效果均未達顯著水準,表示並不存在交互作用。注意:前篇單因子變異數分析時,「性別」是顯著的,為何在此變成不顯著呢?因為現在增加與「教育程度」的交互作用分析,因迷失值(Missing data)的影響,降低「有效」樣本數,而「顯著」的意義,就是樣本夠不夠。這個例證,也反映了:迷失值(Missing data)、「有效」樣本數、資料分析結果、以及應用統計實務上的密切牽連關係。注意:在正式研究中,如果不顯著,所有報表都不必列。如果顯著,所報表都必須列出,不能省略,否則無法判斷。這裡是習題,所以還是列出來以便說明。平均數分析Post Hoc檢定同質子集如果選擇Scheffe法,會多一個同質子集表。剖面圖:交互作用之視覺輔助交互作用分析的重點之一,就是以剖面圖顯示:是否存在交互作用的視覺輔助。基本判斷方法:如果個別線呈大致平行,就是沒有交互作用;如果不對稱(有增強作用)或交叉(互逆作用),就是有交互作用。本習題的2條線大致平行,可知沒有交互作用。值得注意的是:大專組出現不對稱的情形,可能會有Post Hoc個別組內交互作用的現象,但是因為樣本太少,所以檢定也不顯著。連續資料:多元迴歸分析法如果所有自變項為連續資料,或人為連續資料,就可以採用多元迴歸法。人為連續資料譬如性別變項,假設「男性﹦1」,「女性﹦2」,若性別與某變項之相關係數為正,則與女性相關;若相關係數為負,則與男性相關。手動建構交互作用變項,如 「變項A × 變項B」等。然後將「變項A 」「 變項B」 「變項A × 變項B」作為多元迴歸的3個自變項。 參考文獻
& 統雄-統計神掌&SPSS&調節模型_交互作用分析篇
此作品衍生自統雄網路社群 http://tx.liberal.ntu.edu.tw 由製作,以釋出。此條款的授權同時適用於
下,除特別標明外,所有媒體形式之著作物。
本網群為公益服務,瀏覽者須接受以下聲明,方可瀏覽。-Copyright
&:--:本網路社群之硬體設備由臺灣大學獎助提供,相關研究亦曾受補助。

我要回帖

更多关于 摩羯是什么动物 的文章

 

随机推荐