数据分析之因子分析

数据分析之因子分析,第1张

系统聚类分析可以对变量进行分类,但是难以判断变量分类结果的合理性。另外,如果要衡量每个变量对类别的贡献,也难以通过聚类分析来实现。这个时候就要采用因子分析来实现了。因子分析就是找出隐藏在变量背后具有共性的因子。

因子分析是通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,并据此对变量进行分类的一种统计分析方法。由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,所以,这一分析过程也称为降维。

因子分析的主要目的有以下三个:

(1)探索结构:在变量之间存在高度相关性的时候我们希望用较少的因子来概括其信息;

(2)简化数据:把原始变量转化为因子得分后,使用因子得分进行其他分析,比如聚类分析、回归分析等;

(3)综合评价:通过每个因子得分计算出综合得分,对分析对象进行综合评价。

因子分析就是将原始变量转变为新的因子,这些因子之间的相关性较低,而因子内部的变量相关程度较高。

为了更好的了解因子分析,需要了解以下:

(1)因子载荷

因子载荷就是每个原始变量和每个因子之间的相关系数,它反映了变量对因子的重要性。通过因子载荷值的高低,我们能知道变量在对应因子中的重要性大小,这样能够帮助我们发现因子的实际含义,有利于因子的命名。当有多个因子的时候,因子载荷将构成一个矩阵,称为因子载荷矩阵。

(2)变量共同度

变量共同度就是每个变量所包含的信息能够被因子所解释的程度,其取值范围介于0和1之间,取值越大,说明该变量能被因子解释的程度越高。

(3)因子旋转

因子分析的结果需要每个因子都要有实际意义,有时,原始变量和因子之间的相关系数可能无法明显地表达出因子的含义,为了使这些相关系数更加显著,可以对因子载荷矩阵进行旋转,使原始变量和因子之间的关系更为突出,从而对因子的解释更加容易。

旋转方法一般采用最大方差法,该方法能够使每个变量尽可能在一个因子上有较高载荷,在其余的因子上载荷较小,从而方便对因子进行解释。

(4)因子得分

因子得分可以用来评价每个个案在每个因子上的分值,该分值包含了原始变量的信息,可以用于代替原始变量进行其他统计分析,比如回归分析,可以考虑将因子得分作为自变量,与对应的因变量进行回归。

原始变量的数值是可以直接观测到的,而因子得分只能通过原始变量和因子之间的关系计算得到,并且因子得分是经过标准化之后的数值,各个因子得分之间不受量纲的影响。

(1)判断数据是否适合因子分析;

         因子分析的变量要求是连续变量,分类变量不适合直接进行因子分析;建议个案个数是变量个数的5倍以上,这只是一个参考依据,并不是绝对的标准;KMO检验统计量在05以下,不适合因子分析,在07以上时,数据较适合因子分析,在08以上时,说明数据极其适合因子分析。

(2)构造因子变量;

(3)利用因子旋转方法使得因子更具有实际意义;

(4)计算每个个案因子得分;

(1)初始特征值大于1的因子个数;

(2)累积方差贡献率达到一定水平(60%)的因子个数;

(3)碎石图中处于较陡峭曲线上所对应的因子个数;

(4)依据对研究事物的理解而指定因子个数;

期刊的影响因子(Impact factor,IF),是表征期刊影响大小的一项定量指标。也就是某刊平均每篇论文的被引用数,它实际上是某刊在某年被全部源刊物引证该刊前两年发表论文的次数,与该刊前两年所发表的全部源论文数之比。
nk-1+nk-2
计算公式:IF(k) = Nk-1+Nk-2
说明:
k 为某年, Nk-1+Nk-2 为该刊在前一两年发表的论文数量, nk-1 和nk-2 该刊在 k 年的被引用数量。也就是说,某刊在2005年的影响因子是其2004和2003两年刊载的论文在2005年的被引总数除以该刊在2004和2003这两年的载文总数(可引论文)。

晶胞常数:底面边长
a
和高
c,原子半径:r=1/2a原子数:n=12×1/6+2×1/2+3
=6致密度:
K=
nV原子/V晶体=
074
 
密排六方晶格(胞)(HCP晶格)晶胞为一正六棱柱体,密排六方晶格的晶胞中十二个金属原子分布在六方体的十二个角上,在上下底面的中心各分布一个原子,上下底面之间均匀分布三个原子。晶体致密度为74%,晶胞内含有原子数目为6。配位数为12,原子半径为1/2a。

扩展资料:


最密六方结构的晶胞,密排六方可看成是由两个简单六方晶胞穿插而成,最密六方结构亦是原子排列最密集的晶体结构之一。
其晶胞原子数可计算如下:六方柱每个角上的原子属6个相邻的晶胞所共有,上下底面中心的每个原子同时为两个晶胞所共有上晶胞内的三个原子,故晶胞原子数为16x12+1/2x2+3=6。
最密六方结构的特点是晶胞中面上相邻原子都相切,相邻的两个面上的最近邻原子也彼此相切。如图中A原子既和同一层面上的六个原子B、C、D、E、
F、G相切,又和下层的H、J、K原子相切。
显然A原子还和上层的三个原子相切这样,在密排六方结构中每个原子就有12个最近邻的原子,即配位数是12。
参考资料来源:百度百科-最密六方结构

影响因子是以年为单位进行计算的。以1992年的某一期刊影响因子为例,IF(1992年) = A / B
其中,
A = 该期刊1990年至1991年所有文章在1992年中被引用的次数;
B = 该期刊1990年至1991年所有文章数。
影响
许多著名学术期刊会在其网站上注明期刊的影响因子,以表明在对应学科的影响力。如,美国化学会志、Oncogene等。
中国大陆各大高校(如清华大学、中国科学技术大学、南开大学、中国农业大学、吉林大学、哈尔滨工业大学、浙江大学、上海大学、大连理工大学等)都以学术期刊的影响因子作为评判研究生毕业的主要标准。
以1992年为例,计算某期刊在该年的影响因子:
X=以1992年为基点、某期刊于1990和1991年在1992年全部被引用之论文总次数
Y=以1992年为基点、某期刊1990和1991年全部论文发文量的总和
IF1992年 =(X(1990年,1991年) / Y(1990年,1991年))

价格挤压因子计算公式ecpm=1000pCTRbidc。根据相关信息显示,将eCPM的计算改为ecpm=1000pCTRbidc,叫做价格挤压(squashing)因子,挤压出价的权重。调高质量高,调低竞争力度提高。

三江平原第四系松散堆积物十分发育,它分布广、厚度大、地层完整、含化石丰富。第四系松散堆积物是岩石圈转化而来的一种重要物理风化现象形成的,是崩塌、滑坡、搬运地质作用的产物。第四系松散堆积物其基本母质来于岩石,同岩石圈有着非常密切的联系,属未固结的近代沉积物,是岩石的风化物经过水力、风力和重力的搬运作用形成的,具有不同程度的分选和沉积韵律的特点,未经固结且质地疏松。

一、第四系松散堆积物沉积的特征

(一)沉积特征

三江平原在地质上是一个长期间歇性沉降的内陆断陷,处于三面环山和三大江汇流之后,在这样独特的地质-地理条件下,第四系沉积物必然是十分发育和具有特色的。

根据原地矿部九○四水文地质工程地质大队在三江平原工作成果,三江平原第四系的成因类型十分复杂,它包括残积、坡积、洪积、冲积、湖积、风积、沼泽沉积、冰水沉积和一些混合成因类型。主要有河流滞留相和冲洪积相。在平原的边缘山麓地带还有一部分冰碛物。在时间上,冲积成因的河床相砂和砂砾沉积占有最大比重,从而在平原内构成了一个统一的大厚度第四系含水岩组。在三江平原表层,漫滩-沼泽相富含有机质的淤泥质砂质粘土和漫滩相砂质粘土、亚砂土,共同构成了复杂分布,成为平原内大部分地区承压含水层的隔水顶板,同时也是促成三江平原沼泽广布的重要因素。

三江平原第四系的厚度较大。除平原边缘和残山残丘附近厚仅50~100m外,平原内部厚度一般为120~200m,最厚可达240~280m。第四纪中不同时期的沉积物,自新到老,从上到下构成了既嵌入又叠置的上叠型沉积。

三江平原第四系的岩相变化规律是西粗东细、北粗南细和北厚南薄。就地表物质组成而言,东西两半部的差异极其明显。以街津山、二龙山、乌尔虎力山、别拉音山至双山一线为界,西半部地面物质较粗,粘土、砂质粘土层很少或缺失,亚砂土、砂,甚至砂砾层往往直接出露地表。东半部地面物质较细,地表常见3m以上甚至十几米厚的粘土、砂质粘土覆盖层。

三江平原第四系沉积物的平均粒度比我国东部其他堆积平原粗。其岩性以砂砾石和砾质中粗砂为主,很少有粘性土夹层。粒度组成在剖面上表现出3个大的韵律,与下伏古近-新近系含煤砂泥岩系的粒级差异是比较明显的。在重砂矿物中,以风化能力较低的角闪石和绿帘石为主,形成非稳定矿物组合,其风化系数在剖面上低于孔平均值,反映了第四纪全球性气候变冷的特征,与古近-新近纪以褐铁矿、钛铁矿等金属矿物为主的稳定矿物组合截然不同,反映了不同按气候条件下化学风化作用的明显差异。但其重矿物组合对第四纪不同气候期的反映不甚明显,只在中更新统出现了锆英石的低含量带。

(二)化学特征

据现有资料(表6-26)分析,地表以下的第四纪地层中,微量元素含量以Ti为最丰富,其次是Sr,含量最低的微量元素为Cd和Mo。在7~13m处,Ti、Cr、Cd、Cu、Sr等含量明显增高,而Ni、Mo、Zn等含量明显变低。其他比例失调的元素还有Be、Hf、Zr、Ca等。地层内不同深度铁氧化物类型(表6-27),在7~15m之间,FeO>Fe2O3,说明此区间为典型还原条件下沉积的地层,三江平原多数地带具备此特点。由于在7~15m之间多数地带分布1层或数层淤泥质砂质粘土,沉积时为还原环境,因此导致水质不好。许多民井打在此地层上,造成了地方病的高发。地层中其他氧化物随深度变化不明显(表6-28)。与表层土壤相比,第四纪地层中K+、Na+、Ca2+、Mg2+、Cl-、SO2-4、NO-3等可溶盐含量很低(表6-29),其中NO-3小于010mg/L,这说明地表以下第四纪地层受污染较轻。以上各种元素及氧化物分布规律比较实际地反映了三江平原第四纪地层的原始景观环境。

表6-26 三江平原第四纪地层中微量元素的含量

表6-27 第四纪地层中Fe2O3与FeO含量对比表

表6-28 6号孔-1(新华木材厂)氧化物分析成果表

表6-29 三江平原第四纪地层中可溶盐含量均值

二、第四系松散堆积物中的矿产

三江平原第四纪地质作用发育,松散堆积物矿产丰富,数量多、分布广、易开采。现已发现主要矿产有砂金、泥炭、宝玉石、铸形砂、陶土、砂砾石、粘土等。这些矿产资源有的已开采利用。

(一)砂金

砂金主要分布于小兴安岭山前的沟谷中,如梧桐河、嘟噜河流域以及黑龙江中的八岔岛等。

三江平原砂金矿床类型多为河谷型和阶地型,以河谷型为主。其形成受原生矿床、气候环境、搬运介质及第四纪地壳运动等因素控制,多为冲积-洪积型、冰川和冰水成因类型及残坡积型。

(二)泥炭

泥炭是沼泽的特有产物,由沼泽植物残骸、腐殖质组成的。它是在还原条件下,大量植物遗体堆积后经细菌分解而形成的。所以,泥炭多分布于古河道、牛轭湖、河漫滩等处。

(三)水泥用粘土

在区内的高平原、阶地、低平原等大部分地区,都有水泥用粘土层成分。其成因多为第四纪以来不同时代湖相沉积物。

(四)卵砾石料

据岩相古地理图揭示:三江地区除现代沟谷、河流的河床、漫滩区外,平原区下部也堆积有大面积近百米厚的砂砾石、卵砾石层,储量丰富,为第四系冲洪积、洪积层,属河床相沉积物。该层分选较差,次磨圆,质地致密坚硬,密度大于25g/cm3,干容重大于15g/cm3,孔隙率小于45%,吸水率小于25%,杂质泥质含量小于10%、针状、片状颗粒含量小于15%,是用作混凝土良好粗骨料。

(五)砂料

主要分布在各大水系高低漫滩区、平原区土层下部,有大面积、厚度近百米的砂质土分布。储量丰富,为第四系冲积、冲洪积层,属边滩相、滨湖相沉积物。区内几条大砂冈如萝北、同江等地砂场已被开采。颗粒大小均匀,粗、中、细砂均有,含少量砾石,分选中等,磨圆较好。杂质泥质含量小于25%,干容重大于15g/cm3,孔隙率小于40%,水容盐含量小于10%,有机质含量少。是工程建筑用混凝土等良好细骨料。

(六)土料

土料一般为粘土、砂质粘土及黄土状土,用于烧制砖瓦和水泥掺和用料等建筑用土料。一般分布在台地和低平原区东部,厚度2~50m,为第四系湖相沉积物。颗粒较细,粒度在001~010mm,小于005mm含量大于50%,塑性指数10~20,水溶盐含量小于3%。土料储量丰富,是良好建筑用土料。

三、主要环境地质问题

(一)第四系松散堆积物中铁质矿物含量高

根据平原区钻孔中的重砂矿物分析资料,地层中含铁矿物种类多、含量高、分布广,砂砾石中含铁矿物一般含量为30%~50%,平均值为394%,最高可达987%(表6-30)。地层里的含铁矿物在垂向上的分布仍具一定的变化规律:含铁质矿物较高的地段一般在地表以下20~40m、80~130m、160~190m处(图6-2)。这与地下水中铁离子含量的垂向变化规律大致吻合,这充分说明地下水中的铁离子主要来源于地层中的含铁矿物。

另外,区域土壤中铁的背景值很高,故各种土壤均有铁质浸染现象,形成**和棕红色铁质条带,并伴有大量的铁锰质结核。沼泽水中铁离子含量一般为03~2mg/L,这些均影响着浅层地下水中铁离子的形成和变化。

表6-30 萝北地区钻孔铁矿物含量平均值统计 单位:%

注:总体均值为394%。

(二)不良特殊土

特殊土类因其具有特殊的工程地质性质,在进行工程建筑时,会产生一些特殊的工程地质问题而引起人们格外的注意。三江地区较为常见的特殊土有冻土(包括季节性冻土和岛状多年冻土)、盐碱土、淤泥类土等。

1冻土

测区受其自然地理、气候、水文等因素影响,季节性冻土广泛发育,而岛状多年冻土仅在萝北石灰窑附近被揭露。冻土的工程地质性质主要受其土体温度及含水量影响。坚硬冻土中未冻结水的含量较少,土粒冻结牢固,抗压强度高,压缩性能低。但其融冻时,土颗粒连接松散,结构变化抗压强度急剧降低,融化后呈衡释状态。塑性冻土中未冻结水的含量较多,具塑性,在荷载作用下可压缩变形。抗压强度也不高。岛状多年冻土和季节性冻土的下半部在一定深度内多为塑性冻土,区内也主要为此类冻土。在设计工程建筑的基础埋深时,一般应对残留冻土层的厚度加以计算考虑,以便采暖和防融陷处理。

图6-2 钻孔中含铁矿物垂向变化曲线

2盐碱土

盐碱土主要分布在友谊农场、二九一农场、集贤、七星泡等山前台地、平原区,为碳酸盐类盐碱土,属轻—中度盐碱化。盐碱土具有独特的工程地质性质:颗粒松散、内聚力很低,吸水潮湿而土体膨胀。抗压强度很小。但在其盐分结晶、颗粒板结后,内聚力升高,内摩擦角增大,抗压强度也随之增大。其工程地质性质与盐分的组成、含量的多少有关。盐碱土层一般位于包气带附近,厚03~05m左右,最厚不超过2m。盐碱土作为地基土必须进行压密夯实处理。

3淤泥类土(软土)

淤泥类土主要分布在三江平原挠力河中下游漫滩区牛轭湖及其附近大面积沼泽湿地内。岩性组合有:淤泥、泥炭、淤泥质粘土、淤泥质砂质粘土、淤泥质砂等。多呈夹层或透镜体产出。在表层时厚度一般小于05m,为第四系湖积、沼泽沉积层。多为中-高压缩性土,天然湿度294%~441%,有机质含量50%~195%,内聚力C=004~015kPa,内摩擦角θ=0°~11°。

(三)河流侧向侵蚀塌岸

河流的侵蚀作用主要发生在三江地区黑龙江和乌苏里江岸边,河流的侧向侵蚀产生侵蚀陡坎,形成新岸及水土流失等现象。当黑龙江在流出嘉荫峡谷进入平原区后,由于水深流急,沿岸土质松软,冲刷侵蚀作用明显加强,形成多处塌岸。经多年观察,中兴镇、名山、同仁北口子等凹岸地较为严重。一般塌岸速率为2~8m/a。中兴镇平均塌岸速率10m/a,塌岸长约几十千米,估计每年约有十几公顷的国土流失。

(四)地面塌陷

双鸭山煤田和鹤岗煤田有一部分矿区在平原区,而集贤煤田和绥滨煤田及宝清煤田都在平原上,深埋第四系地层之下。

在煤矿区,由于地下煤炭资源的开采,在地下留下了较大的采空区,这些开采空间破坏了地下原有岩体的平衡状态,开采煤层的上覆岩层和土层依次发生冒落、断裂、弯曲等变形破坏,最终波及地表,在地表造成规模不等的资源破坏、房屋建筑、民工用设施失稳等影响其使用功能及其生态环境的恶化不良环境效应。这些问题在双鸭山、鹤岗矿区已表现得相当严重(表6-31)。

表6-31 矿区地表塌陷一览表

(五)土体崩塌

土崩主要发生在一些大型取土坑内,是由于人类挖土烧砖工程活动,在台地陡坡处开挖出现土体陡坡,通过地表水渗透沿土体垂直裂隙切割,使土体陡坡垮落。比如汤原县正阳乡位于汤旺河与松花江汇流处,其新胜村东南大型侵蚀沟沟岸坍塌,流失土方量200m3,下游沟口淤积泥砂厚达25m多。松花江凹岸,由于水流长期侵蚀作用,岸边多处失稳形成崩塌,平均每年因江水侧蚀造成岸边崩塌宽度1~2m。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/yw/13267551.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-29
下一篇 2023-06-29

发表评论

登录后才能评论

评论列表(0条)

保存