论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 主成分分析外文文献翻译 主成分分析的参考文献 主成分分析的文献综述 主成分分析论文 主成分分析数学建模论文 主成分分析参考文献

主成分分析方面本科论文怎么写 和基于主成分分析和聚类分析的国民生活幸福感综合评价相关硕士毕业论文范文

分类:硕士论文 原创主题:主成分分析论文 发表时间: 2024-04-04

基于主成分分析和聚类分析的国民生活幸福感综合评价,该文是关于主成分分析相关专科毕业论文范文跟聚类和幸福感和综合评价方面专科毕业论文范文.

(上海理工大学 管理学院,上海 200093)

摘 要:运用主成分分析法和聚类分析法,对全国31个省份、直辖市与人民生活幸福感相关的11个相指标进行分析,找到各个地区人民生活幸福感的相对指数,分析各个地区人民生活幸福感差异的原因,并对未来发展方向提出合理建议.

关键词:人民生活幸福感;主成分分析;聚类分析;综合评价

中图分类号:C916文献标识码:A文章编号:

An Evaluation of People´s Happiness in Our Country Based on Principal Component Analysis and Cluster Analysis

XU Jin, LI Fang

(Business School, University of Shanghai for Science and Technology, Shanghai 200093, China)

Abstract: Scientific evaluation of the people´s well-being, to understand people´s livelihood, scientific development, to develop effective strategies to improve living standards of the people. Using principal component analysis method and cluster analysis, carries on the analysis to the 31 provinces and municipality directly under the central government and 11 indexes that related to people’s happy life, find the relative index of people´s sense of happiness in each areas, analyze the reason why people he different sense of happiness in each area, and then give some reasonable proposals for future development direction.

Key words: People´s life happiness; principal component analysis; cluster analysis; Comprehensive evaluation

1引言

改革开放30多年,给中国的经济、社会、政治和人民生活带来了巨大的变化.20世纪80年代以来,我国的经济以平均9%以上的速度连续20多年飞速地发展.2000年年末我国人均GDP已经超过800美元,这是人民生活水平总体上达到小康的重要标志.国家经济的飞速发展使人民的收入水平提高,生活条件也在不断改善.进入2017年,我国经济增长速度逐渐放缓,中国经济面临软着陆,人民生活的幸福感是否真正提高越来越受到社会的广泛关注,因此提升人民生活幸福感是我国当前应当重点关注的方向,构建幸福指标体系是测度幸福指数并理解国民幸福结构的基础性研究工作[1].幸福感是一种心理体验,它既是对生活的客观条件和所处状态的一种事实判断,又是对于生活的主观意义和满足程度的一种价值判断.由于人的主观意识无法得到测量和取值,所以本文采用客观条件和所处状态的事实判断对幸福感进行研究.运用主成分分析法并对最终得分进行聚类分析,对全国31个省(直辖市)居民幸福感进行研究,选取客观性能够代表人民生活幸福感的11个相关指标进行比较[2],找出各个省市的人民生活水平的特点并分析差异原因,并对我国人民生活幸福感进行综合评价,进而提出提高人民生活水平的相应策略.

2研究方法及数据来源

2.1主成分分析法

主成分分析是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法[3].这些主成分能够反映原始变量的绝大部分信息,通常表示为原始变量的某种线性组合.使观测数据从高维降到低维,从而简化数据[4].主成分分析的模型为:

F1 等于 C11X1 + C12X2 +...+ C1pXp

F2 等于 C21X1 + C22X2 +...+ C2pXp

...

Fp 等于 Cp1X1 + Cp2X2 +...+ CppXp

因主成分分析中各主成分是按方差大小依次排序的,则在分析问题时,可以舍弃部分主成分,用前后方差较大的几个主成分来代表原变量,这样不但可消除评价指标间的多重共线性,还可减少指标选择的工作量[5].为了便于显示人民幸福感影响因素的差异,本文拟将各因子的综合得分转换为百分制,公式如下:

2.2聚类分析法

聚类分析是将个体或对象分类,使得同一类中的对象之间的相似性与其他类的对象的相似性更强.其目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化[6].聚类分析又有很多种,本文采用K-均值法进行聚类.

2.3指标的确定与数据来源

本文以全国31个省(直辖市)为研究对象,根据文献[1]的理论,从中选取客观性指标,再从2016年中国统计年鉴上下载指标数据,利用主成分分析和聚类分析的方法对我国各地区幸福度进行研究.

本文选取了与人民生活幸福感相关的11个指标:X1:人均生产总值(元);X2:居民消费水平(元);X3:人均可支配收入(元);X4:政府教育支出(亿元/万人);X5:政府社会保障和就业支出(亿元/万人);X6:政府医疗卫生和计划生育支出(亿元/万人);X7:人均电力消费量(亿千万小时/万人);X8:人均网上零售额(亿元/万人);X9:老年人口抚养比(%);X10:人均废水中主要污染物排放量(万吨/万人);X11:人均空气中烟(粉)尘排放量(万吨/万人).其中前8个为正指标,后3个为逆指标.

2.4 数据标准化

由于不同指标间存在量纲差异,为了使数据具有可比性,采用标准差标准化法对评价指标进行标准化处理,标准化公式为:

(1)

对于正指标之间利用(1)式来对数据进行标准化处理,对于逆指标则将原来的变量变为:P’ij等于1/Pij,然后再利用(1)式处理

公式中:表示第个省市第个指标标准化后的数值,表示第个地区第个指标的指标原值,表示第个指标的算术平均值,表示第个指标的样本标准差.

3分析过程及结论

3.1数据预处理

根据2016中国统计年鉴[7],将全国31个省(直辖市)所要研究的指标汇总成表,然后将汇总的表进行标准化处理,处理结果如表1:

3.2数据导入与分析

将数据导入IBM SPSS Statistics 22软件中,将数据进行主成分分析,表2为每个变量的初始共同性以及主成分分析法抽取主成分后的共同性,共同性越高,代表该变量与其他变量可测量的共同特质越多,由表3可知,11个变量信息提取都比较充分.

由SPSS输出方差解释表(见表3)

提取方法:主成分分析法.

本文采用主成分分析法提取因子,由表3可以看出,前三个特征根大于1,其余八个特征根小于1,前三个公因子的方差贡献率为86.314%,这三个公因子能够反映原始指标的绝大部分信息,提取三个公因子能够对31个省市进行人民生活幸福感的分析.

从表4成分矩阵中可以找出:第一主成分:X1人均生产总值,X2居民消费水平,X3人均可支配收入,X8人均网上零售额.代表了该地区居民的收入和消费水平.第二主成分:X4政府教育支出,X5政府社会保障和就业支出,X6政府医疗卫生和计划生育支出,X9老年人口抚养比.代表了该地区政府公共服务水平.第三主成分:X7人均电力消费量.代表该地区繁荣程度.其中X10人均废水中主要污染物排放量,X11人均空气中烟(粉)尘排放量这两项指标得到的载荷量比较小,对综合值影响也比较小,且大多数指标分布在第一主成分中.

a. 提取 3 个元件.

然后根据元件评分系数矩阵来计算因子得分,表5为元件评分系数矩阵:

元件评分系数矩阵

提取方法:主成分分析.

从表5的数据可以得到如下因子得分函数:

F1等于0.190X1+0.197X2+0.200X3+0.115X4+0.084X5+0.094X6+0.048X7+0.190X8-0.016X9-0.112X10+0.115X11

F2等于-0.064X1-0.077X2-0.074X3+0.235X4+0.225X5+0.261X6+0.061X7-0.031X8+0.249X9+0.221X10+0.027X11

F3等于0.106X1+0.058X2-0.007X3-0.074X4+0.097X5-0.038X6+0.623X7-0.116X8+0.116X9-0.188X10-0.464X11

最后,计算出因子得分,以及各因子的方差贡献率占两个因子总方差贡献率的比重作为权重进行加权汇总,得出各地区人民生活幸福指数的综合得分F,即

F等于(43.587*F1+29.681*F2+13.046*F3)/86.314

各省市在每个公因子上的得分及综合得分如表6所示:

3.3聚类分析

基于以上主成分分析得出的三个主成分的取值,在此基础上利用SPSS的K-均值聚类法对这三个主成分进行聚类分析.

聚类情况如下图所示:

从上图可以看出,全国31个省市分为四类:

第一类:北京、天津、上海、浙江、江苏、广东.

第二类:河北、山西、辽宁、吉林、黑龙江、安徽、福建、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南.

第三类:内蒙古、海南、青海、宁夏、新疆.

第四类:西藏.

F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别.观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验.

由上表可见P值均为小于0.05,说明分类效果良好.

3.4数据分析

结合主成分分析的得分表和聚类表可知:

北京、天津、上海、浙江、江苏、广东.这6个省市属于人民生活幸福感相对较高的地区,可以将其归为发达地区,我们可以从得分表中具体看出,这一地区的第一主成分的得分都很高,说明这一地区人民收入和消费水平很高,该地区人民的幸福感主要来自于高收入带来的经济享受.这些地区的第三主成分也都是处于相对较高的水平,说明这些地区电力消耗很高,经济的发展离不开电力的消耗,人民生活娱乐离不开电力的消耗,人均电力消费量高,直接反映了人民生活水平很高,进而得到人民生活幸福感很高.这6个省市,代表的是京津冀,长三角,珠三角三个地区,这三个地区目前来说是我国重要的科技、贸易、金融和信息中心,且是国际文化交流和融合的地方.经济的飞速发展,必然会带动民生的发展.京津冀发展区以北京为核心,带动周围城市的经济发展,而长三角地区则以上海为中心带动.这两片地区依靠着国家发展红利,以及核心城市的经济带动,近几年飞速发展,而珠三角地区是我国对外开放的窗口,拥有发达的进出口贸易,并且气候、地理位置优越.在这三个地区生活的人民不仅能够感觉到国际化大都市给民众带来的生活享受,而且交通、餐饮等行业快速的发展,能够给人民的生活带来极大的便利.所以综合来说,在这6个省市的人民生活幸福感最高.

河北、山西、辽宁、吉林、黑龙江、安徽、福建、江西、山东、河南、湖北、湖南、广西、重庆、四川、贵州、云南.这17个省市为一类,代表了我国经济欠发达地区的居民幸福感,该类地区经济水平不高,发展较缓慢,所以人民收入和消费水平相对偏低,且地方经济发展缓慢,政府对于公共服务的投入相对较少,如教育,医疗方面,该地区民生的发展受到经济发展条件的制约,因此该地区人民生活质量普遍一般.并且,对比原始数据和人均处理后的数据,安徽,河南,河北等地区,明显由于庞大的人口基础导致各项指标偏低,并不完全能够代表当地民生发展状况,近年来,安徽,河南,河北等地的民生发展状况逐步上升,逐渐像东部地区靠拢.我们也可以从主成分综合得分表可以看出,部分地区,如福建,与发达地区的差距已经越来越小.

内蒙古、海南、青海、宁夏、新疆.这5个省第二第三主成分得分很高,说明虽然经济发展不是很迅速,但是人口相对来说不多,每个人能享受到的政府资源相对来说得到提高,而且该地区污染少,空气质量高,这也从一个方面提高了人民的幸福感.

西藏地区为第四类地区,西藏虽然地处我国西部,地理位置相对偏僻,经济发展缓慢,但西藏人民生活的幸福感并没有降低.青藏铁路的通车打开了西藏的大门,加快西藏与东部地区的经济文化交流.相关资料显示,西藏率先实现了学前教育、城乡义务教育和高中阶段教育的免费教育.并且西藏100%的农牧民均享有以免费医疗为基础的医疗保障.这些都提高了西藏的幸福指数.

4结论与建议

提升人民生活水平是我国经济发展的目标之一.

本文认为,目前,我国经济发达地区的人民生活幸福感相对较高,由于经济的快速发展,城市各项生活指标日渐完善,公共设施更加便利,再者人民收入得到提升,能够享受到更多城市快速发展带来生活质量上的提升.所以对于发达城市,应该继续保持城市民生建设,稳中求进.

但是也不难发现,对于中部经济发展并不优秀的城市,如何提升人民生活品质成为了一个重要课题.这类地区经济发展普遍缓慢,但是不能因为经济发展缓慢而把建设重点完全放在经济发展上,民生发展同样重要,提升人民生活幸福感也是重中之重,所以作为领导者,可以经济、民生兼顾发展,并不是只有经济发展才能带动民生发展,而是应该寻求一条可靠的路径使得经济、民生同步推进.

参考文献:

[1]陈惠雄,潘护林.基于经济社会发展的幸福指标体系:构建与解释[J].社会科学战线,2015,(3):212-222

[2]毛锦凤,孙玉凤.基于主成分分析的甘肃省民族地区经济综合评价[J].开发研究,2009,(05):41-44.

[3]俞一珍,王章豹.我国区域产业结构优化升级水平评价及聚类分析[J].科技和产业,2016,16(6):17-24.

[4]何晓群.多元统计分析(第四版)[M].北京:中国人民大学出版社,2015.

[5]魏芸菲,凌济民,陈烛蔷,王学军.基于主成分、聚类分析对我国各个地区幸福指数的研究[J].安庆师范学院学报,2013,(11):40-44.

[6]曾奔豪,张新英,吴凤华等.基于主成分分析方法的乡镇可持续发展能力评价[J].科技和产业,2016,16(3):106-115.

[7]国家统计局.2016 中国统计年鉴[Z].北京:中国统计出版社,2016.

上文总结:这是一篇关于聚类和幸福感和综合评价方面的相关大学硕士和主成分分析本科毕业论文以及相关主成分分析论文开题报告范文和职称论文写作参考文献资料.

参考文献:

1、 基于形态学标记青贮玉米自交系的聚类分析 收稿日期20161119基金项目20132014黑龙江省财政厅自拟课题(XZNKT5);20132015齐齐哈尔市科学技术计划指导性项目 作者简介柴华(1985),男,汉族,黑龙江齐齐哈尔人,硕士,助.

2、 云南省各州市旅游投融资分析基于SPSS聚类分析法 谢宗运,朱晓辉(云南财经大学旅游文化产业研究院,云南昆明650221)摘要利用云南“十二五”期间各州市不同的旅游项目类型中的投融资额,采用聚类分析法,分析各地州市的旅游投融资项.

3、 传统新闻媒体微博影响力的评价模型基于主成分分析的实证 摘 要 本文以15 家传统媒体的微博为研究对象,样本涉及通讯社、报纸、广播电视……传统媒体,选取6 项关键性指标,运用SPSS 软件对影响传统媒体微博影响力的因子做主成分分析,提取了“社交.

4、 聚类算法概述和应用 【摘要】 聚类算法在数据挖掘技术中有着十分重要的应用,在数据分类操作中能够达到良好的效果 本文对划分聚类、层次聚类、密度聚类、网格聚类算法的主要思想及内容进行简单概述,并根据其各自特点分析每种聚类在处.

5、 英汉类动词的语义成分与词化模式分析 摘 要借用词化模式理论和语义成分分析法,分析英汉“思考”类动词的核心语义、语义构成、语义容量和词化偏好,发现英汉语中的“思考”类动词在语义成分及结构上既.

6、 腰痛片中香豆素类成分含量测定方法优化 摘 要为了建立腰痛片中活性成分含量快速、简便、高效的测定方法 以甲醇水(含0 1甲酸)为流动相,采用梯度洗脱 通过高效液相色谱法对腰痛片中补骨脂素和异补骨脂素含量进行测定,结果表明,补骨脂素在0 03.