论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 关于大数据的论文 毕业论文数据怎么找 大数据杂志 论文数据 有关大数据的论文 数据挖掘论文 硕士论文数据挖掘银行 数据挖掘论文参考文献 数据挖掘期刊 数据挖掘论文下载 数据挖掘应用论文 数据挖掘技术开题报告

关于数据挖掘方面毕业论文格式范文 跟关联算法在排课数据挖掘中的应用有关论文写作资料范文

分类:论文范文 原创主题:数据挖掘论文 发表时间: 2024-03-23

关联算法在排课数据挖掘中的应用,该文是关于数据挖掘方面论文参考文献范文跟数据挖掘和课数据挖掘和关联类毕业论文开题报告范文.

摘 要:科学的进行课程安排,合理规划课程实施是关系教学效果提升和人才质量培养的重要途径.在分析典型Aprior关联算法的基础上,对某院校的排课信息进行离散化预处理,使用Aprior关联算法研究高职老师的授课倾向问题,得出高职授课规律并提出合理排课建议.

关键词:排课管理;Aprior关联算法;数据预处理;离散化

一、前言

排课管理是高校教学管理的一项重要事务,是合理配置师资力量的核心手段,如何科学的进行课程安排,合理规划课程实施是关系教学效果提升和人才质量培养的重要途径.在对高校排课信息数据进行预处理的基础上,研究典型的Aprior 关联算法,并据此对排课数据进行挖掘,重点研究高级职称老师的授课倾向问题,发现各开课单位的排课趋势和特点,拟定合理化建议,从而优化师资配置,对推动高校教学管理信息化、智能化建设,提升教学质量与效果具有重要意义.

二、 Apriori 算法

Apriori 算法是一种经典的频繁模式分析算法,该算法最早是由R.Agrawal 和R.Srikant 于1994 年提出,它利用的是布尔关联规则,核心内容是递推与关联[1].

Apriori 算法首先对频繁项进行分析,而这些频繁项被分析出的必要条件是频繁程度高于自己的设定,然后,对这些频繁项之间的强关联规则进行分析,同样的,频繁程度也需要满足前提条件:高于自己的设定.由频繁项集产生期望的规则,而且产生只包含集合项的所有规则.

Apriori 算法主要分为三个关键点[2,3]:一是候选项集的计数,对每个候选项集对应到事务数据库中,建立一棵树,把每个事务中所包含的k 维项集存储到树,进而查找候选项集树的结构,若发现目标,则进行累加,循环遍历;二是生成候选项集,将所有的属性进行频繁度分析,相互组合,循环遍历; 三是生成频繁项集,在上一步的基础上进行筛选,挑选满足置信度要求的项集,生成频繁项集[28].Apriori 算法描述如下:

1)L1等于{ 大项目集1 项集};

2) for( k 等于2; Lk-1 ≠? ;k++)do begin

3) Ck等于apriori-gen( Lk-1) ; // 构造候选项目集

4) for all a ∈ D do begin

5)Ca等于subset(Ck,a);

6)for all c ∈ Ca do begin

7)c.count++; // 计算支持数

8) end for

9)Lk 等于{c ∈ Ck |c. count ≥ minsupport_count };

// 得到k 阶大项集10)end for

11) 答案等于 ;

在此过程中只要找出频繁项集,并且满足最小置信度和最小支持度的条件在此过程中只要找出频繁项集,并且满足最小置信度和最小支持度的条件,即可产生强关联规则.但是Apriori 算法还是存在两个缺点[4,5],首先,需要很大的I/O负载,由于Apriori 算法运行过程中需要对每次循环进行扫描数据库,因为进行多次扫描事务数据库;第二,便是在算法运行过程中会产生大量的候选集,对存储空间要求较高.为解决上述缺点,研究人员提出很多方法进行改进:有利用基于散列技术产生频繁项集算法,有压缩未来迭代扫描的事务数进而提高效率,还有将数据划分应用到关联规则挖掘中,进而改善关联规则挖掘的适应性,还有牺牲精确性来换取有效性的基于采样的方法.

三、 Apriori 算法在排课数据中的应用

关联算法是通过对几个属性之间的进行计算比对进而得出属性与属性之间的支持度,然后根据属性之间支持度的大小来进行分类的.该方法在教育教学领域的成绩分析,教学评价中已有较多运用[6,7],本文从师资管理角度出发主要研究教员的职称等级与其他教学因素之间的关系,所以将职称等级作为主属性,将其与其他教学相关属性作关联度分析.

3.1 样本数据预处理

选取了某高校2016 学年的课程管理信息作为应用数据集,该数据集涵括了30 余万条样本数据,包括了基本属性集合为{ 开课单位、课程性质、合班人数、学时学分},目标属性为{ 职称}.

对样本数据进行数据预处理后,属性集合数据均调整为标称属性[8].其中,开课单位有将零散的、授课任务少的直属院系等合并为一项,即直属单位进行研究讨论;对于教员的职称等级,在本系统中有高职、中职、初职,鉴于初职的数据信息较少,本文进行关联算法处理时划分成高职与非高职;关于合班人数,定义为离散集合{‘小’,‘中’,‘大’}三个层次,分别为“小班”为30 人及以下,“中班”为31人至50 人中班,“大班”为51 人及以上;关于课程性质,本文在研究学校课表的基础上,将所有课程划分为选修课和必修课进行研究讨论;课程学时与学分相关联,所以在讨论时仅对学时作讨论分类,学时定义为离散集合{‘多’,‘中’,‘少’},较少学时课程,小于等于40 学时;中等学时课程,41 与50 之间;较多学时课程,大于等于51 学时.

因此,经过预处理得到各属性在全体样本数据集D 上离散取值为:

开课单位等于{ 基础部,电子学院,动力机械学院,电力电气学院,直属单位}

课程性质等于{ 必修,选修}

合班人数等于{ 大,中,小}

学时学分等于{ 多,中,少}

职称等于{ 高职,非高职}.

3.2 Apriori 算法的应用

对职称等级与各属性进行关联置信度分析,其中高职数据有142630 条,中职与初职数据有160210 条,其他数据为课程教员不确定,无法确定职称等级.

首先进行开课单位与职称的关联进行支持度分析,信息见表1:

在课表信息众多的属性中,与高职匹配发现频繁项集支持度大于0.3 的只有三项,从高到低分别为必修课、小班、少学时,而进行三项频繁项集支持度分析时,发现小班、必修课和少学时、必修课与高职之间的支持度仍较大,所以我们得出结论:

职称为高职更倾向于选择属性为必修课、小班、学时较少的课程.除此之外,在分析课程信息的两项属性时我们可以发现,{ 小班,必修课} 和{ 少学时,必修课} 这一属性的课程也更被高职教员所青睐.

根据上述结论,向教务课程管理人员提出以下决策建议:

增加职称为高职的教员教授属性为{ 大班}、{ 学时数多}和{ 选修课} 的课程.

四、结语

通过对排课数据的基于Apriori 算法的关联挖掘,研究高级职称老师与其他教学因素之间的关联程度,发现高职老师更倾向于选择属性为必修课、小班、学时较少课程的规律特点,为后期优化师资配备提供了科学数据支撑,对提高教学管理信息化、智能化水平,提高教学质量具有重要意义.

本文点评:本文是一篇适合不知如何写数据挖掘和课数据挖掘和关联方面的数据挖掘专业大学硕士和本科毕业论文以及关于数据挖掘论文开题报告范文和相关职称论文写作参考文献资料.

参考文献:

1、 弱关联冗余环境下的挖掘算法 蔡柳萍(广东技术师范学院天河学院信息与传媒学院,广东 广州 510540)摘 要在弱关联冗余环境下,开展的挖掘算法应用需要考虑关联属性,本文主要从模糊神经元网络学习算法与弱关联规则模型,建立两方面内.

2、 数据挖掘网格中决策树并行算法设计与性能分析 目前采用数据纵横剖分配合递归过程的基本方法能够实现数据网格中决策树的并行化,满足可扩展的高性能并行计算条件,对优化并行分类算法,解决海量数据信息非常有帮助 所以首先应该分析并行算法并对其数据进行试验 .

3、 基于Hadoop平台的并行数据挖掘算法 【摘要】 本文采用Hadoop 分布式云计算平台的两大核心技术MapReduce 和HDFS,实现数据挖掘算法中分类聚类算法的并行化,这一算法是在传统算法的基础上的改进,通过实践论证了该平台的分类聚类.

4、 数据挖掘在计算机网络病毒防御中的应用 【摘要】 社会科学技术的发展进程中,互联网技术的应用已经渗透到群众生活、工作的方方面面,而随着互联网信息技术的不断普及和应用,信息技术的应用中也出现了相应的漏洞和错误;文章就数据挖掘在计算机网络病毒防.

5、 大数据时代的数据挖掘和分析 摘要随着我国经济经济体制的全面革新与发展,我国各行各业都在飞速发展中,尤其是近些年来,科学领域的大力发展,科学技术更为普及,也从很多方面促进了科技的交融,当前的大环境下,数据的形式与规模也在朝着精准的.

6、 基于数据挖掘的橙光扶农平台用户细分模块设计 摘要数据挖掘技术是电子商务领域未来应用空间最大的一种新技术 橙光扶农平台为了以最快的速度和效率推广滞销农产品,需要迅速找出潜藏于大量客户群体中可以发展为爱心公益推广使者的志愿者 因此,平台利用数据挖掘.