|
||
|
||
| 一、引言 学习特征是指对学生的学习产生影响的心理生理和社会特点,也是学习者的个性因素。著名心理学家卡特尔将人的个性抽取16种基本特征或称16种个性因素,并通过实验证明这16种个性因素在一个人身上的不同组合,构成了一个人不同于其他人的独特人格。这些个性因素不仅影响人们在生活中待人接物的方式同时还影响人们在学习中的行为。远程教育的学习态度、学习方式、学习评价和上网时间等四个方面均受个性因素的影响。 学习特征由学习者的知识结构和学习风格组成。知识状态说明了学习者对正在或将要学习的知识的掌握情况,有学习者初始技能、当前技能和目标技能;学习风格包括学习者的生理特征、心理特征和社会特征三个方面。生理要素是对学习者的学生产生影响的生理特点,主要有学习者的性别、年龄、偏爱的学习时间以及感知觉通道;心理特征包括认知、情感和意动。认知风格是学习风格的一个重要组成部分,它反映了学习者对外界信息刺激的感知、思维、记忆和理解问题的方式与倾向;情感与学习者从事学习活动的主动性和自觉性密切相关;意动则与学习者从事学习活动的持久性密切相关;社会特征主要为学习者与他人的交往能力。为了便于收集和处理网络学习环境中的学习特征,我们将学习特征简化为4个基本要素: 知识结构:学习者对正在或将要学习的知识的掌握情况。它有学习者初始技能、当前技能和目标技能。按照加涅的学习结果分类分为是言语信息、智慧技能、认知策略、态度和动作技能。 信息加工方式:听觉型、视觉型和触动型。社会特征:合作学习者还是个别学习者。情感、意动类型:依据学习者理性水平、控制点和成就动机的不同将学习者分为被动型、选择型和积极型。积极性对学习有强烈的热情,同时具有高度的责任感,能够自我激励,自我管理学习,能竭尽全力达到目标;选择型学习者只是对自己感兴趣的内容才有学习热情,希望能够用最少的努力就可以达到目标;被动型学习者对学习没有激情,缺乏自主性,害怕失败。学习者的情意类型及其特征,被动型 选择型 积极型。 基本特征 对学习没有激情,不愿意为自己的学习承担责任。害怕冒险和失败。学习自主性较差。 对感兴趣的内容有强烈的学习动机。对自己感兴趣的内容能够安排自己的学习。不愿意花费精力去实现目标。 具有强烈的学习动机和良好的学习策略。能够主动激发自己的学习动机、安排自己的学习过程。具有较强的自主性适合的学习环境 适合学习线性结构的学习材料,喜欢得到明确的指导,适合低要求的、讲授型的教学模式。 喜欢半结构化的学习材料。 喜欢得到简洁的指导。学习动机主要来自外部的激励。适合中等要求、训练型的学习模式 喜欢结构松散的学习材料,例如超文本式。喜欢自由的学习方式,适合高要求的、发现型的教学模式。例如讨论式的学习模式。 三、学习特征分析系统的组成 学习特征决定学习者的学习行为并通过学习行为表现出来。在网络学习过程中,学习者与网络学习环境之间不断地产生交互行为,例如提交注册信息、提交检索关键字,点击链接点、完成测试等。我们可以利用一定的技术将这些数据记录在数据库中,通过数据挖掘转化,再现为学习者的个性特征。 数据挖掘又称数据库中知识发现。它通过对海量的历史存储数据进行分析和分类得出有意义的模式和关系的过程。数据挖掘的应用十分广泛,其挖掘的对象可以是关系的、事务的、面向对象的和对象--关系的数据仓库。挖掘的数据类型的不同可以分为--空间数据挖掘、时间系列数据挖掘、文本或多媒体挖掘以及网络数据挖掘。特别是网络数据挖掘可以从用户使用网络的过程发现用户使用网络的偏好,对发现学习者在网络学习环境中的学习特征非常有效。
界面模块是学习者信息分析系统的使用者与分析系统进行交互活动的界面。通过它,用户可以向分析系统手工添加学习者信息、提出分析要求同时查看分析结果。这些用户可以是网络教育的管理者、设计者,也可以是虚拟的教师指导者。 2.信息收集模块 信息收集模块负责收集和学习者学习有关的所有数据。收集到的所有原始数据都被存储在源数据库中,为分析学生特征做准备。所以必须保证数据收集的全面性和正确性。 数据的收集方式有两种:第一种是异步收集方式。即采用传统的信息收集方法,通过问卷调查、学习者自我介绍来获取有关的数据。需要收集的数据包括学习者的名字、ID号,性别、年龄、教育程度、起始水平等、初始学习风格(学生第一次登陆时通过学习风格调查问卷获得)这类信息多为静态信息,不会随着学习者的学习过程改变;第二种为同步收集方式,即充分利用网络通讯技术,对学习者的学习活动进行实时追踪,记录所有与学习相关的信息。这些信息包括:动态数据:用户经常点击的URL、Search的关键字;经常访问信息的类型;课件的内容及时间;做作业和考试的过程和结果;用户的停留时间、访问的时间频率 ;进行电子讨论的话题、访问的时间段;用户经常使用的交流工具;学生上次浏览的教案页面;学生已浏览过的教案页面;学生已做过的练习和阶段测试,及培训工具返回的结果;学生查阅过的问题列表;学生的登录时间、下线时间;学生的学习类型:预习、复习、上课、实验等;学生此次学习活动所采用的教案编号;使用的交流工具及使用次数;学生提问、回答问题的次数、正确回答问题的次数;学生练习的答案;各知识点的学习成绩。 数据的来源可以有web服务器、客户端以及代理服务器。其中网络日志文件是重要的数据来源,它清晰地记录了学习者的浏览行为。网页日志除了记录学生在网络教学平台上的学习活动,同时也记录了一些与学习活动不相关的档案,而且网络日志也无法记录学习者的所有行为数据,例如无法获得cookie等。因此,为了能够更好地进行学生特征分析,一方面需要先对网页日志做一次重新组织的工作,确保所获得的网页日志均与学习活动相关的信息;另一方面还需要利用java等语言来获得其它与学习相关的信息。 3.数据抽取模块 数据库中的数据是最原始的数据,为了提高数据挖掘的质量,首先要按照元数据标准进行清理、集成和变换去掉数据中的“噪声”、不一致的数据,将原始数据转化为全面的数据视图存储在数据仓库中。 在数据抽取过程中,元数据扮演着重要的角色。它规定了对数据抽取、净化和转化以及最后在数据仓库存储的方式,决定了数据挖掘的效率。在这里需要定义两种元数据:学习者元数据和学习对象元数据。学习者元数据用来规范所要收集的学习者特征。而学习对象元数据用来描述学习材料的属性。目前关于元数据的标准比较多,为了使该信息分析系统内的信息具有通用型和共享性。本文依据教育部教育信息化技术标准委员会(CELTSC)制定的学习者模型规范和学习对象规范将学习者元数据和学习对象元数据分别定义为: a、 学习者元数据,它由五个维度组成: 学习者基本信息:包括姓名、呢称、ID、性别、班级、年纪、email、密码等字段 b、 学习对象元数据:它包括以下属性: 标题 4.数据分析模块 经过清洗、转化后的数据所包含的信息仍既是隐性的、非可视化的。例如学习者偏爱的学习模式、媒体类型等我们仍然无法能够直观地看出来。因此还需要用一定的算法发现隐藏在数据背后的规律,将其转化为信息(知识)--关于学习者特征的知识存放在知识库和模型库中,再通过用户界面呈现给用户,并用这些规律还将指导以后的联机分析和数据挖掘。 数据挖掘的算法可以分为两类。一是采用描述式挖掘,以简洁概要的形式提供学习者的学习者特征的数据集。通过概念描述可以对数据仓库中的数据进行汇总,得出学习者在五个维度的概化表示,经过属性相关分析去掉与学习特征不相关或弱相关的属性,并形成不同的类;此外还可以通过聚类将特征相同的学生聚集在一起形成不同的学习特征群,并通过分类得到每个特征群的特征描述,存放在模型库中指导以后的数据挖掘。模型库中的初始模型按前面提到的学习特征建立,并以它为依据指导最初的数据挖掘,在挖掘的过程之中不断修改、完善形成比较合理的学习特征模型。 |
||