您好,欢迎来到刀刀网。
搜索
您的当前位置:首页构建基于知识本体的教育领域知识库初探

构建基于知识本体的教育领域知识库初探

来源:刀刀网
第31卷第10期2010年10月

微󰀁计󰀁算󰀁机󰀁应󰀁用MICROCOMPUTERAPPLICATIONS

Vol󰀁31No󰀁10

Oct󰀁2010

构建基于知识本体的教育领域知识库初探

江󰀁河

(太原大学󰀁外语师范学院󰀁太原󰀁030012)

*

摘要:近年来,知识本体的研究与应用越来越广,知识本体主要被用来描述特定领域的概念与关系的特性。因此领域内的知识关联呈现就成为重要的研究课题。本研究基于本体技术,应用于教育领域知识管理的分类,采用教学领域的知识结构作为研究主体,构建出不同类型的教学资源管理本体。采用教学管理作为研究主体,将教学管理分为教学类别、研究类别及服务类别三种类型,进而构建出三个不同方面的教学管理本体结构,系统以此结构为基础进行模糊推论,并与所搜集到的资料做完整的分析与比对,最后以网页的形式呈现给使用者。经系统测试,领域知识库的建立提供了获取具体对象的教学管理相关资料,达到了简化教学管理分析需求的目的。关键词:Ontology、教学管理知识本体、模糊逻辑推论

ConstructionofOntology-basedknowledgeineducation

JIANGHe

(JournalofForeignLanguageNormalCollageofTaiyuanUniversity,Taiyuan,030012)

Abstract:Thecurrentknowledge-basedapplicationswiththedevelopmentofdifferentknowledgesystemswithintheconceptthatknowledgeofandrelationshipbecomethefocusofontologyisdescribedintheconceptofdomainknowledgeandrelationshipswithinaneffectiveway.ThestudyofOntologytechnology,applicationsmanagementintheteachingestablishmentandmaintenanceofclassificationinordertomanuallybuildteachingmanagementontologystructure,Asamainuseofteachingmanagement,teachingmanagementwillbedividedintoteaching-oriented,research-orientedandservice-orientedthreetypes,andthenconstructedthreedifferentaspectsofteachingmanagementbodystructure.Systembasedonthisstructure,thefuzzyinference,andwiththeinformationcollectedtodoacom󰀂pleteanalysisandcomparison,thefinalformofawebpagepresentedtousers.Thesystemtesting,domainknowledgebaseprovidesfortheestablishmentofthespecificobjectofteachingmanagementinformation,tosimplifythepurposeofteachingmanagementofdemand.Keywords:Ontology;TeachingManagementOntology;FuzzyInference

1󰀁前言

学者认为人们建立知识本体(Ontology)的主要理由包括:人与软件代理之间能否分享信息结构,重复使用领域知识,进而分析领域知识。随着现今科技日新月异的发展,网络已成为不可或缺的重要工具,通过这种模式,分散的信息即可整理为有用的知识,以提供给使用者通过网络传送并进一步浏览信息。近年来,校园网的普及使得校园内的信息快速增长,造成使用者必须耗费很多的时间来搜索所需的信息,为了解决此一问题,本研究以教师为研究主体,依据教学管理的行为加以分析处理,构建一个属于教师个人知识本体架构及教学管理的资料分类系统,并根据此架构分析教师所需信息的类型,主动给予教师相关信息,缩短教师搜索所需相关资料的时间,从而方便教师使用。

本文于2010年-08-02收到。

*本文是山西省教育科学󰀂十一五 规划课题论文,编号:GH-09198。

󰀁10期󰀁

江󰀁河:构建基于知识本体的教育领域知识库初探

71

2󰀁相关研究与探讨

知识本体(Ontology),是用来描述现实事物的本质、是一个实体概念化的明确描述、Ontology是一个以概念来构建的系统,当使用Ontology来描述特定领域的知识,可将Ontology表示是一种概念、属性、实例与关系的组合。目前已有许多研究应用Ontology来表达人类知识。Ontology在知识管理、语意网、信息检索、资料库设计及软件工程等方面均扮演极重要的角色。近年来,已有许多OntologyLanguage被提出,并在SemanticWeb上已渐渐成为重要的组件。

(1)RDFSchema:RDF是由全球信息网协会(W3C)主导发展而成的一个模式,其提供具有语意网络机制,可用来描述网页资源,允许资源描述机构订定各自的控制词汇,提供结构化的相互共容机制,RDF在语法上则是遵循XML。

(2)DAML+OIL:DAML+OIL是由美国国防部高等研究计划局研发,为了比RDF更能表达RDFClass

的定义,在美国提议的努力下,于2000年10月发行DAML-ONT,它是RDF的延伸语言,其具有对象导向和框架基础知识表达。DAML小组为提供更进阶的功能服务而结合OIL,后来发展成为DAML+OIL。(3)OWL:OWL是一种最新被用来定义语意网的OntologyLanguage。OWL提供三种不同表现能力的子语言以用于不同的使用者社群。其中,包括OWLLite、OWLDL以及OWLFull。

图1󰀁语意表现能力层级

3󰀁教学管理知识本体架构

3󰀁1󰀁教学管理知识本体架构

教学管理知识本体架构分为5部份,其定义简述如下:

(1)Domain(领域):所代表的是本体所要描述的特定领域,在本研究中以Teacher为主体。(2)Category(类别):多个概念组成,本研究分别为教学导向、研究导向及服务导向。(3)Class(类):为本体中最主要的部分,用来描述所要说明领域中的概念。(4)Attribute(属性):是用来描述类或关系的特性或属性。(5)Relation(关系):是用来说明类与类的间的关系。

本研究将教师区分为教学导向、研究导向及服务导向等三个类型,每一个类型的教师都有其各自的行

󰀁󰀁72

󰀁

微󰀁计󰀁算󰀁机󰀁应󰀁用󰀁2010年

为分析,可以让TeachingOntology用来归纳其个人归属类型,并且可整合成TeachingOntology,往后,这些架构即可应用在各个不同的领域,针对不同的需求做不同的调整,以满足各类型系统的所需。

图2󰀁TeachingOntology实例图

针对某一领域的本体开发是持续且反复的过程,其设计所谓的对与错,通常较好的解决方式是依赖在预期的应用上,也就是问题-解决模式。在本体架构中关系的描述就是事实的呈现,因而这些关系也可以延用在相同类似的问题上,若问题不相似只是表视在此问题上不具有已描述的关系,但并不代表此关系就不存在,因此在本体的概念中应要能反映事实与领域上的关联,且本体发展者不是要去涵盖所有的问题,而是需要抓住解决问题的核心。3󰀁2󰀁系统流程

使用者首次登录时,通过基本资料构建的程序将使用者的基本资料记录在描述数据库;使用者再次登录后,日志会记录其上网行为并储存于动态行为数据库。通过个人本体构建机制提取描述数据库与动态行为数据库资料,自动转换成OWL描述的文件,模糊逻辑推理系统抓取OWL文件内容值做模糊推论,进而推算出教师所属的类型领域。

本系统的文献检索代理可从互联网上提取符合概念的相关文件以做资料分类。文献检索代理方面会把从互联网所提取到的资料,传送给文件分类机制,再从此机制接收资料作分类,最后将结果储存至文档库供模糊逻辑推理比对。推算出教师所属类型,再和分群好的资料做比对。例如:如果推论出某位教师为研究类别,则该教师在下次上网时,便可收到本系统依据该教师的类型而分类好的相关资料,以减少使用者花费大量时间去搜索所需资料。

本系统架构主要分成三大部分:TeachingOntologyConstruction(教学本体构建)、DocumentsRetrieval(文献检索)及FuzzyInference(模糊逻辑推论)。

第一部份主要工作为教师本体的构建,第二部份为文件提取,第三部分则是比对推论。在教师本体构建中,本系统提出教师本体代理人及日制记录机制;而在文件提取部份中,提出检索代理;最后在比对部分中,本系统提出文献分类代理及模糊映射机制。各项代理人及机制功能简述如下:

󰀁10期󰀁

江󰀁河:构建基于知识本体的教育领域知识库初探

73

图3󰀁系统架构图

(1)ProfileConstruction:记录首次登入本系统使用者的个人基本资料。(2)LogRecordingMechanism机制:记录使用者每一次上网的浏览行为。

(3)PersonalOntologyConstructionMechanism机制:利用提取描述数据库以及在数据库的动态行为的资料,自动转换成以OWL描述的文件。

(4)DocumentsRetrieval代理:在网络上搜索相关的资料并且将资料传送至分类机制。

(5)DocumentsClassification机制:将互联网所提取的文件进行分类并储存至DocumentsRepository。(6)FuzzyMapping机制:从教师本体以及文档库中所得到的资料进行模糊逻辑找出使用者所需的相关文件及资料。

4󰀁模糊推论机制

模糊推论本体与领域知识本体不同之处在于将归属程度嵌入每一个概念里,构成模糊概念。在模糊推论本体中,其每一个模糊概念都含有两种模糊概念关联。4󰀁1󰀁教师行为推论

Leeetal提出的FuzzyInference机制推论出教师类型的归属程度,在此将教师上网的浏览信息,分别以浏览网页的次数、时间以及互动性作为模糊变数进行推论,且搭配OWL文件中定义Ontology架构,进而推断教师行为类型。

(1)输入语言层:此层第一层是负责直接将输入的值传送至下一层,假设第i个󰀂教师 的输入向量为Xi=(X1,iXi2...,Xij),则Xij为第i个󰀂教师 的第j个模糊变数。

󰀁i=((xi11,xi12,!,xi1k1),(xi21,xi22,!,xi2k2),(xij1,xij2,!,xijkj))

(2)输入项:这一层次是执行第一个推论步骤,即计算输入模糊变数的每个模糊语意项的M隶属程度。本论文里采用的为三角形归属函数,而三角形的归属函数可用三个参数[󰀂, ,!]所决定,其函数如下所示:在教学管理行为知识本体系统中,给予四个输入的模糊变数。

󰀁i=((xi11,xi12,!,xi1k),(xi21,xi22,!,xi2k),(xij1,xij2,!,xijk))12j

(3)规则节点:此层是规则层,每一个节点代表用以表示一条模糊推论规则,这一层级的连结完成模糊逻辑规则前项假设的Match,因此,规则节点必须执行模糊AND运算,且其输出必须连结至第四层级的关连

2

2

2

2

2

2

2

2

2

2

1

󰀁󰀁74

󰀁

微󰀁计󰀁算󰀁机󰀁应󰀁用󰀁2010年

语意节点,在本研究中,这些规则是由专家事先定义的,其中模糊变数TIT表示教师上网浏览时间,模糊变数TIF教师上网浏览频率,模糊变数TII表示教师上网互动性,TBT表示教师所属的类型。假设第i个󰀂教师 里的j个模糊变数,分别算出的MatchDegree都是第1个语意项。

(4)输出项层:该层的输出节点是执行模糊OR运算来整合有相同后项的模糊规则,假设:FL、FM及FH为输出的规则节点,并且分别连结到Low、Medium及High的语意项,函数Centroid()为解模糊化重心法的处理程序。

4

max3

󰀁iCentroidF∀LOW󰀁w,CentroidiF1#LoL

FM∀Mediummax

33ax󰀁#Medium,CentroidFm󰀁#HightiFM∀HighiFNN

(5)输出语言层:主要在于完成解模糊化的处理,以求得教学管理类型(TBT)的归属程度。将所算出来的重心做加权平均的运算,则第i个󰀂教学管理类型 的输出结果如下所示:

p=1

Yi=

3

wip#Vip

3p=1

wip

最后,比较各类型教学管理的归属程度,取其最大值为该教师知所属类型。例如:A教师的行为类型归属经模糊推论后,各类型归属程度分别为教学导向:中、研究导向:高、服务导向:中,则该教师推论结果则为研究导向的教师。

4󰀁2󰀁模糊均值分类

理想的分群法则是希望将n个资料分成k个群数,使得同一群中的资料相似性高于其它资料;而所谓相似性就是该点到类聚中心点的归属度大小,故归属函数与类聚中心点得的位置就是FuzzyC-Means所要求的,为了求得最佳解,我们定义效能指标与阀值,一旦效能指标越小于等于阀值,表示有较佳的分群结果。至于文献检索的部分,本研究中的文献检索代理从网络上提取相关资料,其提取资料的依据是来自所定义的概念;所谓的概念是一些与教学、研究与服务资料相关的关键词的同义词,而分类的结果将会分为教学、研究与服务三种导向的资料,再分别将这三种类型的资料储存至文件库,以供模糊推论比对后可将分类好的资料呈现给使用者。

5󰀁系统实现

5󰀁1󰀁系统功能概述

系统网页中主要分为5大部分:

(1)在校务相关信息:包含教学信息、最新消息和行政会议的记录等。

(2)课程信息中:列出教师可能的相关用书,包含了系统书目及管理学书目等。(3)教学资源:包含远距教学网、国内教育资源网与本校特色教育资源等。(4)研究发展:列出了国内一些相关的研究中心和研究机构等。(5)论文信息:记录学校最新的论文记录。5󰀁2󰀁系统实现

登录系统利用申请的账号跟密码,登录本系统且开始使用服务。

(1)未分类文件显示文献检索代理根据定义到互联网搜索比对概念而得到的文件。

(2)分类文件的呈现使用者可在下次登录系统后,收到自己可能需要的相关文件,分类的信息是利用模糊推论技术进行资料分类。

(3)记录教师在线浏览行为在教师浏览网页时,系统便会记录教师的在线浏览行为,以便后续的分析与研究,使用者结束浏览行为时,点选推论的连结,系统便会对教师浏览行为进行模糊推论。

(4)教师类型转变时,模糊映射机制便会分析比对的前的数据,判断该教师类型是否改变,并于下次登

󰀁10期󰀁

江󰀁河:构建基于知识本体的教育领域知识库初探

75

录系统时,呈现其所属类型的信息。

6󰀁结束语

本研究以教师作为研究主体,通过系统分析与规划,开发教师本体架构。由实验结果可知,此基于知识本体的模糊推论方式,减少昂贵的搜寻成本,具有一定的参考价值。此外还配合OWL语法、模糊理论等技术,研究宛成代理人的技术研发,本研究以人工方式构建教师本体。为了解所建构的教师本体的实用度,邀请信息技术教师四名进行知识本体论建构分类测试,使用效果良好。未来希望可以进一步将此系统与研究分析架构应用到相关领域知识教学中去。

考文

[1]江鹏.Ontology知识表示的艺术[J].计算机教育,2004(7):41-43󰀁[2]宋炜,张铭󰀁语义网简明教程[M].上海:高等教育出版社,2004󰀁

[3]李善平,胡玉杰,郭鸣,等󰀁本体论研究综述[J].计算机研究与发展,2004,7:1040-1050[4]郁书好,郭学俊󰀁基于本体的教学知识库研究与应用[J].计算机研究与发展,2007,8:161-1󰀁[5]郝泳涛,刘峥󰀁基于几何本体的特征建模及制造行为推理[J].微计算机应用󰀁2010,8:1-8󰀁

[6]谢东成󰀁教师个人知识本体建构技术及其运用󰀁http://ec2006󰀁atisr󰀁org/proceeding/Paper/ec1392󰀁pdf󰀁

[7]Corcho,0,andAG󰀁omez-P󰀁erez,󰀂Ontologylanguagesforthesemanticweb. IEEEIntelligenceSystems,vol󰀁17,no󰀁1,pp󰀁54-60,Jan./Feb.2002.

作者简介

江河,男,1976年生,硕士研究生,讲师,研究方向:多媒体资源库。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.com 版权所有 湘ICP备2022005869号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务