知识图谱分为几种?大型学科知识图谱如何构建呢?
文章摘要:目前已有的知识图谱,分为通用知识图谱,比如数据库、YAGO、Freebase等,以及谷歌的KnowledgeGraph、百度“知心”、搜狗“知立方”等;另一种为领域知识图谱,比如Geonames、“天眼查”等。目前,采用全自动化...
目前已有的知识图谱,分为通用知识图谱,比如数据库、 YAGO、 Freebase等,以及谷歌的 Knowledge Graph、百度“知心”、搜狗“知立方”等;另一种为领域知识图谱,比如 Geonames、“天眼查”等。
目前,采用全自动化的方法很难获得更精确的知识图谱,如 DBPedia、 YAGO等,错误较多;而完全手工构造的方法,虽能确保准确率,但代价高昂,且耗费大量的人力物力,难以建立大型的知识图谱,因此,如何协调正确率与效率,平衡自动化方法与人工投入,以最有效的方法构造出最精确的知识图谱,是当前知识图谱建设中亟待解决的问题。
针对上述问题,以基础地理知识图谱为例,提出了一种系统的解决方案,即“四步法”,即:
(1)领域本体的建立:以地理科权威的教科书、辅助材料为基础,采用开放式 IE技术及相关统计方法,参照其它知识图谱的本体结构,并根据地理学专业的专业和教学人员的建议,实现对基础教育的地学本体的建构;
(2)“众包”半自动语义标注:以地理学科领域本体为基础,利用语义标注系统实现半自动语义标注,并在该过程中完善地理学科领域本体;
(3)外源资料补充:根据地理学知识图谱的本体结构,将结构化的外部资料进行适当的加工,获得外源资料,成为地理学科知识图谱中的一项重要内容;
(4)信息提取:根据地理知识图谱的本体结构,采用有监督、半监督、不监督的方式提取百度百科中的实体和关联,从而获得更多的数据。
以上就是大型学科知识图谱构建的解决方案。
文章为沃丰科技原创,转载需注明来源:https://www.udesk.cn/ucm/faq/19328