[目的/意义] 分析古籍数字化领域研究现状,构建古籍数字化工作路径,发现当前国内古籍数字化研究工作的不足并提出未来发展方向,为便捷古籍开发、实现传统文化的传承提供参考。[方法/过程] 藉由国内外古籍数字化相关文献分析国内外现有古籍数字化研究的主要内容,结合五原语论与数字人文技术体系建设古籍数字化路径,并根据国内外研究现状找寻当前国内古籍数字化研究不足和发展方向。[结果/结论] 提出包含转化、重构、应用和控制4个部分的古籍数字化建设路径并对古籍数字化路径各部分内容进行了规划,基于文献分析结果与古籍数字化路径内容对国内古籍数字化现存问题与未来发展方向提供参考。
[目的/意义] 基于数字人文视角,以藏医学古籍《四部医典》为例,探索藏医学病症关系、病因关系、用药规律以及新处方挖掘路径,有利于藏医学古籍资源的开发与利用,从具体实践中帮助解读和传播少数民族医学资源。[方法/过程] 本研究使用Python、Gephi等工具软件,按照文档识别与校对、文本分词与提取、数据分析处理、数据可视化、结果阐释的研究过程,对藏医学进行病症关系分析、病因关系分析、用药规律挖掘以及新处方预测分析。[结果/结论] 相关的分析过程和结果有助于完成藏中医古籍知识发现路径,确定藏医学古籍内容挖掘的可行方法,为中医学古籍内容挖掘与知识发现提供新思路。
[目的/意义] 针对藏医古籍知识组织与开发不足的问题,利用混合深度学习方法构建面向藏医古籍的命名实体识别模型,为藏医古籍知识的深度开发与利用提供方法支持。[方法/过程] 根据藏医古籍知识特点,构建ALBERT-BiLSTM-CRF模型。以《四部医典》为数据集,在人工标注与文本预处理的基础上,进行命名实体识别实验,并将实验结果与其他3种常见模型进行对比分析。[结果/结论] ALBERT-BiLSTM-CRF模型对藏医古籍实体识别效果最好,F1-score达到96.28%,与其他方法相比提升约7个百分点。
[目的/意义] 面向藏医学专业研究人员和医疗工作者的科研需求,探索实现藏医古籍知识组织与服务的实现路径,设计藏医古籍服务平台的知识服务功能。[方法/过程] 在设计藏医古籍知识本体模型与知识图谱的基础上,探索知识检索、知识推理、知识推送3种服务功能在藏医古籍知识服务中的应用。[结果/结论] 研究显示,将人文计算等智能算法应用于藏医古籍知识的处理,能够为用户提供更加精准和高效的知识服务,以充分发掘与利用藏医古籍的活力与价值。
[目的/意义] 建立一个科学的中医古籍数字化平台服务质量评价体系,为今后平台提高服务质量和提升用户满意度提供参考。[方法/过程] 从中医古籍数字化平台服务特点和经典的服务质量评价理论模型入手,首先通过文献梳理确立了SERVQUAL模型在中医古籍数字化平台服务质量评价中的可借鉴性,然后采用因子分析方式确定了中医古籍数字化平台服务质量评价指标,同时利用主成分分析法确定了评价体系中各级指标的权重。[结果/结论] 构建了包含6个维度和22个二级指标的中医古籍数字化平台服务质量评价指标体系,依照提出的评价指标体系选择3个中医古籍数字化平台进行了应用,最后提出了平台服务质量提升策略。
[目的/意义] 基于早期施引文献与科学论文的知识关联对科学论文扩散效果进行预测,有助于从价值反馈角度前瞻性识别高影响力学术论文,为科研人员建立科学研究成果早期学术影响力评估体系提供参考。[方法/过程] 测度早期施引文献与目标科学论文在主题、期刊和作者3个层面的关联程度,采用线性回归与负二项回归模型,挖掘3种类型的知识关联度与目标科学论文扩散效果(即扩散速度、广度和强度)的内在关联机制;在此基础上引入机器学习算法对科学论文的扩散效果进行预测,剖析3类知识关联特征在预测任务中的重要性排序。[结果/结论] 神经科学领域的实证分析显示,主题关联与目标科学论文的扩散速度呈正相关关系,与扩散广度和扩散强度呈倒U型关系;期刊关联会抑制目标科学论文的扩散速度,但能够正向影响其扩散强度与扩散广度;作者关联仅对扩散强度有稳定的正向影响;基于主题关联与期刊关联可以实现对科学论文扩散速度的有效预测,但难以预测扩散广度和扩散强度。随机森林模型在扩散速度预测中性能最佳,主题关联特征的重要性高于期刊关联。
[目的/意义] 个体认识论信念是主体心理世界的现象,也是影响个人学习过程的重要因素。本研究以气候变化议题为研究情境,诠释个体在搜索即学习过程中的认识论信念和知识建构过程,对拓展和细化信息搜索研究中的主体属性维度,把握信息研究和认识论研究的相交点具有重要意义。[方法/过程] 本研究以解释现象学为方法论,通过访谈、问卷和眼动追踪引导的回溯性口头报告了解参与者一般性认识论信念和主题认识论信念,采用访谈和书面报告从知识质量、知识变化广度和知识变化深度多个方面探究搜索过程中的知识变化。[结果/结论] 研究发现,两种认识论信念差异较大;主题认识论信念的简单性和确定性越低,则搜索策略越灵活,知识质量更高,知识变化广度更大;当认识正当性信念缺失时,知识变化深度也会缺失;主体对知识有用性建构影响了最终的知识表达。
[目的/意义] 构建线性文化遗产资源知识表示及语义增强框架,为文化机构开展文化遗产智慧化数据建设及推动优秀传统文化创新性发展提供路径参考。[方法/过程] 在提炼线性文化遗产“资源族群性、时间流动性和空间链状性”特征基础上,剖析线性文化遗产知识体系的层级结构,建构线性文化遗产资源知识表示模型,并依据表征理论和情境认知理论,从结构化语义增强和情境化语义增强视角对线性文化遗产数据进行语义增强,创新性地提出“时空”双重维度语义增强路径,最后以京杭大运河线性文化遗产为例,进行大运河知识表示及语义增强案例研究。[结果/结论] 本文构建的知识表示模型及语义增强框架有利于推进线性文化遗产数据的多维语义组织和深度挖掘研究,提升线性文化遗产内容的语义互联性和外延性。
[目的/意义] 为改变“以刊评文”的学术质量评价方法,本文尝试从文本片段入手开展知识单元粒度的学术质量评价。[方法/过程] 首先基于知识单元的描述规则抽取学术文献中的知识单元;其次梳理现有的学术质量评价指标,构建初步的知识单元质量评价体系;然后完善初选的评价指标体系,并根据领域专家意见对待评的知识单元质量进行赋分;最后利用回归分析拟合各量化指标与专家赋分,实现知识单元质量的自动评价。[结果/结论] 构建起以形式评价、内容评价和效用评价为核心的三维评价模型,实现了融合领域专家意见的知识质量自动化计量方法,克服了长久以来学术质量评价过度依赖于学术载体的不足,真正将学术评价的单位从知识载体深入到知识内容中。
[目的/意义] 为挖掘旅游平台游记文本蕴含知识,协助旅游者高效获取符合需求的信息和知识,为制定旅游计划提供科学决策的信息支持。[方法/过程] 首先面向用户需求提出基于布尔矩阵和集合逻辑改进Apriori算法的思路;然后融合命名实体识别实现了游记文本关联知识挖掘及聚合,构建了基于关联知识挖掘的个性化推荐服务模式,并以携程网中杭州相关的游记文本进行了实证研究。[结果/结论] 研究发现,融合命名实体识别和改进的Apriori算法,能够有效挖掘游记文本蕴含知识,实验结果验证了在算法性能及结果上要优于传统Apriori算法,并能够根据挖掘结果向用户提供个性化推荐服务,协助旅行者科学、高效地制定旅游计划。研究结论丰富了游记文本挖掘的方法论,为旅游平台服务推荐优化提供了新的思路。
[目的/意义] 本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程] 通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论] 本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。
[目的/意义] 开源软件社区用户通常从社区中获取代码相关知识, 而缺乏贡献的动机和意愿, 这将影响社区的可持续发展。[方法/过程] 整合动机理论与社会资本理论, 构建了开源社区用户知识贡献行为模型, 采用混合方法包括SEM和fsQCA对数据进行分析。[结果/结论] 研究发现, 内部动机(流体验、自我效能)、外部动机(感知声誉、互惠)、社会互动关系、社区认同、共同语言显著影响用户知识贡献意愿和行为。fsQCA结果显示, 流体验、感知声誉、互惠、信任是4个组态的共同核心条件。研究结果启示, 开源软件社区需要关注用户的内外部动机, 发展社会资本, 以激发用户的知识贡献意愿和行为, 促进开源社区持续快速发展。
[目的/意义] 为避免个体落入信息茧房窠臼, 对网络用户信息茧房影响因素的相互作用关系和关联路径进行研究, 提出具有针对性和整体性的"破茧"策略。[方法/过程] 通过文献回顾和专家意见确定影响信息茧房的16项因素及其直接影响关系, 构建解释结构模型, 揭示各因素之间的层级关系和关联路径, 借助交叉影响矩阵相乘分类法进一步分析因素的驱动力和依赖性, 同时验证解释结构模型的科学性。[结果/结论] 网络用户信息茧房影响因素的递阶结构模型包括6个层级, 可划分为直接层、中间层和根源层3个层次。MICMAC分析得出影响用户信息茧房的自治簇、依赖簇和独立簇因素。两者在影响性质上具有统一性, 表明构建的解释结构模型科学合理, 据此从信息素养、意见领袖、社群影响、选择性心理和个性化信息需求5个方面提出突破信息茧房效应束缚的相应建议。
[目的/意义] 研究有声读物平台用户满意度影响因素, 有助于平台运营商针对影响用户满意度的核心问题做出改善, 提升平台服务质量, 增强用户对平台的满意度, 促进有声读物平台的良性、可持续发展。[方法/过程] 从信息生态视角出发对有声读物平台用户满意度影响因素进行维度划分, 以已有相关文献为理论基础提炼出用户满意度影响因素, 并结合KANO模型设计问卷来判断各影响因素的重要度属性, 同时对提炼出的影响因素进行验证。[结果/结论] 有声读物平台用户满意度影响因素主要包括信息、信息人、信息技术、信息环境4个维度。提炼出的25个用户满意度影响因素中, 魅力属性因素5个, 期望属性因素8个, 必备属性因素1个, 无差异属性因素10个, 反向属性因素1个。建议可以从对用户满意度影响较大的期望属性、魅力属性和必备属性3类影响因素层面来提升用户满意度。