当期目录

  • 全选
    |

    情报方法与技术创新

  • 施顺顺, 苟震宇, 张琳, 黄颖
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 科学文献摘要结构功能识别是从摘要语料中识别出研究背景、方法、结果、结论等特定功能,本研究针对非结构化摘要功能识别任务中普遍存在的数据标注工作繁重、领域迁移能力不足、模型可解释性不佳等问题展开研究。[方法/过程] 使用基于迁移学习思想的深度域适应方法构建摘要结构功能识别模型,通过ALBERT预训练语言模型在摘要语料数据集中提取上下文特征,然后在特征提取器、域判别器和类别分类器共同作用下,将结构功能特征知识从带标记的源域数据迁移到无标记的目标域数据,旨在实现训练样本无标注条件下的模型跨域迁移。此外,采用SHAP方法为模型输出结果提供可解释性分析,并在目标域(COVID-19数据集)和源域(PubMed 20K数据集)上进行实验。[结果/结论] 基于深度域适应方法的模型比基线模型取得了更优的识别性能,其中“方法”“结果”功能的识别效果和可解释性最佳。实验结果表明,该模型能够以无监督学习方式实现从源域到目标域的知识迁移,减轻了模型对数据标注的依赖,同时增强了模型在该任务上的可移植性。

  • 窦路遥, 周志刚, 冯宇
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 为解决潜在标准必要专利识别任务中的序列信息的关键实体识别问题和序列建模的长距离依赖问题,实现识别精准度的提升和识别结果可解释性的增强。基于此,本文提出一种融合预训练模型XLNet和实体识别模型BiLSTM-CRF的潜在标准必要专利识别模型(XLNet-BiLSTM-CRF-CNN,XLBLCC)。[方法/过程] 通过XLNet模型联合上下文语境实现专利文本的词向量化与语义关系表达,并基于BiLSTM-CRF模型生成NER标签,用于标注文本中的命名实体边界,再通过构建CNN模型来学习标准必要专利(SEP)文本中的特征,实现潜在标准必要专利的识别和预测。实证部分以ETSI数据库中检索的SEP和incopat数据库中检索的非SEP构建的数据集对模型性能进行验证。[结果/结论] 研究发现:XLBLCC模型在准确率(86%)、F1值(89%)和AUC值(84%)上均超越其他基线模型;XLNet模型在全局语义理解上较之BERT等模型具备优越性;在高价值专利与标准必要专利的对比实验中,该模型表现出较强的泛化能力。

  • 数据智能与知识服务

  • 张逸勤, 邓三鸿, 王东波
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 本研究探索生成式大语言模型在非物质文化遗产文本嵌套命名实体识别中的应用,以提高特定领域复杂文本中多层次实体的识别精度。[方法/过程] 研究对比了GPT-4、Claude 3.5 Sonnet、ChatGLM2-6b等多种生成式大语言模型与BERT+GlobalPointer基线模型的性能,并设计了思维链与行为推理模式两种提示工程技术,以优化模型在复杂上下文中的识别能力。[结果/结论] GPT-4模型采用行为推理模式时表现最佳,Qwen2-72B模型达到91.16%的最高F1值,展现出优异的领域适应性。研究验证了生成式大语言模型在非遗文本嵌套实体识别中的应用潜力,然而在处理长文本和复杂嵌套结构时仍存在计算资源需求高、推理速度慢等挑战。未来,研究将通过混合模型或多任务学习框架,融合BERT模型的稳定性与生成式大语言模型的灵活性以提升识别性能。

  • 张君冬, 严颖, 王震宇, 刘江峰, 刘艳华, 黄奇
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 为提高领域知识图谱补全性能,解决现有图嵌入模型“语义理解不足”和大模型“生成偏差及计算资源浪费”并存的挑战,本文提出了一种融合大模型与图嵌入模型的领域知识图谱补全框架。[方法/过程] 首先,对开源大模型进行领域语料的深度预训练,增强大模型在知识图谱补全时对领域术语的理解力;其次,通过传统图嵌入模型在知识图谱已有结构的基础上生成候选关系或实体,为后续利用大模型进行知识图谱补全提供高质量候选集;第三,基于不同Prompt提示词策略引导前期训练完成的领域大模型完成候选项的排序,实现知识图谱的高效补全;最后,以生物医学领域现有数据集开展实证研究,验证其可行性。[结果/结论] 实验结果表明,本研究提出的方法在多个评价指标上效果显著,可为后续领域知识图谱补全提供新的思路与技术手段。

  • 信息行为与用户研究

  • 黄伟鑫, 毕达天, 朱梓萌, 王传清
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 用户跨社交媒体信息行为推动了信息推荐方式的创新,即相同的推荐信息在不同社交平台中穿梭,形成跨社交媒体信息推荐网络,然而这一方式的作用机理尚未明晰。探究跨社交媒体信息推荐的作用机理,有助于提供新的理论视角和模型框架。[方法/过程] 基于线索一致性理论和信任转移理论,构建理论模型,通过问卷调查法和偏最小二乘结构方程法检验假设。[结果/结论] 内容一致性、线索一致性、社交平台信任、发布者信任会显著影响信息线索信任,而信息线索信任又显著正向影响信息采纳。同时,社交平台信任和发布者信任分别正向调节内容一致性、评论一致性、信息线索信任之间的关系。此外,社交平台信任一致性促进信息线索信任对信息采纳的影响,与信息线索信任之间是互补关系;发布者信任一致性抑制信息线索信任对信息采纳的影响,与信息线索信任之间是替代关系。本文丰富了跨社交媒体信息推荐的理论基础,并为社交平台、信息发布者、应用跨社交媒体信息推荐的企业提供启发。

  • 周阳, 易明
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 对在线健康社区中知识共创群体动力间的耦合协调水平进行测量, 为优化协调发展格局提供参考。[方法/过程] 基于信息支持、情感支持和患者依从三维动力子系统, 选取合适的耦合分析指标, 利用“与癌共舞”论坛2019年3月—2024年3月的462条研讨贴的19 803条有效评论进行耦合分析, 揭示群体动力耦合的特征和水平。[结果/结论] 信息支持和情感支持处于高级耦合阶段的同时呈现出轻微失调;患者依从和信息支持、情感支持之间均处于高级耦合阶段且呈现基本协调耦合状态, 动力系统之间能够形成相互促进的良性关系, 具有较大发展潜力。

  • 信息计量与科学评价

  • 杨瑞仙, 刘佳涵, 孙倬
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 随着社交网络的普及, 用户隐私泄露问题日益严重, 给个人和社会带来潜在风险。本研究针对社交网络用户隐私泄露问题, 构建用户情感损失函数, 旨在量化用户在隐私泄露情境下的情感损失。[方法/过程] 本研究收集了微博用户生成文本数据, 结合潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)模型将隐私泄露分为社会生活、通信、位置和信息4个类型, 通过情感分析将各隐私泄露类型下的用户情感细化, 并在此基础上构造用户隐私泄露情感损失函数以对其情感损失进行计算。[结果/结论] 研究结果表明, 社交网络用户在隐私泄露情境下普遍表现出负面情绪, 且不同类型隐私泄露导致的情感损失程度和离散程度存在差异。其中, 通信隐私和位置隐私泄露造成的情感损失最为严重, 而社会生活隐私泄露的影响相对较轻。此外, 性别、地域分布、微博数量、使用年限等人口统计学变量对用户的隐私泄露情感损失存在不同程度的影响。

  • 李晶, 杨雪
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 探究论文跨学科性与创新质量的相关关系, 揭示高跨学科性论文创新质量的来源特征。[方法/过程] 从参考文献学科多样性视角构建论文跨学科性测度指标, 从知识生产阶段视角对论文创新质量进行解构, 设计包含知识吸收、知识产出、知识扩散三阶段的创新质量结构与量化体系, 围绕创新知识生产三阶段, 对论文跨学科性与创新质量的关系及跨学科论文的创新来源特征问题进行探讨。[结果/结论] 论文跨学科性与创新质量及其在知识吸收、产出与扩散阶段的创新得分同频增长, 依据区间分组的相关性分析结果, 跨学科性与创新质量存在极强正相关关系, 相关系数为0. 8;跨学科性与知识吸收、产出与扩散阶段创新得分的相关系数分别为0. 76, 0. 67和0. 57;高跨学科性论文的创新质量受知识吸收、产出与扩散阶段创新性的共同影响, 在创新来源方面具有全过程性特征;跨学科性排名位于前5%的论文其来源期刊位于Q1区的比例比排名位于后5%的论文高30. 545%。

  • 刘晓婷, 黄颖, 叶冬梅, 张琳
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 探究科研合作持续性的特征和规律, 有助于提升合作效率, 为科研人员提供决策支持。[方法/过程] 本文阐述了科研合作持续性三维内在逻辑的合理性, 进而分别设计或改进了合作持久性、合作稳定性、合作黏合性相关测度指标, 并基于机器学习算法构建科研合作持续性预测模型以实现对科研合作持续性的精准预测。[结果/结论] 与单一维度的方法相比, 三维测度可以更加全面地剖析科研合作的持续性特征, 为科研合作持续性测度研究提供了新思路。在科研合作持续性预测上, 相比于单一的BPNN、SVR、XGBoost、DT、RF等算法, 本文提出的Self-XGBoost-LSTM预测方法有着更高的准确率。相关结果验证了Self-XGBoost-LSTM在科研合作持续性预测领域的可行性与适用性, 为科研合作持续性预测提供了方法支撑。

  • 数智健康与智慧医养

  • 于海涛, 牟冬梅, 王长聪
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 面向疾病诊断场景, 探讨基于知识和数据融合的人工智能诊断模型的可解释性策略, 为促进智能医学发展, 进一步加强情报学、数据科学与医学学科间的交叉融合。[方法/过程] 结合多学科理论和方法, 从知识数据双轮驱动角度, 构建可解释性的智能诊断理论模型框架, 并以病毒性肺炎和细菌性肺炎的鉴别诊断进行实证研究。[结果/结论] 本文从情报学视角出发, 阐述了可解释性智能诊断模型构建策略, 并通过实际场景应用验证模型框架的可行性与合理性。

  • 何帆, 赵梦石, 刘思源, 范昊
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 为了优化在线医疗平台的医患互动质量,解决医患沟通内容不匹配以及医生推荐偏差的问题,本研究旨在通过提取医患沟通中的主题和医生画像特征,提升医患交流的精准性和有效性。精准构建医生画像不仅可以更好匹配患者需求,还能有效提高在线医疗服务整体质量及患者满意度。[方法/过程] 研究对象为好大夫平台上14 422名参与高血压治疗的医生。首先,利用LDA(Latent Dirichlet Allocation)模型挖掘医患交流中的主要主题。然后,基于问诊记录对医生进行初步分类,结合医生的个人特征、信息行为特征、患者评价特征及医患交流特征4个维度,采用层次聚类法进行二次聚类,构建精细化的医生画像。[结果/结论] 研究发现,核心医生群体在平台上高度活跃,且占据了大量资源。医患交流中的主题存在一定交叉,但部分患者的需求尚未得到充分满足。此外,需要提升患者对无问诊记录医生的信任。为此,建议平台优化推荐策略,深入挖掘非核心医生的潜力,增强医生识别患者特定需求的能力,以进一步提高服务质量和患者体验。

  • 专栏:信息管理实证研究重要理论的研究应用及其展望(十二)

  • 李若晗, 袁勤俭
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 帮助学界深入了解保护动机理论在信息系统领域中的研究进展,从而为后续相关研究提供参考。[方法/过程] 在介绍保护动机理论的起源与发展后,系统地梳理了信息系统领域应用此理论的研究,并分析了研究成果、局限与未来改进方向。[结果/结论] 本文发现,保护动机理论在信息系统领域内的研究主要集中在网络安全、在线隐私等信息安全问题,以及移动医疗服务使用意愿几个方面;研究中存在“对反应成本等可能会对保护动机产生负向影响的因素关注不足”“缺乏对持续保护行为的研究”等问题。

  • 吴迪, 袁勤俭
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 本文通过系统梳理助推理论的发展脉络,探索其在信息系统研究领域的应用现状与不足之处,从而为后续研究指明方向。[方法/过程] 本文就助推理论的起源及其发展历程展开研究,聚焦该理论在信息系统设计、在线行为研究以及信息安全领域的具体应用情况,对其在信息系统领域研究中存在的不足进行深入剖析。[结果/结论] 在信息系统设计中,助推的应用可以提升用户体验以及系统性能,然而,其长期效果并未得到充分验证;在在线行为研究范畴,助推对社交行为以及消费行为的影响较大,但其在群体动态行为以及跨文化背景方面的应用研究有所欠缺;在信息安全领域,助推策略有一定积极作用,只是缺少对多因素交互影响的具体剖析。未来的研究应当聚焦助推理论在应用研究中的长期效应、技术融合、多平台应用以及跨文化定制等方向,进一步完善助推理论的实践与理论框架。

  • 类沐艺, 袁勤俭
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 为帮助研究人员归纳和总结认知评价理论在信息系统研究领域中的应用情况和发展现状,以期未来在信息系统研究领域更好地应用认知评价理论开展研究。[方法/过程] 本文在介绍认知评价理论的起源和发展的基础上,系统梳理了该理论于信息系统研究领域的应用成果、现存不足和发展方向。[结果/结论] 研究发现,认知评价理论于信息系统研究领域中的应用主要聚焦在“电商消费者行为研究领域”“用户在线信息行为研究领域”“用户技术采纳研究领域”这3个方面;现有研究存在“未区分CAT中评价和情绪的各自作用”“对用户持续情感体验和行为意图的探究不足”“研究对象同质化现象强”等局限,这可以为未来研究的发展方向提供有价值的参考。

  • 张一涵, 陈敬华, 裴雷, 袁勤俭
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 本文意在帮助学界深入了解用户体验理论的发展脉络及其在信息系统领域的应用现状,为后续研究提供参考。[方法/过程] 通过对信息系统领域中使用用户体验理论的相关文献进行检索与梳理,归纳当前研究的成果、局限和未来研究方向。[结果/结论] 研究发现:用户体验理论在信息系统领域的应用研究主要集中在“用户体验理论(User Experience Theory,简称UXT)在信息系统设计与优化研究中的应用”“UXT在信息系统使用与采纳研究中的应用”和“UXT在信息系统评价与测量研究中的应用”3个方面;研究存在“针对不同用户群体对信息系统体验、评价、使用的差异关注不够”“对研究结论的实际应用与效果检验可进一步加强”等局限性;细分研究对象与情境,挖掘用户体验维度和类型,通过多案例开展实践应用研究,重视新技术的作用及影响等是未来重要的研究问题。