当期目录

  • 全选
    |

    特约稿件

  • 曹树金
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 科学研究前沿识别是科技战略情报领域的一个重要方向,对《未来新兴科学研究前沿识别研究》一书进行评述,为科学研究前沿探测与演化、关键核心技术识别、颠覆性技术预测等科技战略情报领域的研究与实践提供参考。[方法/过程] 从多源数据融合、文本挖掘方法和多维指标体系创新、可视化分析工具运用、碳纳米管领域实证等角度对该书核心理念和观点进行评述。[结果/结论] 该书的出版对科技情报研究以及科技管理部门研判未来研究前沿领域大势具有重要的指导和引领作用。

  • 马海群, 满振良
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 公共数据授权运营是促进数据交易流通、挖掘数据价值的重要手段,从政策工具视角切入公共数据授权运营政策,有助于探究现有政策的注意力配置情况,为日后国家或其他省市出台公共数据授权运营政策或文件提供参考。[方法/过程] 以质性分析为研究方法,以领跑我国公共数据事业的浙江和山东两省发布的公共数据授权运营政策文件作为政策样本,使用质性分析软件NVivo12PLUS进行政策工具的考察和挖掘,研究其使用情况的重点和不足之处,并针对问题提出相应的完善建议。[结果/结论] 当前公共数据授权运营无论是理论还是实践层面都处于摸索尝试阶段,在对政策样本进行分析后发现,政策工具的使用存在供给型政策工具的比例分配失衡、环境型政策工具滥用、需求型政策工具亟需扩充的问题,仍需要协调供给型政策工具的比例配置、强化环境型政策工具的均衡性以及对需求型政策工具进行扩充完善,以此来优化我国公共数据授权运营的政策体系。

  • 数据智能与知识服务

  • 张卫东, 陈希鹏, 李心怡, 李奉芮
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 通过对民间文学文本数据进行命名实体识别,有助于民间文学资料的深度描述和展示,为构建完整的长白山非遗知识体系夯实根基。[方法/过程] 本研究提出了基于多任务联合学习(BERT-BiGRU-MHA-CRF)的长白山非遗民间文学实体抽取模型,引入双向门控循环单元BiGRU更好地处理实体在句子中的长序列依赖性,解决梯度消失问题;再联合多头自注意力机制MHA加强对关键实体的注意力权重分配,从而获得更好的实体识别结果。[结果/结论] 通过对比BERT-CRF、BERT-BiLSTM-CRF主流多任务联合学习基准模型,本模型对民间文学命名实体识别的准确率均为最优,其精确率达86.76%。本研究初步实现了对民间文学文本的精准实体识别,有利于对民间文学资料进行深入分析和知识挖掘,有助于保护和传承长白山文化记忆。

  • 单涛, 许鑫, 王园梦, 王宇翱, 景慎旗, 叶继元, 郭永安
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 关系抽取是电子病历处理的核心组成部分,对于提高电子病历处理的准确性和效率至关重要。为解决中文电子病历关系抽取中实体冗余、实体词嵌套和实体重叠问题,提高医疗信息抽取效率,提出了一种新型的中文病历关系抽取模型。[方法/过程] 将关系抽取任务分解为关系优先解码器、全局实体提取和主体—客体对齐三部分。首先通过解码器预测和过滤关系,并基于预测的关系限制实体提取;其次采用关系特定的注意机制和全局指针网络,有效处理信息重叠和主体/客体嵌套问题;最后引入实体对应矩阵将主体、客体及其关系对齐为三元组。[结果/结论] 分别在CMeIE中文病历数据集和DiaKG真实糖尿病中文数据集上进行综合实验并与6种常用模型进行了对比分析,发现本文模型在数据集CMeIE和DiaKG上的F1值较主流模型CasRel分别提升了6.6%和5.8%。研究结果表明,本文模型可有效解决中文病历复杂性带来的实体嵌套和实体重叠问题,对医疗信息提取和数据处理流程具有良好价值。

  • 信息行为与用户研究

  • 张宁, 陈江玲, 袁勤俭
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 人工智能(AI)技术在创新发展的同时也产生了算法异化。本研究以算法进步带来的异化现象为切入点,引入矛盾态度概念,研究学术用户人工智能生成内容(AIGC)技术使用意愿形成机制,为促成学术用户AIGC技术合理使用、技术服务商改进平台功能以及相关部门算法治理提供借鉴与参考。[方法/过程] 基于ABC态度模型和自我调节理论,从算法欣赏和算法厌恶的角度构建算法异化下影响学术用户AIGC技术使用的理论模型,采用结构方程模型分析(SEM)和模糊集定性比较分析(fsQCA)的方法,对425份问卷数据进行实证分析。[结果/结论] SEM结果证实了矛盾态度对学术用户的AIGC使用意愿具有显著负向影响。算法欣赏(信息质量、功能质量)负向影响矛盾态度,算法厌恶(信息异化、治理滞后)正向影响矛盾态度,矛盾态度则在算法欣赏、算法厌恶和使用意愿间起到中介作用。同时,算法素养和社会支持在矛盾态度和AIGC技术使用意愿间起着调节作用;fsQCA结果进一步显示,质量导向型(S1)、自我效能型(S2)和群体驱动型(S3) 形成高使用意愿,而风险规避型(NS1)和规范缺失型(NS2) 会引发非高使用意愿。

  • 孟玺, 李庆霜, 霍帆帆
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 探讨社交媒体用户参与算法风险治理的影响因素,有助于提升我国算法风险治理效果,完善多元共治的算法治理体系。[方法/过程] 基于刺激—机体—反应(SOR)模型框架,整合社会认知理论和感知价值理论,根据2 313份问卷调查数据开展实证研究。[结果/结论] 研究结果表明,在总效应模型中,算法素养、政府规制与平台算法责任正向显著影响用户参与治理意愿,政府规制是影响最大的刺激因素。加入感知收益和感知风险中介变量后,算法素养、平台算法责任通过感知收益与感知风险的部分中介作用对用户参与治理意愿产生间接影响;政府规制通过感知收益与感知风险的完全中介作用对用户参与治理意愿产生间接影响。研究发现,感知收益的中介作用比感知风险更加显著。研究结论为完善我国算法风险治理体系提供了理论参考,对激励用户参与以实现算法风险多元协同共治具有积极的实践指导意义。

  • 李洪晨, 尹召凯, 张志强
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 从搜索引擎搜索到对话式搜索的转移, 已经成为用户信息搜寻的趋势, 探究用户搜寻转移行为的影响因素, 构建全面的行为转移分析框架, 提高用户信息搜寻转移行为的成功率, 从而为信息检索系统和对话式搜索平台的优化提供理论基础。[方法/过程] 从搜索引擎搜索到对话式搜索的转移基于能力、机会、动机和行为(COM-B)模型构建用户信息搜寻转移行为影响因素模型, 采用结构方程模型对413份横断面调查问卷进行数据分析, 讨论影响信息搜寻转移行为的障碍因素和促进因素。[结果/结论] 心理能力与身体能力、物理机会与社会机会、自主动机与反思性动机是影响信息搜寻转移行为的积极因素, 政策支持不足、对话式搜索系统的可用性低是用户信息搜寻转移的阻碍因素, 能力和机会能够正向影响信息搜寻转移动机。

  • 数据共享与数据治理

  • 臧国全, 周丽媛, 张凯亮, 柴文科, 张恒苗
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 现行法律法规和行业标准对人社数据提出分级保护, 但缺乏定量依据, 本文定量测度人社数据隐私值, 探索解决该问题。[方法/过程] 普查人社隐私相关文献, 建立人社隐私文本库; 构建人社隐私词表框架, 建立人社敏感词表, 进行人社数据敏感性识别; 设计隐私计量模型, 测度人社数据隐私值。[结果/结论] 计量结果表明, 人社数据隐私值由高到低为: 工资与保险福利数据、专业技术数据、行政工作数据、个人基础数据和入职流动数据。本文挖掘客观存在的人社隐私文本, 计量结果具有客观性, 为人社数据分级提供更科学的依据。

  • 徐伟, 韦红梅
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 生成式人工智能模型的性能依赖于训练数据的安全性, 而频发的训练数据安全风险已经成为人工智能技术发展的障碍。保障训练数据安全对技术的健康发展具有重要意义。[方法/过程] 通过文献、经验和比较分析, 揭示了生成式人工智能训练数据的安全风险, 并在借鉴欧盟治理经验的基础上, 结合我国实践提出了应对策略。[结果/结论] 研究发现, 当前训练数据存在数据来源不透明、标注不规范、内容不安全及泄露风险等问题。欧盟已建立以保障数据来源、标注、内容及泄露防控为核心的监管体系。未来, 我国应加强数据来源管理、统一标注标准、完善内容安全规则, 强化数据保护技术以确保训练数据安全, 推动技术健康发展。

  • 信息传播与信息规制

  • 高晓宁, 张孟伟, 杨蕴琦, 黄青, 袁静
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 运用组态思维厘清突发事件网络舆情传播路径, 有助于政府把握舆论走向, 制定更具针对性的应对措施。[方法/过程] 首先, 借鉴信息生态理论识别影响突发事件网络舆情传播路径的6种要素(事件类型、社会环境、政府、网民、网络媒体和意见领袖), 选取40件突发事件案例作为研究样本, 在时间序列上分阶段收集数据; 其次, 通过多阶段fsQCA分析, 探究要素及其组合作用于突发事件网络舆情传播的规律原理; 最后, 应用PSM方法评估不同组态路径对突发事件网络舆情热度提升的影响。[结果/结论] 突发事件网络舆情传播路径受多种要素共同作用; 事件类型与社会环境是舆情起始因素, 网民与事件类型是爆发因素, 政府是平息因素; 高/非高热度网络舆情传播路径在起始期、爆发期与衰退期共形成10种舆情类型, 且不同组态类型对突发事件网络舆情热度的影响存在显著性差异。

  • 闫璐, 赵江元, 黄微
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 从多维度解构涉企网络舆情, 涵盖情感、规模及影响力等方面, 进而建立针对各维度的量化指标模型以探究网络舆情如何影响企业价值, 以期为企业、投资者、监管等主体有效感知企业自身舆情发展态势提供路径参考。[方法/过程] 利用机器学习、自然语言处理、情感词典等多种技术、方法构建多维度涉企网络舆情测度模型, 从微博平台抓取涉企舆情数据以及从Wind金融数据库抓取文娱行业上市公司财务数据, 运用回归分析方法深入分析多维度涉企网络舆情因素如何具体作用于企业价值。[结果/结论] 结果表明, 涉企网络舆情的正负情感极性会显著影响企业价值的增减, 强度则影响增减的幅度; 企业价值受网络舆情规模大小的影响较为显著, 呈正相关关系; 网络舆情影响力对企业价值的影响不明显。多维度涉企网络舆情测度模型能有效量化网络舆情相关维度指标, 研究结果为企业及监管机构提供更详尽的参考, 有助于精准化解网络舆情风险。

  • 信息计量与科学评价

  • 冯小东, 罗简凡
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 梳理并界定引文扩散深度与广度概念, 探究论文发表早期引文扩散深度与广度特征对后期扩散强度的影响, 以丰富对论文早期被引特征与后期被引关联机制的解释。[方法/过程] 采集50个学科类别各3本期刊于2013年发表的论文题录数据及其早期施引文献题录数据, 构建目标论文的早期个体引文网络; 定义引文扩散深度为引文平均级联深度, 基于布里渊指数从学科广度、地域广度和作者广度3个维度定义引文扩散广度; 使用负二项回归模型和双重机器学习(DDML)方法对早期引文扩散深度和广度对论文后期扩散强度的影响关系进行分析。[结果/结论] 早期引文扩散深度在2年和3年引文窗口下均表现出了对后期扩散强度的显著负向影响, 而早期引文扩散学科广度在两个引文窗口下均表现出对后期扩散强度的正向影响; 地域广度在2年引文窗口下表现出对论文后期扩散强度的正向影响, 在3年引文窗口下则未表现出显著性; 早期引文扩散作者广度对于低被引论文组表现出与论文后期扩散强度的显著正向关系, 但对于高被引论文组则为负向影响关系。

  • 彭贤哲, 张瑜, 孟德杰, 石进
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 明晰中国人文领域核心学者的成长模式, 有利于为该领域人才培育奖励政策的制定或调整提供切实的参考依据, 从人才发展角度出发, 促进中国新文科建设的落地与推进。[方法/过程] 为挖掘中国人文领域核心学者潜在共同的成长模式, 本文以回顾的视角构建他们的科研生产力、学术影响力和综合能力的时序变化记录, 通过动态时间规整和轨迹聚类算法, 展现了他们在3个方面普遍的学术成长模式。[结果/结论] 结果表明, 中国人文领域核心学者的科研生产力的成长模式具有多样性, 哲学和文学学科的核心学者的学术影响力、综合能力的成长发生在后期, 但历史学学科却集中在早期阶段, 3个方面学术能力的成长通常表现出同步效应。由此得出的学者成长模式的阶段性特征、学科性差异以及组合规律, 有助于拟定中国人文领域人才的评价方式、评价周期、评估机制。

  • 数智健康与智慧医养

  • 张馨月, 牟冬梅, 王长聪, 王萍
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 面向健康管理场景, 以真实世界个体健康医疗数据为研究对象, 构建多维度的个体健康画像概念模型, 提升个体健康画像的实用性。[方法/过程] 在对现有个体健康画像研究评述的基础上, 面向健康管理应用场景, 通过分析真实世界个体和群体健康数据, 提出符合真实世界数据条件下多维度健康画像的标签体系, 构建包括人口特征、健康素养、行为习惯及健康状态4个维度的健康画像概念模型, 并以英国生物样本库中50万脂肪肝患者建立健康画像, 依据该健康画像进行预测研究。[结果/结论] 针对真实世界数据构建4个维度健康画像, 画像包括的多标签涵盖了患者的基础指标、客观指标和可控行为, 反映个体健康状态。通过精准的健康状态辨识和远期结局评估, 展示了从单维度到多维度3种模型不同时间点的ROC曲线。结果表明, 随着4种维度信息的逐步纳入, AUC值从0.58逐渐增加到0.64, 验证了"4P"模式下多维度健康画像在预测远期健康结果方面的有效性, 证明了个体健康画像能够帮助医生和个体更好地理解健康状态, 促进精准化健康管理的实施。

  • 何帆, 刘思源, 范昊
    摘要 ( ) RichHTML ( ) PDF全文 ( ) 可视化 收藏

    [目的/意义] 医生通过发布健康科普文章进行主动知识贡献, 对提升在线健康社区公共卫生知识水平具有重要作用。研究该行为对患者择医行为影响, 有助于缓解医患信息不对称问题, 并提升医生经济收益与社会形象。[方法/过程] 本研究基于信息系统成功模型(ISSM), 从使用情况、信息质量和服务质量3个维度构建主动知识贡献对患者择医影响模型。通过收集好大夫平台医生面板数据, 采用倾向得分匹配—双重差分(PSM-DID)方法, 量化医生文章发布行为、数量及类型对新增咨询患者影响, 分析职称和口碑调节作用。[结果/结论] 研究表明, 医生主动知识贡献明显推动患者择医行为。转载、精选、付费及视频文章转化效果尤为显著, 凸显信息质量与媒介丰富度重要性。同时, 高级职称医生存在边际效应递减现象, 而高在线口碑有正向调节作用。此外, 慢性病领域主动知识贡献效果显著优于其他疾病。本研究不仅拓展了医生主动知识贡献行为的理论研究, 还为在线健康社区优化运营策略提供了实践指导。