在数据密集型科研范式和人工智能的大背景下,数据要素成为新型生产要素,是推动全球经济社会发展的新动力。其中,高校科研数据也不例外,但有学者通过调研发现,当前科研人员在科研数据管理与使用方面存在“不愿开放、不敢开放、不知开放什么与不会开放”的实际问题。如何破解这些问题,更好推动高校科研数据开放与治理?围绕这些问题,近期,中国社会科学网记者采访了《高校科研数据开放与治理研究》一书的主要作者、欧亚体育(中国)有限公司科技信息研究所所长刘桂锋教授。
高校科研数据管理与治理亟待加强
中国社会科学网:请您简要阐释一下高校科研数据开放与治理研究的重要性。
刘桂锋:当前高校科研数据资源数量众多,类型丰富,蕴含着巨大的潜力和价值,然而数据资源存在分布比较分散、保存比较随意、管理比较混乱等问题,严重制约着数据要素价值的充分释放,延缓数据密集型科学研究范式的建立以及科学运动的进程。鉴于此,我认为,有必要构建以开放为前提、以治理为保障、以利用为目的的科研数据资源观,加强高校科研数据管理与治理,提升开放利用水平和能力,推动数据价值实现与释放。
回答高校科研数据如何开放、怎么开放,以及如何治理、怎么治理的现实问题,有利于解决高校数据资源孤岛问题,有利于推动数据密集型科研范式的发展,有助于为公共数据的开放、开发与利用提供借鉴和模板,有助于数字政府的实现以及推动数字经济与实体经济的深度、双向、互动融合发展。
中国社会科学网:围绕相关议题,您曾开展过哪些相关研究?
刘桂锋:围绕高校科研数据管理服务理论与实践,我曾经开展过大量研究。
相关研究议题主要是基于数据生命周期理论,采用定性与定量相结合的方法,从理论与实践相结合的角度揭示了高校开展科研数据管理服务的原因、过程、内容与效果等认识规律。主要研究内容包括:高校科研数据管理政策体系框架模型构建研究、高校科研数据管理服务内容模型框架构建研究、高校科研数据管理服务体系构建研究、高校科研数据管理服务典型案例研究、高校科研数据管理服务平台研究、高校科研数据管理服务实现路径研究、高校科研数据管理教育研究等。这些研究也促使我后期承担国家社会科学基金一般项目“开放科学理念下的科研数据治理研究”,并和团队成员在该项目研究的基础上,撰写了《高校科研数据开放与治理研究》一书。
高校科研数据开放受多重因素影响
中国社会科学网:根据您的调查研究,高校科研数据开放的影响因素是什么?
刘桂锋:根据理论研究和访谈调查,高校科研数据开放的影响因素有很多,主要包括个人因素、资源因素、组织因素、技术因素和制度因素,其中个人因素属于内部因素,其他4个因素属于外部因素。内外部因素之间相互联系、相互作用。个人因素包括数据开放意愿、数据开放态度、感知利益、感知风险、感知努力、感知需求、主观规范、数据素养和职业义务等,对高校科研数据开放发挥主导作用。资源因素包括数据质量、数据价值、数据标准、数据格式、数据类型、数据描述、数据融合、数据安全和数据所有权等,对高校科研数据开放发挥基础作用。技术因素包括元数据标准、本体论、开放技术、数据管理机制、数据开放平台等,对高校科研数据开放发挥保障作用。组织因素包括组织结构、组织文化、组织氛围和组织激励等,对高校科研数据开放发挥支持作用。制度因素包括国家政策法规、企业资助政策、科研资助机构政策、高校政策和期刊政策等,对高校科研数据开放发挥推动作用。
高校科研数据开放活动是一个有机整体,主要由开放主体和开放非主体组成。开放主体要素主要指高校科研人员、科研人员所处的科研团队和科研机构以及高校本身。开放非主体要素包括客体要素、平台要素和环境要素。科研数据是高校科研数据开放的客体要素,是开放主体连接其他非主体要素的桥梁和纽带。
调查结果显示,科研数据的质量、安全、价值、来源以及所有权是高校科研数据开放的主要客体要素。高校科研数据开放平台是影响高校科研数据开放的技术要素之一,也是科研数据开放活动实现的重要保障。科研数据开放的实施受内外部环境的共同作用影响,具体来说有社会环境、个人环境、组织环境、制度环境和技术环境。总之,高校科研数据开放需要在内外部环境、内外部因素的共同作用下才能实现。
高校科研数据开放现状并不乐观
中国社会科学网:据您的研究,高校科研数据开放意愿如何?
刘桂锋:数据开放意愿一般是指高校科研人员对科研数据开放行为的主观意愿强烈程度以及未来考虑开放高校科研数据的意愿程度。
问卷调查结果显示,目前,我国高校科研人员的科研数据开放现状并不乐观,开放效果并不显著,开放意愿并不强烈。
开放意愿取决于科研人员对科研数据开放利益与开放风险的平衡度。目前科研人员非常担心的就是科研数据开放可能造成与期望不符的负面结果:比如开放数据后会泄露核心研究内容,或被其他人恶意使用,或被别人先发表成果等;而开放利益主要指科研人员认为开放科研数据可能会得到更多的学术成果回报或奖励,如开放数据会使科研成果被更多的人下载或引用,或者直接用于他人的科学研究,提升科研效率等。当科研人员意识到开放科研数据利大于弊,就会选择合适的科研过程和合理的开放程度开放科研数据,反之,就会全过程不开放。随着开放科学运动的开展和科研人员开放意愿的提升,高校科研数据开放会成为常态。
多方协同推动高校科研数据开放、利用与治理
中国社会科学网:您认为,应当如何推动高校科研数据开放与治理?
刘桂锋:高校科研数据开放与治理是一个系统性工程,涉及到的高校层次不同、学科类型不同、科研过程不同,特别是牵涉到科研人员、科研团队、科研机构、图书馆等高校内部的利益相关者,以及政府部门、基金资助机构、数据平台、出版机构、企业等高校外部的利益相关者。
根据国家社会科学基金一般项目“开放科学理念下的科研数据治理研究”的研究成果,推进高校科研数据开放与治理需要各高校加强顶层设计,从政策、管理、技术、平台、人员等多个方面入手,建立完善的治理体系和服务机制。
具体来说,我有以下几个方面的建议:一是需要建立完善的数据治理政策和法规,明确各利益群体的责任和义务,规范科研数据的采集、存储、处理、共享和使用等全生命周期流程,以及数据的所有权、使用权、管理权等;二是需要建立数据质量管理体系和数据安全管理体系,制定数据质量标准,对数据质量进行全流程监控和评估,注重隐私保护,确保数据安全;三是需要建立科研数据共享平台和服务机制,提供数据上传、下载、检索、共享、使用等功能,并明确各流程的权限、责任和义务;四是需要建立与校外利益相关者的合作和交流,推动科研数据的开放和应用。因此,推进高校科研数据开放与治理不是一朝一夕的事情,需要循序渐进、久久为功。此外,由于科研数据贯穿于科学研究的全生命周期流程,科研数据开放是一个动态、复杂的生态过程,因此,边开放边治理是上佳选择。
中国社会科学网:在高校科研数据开放与治理中,应当如何发挥科研人员的作用?
刘桂锋:科研人员既是科研数据的生产者、又是科研数据的管理者,还是科研数据的使用者,贯穿于科研全过程和数据生命周期的全流程。科研人员是高校科研数据开放与治理的主体,因此需要切实发挥科研人员的主观能动性和主体作用,并与其他利益相关者内外联动、利益共享、责任共担、协同推进高校科研数据开放、利用与治理。
文章来源:中国社会科学网 2024年3月12日
文章链接:https://www.cssn.cn/skgz/bwyc/202403/t20240312_5738072.shtml