
个人简介
沈志宏,正高级工程师,博士生导师,现任中国科学院计算机网络信息中心大数据部主任、中国科学院科学数据总中心常务副主任、大数据分析与计算技术国家地方联合工程实验室总工程师,《数据分析与知识发现》期刊编委、CCF大数据专委会执委、CCF开源委员会执委、中国通信学会开源技术委员会委员,研究方向为大数据管理与处理、图数据库管理系统、分布式计算、语义网技术,目前主持国家重点研发计划项目“面向国家科学数据中心的基础软件栈及系统”、中国科学院网信专项项目“科学大数据工程(三期)”。科学数据基础软件栈FairStack发起人,主持开发融合数据库系统PandaDB、大数据流水线PiFlow、科学数据协作网络CoNet等开源软件系统。
项目经历
- 国家重点研发计划项目“面向国家科学数据中心的基础软件栈及系统”,项目负责人,2021-2024
- 中国科学院网信专项项目“科学大数据工程(三期)”,项目负责人,2021-2025
- 中国烟草总公司科技重大专项项目“烟草科研数据融合与关联挖掘关键技术研究”,项目负责人,2018-2019
- 国家自然科学基金大数据知识管理服务平台,项目负责人,2017
- 中国科学院网信专项项目“科学大数据工程(二期)”,课题负责人,2016-2020
- 国家重点研发计划项目“科学大数据管理系统”,课题负责人,2016-2019
开源软件项目
- InteractiveGraph: InteractiveGraph provides a web-based interactive operating framwork for large graph data, which may come from a GSON file, or an online Neo4j graph database
- RegionFS: a distributed file system
- PandaDB: a property graph based, AI embeded structured & unstructured data management system
- PiFlow: a big data flow system for data ingest, clean & analysis
- spark-http-stream: spark structured streaming via HTTP communication
- elfinder-servlet-2.x: elfinder-2.x-servlet implements a java servlet for elfinder-2.x connector, elfinder is an Open-source file manager for web
- solr-sql: sql interface for solr cloud
- openwebflow: 基于Activiti的工作流引擎扩展,接管了Activiti对活动权限以及用户表的管理,并提供了催办、代办、加签(包括前加签/后加签)、自由跳转、分裂节点等功能
- …
软件研发编著
- 标准C++开发入门与编程实践. 2007年12月. 电子工业出版社. ISBN:9787121052279
- Java6从入门到精通. 2008年. 电子工业出版社. ISBN:9787121062179
- 把脉VC++. 2009年7月. 电子工业出版社. ISBN:9787121086175
学术编著、译著
- 大数据时代的科研活动. 2014年. 科学出版社. ISBN:9787030401830
- 第四范式:数据密集型科学发现. 2012年. 科学出版社. ISBN:9787030347251
已授权专利
- 沈志宏,胡川,周园春. 一种支持Blob数据类型的JSON语法扩展方法和解析方法及装置. 202010285956.6
- 沈志宏,朱小杰,宋东泽等. 基于流水线机制的跨中心协同计算的编排方法与系统. 2022101459584
- 朱小杰,沈志宏,杜一等. 一种大数据ETL任务的编排方法与系统. 2019103596584
- 沈志宏,周园春,赵子豪. 一种融合图数据库和人工智能算法的数据管理方法及系统. 201811212493X
- 沈志宏,周园春,赵子豪. 一种支持非结构化数据存储与查询的图数据库管理系统. 201811202708X
- 沈志宏,赵子豪. 一种基于次级属性的非结构化数据信息查询方法及系统. 202010513529.9
- 沈志宏,赵子豪. 一种基于次级属性图的非结构化数据查询方法及系统. 202010529960.2
- 刘峰,黎建辉,夏景隆等. 一种基于扩展库表数据字典的数据汇交系统定制化方法. 201710368274.X
- 钟伟才;王群;沈志宏等. 一种特征选择方法及设备. 201610586886.1
- 刘峰,黎建辉,胡良霖等. 一种通用的在线服务平台定制化评估方法和系统. 201710549593.0
- 季振峰,李雪斌,沈志宏. 标签预测生成方法及装置. 201610591081.6
- 黎建辉,李跃鹏,沈志宏. 一种适用于多种大数据管理系统的数据模型转换及查询分析方法. 201710515379.3
- 沈志宏,李跃鹏,黎建辉. 一种适用于多种大数据管理系统的交互式查询方法. 201710515380.6.
- 李亮,沈志宏,周园春等. 一种基于图遍历的SPARQL查询优化方法. 201710343003.9. 2020-10-16
- 沈志宏,黎建辉,周园春等. 一种支持BLOB的多元大数据融合方法和系统. 201710321988.5. 2020-08-14
- 陶永,陈金柱,邓仕戈等. 一种混合型航标报警智能检测方法. 201710383979.9. 2020-06-12
- 钟伟才,沈志宏,王群. 基于数据集相关性的标签网络产生方法和系统. 201510896534.1. 2020-03-10
- 沈志宏,钟伟才,季振峰. 一种冲突检验方法以及计算机系统. 201610051422.0. 2019-04-19
- 沈志宏,黎建辉,苏贤明. 一种Spring IOC配置文件的生成方法. ZL201210018123.9. 2015-09-23
- 李晓东,黎建辉,杨风雷等. 一种基于空间数据数值索引的数据存储与检索方法. 201210580189.7. 2016-01-27
- 黎建辉,杨风雷,林青慧等. 一种面向全球变化研究的空间科学数据自动汇聚方法. 201110220536.0. 2013-04-10
- 杨风雷,林青慧,黎建辉等. 面向全球变化研究的空间科学数据元数据自动汇聚方法. 201110220537.5. 2012-12-19
学术论文
- Zhao Z, Shen Z, Mao A, et al. PandaDB: an AI-native graph database for unified managing structured and unstructured data[C]//International Conference on Database Systems for Advanced Applications. Cham: Springer Nature Switzerland, 2023: 669-673.

- Zhao Z, Ge X, Shen Z, et al. S2CTrans: Building a bridge from SPARQL to Cypher[C]//International Conference on Database and Expert Systems Applications. Cham: Springer Nature Switzerland, 2023: 424-430.

- Zhao Z, Hu C, Shen Z, et al. A Key-Value Based Approach to Scalable Graph Database[C]//International Conference on Database and Expert Systems Applications. Cham: Springer Nature Switzerland, 2023: 338-344.

- Zhihong Shen, Chuan Hu, and Zihao Zhao. Lynx: A Graph Query Framework for Multiple Heterogeneous Data Sources. PVLDB, 16(12): 3926-3929, 2023.

- Mao, A., Hu, C., Li, C., Wang, H., Rao, J., Wang, K., & Shen, Z. (2023, December). MMDBench: A Benchmark for Hybrid Query in Multimodal Database. In International Symposium on Benchmarking, Measuring and Optimization (pp. 87-103). Singapore: Springer Nature Singapore.

- 沈志宏, 张晓林, 郑晓欢. PARIS原则:开放协作环境下科学数据的可用性[J]. 大数据, doi: 10.11959/j.issn.2096-0271.2023013.

- Shi W, Fan G, Shen Z, et al. gcCov: Linked open data for global coronavirus studies[J]. Mlife, 2022, 1(1): 92-95.
- 沈志宏,赵子豪,王华进,刘忠新,胡川,周园春.PandaDB:一种异构数据智能融合管理系统.软件学报,2021,32(3):11-0

- 沈志宏,赵子豪,王海波.以图为中心的新型大数据技术栈研究[J].数据分析与知识发现,2020,4(07):50-65.

- 赵子豪,沈志宏. 一种适合多元异构图数据管理系统的交互分析框架[J]. 数据分析与知识发现,2019,10(34):37-46.

- 王华进,黎建辉,沈志宏.基于(n,r,k)fork-join队列分析的NWR数据库写延时模型[J].计算机应用研究,2019,36(02):466-471.

- 王华进,黎建辉,沈志宏,周园春.基于ORC元数据的Hive Join查询Reducer负载均衡方法[J].计算机科学,2018(03):160-166.

- 沈志宏,姚畅,侯艳飞,吴林寰,李跃鹏.关联大数据管理技术:挑战、对策与实践[J].数据分析与知识发现,2018,2(01):9-20.
- Yuepeng Li, Zhihong Shen, Jianhui Li. SimbaQL: A Query Language for Multi-source Heterogeneous Data. BigSDM 2018: 275-284

- Huajin Wang, Jianhui Li, Zhihong Shen and Yuanchun Zhou. Approximations and Bounds for (n, k) Fork-Join Queues: A Linear Transformation Approach. 2018 IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID).

- Liang Li, Zhihong Shen, Jianhui Li, Dongjiang Liu, Huajin Wang, Lipeng Wang, Qinglan Sun:
A Resilient Index Graph for Querying Large Biological Scientific Data. BigData Congress 2017: 435-443

- Wenjuan Cui; Yi Du; Zhihong Shen; Yuanchun Zhou; Jianhui Li. Personalized microblog recommendation using sentimental features. 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)

- 黎建辉,沈志宏,孟小峰. 科学大数据管理:概念、技术与系统. 计算机研究与发展[J]. 2017(2)

- 王林彬,黎建辉,沈志宏. 基于NoSQL的RDF数据存储与查询技术综述. 计算机应用研究[J]. 2015(5)

- 沈志宏,黎建辉,张晓林. 面向LOD的关联发现过程的定位、目标与复杂性分析. 中国图书馆学报[J]. 2013(6)

- 沈志宏,黎建辉,张晓林. 关联数据互联技术研究综述:应用、方法与框架. 图书情报工作[J]. 2013(14)

- Shaopeng He; Jianhui Li; Zhihong Shen. F2R: Publishing file systems as Linked Data. 2013. 10th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD)

- Jianhui Li,Yuanchun Zhou,Wei Shang,Cungen Cao,Zhihong Shen,Fenglei Yang,Xiao Xiao,Danhuai Guo. A cloud Computation Architecture for Unconventional Emergency Management. WAIM2013: 187-198
- 沈志宏,刘筱敏,郭学兵. 关联数据发布流程与关键问题研究——以科技文献、科学数据的发布为例. 中国图书馆学报[J]. 2013(2)

- 黎建辉,兰金松,沈志宏. 面向科学数据的PageRank排序算法. 计算机科学与探索[J]. 2013(06)

- 何少鹏,黎建辉.沈志宏. 大规模的RDF数据存储技术综述. 网络新媒体技术. 2013(1):8-16

- Shen Z, Li J, Han F. OpenCSDB: Research on the application of linked data in scientific databases[J]. Data Science Journal, 2015, 14., DOI: http://
dx.doi.org/10.5334/dsj-2015-004

- 沈志宏,张晓林,黎建辉. OpenCSDB: 关联数据在科学数据库中的应用研究. 中国图书馆学报[J],2012(5)

- 苏贤明,沈志宏,刘宁.基于知识规则的Excel数据质量校验工具[J].科研信息化技术与应用,2012,3(03):29-37.

- Zhihong Shen,Yanfei Hou,Jianhui Li. Voovle: A linked data search engine for scientific data. 2012. 9th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD)

- Zhen Meng,Jianhui Li,Yunchun Zhou,Yanping Gao,Zhihong Shen. iDNABar: A Rapid Species Identification Toolbox for DNA Barcoding, Collection, Preservation, Identification and Tracing. In: ISKE2011.
- 沈志宏,张晓林. 语义网环境下数据溯源描述模型研究综述.现代图书情报技术[J]. 2011, 27(4) 1-8

- Zhihong Shen,Yufang Hou,Jianhui Li. Publishing distributed files as Linked Data. In: FSKD2011.

- 李成赞,沈志宏,黎建辉. 面向科学数据的搜索引擎voovle. 科研信息化技术与应用[J]. 2011, 2(5)

- Zhihong Shen,Jianhui Li,Chengzan Li,et al. VisualDB: Managing and Publishing Scientific Data on the Web. In: CyberC2011.

- 沈志宏,张晓林. 关联数据及其应用现状综述. 现代图书情报技术. 2010(1):1-9

- 张仁,沈志宏,黎建辉,施建平. 基于规则的土壤数据校验模型研究与实现. 计算机系统应用[J]. 2010(08)
- 史晓磊,沈志宏,黎建辉. 支持科学数据专业类型的统一检索框架. 计算机系统应用[J]. 2010(12)
- Zhiyi Huang; Qingling Chang; Zhihong Shen; Yuanchun Zhou; Baoping Yan; Lei Liu. Design and Implementation of an XML-Based Universal Mobile Data Acquisition System. SKG 2009: 456-457

- 吴开超,沈志宏,周园春,阎保平. 信息系统访问控制的层次模型. 计算机工程与设计[J]. 2009(01)

- 吴开超,沈志宏,周园春,阎保平. 访问控制聚合模型研究. 微电子学与计算机[J]. 2009(01)
- 沈志宏,吴开超.基于目录的数据管理与发布模型的研究与应用[J].科研信息化技术与应用,2008(01):22-26.

- 王建芳,阎保平,吴开超,沈志宏. 基于元目录的数据管理模型的研究与实现. 计算机工程[J]. 2007(10)
- 沈志宏, 王龙潇. 目录型元数据在科学数据库系统平台中的应用[C]// 科学数据库与信息技术学术讨论会. 2004.

口头报告
- 科学大数据管理技术:实践与思考. 2019大数据智能与知识服务高端论坛-知领系列论坛(第2期). 2019/11/11. 北京
- 大数据融合管理:需求、现状与实践. 第二届“数据分析与知识发现”学术研讨会,2019/7/11. 兰州
- Wang H, Shen Z, Li Y. SciSpace:Towards a Serverless-Style Cloud Service for Scientific Data Lifecycle Management. 1st International Conference on Big Scientific Data Management. 2018/11/30. Beijing, China

- 开放科学数据的新发展与新挑战. 2017年中国开放获取推介周(2017 China Open Access Week). 2017/10/23. 北京
- 科学大数据管理系统集成框架. 第34届中国数据库学术会议. 2017/10/21. 杭州
- 关联大数据的技术挑战、对策与实践. 数据分析与知识发现学术研讨会. 2017/6/9. 北京
- 技术架构变迁:从SQL到大数据时代. COINFO2016. 2016/10/16. 北京
- Publishing Scientific Data as Linked Data. Sino-German Training Workshop on Open Access. Mar, 2014. Beijing, China

- SQL, NoSQL and NewSQL, What’s your choice? the international training workshop of scientific data sharing. Jun, 2014. Beijing, China
- Publishing, Searching and Linking Scientific Data—Experience on Applying Linked Data to Scientific Database Project. the international training workshop of scientific data sharing. Nov, 2013. Beijing, China
- Publishing and Linking Scientific Data. 2nd Annual CHANGES Workshop Data Driven Science: Data Management, Analytics and Visualization. Sep. 10, 2013. Chicago, US

- Interoperation between Scientific Data and Literature : An overview. CODATA: data science workshop. Oct 25, 2012. Shanghai, China

- Managing and Linking Scientific Data on the Web via VisualDB. The First ICSU World Data System Conference. Sep 5, 2011. Kyoto, Japan

- VisualDB: A Visual Relational Database Management and Publishing System. The First WDCM Seminar. May 17-18, 2011 . Beijing, China
获得奖励
- 2022年“烟草科研大数据资源标准体系、总体架构和关键技术研究与应用”荣获中国烟草总公司科学技术奖一等奖
- 2017年“大规模地理空间数据云服务关键技术与应用”荣获北京市科学技术二等奖
- 2013年中国科学院院长优秀奖
联系方式