个人简介
沈志宏,正高级工程师,博士生导师,现任中国科学院计算机网络信息中心大数据部主任、中国科学院科学数据总中心常务副主任、大数据分析与计算技术国家地方联合工程实验室总工程师,《数据分析与知识服务》期刊编委、CCF大数据专委会执委、CCF开源委员会执委、中国通信学会开源技术委员会委员,研究方向为大数据管理与处理、图数据库管理系统、分布式计算、语义网技术,目前主持国家重点研发计划项目“面向国家科学数据中心的基础软件栈及系统”、中国科学院网信专项项目“科学大数据工程(三期)”。主持开发分布式数据管理发布系统VisualDB、科学数据搜索引擎Voovle、大数据流水线PiFlow、融合数据库系统PandaDB等开源软件系统,发明专利授权22项,在国内外重要刊物及会议发表学术论文30余篇,学术编著1部,译著1部,软件开发类编著3部。积极参与软件开源,主导的开源项目在github/gitee平台获stars数2500+,forks数1000+,部分软件在相关软件社区(Apache Calcite、Neo4j、OpenKG)得到推荐和引用。
Dr. SHEN Zhihong is a professor in the big data department, CNIC, CAS. His current main research interests include graph database, big data processing, distributed computation and semantic web. Leading his team, Dr. SHEN developed a series of widely used big data software including VisualDB, PiFlow, Voovle, RegionFS, PandaDB, etc. He also participates in the national key research projects, projects of informatization plan of CAS and customer-oriented applications.
项目经历
- 国家重点研发计划项目“面向国家科学数据中心的基础软件栈及系统”,项目负责人,2021-2024
- 中国科学院网信专项项目“科学大数据工程(三期)”,项目负责人,2021-2025
- 中国烟草总公司科技重大专项项目“烟草科研数据融合与关联挖掘关键技术研究”,项目负责人,2018-2019
- 国家自然科学基金大数据知识管理服务平台,项目负责人,2017
- 中国科学院网信专项项目“科学大数据工程(二期)”,课题负责人,2016-2020
- 国家重点研发计划项目“科学大数据管理系统”,课题负责人,2016-2019
开源软件项目
- InteractiveGraph: InteractiveGraph provides a web-based interactive operating framwork for large graph data, which may come from a GSON file, or an online Neo4j graph database
- RegionFS: a distributed file system
- PandaDB: a property graph based, AI embeded structured & unstructured data management system
- PiFlow: a big data flow system for data ingest, clean & analysis
- spark-http-stream: spark structured streaming via HTTP communication
- elfinder-servlet-2.x: elfinder-2.x-servlet implements a java servlet for elfinder-2.x connector, elfinder is an Open-source file manager for web
- solr-sql: sql interface for solr cloud
- openwebflow: 基于Activiti的工作流引擎扩展,接管了Activiti对活动权限以及用户表的管理,并提供了催办、代办、加签(包括前加签/后加签)、自由跳转、分裂节点等功能
- …
软件研发编著
- 标准C++开发入门与编程实践. 2007年12月. 电子工业出版社. ISBN:9787121052279
- Java6从入门到精通. 2008年. 电子工业出版社. ISBN:9787121062179
- 把脉VC++. 2009年7月. 电子工业出版社. ISBN:9787121086175
学术编著、译著
- 大数据时代的科研活动. 2014年. 科学出版社. ISBN:9787030401830
- 第四范式:数据密集型科学发现. 2012年. 科学出版社. ISBN:9787030347251
已授权专利
- 沈志宏,胡川,周园春. 一种支持Blob数据类型的JSON语法扩展方法和解析方法及装置. 202010285956.6
- 沈志宏,朱小杰,宋东泽等. 基于流水线机制的跨中心协同计算的编排方法与系统. 2022101459584
- 朱小杰,沈志宏,杜一等. 一种大数据ETL任务的编排方法与系统. 2019103596584
- 沈志宏,周园春,赵子豪. 一种融合图数据库和人工智能算法的数据管理方法及系统. 201811212493X
- 沈志宏,周园春,赵子豪. 一种支持非结构化数据存储与查询的图数据库管理系统. 201811202708X
- 沈志宏,赵子豪. 一种基于次级属性的非结构化数据信息查询方法及系统. 202010513529.9
- 沈志宏,赵子豪. 一种基于次级属性图的非结构化数据查询方法及系统. 202010529960.2
- 刘峰,黎建辉,夏景隆等. 一种基于扩展库表数据字典的数据汇交系统定制化方法. 201710368274.X
- 钟伟才;王群;沈志宏等. 一种特征选择方法及设备. 201610586886.1
- 刘峰,黎建辉,胡良霖等. 一种通用的在线服务平台定制化评估方法和系统. 201710549593.0
- 季振峰,李雪斌,沈志宏. 标签预测生成方法及装置. 201610591081.6
- 黎建辉,李跃鹏,沈志宏. 一种适用于多种大数据管理系统的数据模型转换及查询分析方法. 201710515379.3
- 沈志宏,李跃鹏,黎建辉. 一种适用于多种大数据管理系统的交互式查询方法. 201710515380.6.
- 李亮,沈志宏,周园春等. 一种基于图遍历的SPARQL查询优化方法. 201710343003.9. 2020-10-16
- 沈志宏,黎建辉,周园春等. 一种支持BLOB的多元大数据融合方法和系统. 201710321988.5. 2020-08-14
- 陶永,陈金柱,邓仕戈等. 一种混合型航标报警智能检测方法. 201710383979.9. 2020-06-12
- 钟伟才,沈志宏,王群. 基于数据集相关性的标签网络产生方法和系统. 201510896534.1. 2020-03-10
- 沈志宏,钟伟才,季振峰. 一种冲突检验方法以及计算机系统. 201610051422.0. 2019-04-19
- 沈志宏,黎建辉,苏贤明. 一种Spring IOC配置文件的生成方法. ZL201210018123.9. 2015-09-23
- 李晓东,黎建辉,杨风雷等. 一种基于空间数据数值索引的数据存储与检索方法. 201210580189.7. 2016-01-27
- 黎建辉,杨风雷,林青慧等. 一种面向全球变化研究的空间科学数据自动汇聚方法. 201110220536.0. 2013-04-10
- 杨风雷,林青慧,黎建辉等. 面向全球变化研究的空间科学数据元数据自动汇聚方法. 201110220537.5. 2012-12-19
学术论文
- Zhao Z, Shen Z, Mao A, et al. PandaDB: an AI-native graph database for unified managing structured and unstructured data[C]//International Conference on Database Systems for Advanced Applications. Cham: Springer Nature Switzerland, 2023: 669-673.
- Zhao Z, Ge X, Shen Z, et al. S2CTrans: Building a bridge from SPARQL to Cypher[C]//International Conference on Database and Expert Systems Applications. Cham: Springer Nature Switzerland, 2023: 424-430.
- Zhao Z, Hu C, Shen Z, et al. A Key-Value Based Approach to Scalable Graph Database[C]//International Conference on Database and Expert Systems Applications. Cham: Springer Nature Switzerland, 2023: 338-344.
- Zhihong Shen, Chuan Hu, and Zihao Zhao. Lynx: A Graph Query Framework for Multiple Heterogeneous Data Sources. PVLDB, 16(12): 3926-3929, 2023.
- Mao, A., Hu, C., Li, C., Wang, H., Rao, J., Wang, K., & Shen, Z. (2023, December). MMDBench: A Benchmark for Hybrid Query in Multimodal Database. In International Symposium on Benchmarking, Measuring and Optimization (pp. 87-103). Singapore: Springer Nature Singapore.
- 沈志宏, 张晓林, 郑晓欢. PARIS原则:开放协作环境下科学数据的可用性[J]. 大数据, doi: 10.11959/j.issn.2096-0271.2023013.
- Shi W, Fan G, Shen Z, et al. gcCov: Linked open data for global coronavirus studies[J]. Mlife, 2022, 1(1): 92-95.
- 沈志宏,赵子豪,王华进,刘忠新,胡川,周园春.PandaDB:一种异构数据智能融合管理系统.软件学报,2021,32(3):11-0
- 沈志宏,赵子豪,王海波.以图为中心的新型大数据技术栈研究[J].数据分析与知识发现,2020,4(07):50-65.
- 赵子豪,沈志宏. 一种适合多元异构图数据管理系统的交互分析框架[J]. 数据分析与知识发现,2019,10(34):37-46.
- 王华进,黎建辉,沈志宏.基于(n,r,k)fork-join队列分析的NWR数据库写延时模型[J].计算机应用研究,2019,36(02):466-471.
- 王华进,黎建辉,沈志宏,周园春.基于ORC元数据的Hive Join查询Reducer负载均衡方法[J].计算机科学,2018(03):160-166.
- 沈志宏,姚畅,侯艳飞,吴林寰,李跃鹏.关联大数据管理技术:挑战、对策与实践[J].数据分析与知识发现,2018,2(01):9-20.
- Yuepeng Li, Zhihong Shen, Jianhui Li. SimbaQL: A Query Language for Multi-source Heterogeneous Data. BigSDM 2018: 275-284
- Huajin Wang, Jianhui Li, Zhihong Shen and Yuanchun Zhou. Approximations and Bounds for (n, k) Fork-Join Queues: A Linear Transformation Approach. 2018 IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID).
- Liang Li, Zhihong Shen, Jianhui Li, Dongjiang Liu, Huajin Wang, Lipeng Wang, Qinglan Sun:
A Resilient Index Graph for Querying Large Biological Scientific Data. BigData Congress 2017: 435-443
- Wenjuan Cui; Yi Du; Zhihong Shen; Yuanchun Zhou; Jianhui Li. Personalized microblog recommendation using sentimental features. 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)
- 黎建辉,沈志宏,孟小峰. 科学大数据管理:概念、技术与系统. 计算机研究与发展[J]. 2017(2)
- 王林彬,黎建辉,沈志宏. 基于NoSQL的RDF数据存储与查询技术综述. 计算机应用研究[J]. 2015(5)
- 沈志宏,黎建辉,张晓林. 面向LOD的关联发现过程的定位、目标与复杂性分析. 中国图书馆学报[J]. 2013(6)
- 沈志宏,黎建辉,张晓林. 关联数据互联技术研究综述:应用、方法与框架. 图书情报工作[J]. 2013(14)
- Shaopeng He; Jianhui Li; Zhihong Shen. F2R: Publishing file systems as Linked Data. 2013. 10th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD)
- Jianhui Li,Yuanchun Zhou,Wei Shang,Cungen Cao,Zhihong Shen,Fenglei Yang,Xiao Xiao,Danhuai Guo. A cloud Computation Architecture for Unconventional Emergency Management. WAIM2013: 187-198
- 沈志宏,刘筱敏,郭学兵. 关联数据发布流程与关键问题研究——以科技文献、科学数据的发布为例. 中国图书馆学报[J]. 2013(2)
- 黎建辉,兰金松,沈志宏. 面向科学数据的PageRank排序算法. 计算机科学与探索[J]. 2013(06)
- 何少鹏,黎建辉.沈志宏. 大规模的RDF数据存储技术综述. 网络新媒体技术. 2013(1):8-16
- Shen Z, Li J, Han F. OpenCSDB: Research on the application of linked data in scientific databases[J]. Data Science Journal, 2015, 14., DOI: http://
dx.doi.org/10.5334/dsj-2015-004
- 沈志宏,张晓林,黎建辉. OpenCSDB: 关联数据在科学数据库中的应用研究. 中国图书馆学报[J],2012(5)
- 苏贤明,沈志宏,刘宁.基于知识规则的Excel数据质量校验工具[J].科研信息化技术与应用,2012,3(03):29-37.
- Zhihong Shen,Yanfei Hou,Jianhui Li. Voovle: A linked data search engine for scientific data. 2012. 9th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD)
- Zhen Meng,Jianhui Li,Yunchun Zhou,Yanping Gao,Zhihong Shen. iDNABar: A Rapid Species Identification Toolbox for DNA Barcoding, Collection, Preservation, Identification and Tracing. In: ISKE2011.
- 沈志宏,张晓林. 语义网环境下数据溯源描述模型研究综述.现代图书情报技术[J]. 2011, 27(4) 1-8
- Zhihong Shen,Yufang Hou,Jianhui Li. Publishing distributed files as Linked Data. In: FSKD2011.
- 李成赞,沈志宏,黎建辉. 面向科学数据的搜索引擎voovle. 科研信息化技术与应用[J]. 2011, 2(5)
- Zhihong Shen,Jianhui Li,Chengzan Li,et al. VisualDB: Managing and Publishing Scientific Data on the Web. In: CyberC2011.
- 沈志宏,张晓林. 关联数据及其应用现状综述. 现代图书情报技术. 2010(1):1-9
- 张仁,沈志宏,黎建辉,施建平. 基于规则的土壤数据校验模型研究与实现. 计算机系统应用[J]. 2010(08)
- 史晓磊,沈志宏,黎建辉. 支持科学数据专业类型的统一检索框架. 计算机系统应用[J]. 2010(12)
- Zhiyi Huang; Qingling Chang; Zhihong Shen; Yuanchun Zhou; Baoping Yan; Lei Liu. Design and Implementation of an XML-Based Universal Mobile Data Acquisition System. SKG 2009: 456-457
- 吴开超,沈志宏,周园春,阎保平. 信息系统访问控制的层次模型. 计算机工程与设计[J]. 2009(01)
- 吴开超,沈志宏,周园春,阎保平. 访问控制聚合模型研究. 微电子学与计算机[J]. 2009(01)
- 沈志宏,吴开超.基于目录的数据管理与发布模型的研究与应用[J].科研信息化技术与应用,2008(01):22-26.
- 王建芳,阎保平,吴开超,沈志宏. 基于元目录的数据管理模型的研究与实现. 计算机工程[J]. 2007(10)
- 沈志宏, 王龙潇. 目录型元数据在科学数据库系统平台中的应用[C]// 科学数据库与信息技术学术讨论会. 2004.
口头报告
- 科学大数据管理技术:实践与思考. 2019大数据智能与知识服务高端论坛-知领系列论坛(第2期). 2019/11/11. 北京
- 大数据融合管理:需求、现状与实践. 第二届“数据分析与知识发现”学术研讨会,2019/7/11. 兰州
- Wang H, Shen Z, Li Y. SciSpace:Towards a Serverless-Style Cloud Service for Scientific Data Lifecycle Management. 1st International Conference on Big Scientific Data Management. 2018/11/30. Beijing, China
- 开放科学数据的新发展与新挑战. 2017年中国开放获取推介周(2017 China Open Access Week). 2017/10/23. 北京
- 科学大数据管理系统集成框架. 第34届中国数据库学术会议. 2017/10/21. 杭州
- 关联大数据的技术挑战、对策与实践. 数据分析与知识发现学术研讨会. 2017/6/9. 北京
- 技术架构变迁:从SQL到大数据时代. COINFO2016. 2016/10/16. 北京
- Publishing Scientific Data as Linked Data. Sino-German Training Workshop on Open Access. Mar, 2014. Beijing, China
- SQL, NoSQL and NewSQL, What’s your choice? the international training workshop of scientific data sharing. Jun, 2014. Beijing, China
- Publishing, Searching and Linking Scientific Data—Experience on Applying Linked Data to Scientific Database Project. the international training workshop of scientific data sharing. Nov, 2013. Beijing, China
- Publishing and Linking Scientific Data. 2nd Annual CHANGES Workshop Data Driven Science: Data Management, Analytics and Visualization. Sep. 10, 2013. Chicago, US
- Interoperation between Scientific Data and Literature : An overview. CODATA: data science workshop. Oct 25, 2012. Shanghai, China
- Managing and Linking Scientific Data on the Web via VisualDB. The First ICSU World Data System Conference. Sep 5, 2011. Kyoto, Japan
- VisualDB: A Visual Relational Database Management and Publishing System. The First WDCM Seminar. May 17-18, 2011 . Beijing, China
获得奖励
- 2022年“烟草科研大数据资源标准体系、总体架构和关键技术研究与应用”荣获中国烟草总公司科学技术奖一等奖
- 2017年“大规模地理空间数据云服务关键技术与应用”荣获北京市科学技术二等奖
- 2013年中国科学院院长优秀奖
联系方式