ITPub博客

首页 > IT基础架构 > 服务器/存储 > 杉岩MOS双引擎助力某动力学科研机构智能化档案管理

杉岩MOS双引擎助力某动力学科研机构智能化档案管理

原创 服务器/存储 作者:杉岩数据 时间:2021-04-01 15:36:48 0 删除 编辑

动力学研究——航空航天取得成功的理论基石


2021年3月26日,国家航天局发布2幅由我国首次火星探测任务天问一号探测器拍摄的南、北半球火星侧身影像,这无疑是我国深空探测成果的一个缩影。自2020年7月23日成功发射以来,天问一号探测器已累计飞行两百余天,为后续着陆和巡视探测奠定了良好的基础。这一切的背后,离不开科研人员的持续攻关,而相关的动力学研究便是重要的攻关领域之一。


某动力学科研机构是为适应中国航空航天事业发展需要而组建的,迄今为止已圆满完成大量航空航天飞行器相关的科研任务,获得国家级和部委级科技进步奖千余项。作为国内动力学研究的核心力量,几十年来,机构科研人员默默坚守,逐一攻克该领域发展中的层层阻碍,为我国迈向科技强国做出了突出贡献。


档案管理的新要求:数字化 合规化 智能化


该机构积攒了大量的历史档案资料,绝大部分是以非结构化数据存储的电子文档,包括纸质档案扫描件、录音、录像等。目前所采用的传统IT架构在海量档案存储管理面前显得捉襟见肘。


海量小文件存储

目前档案扫描件数量超过1亿,当录入文件数达到2000万,原有的集中式存储便已出现明显性能瓶颈,影响数据读取和备份效率。后续总文件数预计超过5亿,传统存储显然无法支撑。


档案数据智能处理

由于档案扫描件多是PDF格式,信息检索查阅不便。比如:科研人员想要基于文献内容查阅历史资料就很难实现。因此,该机构要求存储能够对扫描件进行内容提取,进而支持基于内容的检索,提升效率。


全生命周期管理

按照合规要求,档案需长期甚至永久保存,因此要制定生命周期管理策略,让档案数据在在线库、近线库和离线库间自动迁移。而目前无论是原有存储本身还是档案管理系统都没有考虑此问题。


跨部门档案收集

该机构档案资料分散在不同下属机构,以往是通过移动硬盘拷贝到传统存储中,效率低且存在安全风险。


为了满足上述需求,客户最终选择杉岩MOS海量对象存储替换原有传统存储,实现IT基础架构的演进升级。


基于MOS构建海量档案智能存储管理平台


MOS支撑海量存储与便捷管理

该平台基于多台杉岩对象存储一体机构建百TB级对象存储资源池,满足百亿级小文件存储和高效访问的需求,为该机构提供统一的非结构化数据存储和管理平台,并通过生命周期管理策略、智能数据处理引擎等实现电子化档案的集中存储、全局管理、智能处理和自动运维。


图1 基于MOS构建海量档案智能管理平台


MOS智能数据处理引擎带来效益加成


值得一提的是,MOS独有的智能数据处理引擎在该方案为客户带来了极大价值。前述讲到,档案扫描件多是以单层的PDF文件形式进行存储,业务端无法基于PDF中的文字内容进行检索,查阅资料十分不便。

通过MOS智能数据处理引擎集成的OCR识别插件,客户可以根据需要设定文件处理策略,存储自动调用OCR识别功能,将单层PDF文件(文字不可读取)转为双层PDF文件(文字可读取),然后基于文字内容通过检索引擎建立全文索引,方便快速检索查阅,充分发挥档案资料的知识价值。


图2MOS智能数据处理引擎智能处理档案数据


客户价值


集合海量存储核心引擎和智能数据处理引擎,MOS海量对象存储为客户带来显著价值。


安全合规:海量数据永久保存

MOS承载包括纸质档案扫描件、视频、图片在内的多种类型数据,分布式架构支撑海量小文件高效存取和未来扩展性,满足永久保存的合规性要求。

简化管理:集中存储与全局管理

基于MOS构建统一的存储和管理平台,实现全局档案自动化管理,避免了单独拷贝带来的安全风险,同时简化了运维。


效率提升:智能处理助力科研提效

通过智能数据处理引擎,存储自身实现档案数据处理,配合检索工具,科研人员能够快速获取所需档案资料,一定程度上提升了科研效率,让档案的知识价值最大化。


该项目基于MOS构建的智能存储管理平台,不仅解决了客户海量文件读写慢、共享管理难的痛点问题,同时,也证明了MOS智能数据处理引擎在数据价值利用方面的效益加成,是传统IT基础架构向新型分布式智能基础架构演进的成功实践。



来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69956769/viewspace-2766162/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2019-12-06

  • 博文量
    102
  • 访问量
    54866