【AI产品】NLP项目实战原型+模型训练

数字化项目全过程智能监查系统,充分利用人工智能、云计算、大数据等先进技术,遵循高效、智能、实用、规范四大原则,实现项目文档的自动化审核,提高项目全过程文档管理能力水平。

作品介绍

1.概述

针对项目全过程文档管理现状和存在问题,建设数字化项目全过程智能监查系统,充分利用人工智能、云计算、大数据等先进技术,依托国电通软件在语义识别技术方面的优势资源,遵循高效、智能、实用、规范四大原则,实现项目文档的自动化审核,提高项目全过程文档管理能力水平。

高效:实现项目过程文档的自动化 审核,大大提升项目文档审 核的效率,降低了项目管控 人员的工作量。

智能:采用人机结合模式,基于业务经验,训练一套项目问题与风险分析审查模型,实现过程材料完整性预警、文本内容的解析、文本抽取、文本比对等能力。

实用:贴合于项目管控人员的工作习 惯,界面采用所见即所得 的操作模式,也提供了方便 的错误反馈机制。

规范:根据系统定义的审核规则实现对 项目文档的审核,规范了项目文 档管控的流程,避免人为犯错,也使得整个流程可追溯、可审计。

2. 整体架构

平台基于NLP、OCR识别等核心技术,构建“智能+高效”的项目全过程文档数字化管控体系,实现公司项目过程文档的规范化管理,打造全自动、全天候、全过程覆盖的智能化管控模式。

并提供数据标注和模型训练平台。

3. 核心功能

3.1.文档管理

为适应实际管理需求,可通过“手工录入”、“批量导入”、“第三方接入” 等方式实现项目过程文档的电子化管理,确认保存将自动生成档号,即刻归档。归档材料可支持借阅、预览、审核等核心能力。

3.2.文档抽取

将事先定义好的条款从文档中自动抽取出来,并将文档中的文本信息转化为结构化信息,方便用户快速浏览文档中的关键信息。文档抽取模块包括单文件抽取和批量处理。

输入文本、图像、布局三种模态信息文本,图像上文字组成的文本序列图像,抽取文档整体和局部特征图布局,词或图像页面中覆盖的坐标。

多模态网络融入文本和页面布局信息、图 像信息,同时空间感知自注意力机制提高 模型对文档内容的理解能力。

模型对文件(图像、PDF 文件等) 进行理解并分析,同时将其中的非 结构化信息进行抽取和结构化。

3.3.表格解析

表格解析是将非结构化的文档(例如: .pdf、.docx、.jpg 等格式文档)中的表格进行解析,并提供可下载的 excel 文件。

3.4.文档审核

通过审核规则配置,按照既定的规则,把文档中存在风险的内容快速地审阅出来,并将该潜在风险提示给用户。

3.5.文档比对

快速对比两个文本文件中增加、删除或修改的内容。文档比对支持的文档类型有.doo、.dooc、.pdf、.pnp等,并支持不同格式的文件之间的内容比对。

3.6.文件分类

支持自动将文件进行业务分拣,按不同业务流程进行解析处理,实现多种业务场景、不同文档类型的高效处理,减少人工时间,提升流程效率。

3.7. 监查预警

项目群里程碑节点进度识别及预警,通过采集项目核心节点的文档,进行平台化数据清洗、分析、计算,实现对项目群整体进度、质量和安全的管理预警。

4. 原型展示

查看更多

Comment list 共有 0 条评论

暂无评论