您好,欢迎来到刀刀网。
搜索
您的当前位置:首页表格信息结构化提取方法、电子设备及计算机可读存储介质[发明专利]

表格信息结构化提取方法、电子设备及计算机可读存储介质[发明专利]

来源:刀刀网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 107818075 A(43)申请公布日 2018.03.20

(21)申请号 201710962303.5(22)申请日 2017.10.16

(71)申请人 平安科技(深圳)有限公司

地址 518000 广东省深圳市福田区八卦岭

工业区平安大厦六楼(72)发明人 苏晓明 汪伟 肖京 

(74)专利代理机构 深圳市沃德知识产权代理事

务所(普通合伙) 44347

代理人 高杰 于志光(51)Int.Cl.

G06F 17/24(2006.01)

权利要求书3页 说明书14页 附图3页

(54)发明名称

表格信息结构化提取方法、电子设备及计算机可读存储介质(57)摘要

本发明公开了一种表格信息结构化提取方法,该方法包括步骤:获取指定文档中每行文字的位置信息和标签信息;根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形;当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储和分列存储;当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储。本发明可以进行结构化数据提取和存储。

CN 107818075 ACN 107818075 A

权 利 要 求 书

1/3页

1.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的表格信息结构化提取系统,所述表格信息结构化提取系统被所述处理器执行时实现如下步骤:

获取指定文档中每行文字的位置信息和标签信息;根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形;

当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储和分列存储;及

当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储。

2.如权利要求1所述的电子设备,其特征在于,所述第一重塑规则包括:将上边沿坐标相同的文字存储为同一行,将左边沿坐标相同的文字存储为同一列;

所述第二重塑规则包括:

删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格;及

将所述拼接表格中上边沿坐标相同的文字存储为同一行,并将所述拼接表格中左边沿坐标相同的文字存储为同一列。

3.如权利要求2所述的电子设备,其特征在于,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:

根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉;

其中,前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围;及

下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。

4.如权利要求2所述的电子设备,其特征在于,所述换行情形包括行内换行和行尾换行;

其中,所述行内换行的识别包括:

获取该行文字中每个单元格的文字内容位置信息,其中,每个单元格的文字内容位置信息包括每个单元格的文字内容的上边沿坐标;及

从文字内容上边沿坐标相同的单元格中,获取第一次出现的单元格位置和最后一次出现的单元格位置,将第一次出现的单元格位置到最后一次出现的单元格位置的所有单元格确定为同一行,并判定第一次出现的单元格位置与最后一次出现的单元格位置之间文字内容上边沿坐标不同的单元格为行内换行的单元格。

5.如权利要求4所述的电子设备,其特征在于,所述行尾换行的识别包括:若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格的文字内容位置信息,其中,所述剩余单元格的文字内容位置信息包括所述剩余单元格的文字内容的

2

CN 107818075 A

权 利 要 求 书

2/3页

上边沿坐标;

计算所述剩余单元格的文字内容上边沿坐标与当前行及下一行所有单元格的文字内容上边沿坐标的距离,或计算所述剩余单元格的文字内容上边沿坐标与当前行及上一行所有单元格的文字内容上边沿坐标的距离;及

若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。

6.一种表格信息结构化提取方法,应用于电子设备,其特征在于,所述方法包括:获取指定文档中每行文字的位置信息和标签信息;根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形;

当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储和分列存储;及

当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储。

7.如权利要求6所述的表格信息结构化提取方法,其特征在于,所述第一重塑规则包括:将上边沿坐标相同的文字存储为同一行,将左边沿坐标相同的文字存储为同一列;

所述第二重塑规则包括:

删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格;及

将所述拼接表格中上边沿坐标相同的文字存储为同一行,并将所述拼接表格中左边沿坐标相同的文字存储为同一列。

8.如权利要求7所述的表格信息结构化提取方法,其特征在于,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:

根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉;

其中,前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围;及

下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。

9.如权利要求7所述的表格信息结构化提取方法,其特征在于,所述跨页情形的识别包括:

针对该指定文档中相邻的前一表格和下一表格,获取前一表格文字内容的位置信息、标签信息和下一表格文字内容的位置信息、标签信息;

比对下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标;

当下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同时,比对下一表格每行文字的页码与前一表格每行文字的页码;及

若下一表格每行文字的页码与前一表格每行文字的页码存在不同,则判定下一表格与

3

CN 107818075 A

权 利 要 求 书

3/3页

前一表格为存在跨页情形的同一表格。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有表格信息结构化提取系统,所述表格信息结构化提取系统可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求6-9中任一项所述的表格信息结构化提取方法的步骤。

4

CN 107818075 A

说 明 书

1/14页

表格信息结构化提取方法、电子设备及计算机可读存储介质

技术领域

[0001]本发明涉及计算机信息技术领域,尤其涉及一种表格信息结构化提取方法、电子设备及计算机可读存储介质。

背景技术

[0002]现有针对PDF年报中的表格信息抽取,一般是基于OCR技术。但是,在出现换行、换页、特殊字符干扰情况下,OCR技术无法还原和重塑原始表格信息,及进一步的结构化整合,并对使用者造成理解上的困难,也不利于后续的信息比对。故,现有技术中的表格信息提取方法设计不够合理,亟需改进。发明内容

[0003]有鉴于此,本发明提出一种表格信息结构化提取方法、电子设备及计算机可读存储介质,通过分析指定文档(如PDF文档)中表格文字内容的位置信息和标签信息,可以识别出表格(如PDF年报表格)中的换行情形和跨页情形,并对出现换行情形和跨页情形的表格进行结构化数据提取并存储。[0004]首先,为实现上述目的,本发明提出一种电子设备,所述电子设备包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的表格信息结构化提取系统,所述表格信息结构化提取系统被所述处理器执行时实现如下步骤:[0005]获取指定文档中每行文字的位置信息和标签信息;[0006]根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形;

[0007]当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储和分列存储;及

[0008]当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储。[0009]优选地,所述第一重塑规则包括:将上边沿坐标相同的文字存储为同一行,将左边沿坐标相同的文字存储为同一列;[0010]所述第二重塑规则包括:[0011]删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

[0012]将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格;及

[0013]将所述拼接表格中上边沿坐标相同的文字存储为同一行,并将所述拼接表格中左边沿坐标相同的文字存储为同一列。[0014]优选地,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:

[0015]根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档

5

CN 107818075 A

说 明 书

2/14页

中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉;[0016]其中,前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围;及[0017]下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。[0018]优选地,所述换行情形包括行内换行和行尾换行;[0019]其中,所述行内换行的识别包括:

[0020]获取该行文字中每个单元格的文字内容位置信息,其中,每个单元格的文字内容位置信息包括每个单元格的文字内容的上边沿坐标;及[0021]从文字内容上边沿坐标相同的单元格中,获取第一次出现的单元格位置和最后一次出现的单元格位置,将第一次出现的单元格位置到最后一次出现的单元格位置的所有单元格确定为同一行,并判定第一次出现的单元格位置与最后一次出现的单元格位置之间文字内容上边沿坐标不同的单元格为行内换行的单元格。[0022]优选地,所述行尾换行的识别包括:

[0023]若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格的文字内容位置信息,其中,所述剩余单元格的文字内容位置信息包括所述剩余单元格的文字内容的上边沿坐标;

[0024]计算所述剩余单元格的文字内容上边沿坐标与当前行及下一行所有单元格的文字内容上边沿坐标的距离,或计算所述剩余单元格的文字内容上边沿坐标与当前行及上一行所有单元格的文字内容上边沿坐标的距离;及[0025]若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。[0026]此外,为实现上述目的,本发明还提供一种表格信息结构化提取方法,该方法应用于电子设备,所述方法包括:

[0027]获取指定文档中每行文字的位置信息和标签信息;[0028]根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形;

[0029]当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储和分列存储;及

[0030]当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储。[0031]优选地,所述第一重塑规则包括:将上边沿坐标相同的文字存储为同一行,将左边沿坐标相同的文字存储为同一列;[0032]所述第二重塑规则包括:[0033]删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

[0034]将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格;及

[0035]将所述拼接表格中上边沿坐标相同的文字存储为同一行,并将所述拼接表格中左

6

CN 107818075 A

说 明 书

3/14页

边沿坐标相同的文字存储为同一列。[0036]优选地,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:

[0037]根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉;[0038]其中,前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围;及[0039]下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。[0040]优选地,所述跨页情形的识别包括:

[0041]针对该指定文档中相邻的前一表格和下一表格,获取前一表格文字内容的位置信息、标签信息和下一表格文字内容的位置信息、标签信息;

[0042]比对下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标;[0043]当下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同时,比对下一表格每行文字的页码与前一表格每行文字的页码;及

[0044]若下一表格每行文字的页码与前一表格每行文字的页码存在不同,则判定下一表格与前一表格为存在跨页情形的同一表格。[0045]进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有表格信息结构化提取系统,所述表格信息结构化提取系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的表格信息结构化提取方法的步骤。[0046]相较于现有技术,本发明所提出的电子设备、表格信息结构化提取方法及计算机可读存储介质,通过分析指定文档(如PDF文档)中表格文字内容的位置信息和标签信息,可以识别出表格(如PDF年报表格)中的换行情形和跨页情形,并对出现换行情形和跨页情形的表格进行结构化数据提取并存储。该方法无需将PDF文件转化为word、excel等结构化文档,数据提取效率高,大规模数据集下召回率和准确率较高,且利于后续横向比对分析、纵向比对分析及数据建模。

附图说明

[0047]图1是本发明电子设备一可选的硬件架构的示意图;

[0048]图2是本发明电子设备中表格信息结构化提取系统一实施例的程序模块示意图;[0049]图3为本发明表格信息结构化提取方法一实施例的实施流程示意图。[0050]附图标记:

7

CN 107818075 A

说 明 书

4/14页

[0051]

[0052]

[0053]

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0054]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0055]需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

[0056]进一步需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。[0057]首先,本发明提出一种电子设备2。[0058]参阅图1所示,是本发明电子设备2一可选的硬件架构的示意图。本实施例中,所述电子设备2可包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23。需要指出的是,图1仅示出了具有组件21-23的电子设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

8

CN 107818075 A[0059]

说 明 书

5/14页

其中,所述电子设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式

服务器等计算设备,该电子设备2可以是的服务器,也可以是多个服务器所组成的服务器集群。

[0060]所述存储器21至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器21可以是所述电子设备2的内部存储单元,例如该电子设备2的硬盘或内存。在另一些实施例中,所述存储器21也可以是所述电子设备2的外部存储设备,例如该电子设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括所述电子设备2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器21通常用于存储安装于所述电子设备2的操作系统和各类应用软件,例如所述表格信息结构化提取系统20的程序代码等。此外,所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

[0061]所述处理器22在一些实施例中可以是处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制所述电子设备2的总体操作,例如执行与所述电子设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的表格信息结构化提取系统20等。

[0062]所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述电子设备2与其他电子设备之间建立通信连接。例如,所述网络接口23用于通过网络将所述电子设备2与外部数据平台相连,在所述电子设备2与外部数据平台之间的建立数据传输通道和通信连接。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。[0063]至此,己经详细介绍了本发明各个实施例的应用环境和相关设备的硬件结构和功能。下面,将基于上述应用环境和相关设备,提出本发明的各个实施例。[00]参阅图2所示,是本发明电子设备2中表格信息结构化提取系统20一实施例的程序模块图。本实施例中,所述的表格信息结构化提取系统20可以被分割成一个或多个程序模块,所述一个或者多个程序模块被存储于所述存储器21中,并由一个或多个处理器(本实施例中为所述处理器22)所执行,以完成本发明。例如,在图2中,所述的表格信息结构化提取系统20可以被分割成获取模块201、识别模块202、以及存储模块203。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述表格信息结构化提取系统20在所述电子设备2中的执行过程。以下将就各程序模块201-203的功能进行详细描述。

[0065]所述获取模块201,用于获取指定文档(如PDF文档)中每行文字的位置信息和标签信息。在本实施例中,可以使用特定的文字识别工具(如pdf2html工具)获取该指定文档中每行文字的位置信息和标签信息。该特定的文字识别工具可以将PDF文档解析为文本文件

9

CN 107818075 A

说 明 书

6/14页

(如XML文件),同时解析出每行文本在PDF文档中每行文字的位置信息和标签信息。[0066]优选地,在本实施例中,每行文字的位置信息包括,但不限于,每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。其中,该指定文档中表格的每一行存储在相邻位置,即依据每行文字的位置信息(如左边沿坐标)依次存储。进一步地,每行文字的标签信息包括,但不限于,每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0067]所述识别模块202,用于根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形。[0068]具体而言,所述从该指定文档的表格中识别出换行情形包括如下步骤A1-A2。[0069](A1)定位该指定文档中的特定表格,获取该特定表格的位置信息,如该特定表格的左边沿坐标、表格宽度(表格高度)、和表格长度等。在本实施例中,可以通过该指定文档的特定规则,对该指定文档中的表格进行定位。例如,若该指定文档为PDF年报,则年报发布有明确的格式要求,可以根据类似下述的年报规则对特定表格进行判断:[0070]如介绍主要客户和供应商时,表格标题会设为“主要销售客户和主要供应商情况”,因此这一标题后面就是客户供应商的特定表格。根据特定表格的标题关键词,则可以对介绍特定内容的表格进行定位,方便后续的解析。同理,PDF年报中的其它表格都有类似的格式。[0071](A2)根据该特定表格的位置信息依次读取该特定表格中的一行文字,并根据该行文字的位置信息从该行文字中识别出行内换行的单元格。在本实施例中,可以从该特定表格的左边沿坐标开始,根据该特定表格的表格长度读取第一行,并根据该特定表格的表格宽度直至读取到该特定表格的最后一行。[0072]优选地,在本实施例中,该特定表格的每行文字包括多个单元格,如第1单元格、第2单元格、第3单元格、第4单元格。更具体而言,所述换行情形包括行内换行和行尾换行。所述行内换行是指:在该特定表格的一行文字的内部单元格中存在换行情形。所述行尾换行是指:在该特定表格的一行文字的尾部单元格中存在换行情形。[0073]优选地,在本实施例中,所述根据该行文字的位置信息从该行文字中识别出行内换行的单元格包括如下步骤A21-A22。[0074](A21)获取该行文字中每个单元格的文字内容位置信息,其中,每个单元格的文字内容位置信息包括,但不限于,每个单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0075](A22)从文字内容上边沿坐标相同的单元格中,获取第一次出现的单元格位置和最后一次出现的单元格位置(即找到相同上边沿坐标第一次出现的单元格位置和最后一次出现的单元格位置),将第一次出现的单元格位置到最后一次出现的单元格位置的所有单元格确定为同一行,并判定第一次出现的单元格位置与最后一次出现的单元格位置之间文字内容上边沿坐标不同的单元格为行内换行的单元格。[0076]优选地,在其它实施例中,所述表格信息换行识别还包括步骤:(A3)根据当前行文字的位置信息从当前行文字中识别出行尾换行的单元格。[0077]具体而言,所述根据当前行文字的位置信息从当前行文字中识别出行尾换行的单元格包括如下步骤A31-A33。

10

CN 107818075 A[0078]

说 明 书

7/14页

(A31)若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格

的文字内容位置信息。其中,所述剩余单元格的文字内容位置信息包括,但不限于,所述剩余单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0079](A32)计算所述剩余单元格的文字内容上边沿坐标与当前行(如第一行)及下一行(如第二行)所有单元格的文字内容上边沿坐标的距离。[0080](A33)若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。[0081]进一步地,若距离最小值出现在下一行,则将所述剩余单元格的文字内容并入下一行,并判定所述剩余单元格为下一行的行尾换行单元格。[0082]需要说明的是,在其它实施例中,所述根据当前行文字的位置信息从当前行文字中识别出行尾换行的单元格还可以包括如下步骤A34-A36。[0083](A34)若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格的文字内容位置信息。其中,所述剩余单元格的文字内容位置信息包括,但不限于,所述剩余单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0084](A35)计算所述剩余单元格的文字内容上边沿坐标与当前行(如第二行)及上一行(如第一行)所有单元格的文字内容上边沿坐标的距离。[0085](A36)若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。[0086]进一步地,若距离最小值出现在上一行,则将所述剩余单元格的文字内容并入上一行,并判定所述剩余单元格为上一行的行尾换行单元格。[0087]需要说明的是,上述步骤A1-A2、A21-A22、A31-A36是以在PDF文件的特定表格(如客户供应商表格)中识别出表格信息换行情形为例进行说明,本领域技术人员可以理解,在其它实施例中,上述表格信息换行识别方法也可以针对PDF文件的所有表格进行换行情形识别,在此不再赘述。[0088]进一步地,所述从该指定文档的表格中识别出跨页情形包括如下步骤B1-B3(方法一)。[00](B1)针对该指定文档中相邻的前一表格和下一表格,获取前一表格文字内容的位置信息、标签信息和下一表格文字内容的位置信息、标签信息。[0090]优选地,在本实施例中,所述前一表格文字内容的位置信息包括,但不限于,前一表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息,及前一表格每列文字的左边沿坐标等。所述前一表格文字内容的标签信息包括,但不限于,前一表格每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。

[0091]进一步地,所述下一表格文字内容的位置信息包括,但不限于,下一表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息,及下一表格每列文字的左边沿坐标等。所述下一表格文字内容的标签信息包括,但不限于,下一表格每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0092](B2)比对下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标。举例而言,比对下一表格第1列文字的左边沿坐标与前一表格第1列文字的左边沿坐标,

11

CN 107818075 A

说 明 书

8/14页

比对下一表格第2列文字的左边沿坐标与前一表格第2列文字的左边沿坐标,依此类推。[0093](B3)当下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同时(代表下一表格与前一表格为同一表格),则比对下一表格每行文字的页码与前一表格每行文字的页码。举例而言,第一页的页尾包括前一表格,第二页的页首包括下一表格,其中,下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同,则判定下一表格与前一表格为同一表格。

[0094]若下一表格每行文字的页码与前一表格每行文字的页码存在不同,则判定下一表格与前一表格为存在跨页情形的同一表格。若下一表格每行文字的页码与前一表格每行文字的页码都相同,则判定下一表格与前一表格为不存在跨页情形的同一表格,即下一表格与前一表格为位于同一页面的同一表格。[0095]优选地,在本实施例中,若下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标之间的差值都小于预设阈值(如2个像素单位值),则判定下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同。[0096]需要说明的是,上述步骤B1-B3(方法一)是以在PDF文件的相邻两个表格(前一表格和下一表格)中识别出表格信息跨页情形为例进行说明,本领域技术人员可以理解,在其它实施例中,上述表格信息跨页识别也可以针对PDF文件的特定表格(如财务表格)进行跨页情形识别(方法二),方法二包括如下步骤B4-B5。[0097](B4)定位该指定文档中的特定表格,获取该特定表格文字内容的位置信息和标签信息。其中,该特定表格文字内容的位置信息包括,但不限于,该特定表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。该特定表格文字内容的标签信息包括,但不限于,该特定表格每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0098]具体而言,可以通过该指定文档的特定规则,对该指定文档中的特定表格进行定位。例如,若该指定文档为PDF年报,则年报发布有明确的格式要求,可以根据类似下述的年报规则对特定表格进行判断。

[0099]如介绍主要客户和供应商时,表格标题会设为“主要销售客户和主要供应商情况”,因此这一标题后面就是客户供应商的特定表格。根据特定表格的标题关键词,则可以对介绍特定内容的表格进行定位,方便后续的解析。同理,PDF年报中的其它特定表格都有类似的格式。[0100](B5)根据该特定表格文字内容的位置信息(如上边沿坐标)依次读取该特定表格的每行文字(如上边沿坐标相同的文字为同一行),并根据该特定表格文字内容的标签信息获取每行文字的页码。

[0101]若该特定表格每行文字的页码存在不同,则判定该特定表格存在跨页情形(即识别出该特定表格位于不同页面的前一表格和下一表格)。若该特定表格每行文字的页码都相同,则判定该特定表格不存在跨页情形。[0102]所述存储模块203,用于当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表格信息进行分行存储(分行提取表格数据并存储)和分列存储(分列提取表格数据并存储),形成结构化的表格数据。[0103]优选地,在本实施例中,所述第一重塑规则包括:将上边沿坐标相同的文字存储为

12

CN 107818075 A

说 明 书

9/14页

同一行(分行存储),将左边沿坐标相同的文字存储为同一列(分列存储)。[0104]所述存储模块203,还用于当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储,形成结构化的表格数据。[0105]优选地,在本实施例中,所述第二重塑规则包括:[0106]删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

[0107]将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格(即形成同一页的表格);及

[0108]将所述拼接表格中上边沿坐标相同的文字存储为同一行(分行存储),并将所述拼接表格中左边沿坐标相同的文字存储为同一列(分列存储)。[0109]具体而言,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉。[0110]其中,所述前一页面的标签信息包括,但不限于,前一页面的页码、页面长度、页面宽度等;所述下一页面的标签信息包括,但不限于,下一页面的页码、页面长度、页面宽度等。该指定文档的特定规则包括,但不限于,前一页面的页脚所占页面长度的第一比例(如8%)、下一页面的页眉所占页面长度的第二比例(如9%)。可以理解,所述第一比例和第二比例也可以相同。[0111]进一步地,所述前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围。所述下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。[0112]优选地,在其它实施例中,所述表格信息结构化提取系统20还用于:针对存储的结构化表格数据进行横向比对分析和纵向比对分析。[0113]其中,所述横向比对分析包括:比对同一时间范围内(如同一年)同一行业不同公司的结构化表格数据(如应收账款数据),以便分析不同公司的债务情况、资金状况等经营信息。所述纵向比对分析包括:比对同一公司在不同时间范围内(如近三年)的结构化表格数据(如应收账款数据),以便分析该公司的债务情况、资金状况等经营信息(如应收账款变化)。

[0114]通过上述程序模块201-203,本发明所提出的表格信息结构化提取系统20,通过分析指定文档(如PDF文档)中表格文字内容的位置信息和标签信息,可以识别出表格(如PDF年报表格)中的换行情形和跨页情形,并对出现换行情形和跨页情形的表格进行结构化数据提取并存储。该方法无需将PDF文件转化为word、excel等结构化文档,数据提取效率高,大规模数据集下召回率和准确率较高,且利于后续横向比对分析、纵向比对分析及数据建模。

[0115]此外,本发明还提出一种表格信息结构化提取方法。[0116]参阅图3所示,是本发明表格信息结构化提取方法一实施例的实施流程示意图。在本实施例中,根据不同的需求,图3所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。

13

CN 107818075 A[0117]

说 明 书

10/14页

步骤S31,获取指定文档(如PDF文档)中每行文字的位置信息和标签信息。在本实

施例中,可以使用特定的文字识别工具(如pdf2html工具)获取该指定文档中每行文字的位置信息和标签信息。该特定的文字识别工具可以将PDF文档解析为文本文件(如XML文件),同时解析出每行文本在PDF文档中每行文字的位置信息和标签信息。[0118]优选地,在本实施例中,每行文字的位置信息包括,但不限于,每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。其中,该指定文档中表格的每一行存储在相邻位置,即依据每行文字的位置信息(如左边沿坐标)依次存储。进一步地,每行文字的标签信息包括,但不限于,每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0119]步骤S32,根据每行文字的位置信息和标签信息,从该指定文档的表格中识别出换行情形和跨页情形。[0120]具体而言,所述从该指定文档的表格中识别出换行情形包括如下步骤A1-A2。[0121](A1)定位该指定文档中的特定表格,获取该特定表格的位置信息,如该特定表格的左边沿坐标、表格宽度(表格高度)、和表格长度等。在本实施例中,可以通过该指定文档的特定规则,对该指定文档中的表格进行定位。例如,若该指定文档为PDF年报,则年报发布有明确的格式要求,可以根据类似下述的年报规则对特定表格进行判断:[0122]如介绍主要客户和供应商时,表格标题会设为“主要销售客户和主要供应商情况”,因此这一标题后面就是客户供应商的特定表格。根据特定表格的标题关键词,则可以对介绍特定内容的表格进行定位,方便后续的解析。同理,PDF年报中的其它表格都有类似的格式。[0123](A2)根据该特定表格的位置信息依次读取该特定表格中的一行文字,并根据该行文字的位置信息从该行文字中识别出行内换行的单元格。在本实施例中,可以从该特定表格的左边沿坐标开始,根据该特定表格的表格长度读取第一行,并根据该特定表格的表格宽度直至读取到该特定表格的最后一行。[0124]优选地,在本实施例中,该特定表格的每行文字包括多个单元格,如第1单元格、第2单元格、第3单元格、第4单元格。更具体而言,所述换行情形包括行内换行和行尾换行。所述行内换行是指:在该特定表格的一行文字的内部单元格中存在换行情形。所述行尾换行是指:在该特定表格的一行文字的尾部单元格中存在换行情形。[0125]优选地,在本实施例中,所述根据该行文字的位置信息从该行文字中识别出行内换行的单元格包括如下步骤A21-A22。[0126](A21)获取该行文字中每个单元格的文字内容位置信息,其中,每个单元格的文字内容位置信息包括,但不限于,每个单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0127](A22)从文字内容上边沿坐标相同的单元格中,获取第一次出现的单元格位置和最后一次出现的单元格位置(即找到相同上边沿坐标第一次出现的单元格位置和最后一次出现的单元格位置),将第一次出现的单元格位置到最后一次出现的单元格位置的所有单元格确定为同一行,并判定第一次出现的单元格位置与最后一次出现的单元格位置之间文字内容上边沿坐标不同的单元格为行内换行的单元格。[0128]优选地,在其它实施例中,所述表格信息换行识别方法还包括步骤:(A3)根据当前

14

CN 107818075 A

说 明 书

11/14页

行文字的位置信息从当前行文字中识别出行尾换行的单元格。[0129]具体而言,所述根据当前行文字的位置信息从当前行文字中识别出行尾换行的单元格包括如下步骤A31-A33。[0130](A31)若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格的文字内容位置信息。其中,所述剩余单元格的文字内容位置信息包括,但不限于,所述剩余单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0131](A32)计算所述剩余单元格的文字内容上边沿坐标与当前行(如第一行)及下一行(如第二行)所有单元格的文字内容上边沿坐标的距离。[0132](A33)若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。[0133]进一步地,若距离最小值出现在下一行,则将所述剩余单元格的文字内容并入下一行,并判定所述剩余单元格为下一行的行尾换行单元格。[0134]需要说明的是,在其它实施例中,所述根据当前行文字的位置信息从当前行文字中识别出行尾换行的单元格还可以包括如下步骤A34-A36。[0135](A34)若行内换行识别后当前行文字中存在剩余单元格,则获取所述剩余单元格的文字内容位置信息。其中,所述剩余单元格的文字内容位置信息包括,但不限于,所述剩余单元格的文字内容的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。[0136](A35)计算所述剩余单元格的文字内容上边沿坐标与当前行(如第二行)及上一行(如第一行)所有单元格的文字内容上边沿坐标的距离。[0137](A36)若距离最小值出现在当前行,则将所述剩余单元格的文字内容并入当前行,并判定所述剩余单元格为当前行的行尾换行单元格。[0138]进一步地,若距离最小值出现在上一行,则将所述剩余单元格的文字内容并入上一行,并判定所述剩余单元格为上一行的行尾换行单元格。[0139]需要说明的是,上述步骤A1-A2、A21-A22、A31-A36是以在PDF文件的特定表格(如客户供应商表格)中识别出表格信息换行情形为例进行说明,本领域技术人员可以理解,在其它实施例中,上述表格信息换行识别方法也可以针对PDF文件的所有表格进行换行情形识别,在此不再赘述。[0140]进一步地,所述从该指定文档的表格中识别出跨页情形包括如下步骤B1-B3(方法一)。[0141](B1)针对该指定文档中相邻的前一表格和下一表格,获取前一表格文字内容的位置信息、标签信息和下一表格文字内容的位置信息、标签信息。[0142]优选地,在本实施例中,所述前一表格文字内容的位置信息包括,但不限于,前一表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息,及前一表格每列文字的左边沿坐标等。所述前一表格文字内容的标签信息包括,但不限于,前一表格每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。

[0143]进一步地,所述下一表格文字内容的位置信息包括,但不限于,下一表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息,及下一表格每列文字的左边沿坐标等。所述下一表格文字内容的标签信息包括,但不限于,下一表格每行文字在所述指

15

CN 107818075 A

说 明 书

12/14页

定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0144](B2)比对下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标。举例而言,比对下一表格第1列文字的左边沿坐标与前一表格第1列文字的左边沿坐标,比对下一表格第2列文字的左边沿坐标与前一表格第2列文字的左边沿坐标,依此类推。[0145](B3)当下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同时(代表下一表格与前一表格为同一表格),则比对下一表格每行文字的页码与前一表格每行文字的页码。举例而言,第一页的页尾包括前一表格,第二页的页首包括下一表格,其中,下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同,则判定下一表格与前一表格为同一表格。

[0146]若下一表格每行文字的页码与前一表格每行文字的页码存在不同,则判定下一表格与前一表格为存在跨页情形的同一表格。若下一表格每行文字的页码与前一表格每行文字的页码都相同,则判定下一表格与前一表格为不存在跨页情形的同一表格,即下一表格与前一表格为位于同一页面的同一表格。[0147]优选地,在本实施例中,若下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标之间的差值都小于预设阈值(如2个像素单位值),则判定下一表格每列文字的左边沿坐标与前一表格对应每列文字的左边沿坐标都相同。[0148]需要说明的是,上述步骤B1-B3(方法一)是以在PDF文件的相邻两个表格(前一表格和下一表格)中识别出表格信息跨页情形为例进行说明,本领域技术人员可以理解,在其它实施例中,上述表格信息跨页识别方法也可以针对PDF文件的特定表格(如财务表格)进行跨页情形识别(方法二),方法二包括如下步骤B4-B5。[0149](B4)定位该指定文档中的特定表格,获取该特定表格文字内容的位置信息和标签信息。其中,该特定表格文字内容的位置信息包括,但不限于,该特定表格每行文字的左边沿坐标、上边沿坐标、文本宽度、文本长度等坐标信息。该特定表格文字内容的标签信息包括,但不限于,该特定表格每行文字在所述指定文档(如PDF文档)的页码(即每行文字所在页面的序号)、页面长度、页面宽度等。[0150]具体而言,可以通过该指定文档的特定规则,对该指定文档中的特定表格进行定位。例如,若该指定文档为PDF年报,则年报发布有明确的格式要求,可以根据类似下述的年报规则对特定表格进行判断。

[0151]如介绍主要客户和供应商时,表格标题会设为“主要销售客户和主要供应商情况”,因此这一标题后面就是客户供应商的特定表格。根据特定表格的标题关键词,则可以对介绍特定内容的表格进行定位,方便后续的解析。同理,PDF年报中的其它特定表格都有类似的格式。[0152](B5)根据该特定表格文字内容的位置信息(如上边沿坐标)依次读取该特定表格的每行文字(如上边沿坐标相同的文字为同一行),并根据该特定表格文字内容的标签信息获取每行文字的页码。

[0153]若该特定表格每行文字的页码存在不同,则判定该特定表格存在跨页情形(即识别出该特定表格位于不同页面的前一表格和下一表格)。若该特定表格每行文字的页码都相同,则判定该特定表格不存在跨页情形。[0154]步骤S33,当从该指定文档的表格中识别出换行情形时,则根据第一重塑规则将表

16

CN 107818075 A

说 明 书

13/14页

格信息进行分行存储(分行提取表格数据并存储)和分列存储(分列提取表格数据并存储),形成结构化的表格数据。[0155]优选地,在本实施例中,所述第一重塑规则包括:将上边沿坐标相同的文字存储为同一行(分行存储),将左边沿坐标相同的文字存储为同一列(分列存储)。[0156]步骤S34,当从该指定文档的表格中识别出跨页情形时,则根据第二重塑规则将表格信息进行分行存储和分列存储,形成结构化的表格数据。[0157]优选地,在本实施例中,所述第二重塑规则包括:[0158]删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉;

[0159]将删除页脚后的前一表格文字内容与删除页眉后的下一表格文字内容进行拼接形成拼接表格(即形成同一页的表格);及

[0160]将所述拼接表格中上边沿坐标相同的文字存储为同一行(分行存储),并将所述拼接表格中左边沿坐标相同的文字存储为同一列(分列存储)。[0161]具体而言,所述删除前一表格所在前一页面的页脚和下一表格所在下一页面的页眉包括:根据前一页面和下一页面的标签信息、及该指定文档的特定规则,对该指定文档中前一页面的页脚范围和下一页面的页眉范围进行定位,并根据定位确定的页脚范围和页眉范围删除前一页面的页脚和下一页面的页眉。[0162]其中,所述前一页面的标签信息包括,但不限于,前一页面的页码、页面长度、页面宽度等;所述下一页面的标签信息包括,但不限于,下一页面的页码、页面长度、页面宽度等。该指定文档的特定规则包括,但不限于,前一页面的页脚所占页面长度的第一比例(如8%)、下一页面的页眉所占页面长度的第二比例(如9%)。可以理解,所述第一比例和第二比例也可以相同。[0163]进一步地,所述前一页面的页脚范围的确定规则为:依据从下至上的顺序,选取所述前一页面的页面长度的第一比例内容,将选取的第一比例内容作为所述前一页面的页脚范围。所述下一页面的页眉范围的确定规则为:依据从上至下的顺序,选取所述下一页面的页面长度的第二比例内容,将选取的第二比例内容作为所述下一页面的页眉范围。[01]优选地,在其它实施例中,所述表格信息结构化提取方法还包括步骤:针对存储的结构化表格数据进行横向比对分析和纵向比对分析。[0165]其中,所述横向比对分析包括:比对同一时间范围内(如同一年)同一行业不同公司的结构化表格数据(如应收账款数据),以便分析不同公司的债务情况、资金状况等经营信息。所述纵向比对分析包括:比对同一公司在不同时间范围内(如近三年)的结构化表格数据(如应收账款数据),以便分析该公司的债务情况、资金状况等经营信息(如应收账款变化)。

[0166]通过上述步骤S31-S34及其它相关步骤,本发明所提出的表格信息结构化提取方法,通过分析指定文档(如PDF文档)中表格文字内容的位置信息和标签信息,可以识别出表格(如PDF年报表格)中的换行情形和跨页情形,并对出现换行情形和跨页情形的表格进行结构化数据提取并存储。该方法无需将PDF文件转化为word、excel等结构化文档,数据提取效率高,大规模数据集下召回率和准确率较高,且利于后续横向比对分析、纵向比对分析及数据建模。

[0167]进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质(如ROM/RAM、

17

CN 107818075 A

说 明 书

14/14页

磁碟、光盘),所述计算机可读存储介质存储有表格信息结构化提取系统20,所述表格信息结构化提取系统20可被至少一个处理器22执行,以使所述至少一个处理器22执行如上所述的表格信息结构化提取方法的步骤。[0168]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件来实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。[0169]以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。[0170]本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

18

CN 107818075 A

说 明 书 附 图

1/3页

图1

19

CN 107818075 A

说 明 书 附 图

2/3页

图2

20

CN 107818075 A

说 明 书 附 图

3/3页

图3

21

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.com 版权所有 湘ICP备2022005869号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务