(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210135204.0
(22)申请日 2022.02.15
(65)同一申请的已公布的文献号
申请公布号 CN 114218935 A
(43)申请公布日 2022.03.22
(73)专利权人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 黄亚东
(74)专利代理 机构 北京亿腾知识产权代理事务
所(普通合伙) 11309
专利代理师 陈霁 周良玉
(51)Int.Cl.
G06F 40/279(2020.01)
G06F 40/211(2020.01)G06F 40/30(2020.01)
G06F 16/33(2019.01)
(56)对比文件
CN 112001188 A,2020.1 1.27
CN 111091883 A,2020.0 5.01
CN 113657113 A,2021.1 1.16
CN 108491373 A,2018.09.04
CN 110955752 A,2020.04.0 3
审查员 娄贝贝
(54)发明名称
数据分析中的实体展示方法和装置
(57)摘要
本说明书实施例提供一种数据分析中的实
体展示方法和装置, 方法包括: 获取针对用户输
入的自然语言文本进行实体识别得到的实体序
列, 所述自然语 言文本用于表达用户对目标数据
的数据分析需求; 根据所述实体序列中各实体的
实体类别、 实体类型、 各实体之间的关联关系中
的至少一项, 判断所述实体序列中相邻的至少两
个实体是否满足预设规则; 其中, 所述实体类型
用于指示该实体属于数值 或字符串的类型; 若判
断结果为满足预设规则, 则将所述至少两个实体
进行组合, 得到实体组合; 展示所述实体组合作
为所述数据分析需求包括的一项数据过滤条件。
能够在数据分析中的实体展示过程体现实体之
间的关联性。
权利要求书3页 说明书9页 附图3页
CN 114218935 B
2022.06.21
CN 114218935 B
1.一种数据分析中的实体展示方法, 所述方法包括:
获取针对用户输入的自然语言文本进行实体识别得到的实体序列, 所述自然语言文本
用于表达用户对目标 数据的数据分析需求;
根据所述实体序列中各实体的实体类别、 实体类型、 各实体之间的关联关系中的至少
一项, 判断所述 实体序列中相 邻的至少两个实体是否满足预设规则; 其中, 所述实体类型用
于指示该实体属于数值或字符串的类型;
若判断结果 为满足预设规则, 则将所述至少两个实体进行组合, 得到实体组合;
展示所述实体组合作为所述数据分析需求包括的一项数据过 滤条件;
其中, 所述实体类别包括操作符类别、 维度类别和维值类别; 所述维度类别对应于目标
数据中的字段名称, 所述维值类别对应于所述目标 数据中的字段的具体取值;
其中, 所述至少两个实体包括依次排列的第一实体、 第二实体、 第三实体; 所述预设规
则包括:
所述第一实体的实体类别为维度类别, 且其实体类型用于指示该实体属于数值的类
型;
所述第二实体的实体 类别为操作符类别且为 等于或不 等于逻辑运算符;
所述第三实体的实体类别为维值类别, 且其实体类型用于指示该实体属于数值的类
型;
或者, 所述至少两个实体包括依次排列的第 四实体、 第二实体、 第五实体; 所述预设规
则包括:
所述第四实体的实体类别为维度类别, 且其实体类型用于指示该实体属于字符串的类
型;
所述第二实体的实体 类别为操作符类别且为 等于或不 等于逻辑运算符;
所述第五实体的实体类别为维值类别, 且所述第五实体与所述第四实体之间的关联关
系为所述第五 实体属于所述第四实体对应的维值;
或者, 所述至少两个实体包括依次排列的第六实体、 第七实体、 第八实体; 所述预设规
则包括:
所述第六实体的实体类别为维度类别, 且其实体类型用于指示该实体属于数值的类
型;
所述第七实体的实体类别为操作符类别且为大于、 小于、 大于等于或小于等于逻辑运
算符;
所述第八实体的实体类别为维值类别, 且其实体类型用于指示该实体属于数值的类
型;
或者, 所述至少两个实体包括依次排列的第九实体、 第十实体; 所述预设规则包括:
所述第九实体和所述第十实体的实体类别均为维值类别, 且属于同一维度对应的维
值。
2.如权利要求1所述的方法, 其中, 所述展示所述实体组合, 包括:
在输入框里, 针对所述自然语言文本与所述实体组合对应的部分进行突出展示; 或者,
在输入框之外的提 示框里, 展示所述实体组合, 并示出其作为 一项所述数据过 滤条件。
3.如权利要求1所述的方法, 其中, 所述方法还 包括:权 利 要 求 书 1/3 页
2
CN 114218935 B
2根据所述数据 过滤条件, 构建数据查询脚本, 用于执行对所述目标数据的查询操作, 得
到与所述数据分析需求对应的查询结果。
4.一种数据分析中的实体展示装置, 所述装置包括:
获取单元, 用于获取针对用户输入的自然语言文本进行实体识别得到的实体序列, 所
述自然语言文本用于表达用户对目标 数据的数据分析需求;
判断单元, 用于根据 所述获取单元获取的实体序列中各实体的实体类别、 实体类型、 各
实体之间的关联关系中的至少一项, 判断所述实体序列中相 邻的至少两个实体是否满足预
设规则; 其中, 所述实体 类型用于指示该实体属于数值或字符串的类型;
组合单元, 用于若所述判断单元的判断结果为满足预设规则, 则将所述至少两个实体
进行组合, 得到实体组合;
展示单元, 用于展示所述组合单元得到的实体组合作为所述数据分析需求包括的一项
数据过滤条件;
其中, 所述实体类别包括操作符类别、 维度类别和维值类别; 所述维度类别对应于目标
数据中的字段名称, 所述维值类别对应于所述目标 数据中的字段的具体取值;
其中, 所述至少两个实体包括依次排列的第一实体、 第二实体、 第三实体; 所述预设规
则包括:
所述第一实体的实体类别为维度类别, 且其实体类型用于指示该实体属于数值的类
型;
所述第二实体的实体 类别为操作符类别且为 等于或不 等于逻辑运算符;
所述第三实体的实体类别为维值类别, 且其实体类型用于指示该实体属于数值的类
型;
或者, 所述至少两个实体包括依次排列的第 四实体、 第二实体、 第五实体; 所述预设规
则包括:
所述第四实体的实体类别为维度类别, 且其实体类型用于指示该实体属于字符串的类
型;
所述第二实体的实体 类别为操作符类别且为 等于或不 等于逻辑运算符;
所述第五实体的实体类别为维值类别, 且所述第五实体与所述第四实体之间的关联关
系为所述第五 实体属于所述第四实体对应的维值;
或者, 所述至少两个实体包括依次排列的第六实体、 第七实体、 第八实体; 所述预设规
则包括:
所述第六实体的实体类别为维度类别, 且其实体类型用于指示该实体属于数值的类
型;
所述第七实体的实体类别为操作符类别且为大于、 小于、 大于等于或小于等于逻辑运
算符;
所述第八实体的实体类别为维值类别, 且其实体类型用于指示该实体属于数值的类
型;
或者, 所述至少两个实体包括依次排列的第九实体、 第十实体; 所述预设规则包括:
所述第九实体和所述第十实体的实体类别均为维值类别, 且属于同一维度对应的维
值。权 利 要 求 书 2/3 页
3
CN 114218935 B
3
专利 数据分析中的实体展示方法和装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:35上传分享