(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 112908437 A
(43)申请公布日 2021.06.04
(21)申请号 CN202110249095.0
(22)申请日 2021.03.08
(71)申请人 季凯;王正
    地址 276004 山东省临沂市兰山区金雀山街道开元上城5-1-1004
(72)发明人 季凯 王正
(74)专利代理机构
    代理人
(51)Int.CI
      G16H10/40(20180101)
      G16H50/20(20180101)
      G06N20/00(20190101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种提高肿瘤标志物准确性的方法和系统
(57)摘要
      本发明公开了一种提高肿瘤标志物准确性的方法和系统,属于医疗数据处理领域,包括数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别;肿瘤标志物筛查模块,其用于基于肿瘤标志物增强筛查模型,预测出相应待筛查者中恶性肿瘤患病预测值;其中,肿瘤标志物增强筛查模型的训练过程为:构建大规模人样本集合,样本中包含同一人的血常规、血生化和肿瘤标志物指标;利用血常规、血生化和肿瘤标志物指标建立学习样本;利用学习样本训练机器学习算法模型,得到肿瘤标志物增强筛查模型。本发明利用血常规、血生化指标提高了肿瘤标志物准确性。
法律状态
标志图片
法律状态公告日
法律状态信息
法律状态
2021-06-04
公开
公开
2022-01-04
实质审查的生效IPC(主分类):G16H10/40专利申请号:2021102490950申请日:20210308
实质审查的生效
2022-11-04
发明专利申请公布后的撤回IPC(主分类):G16H10/40专利申请号:2021102490950申请公布日:20210604
发明专利申请公布后的撤回
权 利 要 求 说 明 书
1.一种提高肿瘤标志物准确性的方法和系统,其特征在于,包括:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别;
肿瘤标志物筛查模块,其用于基于肿瘤标志物增强筛查模型,预测出相应待筛查者中恶性肿瘤患病预测值;
其中,肿瘤标志物增强筛查模型的训练过程为:构建大规模人样本集合,样本中包含同一人的血常规、血生化和肿瘤标志物指标;利用血常规、血生化和肿瘤标志物指标建立学习样本;利用学习样本训练机器学习算法模型,得到肿瘤标志物增强筛查模型。
2.根据权利要求1所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,用于机器学习的训练数据可以利用血常规数据和血生化的部分指标或全部指标进行训练,只要满足筛查评价指标要求,就可以作为一个肿瘤标志物增强筛查模型。
3.根据权利要求1所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,分别对肿瘤标志物大于阈值和小于阈值两种情况建立学习样本,得到两种情况下的肿瘤标志物增强筛查模型。
4.根据权利要求1所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,肿瘤标志物为AFP、CEA、Cyfra21-1、CA199、CA242、CA125、SCC、PSA。
5.根据权利要求2所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,筛查评价要求包括预测正确率、灵敏度、特异度。
6.根据权利要求3所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,肿瘤标志物增强筛查模型的训练过程中,利用样本集合训练至少四种机器学习算法模型;利用预测值误差来比较所有训练的机器学习算法模型,筛选准确性最高的机器学习算法模型作为最优肿瘤标志物增强筛查模型。
7.根据权利要求6所述的一种提高肿瘤标志物准确性的方法和系统,其特征在于,机器学习算法模型为SVM、随机森林算法、LightGBM算法或XGBoost算法。
说  明  书
<p>技术领域
本发明属于医疗数据处理领域,具体涉及一种提高肿瘤标志物准确性的方法和系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
在医学上,恶性肿瘤有多种称法。癌是指起源于上皮组织的恶性肿瘤,是恶性肿瘤中最常见的一类。相对应的,起源于间叶组织的恶性肿瘤统称为肉瘤。有少数恶性肿瘤不按上述原则命名,如肾母细胞瘤、恶性畸胎瘤等。一般人们所说的“癌症”习惯上泛指所有恶性肿瘤。恶性肿瘤具有细胞分化和增殖异常、生长失去控制、浸润性和转移性等生物学特征,其发生是一个多因子、多步骤的复杂过程。
肿瘤标志物是肿瘤细胞的生物化学性质及其代谢异常,因此在肿瘤病人的体液、排除物及组织中出现质或量上改变的物质,这些就是肿瘤标志物。肿瘤标志物在临床上主要用于对原发肿瘤的发现、肿瘤高危人的筛选、良性和恶性肿瘤的鉴别诊断、肿瘤发展程度的判断、肿瘤效果的观察和评价以及肿瘤复发和预后的预测等。
目前肿瘤标志物的标准在大于阈值的情况下,并不能确定为恶性肿瘤,在小于阈值的情况下,也不能排除恶性肿瘤,如果能够进一步提高这两种情况下的准确度,对于恶性肿瘤的筛查具有很高的实际应用价值。
发明内容
为了解决上述问题,本发明提供一种提高肿瘤标志物准确性的方法和系统,利用血常规、血生化检测指标来提高肿瘤标志物的准确性。
为了实现上述目的,本发明采用以下技术方案:
本发明提供一种提高肿瘤标志物准确性的方法和系统,包括:
数据获取模块,其用于获取血常规化验单、血生化化验单、肿瘤标志物化验单图片,识别血常规、血生化、肿瘤标志物化验单图片中检测指标、年龄、性别;
肿瘤标志物筛查模块,其用于利用肿瘤标志物增强筛查模型,预测出相应待筛查者中恶性肿瘤患病预测值;
其中,肿瘤标志物增强筛查模型的训练过程为:构建大规模人样本集合,样本中包含同一人的血常规、血生化和肿瘤标志物指标;利用血常规、血生化和肿瘤标志物指标建立学习样本;利用学习样本训练机器学习算法模型,得到肿瘤标志物增强筛查模型。