立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 118|回复: 0

[分享] HMCHH-TCT-CellDet2025——液基宫颈细胞学异常细胞检测

[复制链接]
发表于 2025-1-20 13:04 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
今天将分享液基宫颈细胞学异常细胞检测完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。
一、HMCHH-TCT-CellDet2025介绍
宫颈癌是全球女性中癌症发病率和死亡率的第四大主要原因,而早期诊断和治疗可以显著提高患者的生存率。基于细胞学的筛查方法,例如巴氏涂片或液基薄层制片,是宫颈癌早期诊断的核心手段。通过这些方法,病理学家在显微镜下或数字化细胞学图像中寻找异常宫颈细胞,并根据结果发布最终报告。然而,这一过程受到病理学家内部和之间高度可变性的影响,可能导致常规诊断中的高假阴性率。此外,由于异常宫颈细胞通常仅占样本细胞的一小部分,人工检查会造成医疗资源的不必要浪费。因此,在数字化细胞学图像中对异常宫颈细胞进行计算机化筛查成为一个备受科学界关注的研究主题。自深度学习发展以来,基于人工智能(AI)的宫颈癌筛查系统应运而生,为宫颈癌诊断带来了变革。这些系统主要基于现代深度学习的目标检测技术,并通过领域特定的改进提供检测异常宫颈细胞的新自动化方法。这些方法展示了计算机辅助异常宫颈细胞筛查的潜在优势,例如提高灵敏度并减少误诊风险。尽管这些方法展现出显著优势,但其发展高度依赖大量的标注数据。因此,这些研究在初始阶段需要投入大量人力和物力资源来收集宫颈细胞学图像。其主要原因是缺乏公开可用的包含标注异常宫颈细胞的图像数据集。这种情况不仅延长了研究周期,也限制了模型在临床实践中的泛化能力。当处理来自不同中心、仪器或染色技术的图像时,模型的性能可能表现不一致。   
二、HMCHH-TCT-CellDet2025任务
液基宫颈细胞学中异常细胞检测。
三、HMCHH-TCT-CellDet2025数据集
该数据集包含2018年10月至2019年5月期间在黑龙江省妇幼保健院接受宫颈细胞学检查的患者样本。根据检查报告,从病理科收集了129张TCT(液基薄层细胞学检测)切片,这些切片被报告为异常水平(参见伦理审批与参与同意部分)。每张切片通过奥林巴斯BX53光学显微镜在20倍物镜放大倍率下进行数字化处理,并划分为333个不重叠的图像块(大小为2048×2048像素)。信息量较低的图像块(例如被背景覆盖或模糊的块)被移除。剩余的8,037个图像块被保存在数据集中,文件格式为.png。为了获得异常细胞的真实标注,三位病理学家参与了本数据集的标注准备工作,旨在对每个图像块中的异常宫颈细胞进行详尽标注。三位病理学家分别记为A、B和C。其中,A拥有约33年的宫颈细胞学图像阅片经验,B和C则各有约10年的阅片经验。根据ACOG(美国妇产科医师学会)的指导标准,宫颈细胞的异常或正常定义依据该标准进行。基于该指导,标注人员使用Colabeler工具在每个图像块中为异常细胞绘制边界框。最终标注文件的生成遵循以下三个步骤:初始标注、验证步骤和最终检查步骤。首先,图像会被随机分配给标注者B或C进行初始标注。标注完成后,图像及其标注会交由另一位标注者进行复审。最后,标注由标注者A检查并导出。所有标注文件均以.xml文件格式存储,并与相应的图像保持相同的编号。数据集由两个部分组成:一个名为 “JPEGImages” 的文件夹,包含以 .png 文件格式存储的来自相应 TCT 切片的细胞学图像;另一个名为 “Annotations” 的文件夹,包含每张细胞图像对应的异常细胞标注文件,格式为 .xml。“JPEGImages” 文件夹中共有 8,037 张大小为 2048 × 2048 像素的图像,“Annotations” 文件夹中则有同样数量的标注文件。图像文件和标注文件的命名格式一致,即 “患者编号_图像编号”,以便在训练模型时方便地拆分数据集。首先,根据统计数据,整个数据集中共有 15,761 个异常细胞的标注框,即平均每张图像包含 两个异常细胞。此外,通过标注框的面积(以像素为单位)来衡量细胞的大小,并通过长宽比(即高除以宽)来表示细胞的形状。
数据下载:
https://springernature.figshare.com/articles/dataset/A_large_annotated_cervical_cytology_images_dataset_for_AI_models_to_aid_cervical_cancer_screening/27901206
四、技术路线
1、图像预处理,然后采用均值为0,方差为1的方式进行归一化处理,并将数据划分成训练集和验证集。
2、搭建YoloV5检测网络,使用SGD优化器,学习率是0.001,batchsize是8,epoch是300,损失函数采用交叉熵和iou损失。   
3、训练结果和验证结果





4、验证集检测结果   





















5、测试集检测结果   











点击阅读原文可以访问参考项目,如果大家觉得这个项目还不错,希望大家给个Star并Fork,可以让更多的人学习。如果有任何问题,随时给我留言我会及时回复的。

原文地址:https://zhuanlan.zhihu.com/p/19384086218
楼主热帖
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表