-
胸腺上皮性肿瘤(thymic epithelial tumor, TET)是起源于胸腺上皮细胞的肿瘤,约占纵隔肿瘤的20%和前上纵隔肿瘤的47% [1]。参考2021年5月国际癌症研究机构(IARC)出版的《WHO胸部肿瘤分类(第5版)》[2]中组织病理学分类标准,可根据胸腺上皮细胞形态和淋巴细胞与上皮细胞的比例,将TET分为胸腺瘤A、AB、B1、B2和B3型;同时可根据肿瘤病理生物学侵袭程度,将TET分为低危组(A、AB、B1型)和高危组(B2、B3型)。手术完整切除是治疗TET患者的重要手段,低危组接受手术完整切除通常可以达到治愈,从而长期获益;然而,高危组患者手术切除具有一定困难,需要接受术前新辅助治疗提高可切除比例[3]。因此,术前准确鉴别TET的危险程度,对临床制定个性化治疗方案和预后评估具有重要意义。
胸部增强CT是治疗前评价TET的首选影像检查方法,在TET的影像诊断和鉴别诊断上具有重要作用[4-5]。然而,CT影像征象在不同组织病理学亚型TET之间存在一定程度的重叠,给临床诊断和评估带来困难和挑战[6]。计算机图像分析是一种可应用于多种脏器病变的辅助诊断方法,并被证实具有较高的临床价值[7-8]。使用计算机算法从CT图像中提取的熵特征,包括一阶熵特征和二阶熵特征,可以直接反映病灶体素单位内灰度值的分布和变化趋势,并能够进一步进行量化分析[9]。目前有研究者探讨使用CT熵特征预测孤立性肺结节的良恶性和评估食管癌的淋巴结转移等[10-11]。
本研究回顾性分析了经手术和组织病理学检查结果证实的TET患者,基于术前胸部增强CT图像,使用计算机算法提取、筛选熵特征,结合临床特征构建组合模型,探讨熵特征联合传统影像征象在TET危险程度预测中的应用价值,为临床精准诊疗提供帮助。
-
回顾性分析2008年10月至2021年5月在江门市中心医院和中山大学附属第五医院经手术和组织病理学检查结果证实的178例TET患者的临床资料[男性83例、女性95例;年龄(52.7±12.4)岁,范围26~83岁]。纳入标准:(1)经手术完整切除并被组织病理学检查结果证实为TET;(2)术前2周内接受胸部CT平扫和双期增强扫描;(3)CT图像可以通过影像储存且可通过传输系统(PACS)获取原始DICOM图像;(4)CT图像层厚≤3.0 mm。排除标准:(1)经CT引导下穿刺活检确诊的患者;(2)CT图像质量达不到诊断要求;(3)术前接受新辅助放化疗等治疗;(4)有既往恶性肿瘤病史。本研究通过了江门市中心医院医学伦理委员会批准[批准号:2021(59)],患者均签署了知情同意书。
按照纳入患者的诊疗时间顺序,以6∶4的比例,将所有患者分为3个独立数据集:训练集86例[男性46例、女性40例;年龄(52.0±12.0)岁,范围27~81岁],2008年10月至2017年6月于江门市中心医院收集;内部验证集51例[男性22例、女性29例;年龄(55.6±11.3)岁,范围26~77岁],2017年7月至2019年10月于江门市中心医院收集;外部验证集41例[男性15例、女性26例;年龄(50.8±13.7)岁,范围28~83岁],2014年5月至2021年5月于中山大学附属第五医院收集。其中,内部验证集和外部验证集合称为全部验证集,共92例[男性37例、女性55例;年龄(53.5±12.7)岁,范围26~83岁]。
-
使用日本东芝公司的 Aquilion One 64排CT和德国西门子公司的双源Force CT进行胸部CT平扫和增强扫描。采集参数:管电压120 kV、管电流采用自动毫安秒技术、螺距0.875~1.500、准直 0.625~2.500 mm、旋转时间0.5~1.0 s、视野350 mm×350 mm、矩阵512×512。嘱患者仰卧位,双臂上举,扫描前进行深吸气屏气呼吸训练,胸部CT扫描范围为胸廓入口处至双侧肺底水平。CT增强扫描使用高压注射器静脉团注非离子型碘对比剂(碘海醇注射液,美国GE公司),浓度350 mgI/ml,总量60~80 ml,速度2.5~3.5 ml/s,分别获取动脉期 (30~35 s)、静脉期 (60~70 s)图像。多平面重组图像包括:纵隔窗横断位,层厚2.5~3.0 mm;冠状位和矢状位,层厚3.0 mm。
-
在未知晓临床病史和病理诊断结果的前提下,由2名胸部放射学专业的高年资医师(15年和25年)共同阅读CT图像,意见不统一时协商达成一致。分别使用纵隔窗(窗位30 HU、窗宽350 HU)和肺窗(窗位−600 HU、窗宽1500 HU)进行观察。
阅读和记录TET病灶的CT征象,包括以下几个方面。(1)位置:左侧、右侧和中间;(2)径线:测量方法为选取静脉期横断位最大层面,测量长径和垂直短径,取二者平均值;(3)边缘光整:是、否;(4)形态:圆形或卵圆形定义为形态规则;(5)周围侵犯:病灶邻近纵隔脂肪或肺实质模糊,病灶邻近胸膜增厚,纵隔或肺门血管腔内出现充盈缺损等表现;(6)钙化:有、无;(7)增强均匀程度和强化程度:选择病灶实质区域,避开钙化区、坏死区或囊变区,与CT平扫相比,静脉期病灶实质成分最大强化CT值增加<20 HU为轻度,20~40 HU为中度,>40 HU为重度[12-13]。
-
手术切除标本经过甲醛固定、石蜡包埋、常规制片和苏木精-伊红染色,由1名胸部病理学专业的高年资医师(20年)参考2021年《WHO胸部肿瘤分类(第5版)》[2]进行组织病理学诊断。依据肿瘤上皮细胞形态及淋巴细胞与上皮细胞比例,将所有TET患者分为低危组(A、AB、B1型)和高危组(B2、B3型)。
-
基于MATLAB R2016工作平台(美国MathWorks公司)的开发软件获取病灶ROI,包括以下步骤:(1)选择胸部增强CT静脉期的横断位图像,标记病灶的起始层和终止层,计算机自动获取病灶全部连续层面的二维CT图像;(2)由放射科医师在横断位二维CT图像上,逐层勾画病灶边界,得到全部二维ROI;(3)使用插值算法,将病灶全部二维ROI重建为三维容积感兴趣区(volume of interest, VOI)。
为了提高特征的稳定性,需对VOI进行预处理,降低图像采集过程中的干扰因素。(1)采用小波算法对图像进行去噪处理,去噪参数分别设置为1/2、2/3、1.0、3/2和2.0;(2)采用各向同性重采样技术,降低熵特征在肿瘤三维方向上的依赖,重采样参数分别为pixelW、0.8、1.0、1.2、1.5和2.0;(3)分别采用Equal和Lloyd量化算法将肿瘤区域的强度范围量化为更小的灰度范围,灰度级参数分别为8、16、32和64。
基于MATLAB R2016工作平台开发熵特征提取算法。使用MATLAB软件对病灶VOI自动计算一阶熵特征和二阶熵特征。熵特征类型分别包括灰度共生矩阵(gray level co-occurence matrix,GLCM)、灰度区域大小矩阵(gray level size zone matrix,GLSZM)和邻域灰度差分矩阵(neighbouring gray tone difference matrix,NGTDM)。具体由整体熵Global-entropy、联合熵GLCM-Joint_entropy、和熵GLCM-Sum_entropy、差熵GLCM-Diff_entropy、运行熵GLRLM-Run_entropy、区域熵GLSZM-Zoon_entropy和复杂度熵NGTDM-Complexity_entropy构成。
一阶熵特征的计算公式如下:
$ {\rm{entropy}}=- \sum\limits_{i=0}^{K - 1} {p_i\log (p_i)} $ 其中,entropy表示熵特征;K表示VOI内体素密度i的数量;
$p_i$ 表示VOI内体素密度i的概率,其计算方法是通过体素密度i的个数除以VOI内体素值的总数。二阶熵特征的计算公式如下:
$ {\rm{entropy}}=- \sum\limits_{i=0}^{K - 1} {\sum\limits_{j=0}^{K - 1} {p(i,j)} \log (p(i,j))} $ 其中,entropy表示熵特征;K表示VOI内体素密度i的数量;
$ p(i,j) $ 表示第i行第j列中GLCM元素的概率。 -
应用SPSS 20.0软件和RStudio软件进行统计学分析。符合正态分布的计量资料以
$ \bar x\pm s $ 表示,2组间比较采用独立样本 t 检验(方差齐);不符合正态分布的计量资料以M(Q1,Q3)表示,2组间比较采用Mann-Whitney U检验。计数资料以例数表示,2组间比较采用χ2检验。采用Mann-Whitney U检验对计算机提取的熵特征进行统计分析,筛选出差异有统计学意义的特征。在MATLAB R2016工作平台上,采用极限学习机(ELM)分类算法计算熵特征权重和熵标签值,即随机给定输入层的权重和隐藏层的偏置,通过优化最小二乘法,计算输出层的熵特征权重;基于筛选出的核心熵特征构建熵标签值作为预测结果。采用多因素Logistic回归分析,分别从临床、CT和熵特征中筛选独立预测因素,分别构建临床模型、熵模型和组合模型。绘制3个预测模型的ROC曲线,并计算灵敏度、特异度、准确率和AUC。在训练集、内部验证集、外部验证集和全部验证集上分别进行测试,对比临床模型、熵模型和组合模型的诊断效能。采用Delong检验和综合判别改善指数(integrated discrimination improvement,IDI)对预测模型的诊断效能进行对比分析。P<0.05为差异有统计学意义。 -
178例TET患者中,低危组83例(A型19例、AB型44例、B1型20例),其中男性38例、女性45例,年龄(52.8±12.4)岁,范围26~83岁;高危组95例(B2型70例、B3型25例),其中男性45例,女性50例,年龄(52.0±12.0)岁,范围27~80岁。训练集中低危组和高危组TET患者在性别和年龄分布上的差异均无统计学意义(χ2=3.629,P=0.140;t=1.404,P=0.164),见表1。
临床和CT特征 训练集(n=86) 检验值 P值 内部验证集(n=51) 检验值 P值 低危组(n=40) 高危组(n=46) 低危组(n=23) 高危组(n=28) 性别(例) χ2=3.629 0.057 χ2=3.060 0.080 男 17 29 13 9 女 23 17 10 19 年龄( ,岁)$\bar x \pm s $ 54.0±12.0 50.1±11.9 t=1.404 0.164 55.6±11.4 55.7±11.7 t=−0.121 0.904 位置(例) χ2=0.686 0.710 χ2=0.699 0.705 左 13 15 6 9 中 16 15 10 9 右 11 16 7 10 径线[M(Q1,Q3)或 ,cm]$\bar x \pm s $ 4.31(2.94, 6.34) 3.39(2.68, 5.47) Z=−1.191 0.234 4.74±1.69 4.29±2.29 t=0.490 0.626 边缘(例) χ2=0 0.991 χ2=0.158 0.691 光整 27 31 16 18 不光整 13 15 7 10 形态(例) χ2=1.795 0.180 χ2=0.345 0.557 圆形 29 27 15 16 不规则 11 19 8 12 周围侵犯(例) χ2=5.108 0.024 χ2=2.713 0.100 无 36 31 19 16 有 4 15 4 12 钙化(例) χ2=0.036 0.850 χ2=0.774 0.379 无 26 29 19 19 有 14 17 4 9 增强均匀度(例) χ2=0.156 0.693 χ2=0.366 0.545 均匀 14 18 4 8 不均匀 26 28 19 20 强化程度(例) χ2=5.757 0.056 χ2=6.237 0.033 轻度 9 19 7 6 中度 17 20 2 11 重度 14 7 14 11 熵标签值( )$\bar x \pm s $ 0.519±0.21 0.997±0.23 t=−9.747 <0.001 0.644±0.17 0.944±0.24 t=−4.867 <0.001 临床和CT特征 外部验证集(n=41) 检验值 P值 全部验证集(n=92) 检验值 P值 低危组(n=20) 高危组(n=21) 低危组(n=43) 高危组(n=49) 性别(例) χ2=0.196 0.658 χ2=2.495 0.114 男 8 7 21 16 女 12 14 22 33 年龄( ,岁)$\bar x \pm s $ 50.7±15.7 50.9±12.7 t=−0.273 0.786 53.3±13.6 3.6±12.1 t=−0.284 0.777 位置(例) χ2=1.482 0.477 χ2=1.355 0.508 左 8 6 14 15 中 7 6 17 15 右 5 9 12 19 径线( ,cm)$\bar x \pm s $ 4.34±1.56 3.42±1.56 t=1.571 0.123 4.55±1.66 3.91±2.07 t=1.287 0.201 边缘(例) χ2=0.266 0.606 χ2=0.385 0.535 光整 13 12 29 30 不光整 7 9 14 19 形态(例) χ2=0.223 0.636 χ2=0.511 0.475 圆形 11 10 26 26 不规则 9 11 17 23 周围侵犯(例) χ2=0.373 0.541 χ2=4.494 0.034 无 16 14 35 30 有 4 7 8 19 钙化(例) χ2=1.223 0.269 χ2=3.608 0.058 无 18 15 37 34 有 2 6 6 15 增强均匀度(例) χ2=0.016 0.901 χ2=0.244 0.622 均匀 8 8 12 16 不均匀 12 13 31 33 强化程度(例) χ2=0.759 0.686 χ2=0.967 0.616 轻度 4 5 11 11 中度 13 11 15 22 重度 3 5 17 16 熵标签值( )$\bar x \pm s $ 0.624±0.10 0.749±0.11 t=−3.657 0.001 0.635±0.14 0.861±0.22 t=−5.658 <0.001 注:CT为计算机体层摄影术 表 1 178例胸腺上皮性肿瘤患者在训练集和验证集中的临床和CT特征对比
Table 1. Comparison of clinical and CT manifestations of 178 patients with thymic epithelial tumor in training and validation cohorts
全部TET的径线为(4.36±2.07) cm,范围0.95~11.50 cm。训练集中低危组和高危组径线分别为4.31(2.94,6.34) cm和3.39(2.68,5.47) cm,2组间的差异无统计学意义(Z=−1.191,P=0.234)。训练集中低危组和高危组TET在位置、边缘、形态、钙化、增强均匀程度和强化程度上的差异均无统计学意义(χ2=0.036~5.757,均P>0.05)。训练集中高危组TET较多出现周围侵犯(32.6%,15/46),明显高于低危组(10%,4/40),且差异有统计学意义(χ2=5.108,P=0.024),见表1。以周围侵犯为独立预测因素建立临床模型,其诊断效能见表2。
数据集 模型 AUC (95%CI) 灵敏度 特异度 准确率 阳性预测值 阴性预测值 训练集
(n=86)临床模型 0.577
(0.466~0.683)0.304
(14/46)0.850
(34/40)0.558
(48/86)0.700
(14/20)0.515
(34/66)熵模型 0.929
(0.876~0.983)0.761
(35/46)0.975
(39/40)0.861
(74/86)0.972
(35/36)0.780
(39/50)组合模型 0.941
(0.894~0.987)0.826
(38/46)0.975
(39/40)0.895
(77/86)0.974
(38/39)0.830
(39/47)内部
验证集
(n=51)临床模型 0.609
(0.463~0.743)0.393
(11/28)0.826
(19/23)0.588
(30/51)0.733
(11/15)0.528
(19/36)熵模型 0.832
(0.723~0.941)0.821
(23/28)0.793
(17/23)0.784
(40/51)0.793
(23/29)0.773
(17/22)组合模型 0.871
(0.775~0.968)0.714
(20/28)0.913
(21/23)0.804
(41/51)0.909
(20/22)0.724
(21/29)外部
验证集
(n=41)临床模型 0.567
(0.403~0.720)0.333
(7/21)0.800
(16/20)0.561
(23/41)0.636
(7/11)0.533
(16/30)熵模型 0.802
(0.666~0.939)0.905
(19/21)0.650
(13/20)0.781
(32/41)0.731
(19/26)0.867
(13/15)组合模型 0.819
(0.689~0.949)0.619
(13/21)0.900
(18/20)0.756
(31/41)0.867
(13/15)0.692
(18/26)全部
验证集
(n=92)临床模型 0.591
(0.483~0.692)0.367
(18/49)0.814
(35/43)0.576
(53/92)0.692
(18/26)0.530
(35/66)熵模型 0.803
(0.715~0.890)0.898
(44/49)0.558
(24/43)0.739
(68/92)0.698
(44/63)0.828
(24/29)组合模型 0.840
(0.761~0.919)0.816
(40/49)0.721
(31/43)0.772
(71/92)0.769
(40/52)0.775
(31/40)注:AUC为曲线下面积;CI为置信区间 表 2 临床模型、熵模型和组合模型在胸腺上皮性肿瘤危险程度预测中的诊断效能
Table 2. Diagnostic efficiency of clinical model, entropy model and combined model in differentiating risk status of thymic epithelial tumor
-
从增强CT静脉期图像中共提取出1680个初始熵特征,其中一阶特征240个、二阶特征1440个。为了降低特征冗余,采用Mann-Whitney U检验进行统计分析,最终得出21个核心熵特征在低危组与高危组TET间的差异有统计学意义,包括10个GLCM熵特征、8个GLSZM熵特征和3个 NGTDM熵特征,见图1。由21个核心熵特征构建并计算熵标签值。训练集中,通过ELM计算得出的低危组熵标签值为(0.519±0.21),明显低于高危组(0.997±0.23),组间差异有统计学意义(t=−9.747,P<0.001),见表1和图2。内部验证集、外部验证集和全部验证集中,熵标签值在低危组和高危组TET患者间的差异均有统计学意义(t=−4.867,P<0.001;t=−3.657,P=0.001;t=−5.658,P<0.001),见表1。
-
多因素Logistic回归分析结果显示,周围侵犯(OR=6.343;95%CI:1.009~36.604;P=0.039)和熵标签值(OR=20.145;95%CI:5.887~68.936;P<0.001)是低危组和高危组TET之间的独立预测因素,共同构建组合模型。
-
熵模型和组合模型在训练集的AUC分别为0.929(95%CI:0.876~0.983)和0.941(95%CI:0.894~0.987);在内部验证集的AUC分别为0.832(95%CI:0.723~0.941)和0.871(95%CI:0.775~0.968);在外部验证集的AUC分别为0.802(95%CI:0.666~0.939)和0.819(95%CI:0.689~0.949);在全部验证集的AUC分别为0.803(95%CI:0.715~0.890)和0.840(95%CI:0.761~0.919),见表2和图3。
图 3 临床模型、熵模型和组合模型预测胸腺上皮性肿瘤危险程度的受试者工作特征曲线
Figure 3. Receiver operating characteristic curves of clinical model, entropy model and combined model in distinguishing risk status of thymic epithelial tumors
使用Delong检验和IDI进一步对比,结果显示组合模型优于临床模型,Delong检验和IDI结果分别为训练集:P<0.001,IDI=0.539(P<0.001);内部验证集:P=0.002,IDI=0.240(P<0.001);外部验证集:P<0.001,IDI=0.291(P<0.001);全部验证集:P<0.001,IDI=0.291(P<0.001)。IDI结果显示,与临床模型和熵模型相比,组合模型具有更高的诊断效能。
-
本研究探讨了基于胸部增强CT图像的熵特征与TET危险程度之间的相关性。我们筛选出21个熵特征用来鉴别低危组和高危组TET,进一步融合临床特征和熵标签值构建组合模型,可以准确预测TET的危险程度,对于治疗方案的制定具有重要临床意义。
既往研究结果显示,CT表现可以预测TET的组织病理学亚型和预后生存情况[13]。Han等[14]的研究结果显示,轮廓光滑、包膜完整、强化均匀的病灶倾向于归入低危组。而高危组病灶通常生长活跃、血供丰富,易发生缺血坏死,增强后大部分表现为重度、不均匀的强化[12]。有研究报道,纵隔脂肪和大血管侵犯可用于区分低危组和高危组TET,高危组经常出现肿瘤-纵隔脂肪交界面模糊,血管分界不清等表现[15]。本研究CT征象分析结果显示,高危组TET病灶发生周围侵犯的比例(35.8%, 34/95)明显高于低危组(14.5%,12/83),并且是TET危险程度的独立预测因素。然而,CT征象在不同危险程度的TET病灶之间存在重叠,同时不同年资放射科医师的视觉评估结果存在差别,可能会导致临床误判和不适当的诊疗行为[16]。
计算机熵特征可以定量描述CT图像中体素密度的变化,反映肿瘤内部成分的异质性。当病灶内部体素密度值基本相同或者接近时,熵标签值趋近于0;当体素密度值分布变得不规则时,熵标签值增大。有研究者使用熵特征鉴别肺癌的分化程度,结果表明浸润性腺癌的熵标签值明显高于浸润前病变[17]。本研究中,高危组熵标签值明显高于低危组(P<0.001),可能与胸腺上皮来源肿瘤的组织病理学异质性有关[18-19]。(1)高危组肿瘤细胞数量多,排列紧密,细胞核大深染,形态不规则,对应CT图像体素密度分布不均匀,熵标签值明显增大;(2)高危组内部含有更为复杂的微观结构和多种组织成分,合并坏死、出血和炎症反应细胞等,亦会引起CT图像体素密度混杂且排列不对称,熵标签值亦随之增大。另外,核心熵特征均属于二阶熵特征,用于衡量相邻体素在不同方向上的强度变化,既反映了体素的信号强度分布,又涵盖了空间位置信息,在鉴别分化程度相似的组织上更为准确和全面。
Iannarelli等[20]报道了熵特征与TET病理分级的相关性,发现熵特征对胸腺瘤WHO病理分级和分期有较好的预测价值,但该研究的样本量较少(n=16),且没有建立预测模型。既往研究结果显示,基于二维CT图像的计算机特征分析方法不能全面体现肿瘤的复杂程度[21]。本研究中,我们使用全瘤体积重建算法,覆盖病灶全部体素,可以更完整地反映TET内部的异质性。本研究中,我们联合临床特征和熵标签值构建组合模型,结果显示其诊断效能高于单独的熵模型和临床模型,Delong检验和IDI结果显示,组合模型在内部验证集和外部验证集中均稳定地提高了诊断效能。
本研究尚存在一定的局限性。首先,本研究为回顾性分析,难免出现选择性偏倚,需要增加样本量和多中心单位来进一步验证研究结果。其次,本研究中病灶分割为手动勾画完成,花费较多时间和精力,需要更加先进的图像分割技术,完成计算机图像预处理的过程。
综上,基于胸部增强CT图像提取的熵特征可以无创、定量、客观、稳定地反映TET的病理生物学行为。融合临床特征和熵标签值的组合模型,可以准确地预测TET的危险程度,为患者的个性化治疗提供科学依据。
利益冲突 所有作者声明无利益冲突
作者贡献声明 苏秀芳负责研究过程的实施、论文的撰写;徐坤财负责影像图像的计算机分析;段晓蓓负责内部训练集和验证集数据的收集与分析;冯宝负责论文的审阅与修改;陈业航负责预测模型的构建;李坤炜负责外部验证集数据的收集与分析;李荣岗负责病理图像的阅读与分析;陈相猛负责论文命题的提出与设计
增强CT熵特征联合传统影像征象对胸腺上皮性肿瘤危险程度的鉴别诊断
Enhanced CT-based entropy combined features with traditional imaging features for the differential diagnosis of risk status in thymic epithelial tumors
-
摘要:
目的 探讨增强CT熵特征联合传统影像征象的组合模型鉴别诊断胸腺上皮性肿瘤(TET)危险程度的临床价值。 方法 回顾性分析2008年10月至2021年5月在江门市中心医院和中山大学附属第五医院经手术和组织病理学检查结果证实的178例TET患者的临床资料[男性83例、女性95例;年龄(52.7±12.4)岁,范围26~83岁],按照组织病理学亚型分为低危组(A、AB和B1型)和高危组(B2和B3型)。将全部患者进一步分为训练集(n=86)、内部验证集(n=51)、外部验证集(n=41),其中内部验证集和外部验证集合称为全部验证集(n=92),训练集和验证集分别用于预测模型的过程构建和效能评价。记录TET患者的临床特征,分析病灶的传统CT征象。应用MATLAB R2016平台的开发软件,在增强CT静脉期图像上定量提取、筛选熵特征。通过Mann-Whitney U检验筛选有鉴别价值的熵特征,采用极限学习机(ELM)分类算法计算熵特征权重和熵标签值。采用多因素Logistic回归分析分别构建临床模型、熵模型和组合模型,并采用受试者工作特征曲线对比3个预测模型的诊断效能。 结果 178例TET患者中,低危组83例[男性38例、女性45例;年龄(52.8±12.4)岁,范围26~83岁];高危组95例[男性45例、女性50例;年龄(52.0±12.0)岁,范围27~80岁]。单因素分析结果显示,训练集CT征象中周围侵犯在2组间的差异有统计学意义(χ2=5.108,P=0.024)。共提取初始熵特征1680个,最终筛选到21个核心熵特征,通过ELM计算得出训练集中低危组熵标签值为0.519±0.21,明显低于高危组(0.997±0.23),2组间差异有统计学意义(t=−9.747,P<0.001)。熵模型在训练集、内部验证集、外部验证集和全部验证集的曲线下面积(AUC)分别为0.929(95%CI:0.876~0.983)、0.832(95%CI:0.723~0.941)、0.802(95%CI:0.666~0.939)、0.803(95%CI:0.715~0.890)。多因素Logistic回归分析结果显示,周围侵犯(OR=6.343;95%CI:1.009~36.604;P=0.039)和熵标签值(OR=20.145;95%CI:5.887~68.936;P<0.001)是预测TET危险程度的独立危险因素,二者共同构建的组合模型在训练集、内部验证集、外部验证集和全部验证集的AUC分别为0.941(95%CI:0.894~0.987)、0.871(95%CI:0.775~0.968)、0.819(95%CI:0.689~0.949)、0.840(95%CI:0.761~0.919)。 结论 基于胸部增强CT图像的熵特征可以定量评估TET的危险程度;周围侵犯和熵标签值构建的组合模型的诊断效能最高,可以精准指导TET患者的术前治疗策略。 -
关键词:
- 胸腺上皮性肿瘤 /
- 熵 /
- 体层摄影术,X线计算机 /
- 危险程度
Abstract:Objective To investigate the clinical value of a combined model of enhanced CT-based entropy features and traditional imaging features for the differential diagnosis of risk status in patients with thymic epithelial tumor (TET). Methods A retrospective analysis was conducted on the clinical data of 178 TET patients (83 males and 95 females; aged (52.7±12.4) years, ranged from 26 years to 83 years) confirmed by surgical and histopathological results at Jiangmen Central Hospital and the Fifth Affiliated Hospital of Sun Yat-sen University from October 2008 to May 2021 were retrospectively analyzed. They were divided into low-risk (A, AB, and B1 types) and high-risk (B2 and B3 types) groups according to histopathology subtypes. All patients were further divided into a training set (n=86), an internal validation set (n=51), and an external validation set (n=41). The internal and external validation sets were called the total validation set (n=92). The training and validation sets were used for the process construction and performance evaluation of the predictive model, respectively. The clinical characteristics of TET patients were recorded, and the traditional CT features of lesions were analyzed. Entropy features were extracted and selected from enhanced CT venous phase images by using software developed based on MATLAB R2016 platform. Mann-Whitney U test was used to select valuable entropy features. Extreme learning machine classification algorithm was adopted to calculate the different weights of entropy features and entropy signature value. Clinical model, entropy model, and combined model were constructed through Logistic analysis, and receiver operating characteristic curve was used to compare the diagnostic efficacy of the three predictive models. Results A total of 83 cases were included in the low-risk group (38 males and 45 females; aged (52.8±12.4) years, ranged from 26 years to 83 years), whereas 95 cases were in the high-risk group (45 males and 50 females; aged (52.0±12.0) years, ranged from 27 years to 80 years). Univariate analysis showed that the difference in peripheral invasion between the two groups in the training set was statistically significant (χ2=5.108, P=0.024). A total of 1 680 initial entropy features were extracted, and 21 core entropy features were ultimately selected. The entropy signature value of the low-risk group in the training set was 0.519±0.21, which was significantly lower than that of the high-risk group (0.997±0.23). The difference between the two groups was statistically significant (t=−9.747, P<0.001). The area under curve (AUC) of the entropy model in the training set, internal validation set, external validation set, and total validation set were 0.929(95%CI: 0.876–0.983), 0.832(95%CI: 0.723–0.941), 0.802(95%CI: 0.666–0.939), and 0.803(95%CI: 0.715–0.890), respectively. Results of multivariate Logistic regression analysis showed that peripheral invasion (OR=6.343; 95%CI: 1.009−36.604; P=0.039) and entropy signature value (OR=20.145; 95%CI: 5.887−68.936; P<0.001) were independent risk factors for predicting TET risk status. The combined model constructed by the two together had AUCs of 0.941(95%CI: 0.894–0.987), 0.871(95%CI: 0.775–0.968), 0.819(95%CI: 0.689–0.949), and 0.840(95%CI: 0.761–0.919) in the training set, internal validation set, external validation set, and total validation set, respectively. Conclusions The entropy feature based on enhanced chest-CT images can be used to assess the risk status of TET quantitatively. The combined model constructed by peripheral invasion and entropy signature value showed the highest diagnostic efficacy, which can accurately guide the preoperative treatment strategy of TET patients. -
Key words:
- Thymic epithelial tumors /
- Entropy /
- Tomography, X-ray computed /
- Risk status
-
表 1 178例胸腺上皮性肿瘤患者在训练集和验证集中的临床和CT特征对比
Table 1. Comparison of clinical and CT manifestations of 178 patients with thymic epithelial tumor in training and validation cohorts
临床和CT特征 训练集(n=86) 检验值 P值 内部验证集(n=51) 检验值 P值 低危组(n=40) 高危组(n=46) 低危组(n=23) 高危组(n=28) 性别(例) χ2=3.629 0.057 χ2=3.060 0.080 男 17 29 13 9 女 23 17 10 19 年龄( ,岁)$\bar x \pm s $ 54.0±12.0 50.1±11.9 t=1.404 0.164 55.6±11.4 55.7±11.7 t=−0.121 0.904 位置(例) χ2=0.686 0.710 χ2=0.699 0.705 左 13 15 6 9 中 16 15 10 9 右 11 16 7 10 径线[M(Q1,Q3)或 ,cm]$\bar x \pm s $ 4.31(2.94, 6.34) 3.39(2.68, 5.47) Z=−1.191 0.234 4.74±1.69 4.29±2.29 t=0.490 0.626 边缘(例) χ2=0 0.991 χ2=0.158 0.691 光整 27 31 16 18 不光整 13 15 7 10 形态(例) χ2=1.795 0.180 χ2=0.345 0.557 圆形 29 27 15 16 不规则 11 19 8 12 周围侵犯(例) χ2=5.108 0.024 χ2=2.713 0.100 无 36 31 19 16 有 4 15 4 12 钙化(例) χ2=0.036 0.850 χ2=0.774 0.379 无 26 29 19 19 有 14 17 4 9 增强均匀度(例) χ2=0.156 0.693 χ2=0.366 0.545 均匀 14 18 4 8 不均匀 26 28 19 20 强化程度(例) χ2=5.757 0.056 χ2=6.237 0.033 轻度 9 19 7 6 中度 17 20 2 11 重度 14 7 14 11 熵标签值( )$\bar x \pm s $ 0.519±0.21 0.997±0.23 t=−9.747 <0.001 0.644±0.17 0.944±0.24 t=−4.867 <0.001 临床和CT特征 外部验证集(n=41) 检验值 P值 全部验证集(n=92) 检验值 P值 低危组(n=20) 高危组(n=21) 低危组(n=43) 高危组(n=49) 性别(例) χ2=0.196 0.658 χ2=2.495 0.114 男 8 7 21 16 女 12 14 22 33 年龄( ,岁)$\bar x \pm s $ 50.7±15.7 50.9±12.7 t=−0.273 0.786 53.3±13.6 3.6±12.1 t=−0.284 0.777 位置(例) χ2=1.482 0.477 χ2=1.355 0.508 左 8 6 14 15 中 7 6 17 15 右 5 9 12 19 径线( ,cm)$\bar x \pm s $ 4.34±1.56 3.42±1.56 t=1.571 0.123 4.55±1.66 3.91±2.07 t=1.287 0.201 边缘(例) χ2=0.266 0.606 χ2=0.385 0.535 光整 13 12 29 30 不光整 7 9 14 19 形态(例) χ2=0.223 0.636 χ2=0.511 0.475 圆形 11 10 26 26 不规则 9 11 17 23 周围侵犯(例) χ2=0.373 0.541 χ2=4.494 0.034 无 16 14 35 30 有 4 7 8 19 钙化(例) χ2=1.223 0.269 χ2=3.608 0.058 无 18 15 37 34 有 2 6 6 15 增强均匀度(例) χ2=0.016 0.901 χ2=0.244 0.622 均匀 8 8 12 16 不均匀 12 13 31 33 强化程度(例) χ2=0.759 0.686 χ2=0.967 0.616 轻度 4 5 11 11 中度 13 11 15 22 重度 3 5 17 16 熵标签值( )$\bar x \pm s $ 0.624±0.10 0.749±0.11 t=−3.657 0.001 0.635±0.14 0.861±0.22 t=−5.658 <0.001 注:CT为计算机体层摄影术 表 2 临床模型、熵模型和组合模型在胸腺上皮性肿瘤危险程度预测中的诊断效能
Table 2. Diagnostic efficiency of clinical model, entropy model and combined model in differentiating risk status of thymic epithelial tumor
数据集 模型 AUC (95%CI) 灵敏度 特异度 准确率 阳性预测值 阴性预测值 训练集
(n=86)临床模型 0.577
(0.466~0.683)0.304
(14/46)0.850
(34/40)0.558
(48/86)0.700
(14/20)0.515
(34/66)熵模型 0.929
(0.876~0.983)0.761
(35/46)0.975
(39/40)0.861
(74/86)0.972
(35/36)0.780
(39/50)组合模型 0.941
(0.894~0.987)0.826
(38/46)0.975
(39/40)0.895
(77/86)0.974
(38/39)0.830
(39/47)内部
验证集
(n=51)临床模型 0.609
(0.463~0.743)0.393
(11/28)0.826
(19/23)0.588
(30/51)0.733
(11/15)0.528
(19/36)熵模型 0.832
(0.723~0.941)0.821
(23/28)0.793
(17/23)0.784
(40/51)0.793
(23/29)0.773
(17/22)组合模型 0.871
(0.775~0.968)0.714
(20/28)0.913
(21/23)0.804
(41/51)0.909
(20/22)0.724
(21/29)外部
验证集
(n=41)临床模型 0.567
(0.403~0.720)0.333
(7/21)0.800
(16/20)0.561
(23/41)0.636
(7/11)0.533
(16/30)熵模型 0.802
(0.666~0.939)0.905
(19/21)0.650
(13/20)0.781
(32/41)0.731
(19/26)0.867
(13/15)组合模型 0.819
(0.689~0.949)0.619
(13/21)0.900
(18/20)0.756
(31/41)0.867
(13/15)0.692
(18/26)全部
验证集
(n=92)临床模型 0.591
(0.483~0.692)0.367
(18/49)0.814
(35/43)0.576
(53/92)0.692
(18/26)0.530
(35/66)熵模型 0.803
(0.715~0.890)0.898
(44/49)0.558
(24/43)0.739
(68/92)0.698
(44/63)0.828
(24/29)组合模型 0.840
(0.761~0.919)0.816
(40/49)0.721
(31/43)0.772
(71/92)0.769
(40/52)0.775
(31/40)注:AUC为曲线下面积;CI为置信区间 -
[1] Marom EM. Advances in thymoma imaging[J]. J Thorac Imaging, 2013, 28(2): 69−80. DOI: 10.1097/RTI.0b013e31828609a0. [2] WHO Classification of Tomours Editorial Board. WHO classification of tumours. Thoracic tumours[M]. 5th ed. Lyon: IARC Press, 2021. [3] Fujii Y. Published guidelines for management of thymoma[J]. Thorac Surg Clin, 2011, 21(1): 125−129. DOI: 10.1016/j.thorsurg.2010.08.002. [4] Yu C, Li T, Zhang R, et al. Dual-energy CT perfusion imaging for differentiating WHO subtypes of thymic epithelial tumors[J/OL]. Sci Rep, 2020, 10(1): 5511[2022-11-15]. https://www.nature.com/articles/s41598-020-62466-1. DOI: 10.1038/s41598-020-62466-1. [5] 陈涛, 樊建中, 李文菲, 等. 18F-FDG PET/CT与增强CT在成人原发前纵隔恶性肿瘤中 的诊断价值[J]. 国际放射医学核医学杂志, 2020, 44(9): 548−553. DOI: 10.3760/cma.j.cn121381-201906009-00072.
Chen T, Fan JZ, Li WF, et al. Diagnostic value of 18F-FDG PET/CT and enhanced CT for adult patients with primary malignant tumors of the anterior mediastinum[J]. Int J Radiat Med Nucl Med, 2020, 44(9): 548−553. DOI: 10.3760/cma.j.cn121381-201906009-00072.[6] Gentili F, Monteleone I, Mazzei FG, et al. Advancement in diagnostic imaging of thymic tumors[J/OL]. Cancers (Basel), 2021, 13(14): 3599[2022-11-15]. https://www.mdpi.com/2072-6694/13/14/3599. DOI: 10.3390/cancers13143599. [7] Jiang H, Li A, Ji ZY, et al. Role of radiomics-based baseline PET/CT imaging in lymphoma: diagnosis, prognosis, and response assessment[J]. Mol Imaging Biol, 2022, 24(4): 537−549. DOI: 10.1007/s11307-022-01703-7. [8] Savadjiev P, Chong J, Dohan A, et al. Image-based biomarkers for solid tumor quantification[J]. Eur Radiol, 2019, 29(10): 5431−5440. DOI: 10.1007/s00330-019-06169-w. [9] Lubner MG, Smith AD, Sandrasegaran K, et al. CT texture analysis: definitions, applications, biologic correlates, and challenges[J]. Radiographics, 2017, 37(5): 1483−1503. DOI: 10.1148/rg.2017170056. [10] Dennie C, Thornhill R, Sethi-Virmani V, et al. Role of quantitative computed tomography texture analysis in the differentiation of primary lung cancer and granulomatous nodules[J]. Quant Imaging Med Surg, 2016, 6(1): 6−15. DOI: 10.3978/j.issn.2223-4292.2016.02.01. [11] Lee HN, Kim JI, Shin SY, et al. Combined CT texture analysis and nodal axial ratio for detection of nodal metastasis in esophageal cancer[J]. Br J Radiol, 2020, 93(1111): 20190827. DOI: 10.1259/bjr.20190827. [12] Yakushiji S, Tateishi U, Nagai S, et al. Computed tomographic findings and prognosis in thymic epithelial tumor patients[J]. J Comput Assist Tomogr, 2008, 32(5): 799−805. DOI: 10.1097/RCT.0b013e31815896df. [13] Padda SK, Terrone D, Tian L, et al. Computed tomography features associated with the eighth edition TNM stage classification for thymic epithelial tumors[J]. J Thorac Imaging, 2018, 33(3): 176−183. DOI: 10.1097/RTI.0000000000000310. [14] Han XW, Gao WW, Chen Y, et al. Relationship between computed tomography imaging features and clinical characteristics, Masaoka-Koga stages, and World Health Organization histological classifications of thymoma[J/OL]. Front Oncol, 2019, 9: 1041[2022-11-15]. https://www.frontiersin.org/journals/oncology/articles/10.3389/fonc.2019.01041/full. DOI: 10.3389/fonc.2019.01041. [15] 姜丽姣, 陈春雨, 关湘萍, 等. 18F-FDG PET/CT在鉴别胸腺上皮肿瘤组织学分型中的应用[J]. 中华临床医师杂志(电子版), 2019, 13(4): 259−265. DOI: 10.3877/cma.j.issn.1674-0785.2019.04.004.
Jiang LJ, Chen CY, Guan XP, et al. Value of 18F-FDG PET/CT in WHO classification of thymic epithelial neoplasms[J]. Chin J Clin (Electron Ed), 2019, 13(4): 259−265. DOI: 10.3877/cma.j.issn.1674-0785.2019.04.004.[16] Ackman JB, Verzosa S, Kovach AE, et al. High rate of unnecessary thymectomy and its cause. Can computed tomography distinguish thymoma, lymphoma, thymic hyperplasia, and thymic cysts?[J]. Eur J Radiol, 2015, 84(3): 524−533. DOI: 10.1016/j.ejrad.2014.11.042. [17] Chae HD, Park CM, Park SJ, et al. Computerized texture analysis of persistent part-solid ground-glass nodules: differentiation of preinvasive lesions from invasive pulmonary adenocarcinomas[J]. Radiology, 2014, 273(1): 285−293. DOI: 10.1148/radiol.14132187. [18] 周倩茹, 丁重阳. 胸腺上皮性肿瘤18F-FDG PET/CT显像最大标准化摄取值与WHO病理分型及Masaoka分期的关系[J]. 国际放射医学核医学杂志, 2020, 44(8): 475−479. DOI: 10.3760/cma.j.cn121381-201906023-00059.
Zhou QR, Ding CY. Relationship between the maximum standardized uptake value of 18F-FDG PET/CT and WHO pathological classification and Masaoka stage of thymic epithelial tumors[J]. Int J Radiat Med Nucl Med, 2020, 44(8): 475−479. DOI: 10.3760/cma.j.cn121381-201906023-00059.[19] Chang SY, Hur J, Im DJ, et al. Volume-based quantification using dual-energy computed tomography in the differentiation of thymic epithelial tumours: an initial experience[J]. Eur Radiol, 2017, 27(5): 1992−2001. DOI: 10.1007/s00330-016-4542-9. [20] Iannarelli A, Sacconi B, Tomei F, et al. Analysis of CT features and quantitative texture analysis in patients with thymic tumors: correlation with grading and staging[J]. Radiol Med, 2018, 123(5): 345−350. DOI: 10.1007/s11547-017-0845-4. [21] Ng F, Kozarski R, Ganeshan B, et al. Assessment of tumor heterogeneity by CT texture analysis: can the largest cross-sectional area be used as an alternative to whole tumor analysis?[J]. Eur J Radiol, 2013, 82(2): 342−348. DOI: 10.1016/j.ejrad.2012.10.023. -