Abstract
为探讨计划验证设备用于容积旋转调强放疗(VMAT)计划验证的γ通过率限值及其对多叶准直器(MLC)开合误差的敏感性,本研究选取50例含顺时针和逆时针两个全弧的鼻咽癌VMAT计划,对其中10例引入8种大小的MLC开合误差,生成80例含误差的计划。首先,对单野和合成野使用计划验证设备进行验证并执行剂量差异3%、距离差异2 mm、10%剂量阈值、绝对剂量全局归一条件下的γ分析,再使用梯度分析研究合成野和单野对MLC开合误差的敏感性,并使用受试者工作特征曲线(ROC)研究识别误差的最佳通过率阈值。然后,对另外40例应用统计过程控制(SPC)方法计算γ通过率的容差限值和干预限值,将SPC容差限值、通用容差限值(95%)对误差的识别能力与ROC最佳阈值对误差的识别能力进行比较。研究结果显示,对于合成野、顺时针弧及逆时针弧,γ通过率随每毫米MLC打开误差下降的梯度分别为10.61%、7.62%及6.66%,随每毫米MLC闭合误差下降的梯度分别为9.75%、7.36%及6.37%。ROC方法得到的最佳阈值分别为99.35%、97.95%及98.25%;SPC方法得到的容差限值分别为98.98%、97.74%及98.62%。SPC容差限值与ROC最佳阈值较为接近,两者均能识别全部±2 mm的错误,而通用容差限值只能部分识别,说明通用容差限值对部分较大的误差并不敏感。因此综合考虑易用性、精确性等因素,在临床实践中建议可使用实际射野角度合成测量的方法,并根据SPC方法制定与机构自身流程相适宜的通过率限值。综上,期待本文研究结果可为各机构优化放疗计划验证流程、设置合适的通过率限值、促进放疗计划验证规范化提供一定的参考。
Keywords: 容积旋转调强放疗, 计划验证, 统计过程控制, 受试者工作特征曲线, γ通过率限值, 多叶准直器误差
Abstract
To investigate the γ pass rate limit of plan verification equipment for volumetric modulated arc therapy (VMAT) plan verification and its sensitivity on the opening and closing errors of multi-leaf collimator (MLC), 50 cases of nasopharyngeal carcinoma VMAT plan with clockwise and counterclockwise full arcs were randomly selected. Eight kinds of MLC opening and closing errors were introduced in 10 cases of them, and 80 plans with errors were generated. Firstly, the plan verification was conducted in the form of field-by-field measurement and true composite measurement. The γ analysis with the criteria of 3% dose difference, distance to agreement of 2 mm, 10% dose threshold, and absolute dose global normalized conditions were performed for these fields. Then gradient analysis was used to investigate the sensitivity of field-by-field measurement and true composite measurement on MLC opening and closing errors, and the receiver operating characteristic curve (ROC) was used to investigate the optimal threshold of γ pass rate for identifying errors. Tolerance limits and action limits for γ pass rates were calculated using statistical process control (SPC) method for another 40 cases. The error identification ability using the tolerance limit calculated by SPC method and the universal tolerance limit (95%) were compared with using the optimal threshold of ROC. The results show that for the true composite measurement, the clockwise arc and the counterclockwise arc, the descent gradients of the γ passing rate with per millimeter MLC opening error are 10.61%, 7.62% and 6.66%, respectively, and the descent gradients with per millimeter MLC closing error are 9.75%, 7.36% and 6.37%, respectively. The optimal thresholds obtained by the ROC method are 99.35%, 97.95% and 98.25%, respectively, and the tolerance limits obtained by the SPC method are 98.98%, 97.74% and 98.62%, respectively. The tolerance limit calculated by SPC method is close to the optimal threshold of ROC, both of which could identify all errors of ±2 mm, while the universal tolerance limit can only partially identify them, indicating that the universal tolerance limit is not sensitive on some large errors. Therefore, considering the factors such as ease of use and accuracy, it is suggested to use the true composite measurement in clinical practice, and to formulate tolerance limits and action limits suitable for the actual process of the institution based on the SPC method. In conclusion, it is expected that the results of this study can provide some references for institutions to optimize the radiotherapy plan verification process, set appropriate pass rate limit, and promote the standardization of plan verification.
Keywords: Volumetric modulated arc therapy, Plan verification, Statistical process control, Receiver operating characteristic curve, Limit value of γ pass rate, Errors of multi-leaf collimator
0. 引言
随着放射治疗技术的发展,容积旋转调强放疗(volumetric modulated arc therapy,VMAT)已逐渐成为首选的放疗技术之一。相较于固定野调强放疗,VMAT在提高治疗效率的同时可获得更加适形的靶区剂量分布和更好的正常组织保护,但其涉及的可调制参数更加复杂多样,大机架旋转的同时,多叶准直器(multi-leaf collimator,MLC)位置和运动速度、加速器出束剂量率等多种参数都在不断变化,因此对VMAT计划的质控是其临床使用中的重点和难点之一[1-2]。患者治疗计划的验证是放疗质控中的重要环节,其目的是通过验证设备来比对加速器实际投照剂量分布和计划剂量分布间的一致性,目前常用的比对方法是基于剂量和距离一致性的γ分析法[3]。然而计划验证的测量方式及其γ分析标准在各机构间并未形成统一的规范。对测量方式而言,以往的一些研究表明,逐个射野单独测量可能比各野合成测量更加严格,因为后者可能会掩盖一些错误[4-6];但这些研究大多是指射野角度归零后的验证情况,对实际射野角度合成测量与实际射野角度单独测量间的比对研究较少。γ分析标准方面,美国医学物理师协会(The American Association of Physicists in Medicine,AAPM)第119号工作组报告(task group No.119,TG-119)中采用Palta等[7]提出的方法得到在剂量差异3%、距离差异3 mm条件下合成野的γ通过率限值为88%,单野的限值为93%[8]。Carlone等[9]使用受试者工作特征曲线(receiver operating characteristic curve,ROC)研究了计划验证设备MapCHECK 2(Sun Nuclear Corp.,美国)在不同γ分析参数下验证前列腺调强放疗计划的γ通过率限值。不同研究使用的分析条件、验证设备以及得到的γ通过率限值往往并不相同。为促进计划验证过程的规范化,AAPM第218号工作组报告(task group No.218,TG-218)建议,在测量设备允许的情况下,采用实际射野角度合成测量,并使用容差限值和干预限值对计划验证过程进行控制,推荐采用剂量差异3%、距离差异2 mm、剂量阈值设置为10%、绝对剂量全局归一的γ分析条件,并建议此条件下γ通过率的通用容差限值为95%,干预限值为90%;若通过率高于容差限值则表示计划的实际执行与计划设计之间高度吻合,计划可通过验证;若低于干预限值则表示计划在实际执行过程中可能出现对患者治疗产生负面影响的误差,计划不能通过验证[10];若通过率处于干预限值和容差限值之间,则需经物理师审查后决定计划是否可通过验证。该报告还介绍了基于统计过程控制(statistical process control,SPC)计算各机构个性化γ通过率容差限值和干预限值的方法[10-13]。
针对计划验证设备的研究较多,但这些研究主要集中在设备自身物理特性及其与其他设备间的比较方面[14-17]。虽有相关研究使用SPC方法对计划验证的γ通过率限值进行了报道,但缺乏使用该限值对含误差计划的实际识别能力测试,也缺乏使用不同测量方式、不同通过率限值时的误差识别能力比较[18-20]。本研究对鼻咽癌VMAT计划模拟了具有较大临床影响的MLC开合误差,用以检测不同测量方式对这种较大临床误差的敏感性,并将TG-218号报告推荐的通用容差限值、SPC方法计算所得的容差限值对误差的识别能力与ROC方法所得的最佳阈值对误差的识别能力进行比较,探讨不同测量方式下使用不同通过率限值对该类误差的识别能力,以期加深对此类设备和不同通过率限值的理解和认识,为其临床使用提供参考。
1. 材料与方法
1.1. 计划选取与研究流程
本研究所有原始计划均来自四川省人民医院肿瘤放射治疗中心,研究中的计划用于驱动加速器按计划对验证设备进行照射,全过程不涉及任何人体或动物,不涉及对任何人或动物的数据采集,不会对任何人或动物的权益造成损害。在本机构计划数据库中随机选取50例在放射治疗加速器TrueBeam(Varian Medical Systems,Inc.,美国) 上执行的鼻咽癌VMAT计划,每例计划都由顺时针和逆时针两个全弧组成,并在治疗计划系统Eclipse 13.6(Varian Medical Systems,Inc.,美国)中使用光子优化算法(photon optimizer,PO)进行优化,各向异性分析算法(anisotropic analytical algorithm,AAA)进行剂量计算,计算网格为2.5 mm。
本文方法研究流程如图1所示,首先,通过自编程序对10例VMAT计划进行编辑引入MLC开合误差,产生80例含MLC开合误差的计划。然后使用验证设备对这些计划进行验证及γ分析,通过梯度分析研究了不同测量方式(两野合成野、单野)对误差的敏感性,并基于ROC方法得到识别误差的最佳通过率阈值。其次,对额外40例不含误差的计划进行验证及γ分析,对验证结果使用SPC方法计算了通过率容差限值。最终,在不同测量方式下,将SPC容差限值、TG-218号报告建议的通用容差限值对误差的识别能力与ROC最佳阈值作为限值时对误差的识别能力进行比较。
图 1.

The flow chart of research methods in this study
本文方法研究流程图
1.2. MLC误差模拟
模拟MLC误差的计划由自主编程的图形界面程序生成。该程序通过计算机程序设计语言Python(Python Software Foundation,美国)编程实现,具备对以医学数字成像和通信(digital imaging and communications in medicine,DICOM )格式存储的计划文件进行交互式修改的功能。在该程序中打开一个放疗计划,通过界面设定引入误差的具体参数并应用后,程序将按要求修改所打开计划的每一个控制点上的MLC叶片位置并在界面上可视化显示,确认无误后可将修改后的计划保存为一个新的计划文件,将此文件导回Eclipse 13.6(Varian Medical Systems,Inc.,美国)进行剂量计算后即可得到可执行的含误差计划。如图1所示,将10例VMAT计划的计划文件导入到编写的程序中,对每例计划分别模拟了±0.4 mm、±1.2 mm、±2 mm、±3 mm的MLC开合误差(MLC系统性地向外打开或向内闭合造成开口扩大或缩小的数值,误差对称地平分到两侧叶片,闭合记为负,打开记为正),共获得80例已知MLC开合误差的放疗计划。
1.3. 计划验证
本研究所使用的计划验证设备为ArcCHECK(Sun Nuclear Corp.,美国),该设备是用于VMAT计划验证的常用设备之一[21]。其外观呈圆柱形,由水等效材料制成,在距表面2.9 cm深度、直径和长度均为21 cm的圆柱面上共分布有1 386个半导体探测器。测量前,对50例计划分别计算两个单野(顺时针弧和逆时针弧)及其合成野在该设备中的剂量分布,将计算的分布导入剂量分布比较软件SNC Patient 6.2.3(Sun Nuclear Corp.,美国)中与随后的测量分布进行比较。
验证设备进行剂量和阵列校准后,对50例不含误差的计划及80例引入MLC误差的计划,分别测量每个计划的两个单野用于单野的剂量分布比较,然后将两个单野合成一个分布用于合成野的剂量分布比较。
对所有测量分布及相应不含误差的计算分布,在SNC Patient 6.2.3(Sun Nuclear Corp.,美国)软件中执行剂量差异3%、距离差异2 mm、10%剂量阈值、绝对剂量全局归一条件下的γ分析。使用统计分析软件SPSS 22.0(International Business Machines corp.,美国)对合成野及单野间的γ通过率进行弗里德曼(Friedman)检验,P<0.05代表差异具有统计学意义。
1.4. 对MLC开合误差的敏感性分析
对10例原始计划和相应80例引入MLC误差的计划,使用梯度分析方法研究不同测量方式下γ通过率随MLC开合误差的变化情况。梯度值由γ通过率与MLC误差间的线性拟合的斜率得到,代表每单位误差引起的γ通过率的变化值,值越大则对该类误差越敏感。
1.5. 基于ROC方法的最佳阈值
ROC是临床研究中用于反映某指标判别阴阳性能力的常用研究方法之一。通过对某指标(如γ通过率)的结果设置不同的阈值,从而可得到不同的敏感性(真阳性率)和特异性(真阴性率),再以敏感性为纵坐标,1-特异性(假阳性率)为横坐标绘制成线即可得到ROC曲线,该曲线下面积(area under curve,AUC)越大,则该指标用于区分阴阳性的准确性就越高[9]。本研究以10例原始计划的通过率表征阴性计划,80例引入误差计划的通过率表征阳性计划,在作图软件GraphPad Prism 8.2.1(GraphPad Software,LLC.,美国)中绘制γ通过率指标的ROC曲线,得到AUC值及区分阴阳性计划的最佳阈值。
1.6. 基于SPC方法的限值计算
根据SPC方法计算容差限值和干预限值的过程如式(1)、式(2)所示:
![]() |
1 |
![]() |
2 |
式中,n为所测量的计划总例数,建议一般应至少取20例。xi为第i例计划的γ通过率,
为所有计划γ通过率的平均值,β是度量流程能力和平衡假设检验中两种类型错误的两种因子的组合,是一种可以通过研究加以改进的常数值,推荐取值为6[22]。σ2为方差,T为流程目标值,在γ通过率场景中,T取100%。有研究指出,剔除失控点后再计算限值是比较合理的做法,因此本研究首先使用40例计划的通过率计算限值,若计算过程中遇到失控点则将该点剔除后重新进行计算直至所有点都在限值以内[23]。
1.7. 不同测量方式及通过率限值对误差的识别能力
在不同测量方式下,将TG-218号报告建议的通用容差限值、SPC方法得到的容差限值对MLC开合误差的识别情况与ROC方法得到的最佳阈值对误差的识别情况进行比较。其中,单野使用两野联合判断,即任一射野不通过,则认为该计划不能通过验证。
2. 结果
10例原始计划及相应80例含误差计划在不同测量方式下的γ通过率如表1所示。从通过率数值上看,当MLC开合误差小于±1.2 mm时,合成野与单野的通过率差异不大,顺时针弧略小于合成野及逆时针弧。但当误差大于±1.2 mm时,合成野的通过率开始迅速下降且波动幅度也随之增大。但三者的差异仅在较小误差和极大误差时才具有统计学意义(开合误差为0、–0.4、±3 mm时,P<0.05)。
表 1. The γ pass rate under different measurement methods for plans with different errors.
含不同误差的计划在不同测量方式下的γ通过率
| MLC开合 误差/mm |
γ通过率(%) | P值 | ||
| 两野合成 | 顺时针弧 | 逆时针弧 | ||
| –3.0 | 69.09±11.29 | 75.83±8.10 | 79.41±6.37 | 0.014 |
| –2.0 | 90.42±5.30 | 91.09±4.48 | 93.65±3.03 | 0.150 |
| –1.2 | 97.81±1.14 | 96.60±1.81 | 98.28±1.09 | 0.154 |
| –0.4 | 99.65±0.26 | 98.68±0.71 | 99.51±0.46 | 0.001 |
| 0 | 99.67±0.22 | 98.72±0.85 | 99.42±0.50 | 0.007 |
| 0.4 | 99.41±0.49 | 98.36±1.13 | 99.19±0.59 | 0.085 |
| 1.2 | 96.91±2.34 | 96.00±2.27 | 97.18±1.74 | 0.670 |
| 2.0 | 88.47±6.99 | 89.77±4.70 | 91.95±4.28 | 0.202 |
| 3.0 | 66.67±12.04 | 75.26±8.26 | 78.83±7.35 | 0.006 |
通过率随MLC误差变化的梯度分析如图2所示。随着MLC开合误差的增大,γ通过率的下降梯度也由缓变大,波动也随之增大。总体来看,对于合成野、顺时针弧及逆时针弧,γ通过率随每毫米MLC打开误差下降的梯度分别为10.61%、7.62%及6.66%,随每毫米MLC闭合误差下降的梯度分别为9.75%、7.36%及6.37%。合成野γ通过率的整体下降梯度大于两野单独分析,而顺时针弧又大于逆时针弧。打开误差引起的梯度变化略大于闭合误差。
图 2.

The gradient analysis of γ pass rate with MLC opening and closing errors
γ通过率随MLC开合误差变化的梯度分析
γ通过率指标对MLC开合误差识别能力的ROC曲线分析结果如图3所示。由图3可知,两野合成的AUC值略大于顺时针弧,逆时针弧最小,相应的最佳阈值分别为99.35%、97.95%和98.25%。
图 3.
ROC curve of the identification ability of γ pass rate on MLC opening and closing error
γ通过率指标对MLC开合误差识别能力的ROC曲线分析
40例计划各自剔除1例、5例、6例失控点后合成野、顺时针弧及逆时针弧的γ通过率情况及根据式(1)、式(2)所计算的限值如表2所示。使用SPC方法计算所得限值均高于TG-218号报告所建议的通用限值。两野合成的通过率及相关限值均高于两野单独分析的结果,三者间的差异具有统计学意义(P<0.01)。
表 2. The γ pass rate and the limit value calculated based on SPC method after excluding out-of-control points for 40 plans.
40例计划剔除失控点后的γ通过率及基于SPC方法计算的限值
| 组别 | 均值(%) | 标准差(%) | 容差限值(%) | 干预限值(%) |
| 两野合成 | 99.74 | 0.30 | 98.98 | 98.81 |
| 顺时针弧 | 99.08 | 0.56 | 97.74 | 96.78 |
| 逆时针弧 | 99.45 | 0.39 | 98.62 | 97.99 |
不同测量方式及γ通过率限值对10例原始计划及引入MLC开合误差的计划的识别情况如表3所示。其中,将10例原始计划定义为阴性,理论阴性率(阴性计划占比)为100%,对应80例引入误差的计划定义为阳性,其理论阴性率为0%。不同γ判断标准下的阴性率指使用该标准将计划识别成阴性计划(通过验证)的比例。由表3可知,除ROC最佳阈值和SPC容差限值下的两单野联合判断外,其余方法均能正确判断阴性计划。所有方法均能识别大于±3 mm的误差,ROC方法和SPC方法对±2 mm误差的识别率(1-阴性率)为100%,而通用容差限值只能部分识别。对小于±1.2 mm的误差,所有γ判断标准均不能完全识别,其中合成野的SPC方法对±1.2 mm误差的识别率与ROC方法相同,–1.2 mm时为90%,1.2 mm时为80%,而合成野通用容差限值不能识别–1.2 mm的误差且仅能识别20%的1.2 mm误差。不同测量方式使用ROC方法均能识别部分±0.4 mm的误差,合成野SPC方法不能识别–0.4 mm误差,能识别部分0.4 mm误差,两单野联合对±0.4 mm的误差均能识别部分,而不同测量方式使用通用容差限值均不能识别±0.4 mm的误差。整体来看,两野联合判断对误差的识别能力略高于合成野独立判断,但当使用ROC和SPC方法时,两野联合判断有一定的假阳性率。
表 3. The identification of negative and positive plans by different measurement methods and limit value of γ pass rate.
不同测量方式及γ判断标准对阴阳性计划的识别情况
| MLC开合 误差/mm |
理论阴性 率(%) |
不同测量方式及γ判断标准下的阴性率(%) | |||||
| 合成野SPC容差 限值 ≥ 98.98% |
单野SPC容差限值: 顺时针弧≥ 97.74% 且逆时针弧≥ 98.62% |
合成野通用容 差限值 ≥ 95% |
单野通用容差限值: 顺时针弧及逆时针 弧 ≥ 95% |
合成野ROC最佳 阈值 ≥ 99.35% |
单野ROC最佳阈值: 顺时针弧≥ 97.95% 且逆时针弧≥ 98.25% |
||
| –3.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| –2.0 | 0 | 0 | 0 | 20 | 20 | 0 | 0 |
| –1.2 | 0 | 10 | 20 | 100 | 80 | 10 | 20 |
| –0.4 | 0 | 100 | 80 | 100 | 100 | 90 | 80 |
| 0 | 100 | 100 | 80 | 100 | 100 | 100 | 90 |
| 0.4 | 0 | 80 | 50 | 100 | 100 | 60 | 60 |
| 1.2 | 0 | 20 | 10 | 80 | 60 | 20 | 10 |
| 2.0 | 0 | 0 | 0 | 20 | 0 | 0 | 0 |
| 3.0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
3. 讨论
调强放疗计划验证有多种测量形式,一项针对国内调强放疗计划验证的调查显示,参与调查的机构中使用归零野(机架置于0°)合成测量的占64%,归零野逐个单独测量的占47.1%,按射野实际角度合成测量的占27.3%[24]。本研究对计划验证设备在临床使用中常见的两种测量方式进行了比较。对MLC开合误差的敏感性方面,随着误差的不断增大,梯度分析表明两野合成的通过率下降梯度要大于两野单独测量,而顺时针弧又大于逆时针弧,说明合成野对这类误差更为敏感。但由于本研究设计的误差是MLC的系统性偏差,合成野可能具有更大的误差累积效应,而MLC在实际运动过程中主要是随机误差,误差可能累积,也可能正负抵消,因此针对其他错误类型合成野并非一定更为敏感。SPC方法的计算结果表明,合成野γ通过率的均值、容差限值及干预限值均高于两野单独测量,而波动低于两野单独测量。Alharthi等[6]对肺癌立体定向体部放疗 VMAT计划进行验证得到的结果也显示,各野单独测量的通过率要低于整体合成测量,但两者对错误检测的灵敏级别是类似的,比如都不能检测到+1°和-2°的小机头误差及±1 mm的MLC平移误差。在本研究中,对单野采用了两野联合判断的形式来识别误差,整体来看两野联合判断对误差的识别能力略高于使用合成野独立判断,但当γ判断标准使用ROC和SPC方法得到的阈值时,两野联合判断有一定的假阳性率,误将阴性计划识别为阳性计划。由于按射野实际角度合成测量更加接近治疗时的情况,产生的剂量分布也更接近患者的受照射情况,并且单个计划只需分析一个测量数据,质控效率更高,因此TG-218号报告建议在验证设备允许的情况下可优先采用射野实际角度合成测量的方式,当此方式失败时,单野的测量分析是有价值的[10]。
本研究使用SPC方法计算的容差限值和干预限值均高于TG-218号报告建议的通用限值,说明整个计划验证过程表现良好,流程可控。郭伟等[18]使用SPC方法对调强放疗计划验证γ通过率限值的研究表明,针对不同部位肿瘤、不同加速器、不同验证设备等组合得到的限值有所差异,其中随机选取的20例头颈部调强放疗计划在剂量差异3%、距离差异2 mm条件下合成野的平均γ通过率为(98.07±0.95)%,容差限值为95.14%,干预限值为93.55%。肖青等[19]选取25例受控头颈部VMAT计划用于基于SPC方法的γ通过率限值计算,得到剂量差异3%、距离差异2 mm条件下的平均γ通过率为(97.73±1.02)%,容差限值为94.68%,干预限值为92.54%。而本研究使用SPC方法得到的合成野平均γ通过率为(99.74±0.30)%,容差限值为98.98%,干预限值为98.81%。这些限值均是基于当地的计划验证情况计算所得,不同研究之间结果的差异可能来源于各机构质控流程中不同因素或因素间的组合,例如不同计划系统、不同加速器、不同病种、不同计划类型,甚至不同质控人员都可能带来结果的差异[10]。其中,测量前仪器的校准可能是一个重要的差异来源,本研究中得到的γ通过率较高可能与设备校准后随即进行集中测量有关,有对其他验证设备的研究表明设备校准后得到的通过率要明显高于校准前的通过率,因此SPC方法在临床实际应用中建议,可根据本机构对验证设备的校准频率,尽量多使用几个校准周期的数据以反映本机构的实际情况[25]。此外,SPC方法理论上需要基于正态分布数据进行计算,但γ通过率大多数情况下并非呈正态分布,因此有学者指出可对这些数据做适当的处理后再进行SPC分析[26]。
Tattenberg等[27]使用ROC方法研究了6 MV非均整模式下脑部VMAT计划误差的识别情况,发现在剂量差异2%、距离差异1 mm或2 mm,以及剂量差异4%、距离差异1 mm的γ分析条件下对大于1 mm的MLC随机误差具有良好的识别能力(AUC>0.8),对应的最佳阈值分别为83.6%、97.7%及94.1%。Woon等[28]使用ROC方法得到剂量差异3%、距离差异2 mm的γ分析条件下识别鼻咽癌VMAT计划0.25~1.00 mm的MLC打开误差的AUC值为0.701。Pogson等[29]在三个机构参与的多中心研究中对相同的10例鼻咽癌病例进行VMAT计划设计并引入MLC系统误差,计划验证后通过ROC分析发现尽管使用相同的病例、相同的验证设备、相同的γ分析条件,不同机构得到的AUC值却不尽相同,这可能与不同机构间的治疗计划差异、加速器差异等多种因素有关。本研究使用ROC方法对MLC开合误差进行识别时,不同测量方式的AUC值均大于0.8,且两野合成略大于单野测量。SPC方法得到的容差限值与ROC方法得到的最佳阈值较为接近,当使用不同方法得到的限值进行误差识别时,无论哪种测量方式,ROC最佳阈值及SPC容差限值对误差的判别能力均优于TG-218号报告建议的通用容差限值。当使用两单野进行联合判断时,SPC容差限值与ROC最佳阈值对误差的判别能力相当且都有一定的假阳性率。使用合成野进行判断时,SPC容差限值对±0.4 mm小误差的识别能力差于ROC最佳阈值。SPC与ROC两种方法都能识别全部±2 mm的开合误差,但两者均不能完全地识别所有小于±1.2 mm的误差。而当使用通用容差限值时,部分±2 mm的误差也不能识别。叶淑敏等[30]研究了MLC系统误差对鼻咽癌VMAT计划剂量的影响,结果显示±1 mm的系统误差给靶区一般等效均匀剂量(general equivalent uniform dose,gEUD)带来的改变在4%左右,而对正常组织的改变在5%~7%之间。这表明通用容差限值在某些情况下可能对一些具有较大临床意义的错误并不敏感,给整个质控流程带来风险。本研究在使用ROC方法时,将所有含误差的计划均视作阳性,为尽量识别±0.4 mm 的误差,ROC方法得到的通过率最佳阈值较高,临床使用中也可根据不同误差带来的患者体内剂量分布差异大小来划分阴阳性计划,但这又涉及到剂量分布差异的阈值问题。ROC方法虽然理论上可能得到更优的通过率限值,但其应用的前提是需要事先准备一批已知阴阳性的计划,面对临床中诸多的误差来源,这种方法可能很难实际运用。而SPC方法无需如此苛刻的前提条件且得到的限值是针对每个机构特定的流程而定制的,运用得当可将流程中的综合误差控制在可接受的范围内,因此建议各机构可根据自身情况制定与本部门流程相适宜的限值,不断提高整个流程的受控水平。
综上所述,本研究探究了计划验证设备验证鼻咽癌VMAT计划的γ通过率限值及面对MLC开合误差时的敏感性。研究表明本机构的计划验证流程可控,表现良好。单野联合判断对误差的识别能力略高于合成野独立判断,但当使用ROC和SPC方法时,单野联合判断有一定的假阳性率,结合TG-218号报告的建议,临床使用时可优先选择实际射野角度合成测量,单野测量可用于验证不通过时的进一步分析。通用容差限值可能不能识别某些具有较大临床意义的错误,综合考虑精确性、易用性等因素,SPC方法是一种有助于发现流程中错误,利于质控流程规范化、标准化、提高质控水平的有效方法。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:胡金有负责研究的具体执行及文章撰写,邹炼、吴章文参与研究决策,提供研究方法指导,数据分析指导及论文审阅修订,其他人员参与研究工作。
Funding Statement
国家重点研发计划数字诊疗装备研发项目(2016YFC0105103, 2016YFC0105107)
National Key Research and Development Program of China
References
- 1.Ling C C, Zhang P, Archambault Y, et al Commissioning and quality assurance of rapidarc radiotherapy delivery system. Int J Radiat Oncol Biol Phys. 2008;72(2):575–581. doi: 10.1016/j.ijrobp.2008.05.060. [DOI] [PubMed] [Google Scholar]
- 2.Verbakel W F, Cuijpers J P, Hoffmans D, et al Volumetric intensity-modulated arc therapy vs. conventional IMRT in head-and-neck cancer: a comparative planning and dosimetric study. Int J Radiat Oncol Biol Phys. 2009;74(1):252–259. doi: 10.1016/j.ijrobp.2008.12.033. [DOI] [PubMed] [Google Scholar]
- 3.Low D A, Harms W B, Mutic S, et al A technique for the quantitative evaluation of dose distributions. Medical Physics. 1998;25(5):656–661. doi: 10.1118/1.598248. [DOI] [PubMed] [Google Scholar]
- 4.Podesta M, Nijsten S M, Persoon L C, et al Time dependent pre-treatment EPID dosimetry for standard and FFF VMAT. Phys Med Biol. 2014;59(16):4749–4768. doi: 10.1088/0031-9155/59/16/4749. [DOI] [PubMed] [Google Scholar]
- 5.Carrasco P, Jornet N, Latorre A, et al 3D DVH-based metric analysis versus per-beam planar analysis in IMRT pretreatment verification. Medical Physics. 2012;39(8):5040–5049. doi: 10.1118/1.4736949. [DOI] [PubMed] [Google Scholar]
- 6.Alharthi T, Vial P, Holloway L, et al Intrinsic detector sensitivity analysis as a tool to characterize ArcCHECK and EPID sensitivity to variations in delivery for lung SBRT VMAT plans. J Appl Clin Med Phys. 2021;22(6):229–240. doi: 10.1002/acm2.13221. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 7.Palta J R, Mackie T R, Chen Z Intensity-modulated radiation therapy: the state of the art. Medical Physics. 2003;30(12):3265. doi: 10.1118/1.1628279. [DOI] [Google Scholar]
- 8.Ezzell G A, Burmeister J W, Dogan N, et al IMRT commissioning: multiple institution planning and dosimetry comparisons, a report from AAPM Task Group 119. Medical physics. 2009;36(11):5359–5373. doi: 10.1118/1.3238104. [DOI] [PubMed] [Google Scholar]
- 9.Carlone M, Cruje C, Rangel A, et al ROC analysis in patient specific quality assurance. Medical Physics. 2013;40(4):042103. doi: 10.1118/1.4795757. [DOI] [PubMed] [Google Scholar]
- 10.Miften M, Olch A, Mihailidis D, et al Tolerance limits and methodologies for IMRT measurement-based verification QA: recommendations of AAPM Task Group No. 218. Medical Physics. 2018;45(4):e53–e83. doi: 10.1002/mp.12810. [DOI] [PubMed] [Google Scholar]
- 11.Pawlicki T, Whitaker M, Boyer A L Statistical process control for radiotherapy quality assurance. Medical Physics. 2005;32(9):2777–2786. doi: 10.1118/1.2001209. [DOI] [PubMed] [Google Scholar]
- 12.Breen S L, Moseley D J, Zhang B, et al Statistical process control for IMRT dosimetric verification. Medical Physics. 2008;35(10):4417–4425. doi: 10.1118/1.2975144. [DOI] [PubMed] [Google Scholar]
- 13.Gérard K, Grandhaye J P, Marchesi V, et al A comprehensive analysis of the IMRT dose delivery process using statistical process control (SPC) Medical Physics. 2009;36(4):1275–1285. doi: 10.1118/1.3089793. [DOI] [PubMed] [Google Scholar]
- 14.Thiyagarajan R, Nambiraj A, Sinha S N, et al Analyzing the performance of ArcCHECK diode array detector for VMAT plan. Reports of Practical Oncology and Radiotherapy. 2016;21(1):50–56. doi: 10.1016/j.rpor.2015.10.004. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 15.Aristophanous M, Suh Y, Chi P C, et al Initial clinical experience with ArcCHECK for IMRT/VMAT QA. J Appl Clin Med Phys. 2016;17(5):20–33. doi: 10.1120/jacmp.v17i5.6118. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 16.Chang K H, Kim D W, Choi J H, et al Dosimetric comparison of four commercial patient-specific quality assurance devices for helical tomotherapy. Journal of the Korean Physical Society. 2020;76(3):257–263. doi: 10.3938/jkps.76.257. [DOI] [Google Scholar]
- 17.Liang B, Liu B, Zhou F, et al Comparisons of volumetric modulated arc therapy (VMAT) quality assurance (QA) systems: sensitivity analysis to machine errors. Radiation Oncology. 2016;11(1):146. doi: 10.1186/s13014-016-0725-4. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 18.郭伟, 毛荣虎, 李兵, 等 基于AAPM-TG218报告对调强放疗计划剂量验证容差和干预限值的初步研究. 中华放射肿瘤学杂志. 2021;30(8):817–821. doi: 10.3760/cma.j.cn113030-20200330-00146. [DOI] [Google Scholar]
- 19.肖青, 李光俊, 李治斌, 等 基于AAPM TG-218报告应用统计过程控制技术监测患者个体化容积旋转调强放疗质量保证过程的初步研究. 生物医学工程学杂志. 2020;37(5):842–847. doi: 10.7507/1001-5515.202001016. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 20.Xiao Q, Bai L, Li G, et al A robust approach to establish tolerance limits for the gamma passing rate-based patient-specific quality assurance using the heuristic control charts. Med Phys. 2022;49(2):1312–1330. doi: 10.1002/mp.15346. [DOI] [PubMed] [Google Scholar]
- 21.Chan G H, Chin L C L, Abdellatif A, et al Survey of patient-specific quality assurance practice for IMRT and VMAT. J Appl Clin Med Phys. 2021;22(7):155–164. doi: 10.1002/acm2.13294. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 22.Sanghangthum T, Suriyapee S, Kim G G Y, et al A method of setting limits for the purpose of quality assurance. Physics in Medicine and Biology. 2013;58(19):7025–7037. doi: 10.1088/0031-9155/58/19/7025. [DOI] [PubMed] [Google Scholar]
- 23.Fuangrod T, Greer P B, Simpson J, et al A method for evaluating treatment quality using in vivo EPID dosimetry and statistical process control in radiation therapy. International Journal of Health Care Quality Assurance. 2017;30(2):90–102. doi: 10.1108/IJHCQA-03-2016-0028. [DOI] [PubMed] [Google Scholar]
- 24.Pan Y, Yang R, Zhang S, et al National survey of patient specific IMRT quality assurance in China. Radiation oncology. 2019;14(1):69. doi: 10.1186/s13014-019-1273-5. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 25.Cui T, Peng J X, Jin X L, et al Improving intensity-modulated radiation therapy quality assurance by adopting statistical process control. Cancer Radiother. 2022;26(3):427–432. doi: 10.1016/j.canrad.2021.05.004. [DOI] [PubMed] [Google Scholar]
- 26.Xiao Q, Bai S, Li G, et al Statistical process control and process capability analysis for non-normal volumetric modulated arc therapy patient-specific quality assurance processes. Medical Physics. 2020;47(10):4694–4702. doi: 10.1002/mp.14399. [DOI] [PubMed] [Google Scholar]
- 27.Tattenberg S, Hyde D, Milette M P, et al Assessment of the Sun Nuclear ArcCHECK to detect errors in 6MV FFF VMAT delivery of brain SABR using ROC analysis. J Appl Clin Med Phys. 2021;22(6):35–44. doi: 10.1002/acm2.13276. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 28.Woon W, Ravindran P B, Ekayanake P, et al A study on the effect of detector resolution on gamma index passing rate for VMAT and IMRT QA. J Appl Clin Med Phys. 2018;19(2):230–248. doi: 10.1002/acm2.12285. [DOI] [PMC free article] [PubMed] [Google Scholar]
- 29.Pogson E M, Arumugam S, Hansen C R, et al Comparison of multi-institutional pre-treatment verification for VMAT of nasopharynx with delivery errors. Physica Medica. 2018;53:25–31. doi: 10.1016/j.ejmp.2018.07.007. [DOI] [PubMed] [Google Scholar]
- 30.叶淑敏, 滕建建, 石锦平, 等 MLC叶片系统误差对鼻咽癌VMAT和IMRT计划剂量影响的比较. 中国医学物理学杂志. 2019;36(10):1139–1144. doi: 10.3969/j.issn.1005-202X.2019.10.005. [DOI] [Google Scholar]



