技术摘要:
本发明涉及基于聚类分析监测片剂包衣终点的方法及其应用。该方法包括以下步骤:采集片剂薄膜包衣全过程内样品和薄膜包衣标准片的近红外光谱;确定有效光谱波长范围经预处理得到特征峰信息;建立近红外光谱系统聚类识别模型;用识别模型对不同批次、不同时间样品的薄膜 全部
背景技术:
近年来,近红外光谱结合判别模式分析技术,由于可直接对样品进行快速、无损检 测,而被广泛应用于制药行业的过程分析技术。该技术已用于缓控释制剂、糖包衣片、滴丸、 肠溶片、中药片剂包衣及在线监测等包衣终点判断领域的研究。 聚类分析是一种无监督学习方法,在没有任何先验信息条件下,将现有无标记数 据进行归类,其中,聚类分析处理的数据集中是不存在类别归属标识。但是,在有监督学习 方法中,数据分类方法所使用的数据是已知类别归属的。这是聚类与分类二者的主要区别。 目前,聚类分析算法可大致分为以下几种:基于划分的算法、基于层次的算法、基于密度的 算法、基于网格的算法和基于模型的算法等。 现有技术中,已报道的有公开申请CN108318440A“一种利用近红外指纹光谱技术 快速判断片剂包衣终点的方法”,其公开了利用近红外技术结合正交偏最小二乘判别分析 模型对包衣终点进行判断;另外文献如夏春燕等发表的“近红外光谱快速预测天舒片包衣 终点研究”,利用近红外技术集合NIRS判别模型对包衣终点进行判断。但是采用近红外结合 聚类识别模型,尚鲜有报道。
技术实现要素:
本发明的目的在于提供基于聚类分析监测片剂包衣终点的方法及其应用。该法将 采集到的片剂薄膜包衣全过程内样品和薄膜包衣标准片的近红外光谱,经预处理得到特征 峰信息,并建立系统聚类识别模型,对薄膜包衣终点判断,具有快速、便捷、无损、精度高的 优点,能够保证不同批次间衣膜质量具有良好的均一性。 为了实现上述目的,本发明采用以下技术方案: 一方面,提供了基于聚类分析监测片剂包衣终点的方法及其应用,包括以下步骤: (1)采集薄膜包衣标准片和待测片剂,两种片剂薄膜包衣全过程内样品的近红外光谱; (2)将步骤(1)获取的近红外光谱确定有效光谱波长范围,再经预处理得到特征峰信 息; (3)利用步骤(2)获得的特征峰信息,建立近红外光谱系统聚类识别模型; (4)运用步骤(3)聚类识别模型对待测片剂薄膜包衣全过程内样品的薄膜包衣进度和 薄膜包衣终点情况进行判断。 进一步地,步骤(3)中构建聚类识别模型,具体步骤为: 将特征峰信息导入建模软件进行聚类建模,薄膜包衣标准片每个时间点的平均光谱设 为训练集,使用Euclidean距离测量方法,聚类数为5,形成五个聚类簇的识别模型;待测片 剂的特征峰信息作为测试集,计算待测片剂到每个标准片平均光谱的距离,将待测片剂归 3 CN 111595814 A 说 明 书 2/7 页 属到与标准片距离最近的簇中。 更进一步地,五个聚类分别为第一类:片芯;第二类:薄膜包衣初期;第三类:薄膜 包衣进展期;第四类:薄膜包衣近终期;第五类:薄膜包衣终点期。 更进一步地,五个聚类簇的结果展示,采用树状图和表格形式。 进一步地,步骤(1)中薄膜包衣全过程内样品包括片芯、不同薄膜包衣时间但未进 入薄膜包衣终点的中间片和薄膜包衣成品片。 进一步地,步骤(2)中预处理是标准化处理。 另一方面,提供了一种上述方法应用于制药领域中薄膜包衣片的薄膜包衣进度监 测及预测薄膜包衣终点。 本发明有益效果: 1. 本发明采用近红外光谱技术,结合聚类方法进行薄膜包衣进度识别,一方面利用了 近红外光谱技术快速、便捷、无损的优点;另一方面利用聚类模型结构简单,易于理解,是一 种无监督方法,适用于未标明类别的数据,聚类模型不仅可以用于终点判断,还可以实现全 过程检测,对于生产过程和生产质量,能及时有效监测和控制。 2. 本发明采用的系统聚类方法,可根据聚类的实际情况选择适当的分类,在最后 结果展示上,采用树状图展示聚类结果,可以直观的看到每个丛集。系统聚类是一种常用的 聚类方法,它既可以对样本聚类,也可以对变量聚类,变量可以是连续型变量也可以是分类 变量。此外,它的类间距离计算方法也十分丰富,本专利采用组间连接法。 附图说明 图1是地格达-4味汤片薄膜包衣标准片的近红外原始光谱; 图2是地格达-4味汤片薄膜包衣标准片的近红外平均光谱; 图3是地格达-4味汤片薄膜包衣标准片经标准化处理的近红外光谱; 图4是地格达-4味汤片薄膜包衣系统聚类模型图。