【应用案例】图谱建库与应用——咖啡豆种类快速鉴别
发布时间:2025-03-05
一、行业背景
在咖啡行业蓬勃发展的当下,咖啡豆种类快速鉴别 具有举足轻重的意义。咖啡可以分为三个原生豆种:阿拉比卡、罗布斯塔和利比里卡,其中阿拉比卡以其细腻、丰富且甜美的口感备受青睐,多被用于制作精品咖啡。罗布斯塔则主要用于速溶咖啡等,强调苦味且成本较低。利比里卡则风味较弱、市场占有量低。

阿拉比卡、罗布斯塔和利比里卡咖啡豆(图片来源于网络)
阿拉比卡咖啡豆售价往往是罗布斯塔的两倍甚至更高,这使得市场上存在出于经济动机的替代掺假现象。精确、快速鉴别咖啡豆种类,能让生产商从源头把控品质,提升品牌口碑,也可以有效遏制欺诈行为,维护市场公平环境。
目前咖啡豆种类鉴别的技术主要包括感官鉴别法、形态学鉴别法、化学分析法和光谱鉴别法。其中,形态学鉴别法仅通过有限的信息可以区分明显不同的品种;化学分析法准确、定量,但实验成本高、不适合大规模快速检测;光谱鉴别法依靠光谱可以实现快速、无损检测,但需要建立准确可靠的光谱数据库,且对于光谱相近的品种鉴别困难。
二
咖啡豆种类常见鉴别方法(图片来源于网络)
将上述方法中的形态学鉴别法与光谱鉴别法结合,即通过图谱特征融合处理技术 进行咖啡豆分选,将形态学特征与光谱特征有效互补,可以克服传统视觉成像信息单一、光谱技术异物同谱等难题,提升咖啡豆种类快速鉴别的准确性。

图谱融合鉴别咖啡豆种类
二、咖啡豆图谱特征建库
本文采用可见近红外光谱成像技术,针对阿拉比卡、罗布斯塔和利比里卡三种咖啡豆,开展了图谱特征建库工作。
1. 咖啡豆样本数据采集
实验样本采购于专业咖啡经销商,包含相同烘焙程度(中深度烘焙)的阿拉比卡豆、罗布斯塔豆和利比里卡豆,为防止其他环境因素影响咖啡豆特征,在进行建库之前将样本分别保存在密封袋中。

阿拉比卡、罗布斯塔和利比里卡样品豆
实验中,采用LabS VNIR可见近红外光谱分析仪采集350~1000nm 范围内18个波段的多光谱图像,光谱图像的空间分辨率为30um,足以准确捕获咖啡豆的形态和光谱特征细节。分别将不同品种的咖啡豆放置于培养皿中,平铺摆放,并进行腹面、背面区分(有胚芽的一面为腹面,无胚芽的一面为背面),每种咖啡豆选取50余组样本进行图谱数据采集。

实验关键步骤

三种咖啡豆的部分波段图谱数据(第1列-背面、第2列-腹面,第3列-两面混合)
2. 图谱特征提取
为全面掌握咖啡豆个体特征,利用掩膜算法提取了咖啡豆的二值化掩膜,在此基础上提取了咖啡豆样本的光谱特征和形态特征,并进行了特征统计分析。
表2-1阿拉比卡、罗布斯塔和利比里卡咖啡豆特征汇总


根据以上特征数据可以看出,三种咖啡豆的光谱曲线形状存在一定差异,在近红外波段,三种咖啡豆的反射率不同。考虑到选用同一烘焙程度的三种咖啡豆,所以色度学参数的差异相对较小。对比不同咖啡豆的特征,阿拉比卡豆和其他两个豆种在面积、椭圆度等形态学特征上差异比较明显,罗布斯塔豆和利比里卡豆则在圆形度和光谱特征上差异比较明显。
三、咖啡豆种类快速鉴别
基于不同种类咖啡豆的图谱特征,尝试快速鉴别咖啡豆种类。
1. 特征重要性分析与分类模型构建
在构建模型时,为筛选关键特征参数,给每个图谱特征分配了权重系数,再将每个特征的权重系数量化为相对比例的归一化贡献值,根据统计出的贡献值可以看出,长轴、面积、短轴、椭圆度、band_10(630nm)和band_16(900nm)等特征排序靠前,其中长短轴、椭圆度等形态学特征的贡献值更高,可见光和近红外的光谱特征对于分类也有贡献。

特征重要性排序
本文采用偏最小二乘判别模型(PLS-DA),对上述筛选出的关键图谱特征 进行训练,并使用K交叉验证来评估模型的泛化能力,确保模型的稳定性和可靠性。在交叉验证的过程中,通过反复训练和验证来选择最优的PLS-DA模型参数,构建出区分不同类别咖啡豆的最优模型。
2. 种类鉴别结果
选取模型训练集和测试集之外的咖啡豆样本作为验证集,将不同种类的咖啡豆按照不同的摆放姿态混合在一起,从左至右的矩形框内依次为利比里卡豆、阿拉比卡豆和罗布斯塔豆,并且保证每种咖啡豆都有腹面和背面(测试摆放姿态的影响),用可见近红外光谱分析仪获取验证集的图谱数据。

咖啡豆分类结果
利用训练好的模型,对验证集中的混合豆种进行分类。如上图所示可以看到算法可以准确的将一组验证数据中的三类咖啡豆分开。对验证集的所有样本进行精度统计分析,其中阿拉比卡豆的识别精度为100%,罗布斯塔豆和利比里卡豆的识别精度约为96%和97%,即阿拉比卡豆可以从三种咖啡豆种准确识别出来,罗布斯塔豆和利比里卡豆之间由于部分验证集样本的光谱、形态特征较为相似而导致了一定概率的误识别,实际应用中可以通过加强对特殊豆粒样本的训练,进一步提高罗布斯塔豆和利比里卡豆的分类稳定性。
此外,实验中单组图谱数据的识别算法运行耗时小于1s,通过算法优化加速、提升算力等方式,可以将识别算法做到准实时的运算效率,从而满足工业流水线上的咖啡豆快速分类要求。
图谱融合技术不仅可以提高咖啡豆的分类精度,还能增强模型的泛化能力,突破单一光谱信息带来的局限性,提供更加全面和精准的分类依据,对不同种类咖啡豆的鉴别具有重要的实际应用价值。
四、延伸应用
咖啡豆的图谱特征融合处理与分析技术,还可以应用到以下场景中。
1. 咖啡行业
(1)咖啡豆产线快速分选
在咖啡豆分选产线中加入光谱工业相机,同步获取咖啡豆的图谱特征,可以对除外观指标之外的品质指标(瑕疵率、风味特征等)、物理指标(密度、水分含量等)以及杂质指标(树枝、石子、泥土等杂质)等进行快速、无损分选。
(2)咖啡豆品质评价标准
从产业发展来看,咖啡生产国与消费国对高品质咖啡愈发关注,迫切需要全新的品质评价标准。通过为咖啡豆建立图谱特征库,有望为咖啡质量检测提供科学依据,协助有关部门制定咖啡行业相关的质量检测规范和标准。

咖啡豆分选(图片来源于网络)
2. 科研领域
(1)推动品种改良
通过光谱成像获取咖啡豆的表型特征,有助于科研人员研究不同品种的遗传特性、生长规律和品质特点,为咖啡豆的品种改良和培育提供基础数据,从而培育出更适应环境变化、产量更高、品质更优的咖啡豆品种。
(2)研究咖啡品质形成机制
不同种类的咖啡豆在成分和风味物质上存在差异。通过图谱特征快速鉴别,科研人员可以有针对性分析不同种类咖啡豆的成分组成,深入研究咖啡风味、香气等品质特征的形成机制,为咖啡加工工艺的优化和创新提供理论依据。

咖啡豆脂质含量研究(图片来源于网络)
小贴士
以上实验中所用LabS VNIR可见近红外光谱分析仪为长光驰宇公司自研产品。长光驰宇依托自主知识产权的多光谱、高光谱产品,为透明/半透明物体检测、低反/不透明物体检测、物质成分分类与反演、近似色域材质分类等工业分选和检测领域,提供光谱视觉软硬件一体化解决方案。

LabS VNIR可见近红外光谱分析仪
五、免费测试样品
欢迎大家联系长光驰宇公司,申请样品免费测试服务及合作洽谈。

