保留指数是在色谱分析中用于表征化合物保留性能的指标,是用于化合物结构鉴定的重要参数。化合物在不同极性固定相上的保留指数差异,使得当前基于单一极性固定相的保留指数预测模型无法有效应用于多种极性固定相的保留指数预测。因此,本研究建立了不同极性固定相上气相色谱保留指数预测模型,从文献中收集到2499种化合物在8种类型固定相上的保留指数数据共4183条,根据McReynolds常数进一步将固定相划分为强极性、极性、中等极性、弱极性与非极性五类,耦合化合物分子结构特征与固定相极性独热编码特征作为模型输入,采用9种算法构建了机器学习预测模型。基于模型性能最优的XGBoost和LightGBM算法,采用投票回归建立集成学习模型,其训练集决定系数(R2)为0.99,训练集均方根误差(RMSE)为101.85,测试集R2为0.97,测试集RMSE为107.44。采用Williams图表征模型的应用域,有94%以上的数据在应用域内。本研究综合固定相极性和化合物结构两类复合特征,成功开发了能够适应多种极性固定相的保留指数预测模型,克服了现有单一极性固定相模型的局限性,极大地拓宽了模型的应用范围。与个体机器学习模型相比,集成模型体现出了更好的稳健性和预测能力。模型的建立对于提高气相色谱靶标和非靶标分析的效率和准确性具有重要的科学意义和实际价值。