交通标志识别应用开发与机器学习实践
1. 应用规划
最终的应用程序将完成数据集解析、集成分类器训练、分类性能评估以及结果可视化等任务,这需要以下几个关键组件:
-main:启动应用程序的主函数例程(位于 chapter6.py 中)。
-datasets.gtsrb:用于解析德国交通标志识别基准(GTSRB)数据集的脚本,包含以下函数:
-load_data:加载 GTSRB 数据集,提取所需特征,并将数据划分为训练集和测试集。
-_extract_features:由 load_data 调用,用于从数据集中提取指定特征。
-classifiers.Classifier:定义所有分类器通用接口的抽象基类。
-classifiers.MultiClassSVM:实现用于多类分类的支持向量机(SVM)集成的类,包含以下公共方法:
-MultiClassSVM.fit:将 SVM 集成拟合到训练数据上,输入为训练数据矩阵(每行是一个训练样本,列包含特征值)和标签向量。
-MultiClassSVM.evaluate:在训练后将 SVM 集成应用于测试数据以评估性能,输入为测试数据矩阵和标签向量,返回三个性能指标:准确率、精确率和召回率。
2. 监督学习
监督学习是机器学习