11. 案例2:预测facebook签到位置

1 数据集介绍

数据介绍:将根据用户的位置,准确性和时间戳预测用户正在查看的业务。

官网:https://www.kaggle.com/navoshta/grid-knn/data

2 步骤分析

  • 对于数据做一些基本处理(这里所做的一些处理不一定达到很好的效果,我们只是简单尝试,有些特征我们可以根据一些特征选择的方式去做处理)

    • 1 缩小数据集范围 DataFrame.query()

    • 2 选取有用的时间特征

    • 3 将签到位置少于n个用户的删除

  • 分割数据集

  • 标准化处理

  • k-近邻预测

3 代码过程

  • 1.获取数据集

  • 2.基本数据处理

  • 特征工程--特征预处理(标准化)

  • 机器学习--knn+cv

  • 模型评估

Last updated