一、数据获取

Python数据分析与挖掘的知识点首先要涉及到数据的获取,这里我们可以使用python语言来获取数据,比如可以使用python来爬取网络上的数据,也可以使用python来从数据库中获取数据,比如使用pymysql来连接数据库,从而获取数据。

二、数据清洗

在获取到的数据中,可能存在一些不符合要求的数据,比如缺失值,异常值等,这里我们需要使用python来对数据进行清洗,比如使用python的pandas库来进行数据清洗,从而获取到满足要求的数据。

三、数据分析

在数据清洗完成后,我们可以使用python来对数据进行分析,比如可以使用python的numpy库来对数据进行统计分析,比如计算数据的均值、中位数、标准差等,也可以使用python的matplotlib库来进行数据的可视化分析,比如画出数据的折线图、柱状图等。

四、数据挖掘

在数据分析完成后,我们可以使用python来进行数据挖掘,比如可以使用python的sklearn库来进行机器学习,比如使用K-means算法来进行聚类分析,或者使用KNN算法来进行分类分析,还可以使用python的scipy库来进行数据挖掘,比如使用Apriori算法来进行关联规则分析。