以下是我自己的学习路线,至少是我目前能回忆起来的一些学习路线,希望能帮到你们。虽然我之前学过前端的网站搭建框架,但是我忘了,因为我好久不用了,所以就不在这里介绍了。
一、python基础
基础环境搭建注释变量数据类型数学计算字符串布尔值列表元组集合字典控制流函数面向对象继承日期JSON数据处理格式化输入输出警告处理文件的基本处理
二、数据处理
需要掌握的模块:
模块pandasnumpy
三、数据可视化
以下是常见需要绘制的图形,是需要掌握的:
内容子图散点图折线图柱形图直方图扇形图K线图箱型图热力图省市地图水球图
个人建议需要掌握的模块:
模块MatplotlibSeabornPyechart
五、网页基础与网络爬虫
需要掌握的网页基础内容:
内容HTMLCSSJS
需要掌握的网络爬虫内容:
基本模块urllibrequestsreXpathbs4seleniumScrapy
六、数据与服务器的管理
需要掌握的内容:
需要掌握SQLLinux
七、机器学习十大基本算法
以下是我脑子能想到比较常见的又还会的,不分顺序:
算法线性回归Logistic 回归逐步回归正则化(岭回归)决策树朴素贝叶斯k-邻近算法(kNN)Kmeans聚类支持向量机(SVM)随机森林(Random Forest)主成份分析主成分回归(PCR)灰色关联皮尔逊相关性特征选择算法XGBoost算法LSTM模型ARMA模型神经网络
如果有时间,希望把西瓜书啃一遍。关于机器学习算法,可以使用Python和Matlab。哪样方便哪样来,本篇主要是介绍的Python,暑假我会更新一套完整的Matlab教程。
八、最后几句话
学习的过程不是一帆风顺的,一定要坚持。数据挖掘工程师在国内是很缺少的,自己打开招聘看看就知道了,对于有经验的数据工程师,至少都是两万起步,基本都能达到三万,这仅仅是公司的基本工资,如果还有股权,以及自己外快,具体自己算(不过要慢慢积累,不是说毕业就这么厉害了)。以上是我个人所学知识,但是对这些掌握也不能说是完全掌握,所以准备是要复习一遍。
对于学生,接触数据挖掘最多的应该就是大学期间的各种数学建模竞赛了,挑战性很强。最后说一句,不是你拿奖了,就代表你有这个实力了,不是说你没拿奖,就代表你没有这个实力了,数学建模竞赛,老玩家懂的都懂了,所以我就不直言。但是这个竞赛,我就把它定义为数据挖掘了。
欢迎你与我联系:点击查看
版权归原作者 川川菜鸟 所有, 如有侵权,请联系我们删除。