大家好,今天小编关注到一个比较有意思的话题,就是关于python数模编程的问题,于是小编就整理了1个相关介绍Python数模编程的解答,让我们一起看看吧。
数学建模预测数据应该如何选择算法?
做数据挖掘的时候,建模是一项重要的步骤,直接关系到项目结果是否符合需求,关于模型的选择,以个人经验来说,主要从两个方面
从业务需求着手
我们建模做项目的都是为业务服务的,一般最开始都是项目需求分析,过程应该会有大量业务和运营人员参与。项目需求首先要搞清楚,比如,做业务预测,做任务画像,做目标客户群划分等等,可能会用到分类算法,预测算法,还是聚类算法,做完需求分析相信你至少在心中会有几个算法模型供选择。
做完需求,再看数据集,首先需要进行数据探索,比如,数据的分部情况,均值,方差,可以通过画图来看,比如散点图,箱形图等,还要看数据是连续性的还是离散型的等等。如果是文本,需要提取特征,筛选特征,在文本分析中用贝叶斯算法做常见也最合适,对于数据,如果是连续型数据夹杂着离散型数据,结合需求,如果是分类,就可以使用逻辑回归算法或者支持向量机,如果大部分都是离散型数据,夹杂着连续性数据,可以考虑使用决策树,也可以使用K近邻算法,,如果是无标签的连续型数据,可以考虑使用聚类算法,当然,都还需要进行数据表换,比如,使用距离分类的算法要数据标准化。
算法没有通用的,只有最优的选择,有时候我们需要使用多个算法,再从中选取准确性,精准率,召回率最佳的算法,推荐使用Python中sklearn算法库,里面有各种算法,还有用来优化模型的参数优化器,会根据设定自动从中选择最优的算法和参数。
在之前的数模竞赛中,即便是美赛O奖的作品中,我们都能看到诸如灰色预测这样的用matlab实现的方法,实际上我们有时间序列,回归等一系列比较常用的预测方法。
在18年前后,预测类数模问题变得较为尴尬,不是因为这些题目简单,是因为大家都有了一套两***成的算法,拿题后只要找到数据就能很快跑程序出数据出图写论文。所以那个时候基本上很少有预测的题目再出现了。
实际上,评价类模型和预测类模型都是这样,因为人均都会,所以导致我们不会见到一整个大题全是讲预测的。
在这之前,我们在国赛见过人口增加预测,长江水质预测,世博会影响预测等等,那个时候基本上都是用matlab去实现这些数据的处理和预测。
说起来,在15年我本科入学的时候有个风潮,就是互联网+,那个时候就是谁有着一个什么创新创业的点子,就可以去参加比赛拿拿奖。我一看这还要做ppt路演,搞得比较商业,当时就没怎么关注,毕竟我只喜欢参加埋头做题的比赛。
上台说话这种我比较怯场,不过我也不是没有改变自己,有一次我最终鼓起勇气去参加了学校一个英语辩论赛,初赛只有抽题观点陈述这一部分,不用和别的同学正面对抗,所以我侥幸侃侃而谈,成功入围复赛,高兴之余,也激动地和室友报喜,随后联系复赛管理人员说我不去了,名额因此也顺延给了后一名,不知道算不算得上一桩美谈。
扯远了,主要是那个时候搞互联网+,什么东西都要加互联网,超市+互联网=做个订超市app,打车+互联网=打车软件。
在数模领域,除了matlab,学会python搞人工智能应用也将是一个趋势,不过吧,实际上MATLAB也能实现一部分。
那么在预测类这方面,用python的话:
到此,以上就是小编对于python数模编程的问题就介绍到这了,希望介绍关于python数模编程的1点解答对大家有用。