人工智能机器学习常用算法总结及各个常用算法精确率对比(5)
Q-Learning是一种无模型的强化学习技术。具体来说,可以使用Q学习来为任何给定的(有限的)马尔可夫决策过程(MDP)找到最优的动作选择策略。它通过学习一个动作价值函数,最终给出在给定状态下采取给定动作的预期效用,然后遵循最优策略。一个策略是代理在选择动作后遵循的规则。当这种动作值函数被学习时,可以通过简单地选择每个状态中具有最高值的动作来构建最优策略。 Q-learning的优点之一是能够比较可用操作的预期效用,而不需要环境模型。此外,Q学习可以处理随机过渡和奖励的问题,而不需要任何适应。已经证明,对于任何有限的MDP,Q学习最终找到一个最优策略,从总体奖励的预期值返回到从当前状态开始的所有连续步骤是最大可实现的意义。 机器学习常用Python包 sklearn开源机器学习模块,包括分类、回归、聚类系列算法,主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等;也提供了一些语料库。 学习地址:https://scikit-learn.org/stable/modules/classes.html numpyPython的语言扩展,定义了数字的数组和矩阵。提供了存储单一数据类型的多维数组(ndarray)和矩阵(matrix)。 学习地址: scipy其在numpy的基础上增加了众多的数学、科学以及工程计算中常用的模块,例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。 学习地址:https://www.scipy.org/ pandas直接处理和操作数据的主要package,提供了dataframe等方便处理表格数据的数据结构 学习地址: statsmodels统计和计量经济学的package,包含了用于参数评估和统计测试的实用工具 学习地址:https://pypi.org/project/statsmodels/ matplotlib、pyplot、pylab用于生成统计图。pyplot 和 pylab属于matplotlib的子模块,所以只需安装matplotlib,就会有pyplot和pylab的了。 学习地址:https://matplotlib.org/ jieba中文分词工具。 学习地址:https://github.com/fxsjy/jieba Pattern此库更像是一个“全套”库,因为它不仅提供了一些机器学习算法,而且还提供了工具来帮助你收集和分析数据。数据挖掘部分可以帮助你收集来自谷歌、推特和维基百科等网络服务的数据。它也有一个Web爬虫和HTML DOM解析器。“引入这些工具的优点就是:在同一个程序中收集和训练数据显得更加容易。 学习地址:https://github.com/clips/pattern 各个算法精确率对比此次算精确率对比,总语料样本21282条,分类标签911个,语料是企业的语料集,不对外公开。精准率是把整体样本按照8:2的比例,分为80%的训练集,20%的测试集来算的,实验流程在每篇文章中都有详细记载。数据量低于21282的是取了总样本的部分数据做的实验,效果统计如下: 支持向量机(SupportVectorMachine) 升级版sklearn Liblinear sklearn 随机森林(Random Forest) 朴素贝叶斯(Naive Bayesian Model) K近邻(K-NearestNeighbor) 逻辑回归(LogisticRegression) 决策树(Decision Tree)(编辑:ASP站长网) |