算法调包族优缺点

Matlab被禁用正好给了我们一个难得的机遇

后Matlab时代如何做科研：人工智能篇

作者 | 王立新

浏览人工智能、统计学习、自动控制等相关领域国际顶级期刊的论文，会发现大部分论文是“调包族”：这些论文不再进行基础算法的编程，而是调用现成的软件包，其中最常用的就是Matlab Toolbox。

这些基础算法包括：BP，Hopfield，Decision Tree，Random Forest，MARS，SVM，等等等等。

由于研究者们不再对这些基础算法进行自己编程，使得研究者们对基础算法的理解趋于表面化、肤浅化，这也是许多年来这些领域在基础理论方面没有突破的一个重要原因。

这是全球整个研究领域的问题，不局限于我们国家。

所以，对于人工智能统计学习等相关领域的研究者们来说，Matlab被禁用正好给了我们一个难得的机遇，让我们回归本学科科学研究的本质。

二十年前，当我觉得模糊系统和模糊控制研究可以暂时先告一段落的时候，我“放眼世界”，最吸引我的就是“统计学习”。

当时，我读Breiman的论文、读Friedman的论文，让我着迷。

Breiman关于Decision Tree的原始论文和书，以及后来发展起来的Random Forests，还有Friedman的MARS，等等等等。

大师们思想的足迹，让我流连忘返。

我自己编程去实现这些算法，然后和我的模糊系统WM方法做比较（我也是模糊大师哦），深刻体会各自方法的优缺点，对我后来的研究与实践帮助甚大。

我深深地体会到，只有自己编程、在不断的试错中“细嚼慢咽”，才能深刻体会这些核心算法的优缺点。

而只有深刻体会这些核心基础算法的优缺点，才能在实践中有效地使用它们，解决重要的实际问题。

“调包族”最大的问题是什么呢？就是当结果不理想时，不知道如何改进，只有“听天由命”。

这是因为调包族对算法的细节缺乏深刻理解，知其然不知其所以然，不知道如何改进算法，使其更加适用于自己的问题。

通常，大数据建模涉及复杂的非线性关系，而且这些复杂关系因问题的不同而不同。

所以，需要对算法的众多参数进行有的放矢的调节，使之适应于需要解决的具体问题。

如果对算法的细节缺乏深刻的理解，不知道这些众多参数之间的互动关系，那么就很难有效地调节这些参数，使算法的性能达到最优。

还有，“调包族”的盛行阻碍了基础理论的发展。

因为，新理论是在旧理论的基础之上、通过改进旧理论的缺点缺陷而发展起来的。

常言道：It takes a better theory to kill an existing theory。

“调包族”对现有算法采取囫囵吞枣的态度，将不同的算法机械地“排列组合”，这种“撞大运”的研究方式很难产生深刻的理论。

总之，Matlab被禁给了我国人工智能研究者们一个难得的“歪打正着”的机会，让我们静下心来自己编程基础算法，深刻体会基础模型与算法的核心要素与优缺点，在现有成绩的基础之上“百尺竿头、更进一步”，迎接更加灿烂的明天。

天若有情天亦老，人间正道是沧桑。好了，气宇轩昂的“大话”咱们就说这么多。

“理想很丰满、现实很骨感”：没有了Toolbox，“调包族”们今后如何生存啊？

其实，虽然toolbox没有了，但这些基础算法的开源原始程序还是很容易找到的。

这些原始程序是可以用Python，C，Fortran，或者Matlab的基础语句写成的。

我的建议是：要读懂这些原始程序，一行一行地读，然后自己运行。这样其实并不用花费很多的时间。

比如我最新的“深度卷积模糊模型”，在论文发表的同时也附上了用Matlab基础语句写成的原始程序。

论文和程序是一个有机的整体，相互交叉地读可以起到相互促进的作用，能够更加深刻地理解模型和算法的核心要素，程序运行起来也就更加心中有底气了。

转载本文请联系原作者获取授权，同时请注明本文来自王立新科学网博客。

链接地址：http://blog.sciencenet.cn/blog-2999994-1238465.html

编辑 | 赵路

排版 | 郭刚