Matlab被禁用正好给了我们一个难得的机遇

 



后Matlab时代如何做科研:人工智能篇

作者 | 王立新

浏览人工智能、统计学习、自动控制等相关领域国际顶级期刊的论文,会发现大部分论文是“调包族”:这些论文不再进行基础算法的编程,而是调用现成的软件包,其中最常用的就是Matlab Toolbox。

这些基础算法包括:BP,Hopfield,Decision Tree,Random Forest,MARS,SVM,等等等等。

由于研究者们不再对这些基础算法进行自己编程,使得研究者们对基础算法的理解趋于表面化、肤浅化,这也是许多年来这些领域在基础理论方面没有突破的一个重要原因。

这是全球整个研究领域的问题,不局限于我们国家。

所以,对于人工智能统计学习等相关领域的研究者们来说,Matlab被禁用正好给了我们一个难得的机遇,让我们回归本学科科学研究的本质。

二十年前,当我觉得模糊系统和模糊控制研究可以暂时先告一段落的时候,我“放眼世界”,最吸引我的就是“统计学习”。

当时,我读Breiman的论文、读Friedman的论文,让我着迷。

Breiman关于Decision Tree的原始论文和书,以及后来发展起来的Random Forests,还有Friedman的MARS,等等等等。

大师们思想的足迹,让我流连忘返。

我自己编程去实现这些算法,然后和我的模糊系统WM方法做比较(我也是模糊大师哦),深刻体会各自方法的优缺点,对我后来的研究与实践帮助甚大。

我深深地体会到,只有自己编程、在不断的试错中“细嚼慢咽”,才能深刻体会这些核心算法的优缺点。

而只有深刻体会这些核心基础算法的优缺点,才能在实践中有效地使用它们,解决重要的实际问题。

“调包族”最大的问题是什么呢?就是当结果不理想时,不知道如何改进,只有“听天由命”。

这是因为调包族对算法的细节缺乏深刻理解,知其然不知其所以然,不知道如何改进算法,使其更加适用于自己的问题。

通常,大数据建模涉及复杂的非线性关系,而且这些复杂关系因问题的不同而不同。

所以,需要对算法的众多参数进行有的放矢的调节,使之适应于需要解决的具体问题。
如果对算法的细节缺乏深刻的理解,不知道这些众多参数之间的互动关系,那么就很难有效地调节这些参数,使算法的性能达到最优。

还有,“调包族”的盛行阻碍了基础理论的发展。

因为,新理论是在旧理论的基础之上、通过改进旧理论的缺点缺陷而发展起来的。

常言道:It takes a better theory to kill an existing theory。

“调包族”对现有算法采取囫囵吞枣的态度,将不同的算法机械地“排列组合”,这种“撞大运”的研究方式很难产生深刻的理论。

总之,Matlab被禁给了我国人工智能研究者们一个难得的“歪打正着”的机会,让我们静下心来自己编程基础算法,深刻体会基础模型与算法的核心要素与优缺点,在现有成绩的基础之上“百尺竿头、更进一步”,迎接更加灿烂的明天。

天若有情天亦老,人间正道是沧桑。好了,气宇轩昂的“大话”咱们就说这么多。

“理想很丰满、现实很骨感”:没有了Toolbox,“调包族”们今后如何生存啊?

其实,虽然toolbox没有了,但这些基础算法的开源原始程序还是很容易找到的。

这些原始程序是可以用Python,C,Fortran,或者Matlab的基础语句写成的。

我的建议是:要读懂这些原始程序,一行一行地读,然后自己运行。这样其实并不用花费很多的时间。

比如我最新的“深度卷积模糊模型”,在论文发表的同时也附上了用Matlab基础语句写成的原始程序。

论文和程序是一个有机的整体,相互交叉地读可以起到相互促进的作用,能够更加深刻地理解模型和算法的核心要素,程序运行起来也就更加心中有底气了。

转载本文请联系原作者获取授权,同时请注明本文来自王立新科学网博客。

链接地址:http://blog.sciencenet.cn/blog-2999994-1238465.html

编辑 | 赵路

排版 | 郭刚

 请按下方二维码3秒识别


    关注 中国科学报


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册