此帐号已被封,内容无法查看 此帐号的内容被自由微信解封
文章于 2021年9月10日 被检测为删除。
查看原文
被微信屏蔽
其他

MATLAB 被禁背后:我们如何做出卡别人脖子的技术?

维罗微风 2021-03-22

作者 | 包云岗

转载自 | 包云岗微博

包云岗 (中国科学院计算技术研究所研究员)




【编者按】最近Matlab被禁一事引起IT界广泛关注。很多人在思考如何解决被禁这个燃眉之急的问题时,中科院计算所研究员、先进计算机研究中心主任包云岗提出我们更需要思考如何在未来做出像 Matlab 等“卡别人脖子”的技术。他先是回顾Matlab 近 40 年的发展历程,从中总结 4 个关键理念。以下是包云岗在CCF YOCSEF杭州Matlab被禁之特别论坛的发言。

很多人都在思考如何解决“Matlab被禁”这个燃眉之急问题。大家回顾了中国的工业软件发展之痛,批评国内的盗版问题、知识产权保护问题、重硬件轻软件等一系列问题。也提出了很多好的建议,比如给了针对Matlab各种功能的开源软件替代方案。这些都算是“昨天和今天”的事。

现在我想和大家一起讨论一下关于“明天”的事。

我们每个人可以问自己一个问题:从现在这个时间点开始,给10年时间,甚至20年时间,我们能做出一个卡别人脖子的东西吗?(并不是说真的要去卡别人脖子,而是说要成为别人离不开的东西)如果从这个角度来看这次“Matlab被禁”事件,那么也许可以给我们更多的是启发——我们都知道Matlab最初只是新墨西哥大学Clever Moler教授在1970年代用于教学中的一个小工具软件,那它为什么能在几十年后成为卡我们脖子的利器?

我们一起来梳理一下Matlab发展过程中折射出来的几个理念:

一、把东西做出来,而不是追求把论文发出来。

Matlab网站上有一篇Moler教授自己在2018年写的Matlab简史。他在开头就写道,在1970年和1975年他所在团队向NSF申请了两个项目,目标是“探索开发高质量数学软件的方法、成本和资源”。

他自己也认为,某种程度上这两个项目是失败的,因为他们没有发表出一篇论文,他们只是开发出了两个软件:一个是EISPACK,另一个是LINPACK。而且这两个软件也谈不上多大的学术创新,因为EISPACK就是把1965-1970年发表论文中用Algo60写的算法翻译为Fortran,而LINPACK则是直接用Fortran重写一遍。

二、把东西用起来,而不是做完就扔了。

虽然EISPACK、LINPACK没有论文,学术创新也似乎不是很高,但确实两个很有用的软件。EISPACK的开发团队在1974年代写了一本使用手册,我在Google Scholar上查了一下,到现在已经被引用了1800多次,1970-1980年代使用非常广泛。LINPACK更是世界超级计算机排行榜Tops500的基准测试程序,可以说是影响了世界超级计算机的发展。

三、把教学场景用起来,而不是把教学当作负担。

Matlab是Moler教授想把EISPACK和LINPACK应用于教学过程中的产物。如果Moler教授不是用心去做教学,不是为了能让学生更好地掌握线性代数与数值分析,更容易地使用EISPACK和LINPACK这两个软件,那么他就不会有动机自己动手去写一个Matlab小工具来把这两个软件接口封装起来,从而方便学生使用。

今天,由于严苛的科研竞争环境和考核压力,很多人都把教学当作了一种负担,认为会影响科研。但教学其实是试验新技术、新工具最好的应用场景,因为试错成本很低,而且学生的创新性和主动性,还能帮助改进优化技术和工具。

Matlab最终走上商业化,就是因为Moler教授在斯坦福大学给学生上课时,有两个学生对Matlab很感兴趣,主动提出用C重写一遍,同时移植到IBM PC上。很多技术最早都是从课堂上发展起来,比如RISC架构是David Patterson教授在伯克利的课程实验。

四、把持久战意识树立起来,而不是期望速胜论。

坚持围绕一件事做,几十年后的累积效应是惊人了。中国今天被卡脖子的东西,几乎都是别人积累了20年以上的东西。

从第一版Matlab算起到现在已经有40年,1980年代初的第一代EDA软件到现在也有快40年,Intel在1970年左右第一代微处理器到现在已经有50年。台积电1987年成立到现在也是积累了30多年。

其实在学术界也有很多有影响力的工作也是积累很多年的产物,我们可以看一下ACM System Software Award,获奖的软件基本上都是持续积累了几十年,比如LLVM持续优化了17年、Eclipse优化了19年、Wireshark优化了22年、Coq优化了31年,GCC则有33年。

再仔细剖析一下Matlab以及对应的公司MathWorks,可以说是持久战的典范。

.MathWorks在1984年成立,只有1名员工。第一笔收入是1985年卖给了MIT10个Matlab版权,收入500美元。

.MathWorks公司早期很不起眼,有个玩笑称它前7年员工数每一年翻一番,1984年1个员工,1985年2个员工,1986年4个员工,直到7年后的1991年也才只有128个员工。和今天很多初创公司相比,这个成长速度就像是蜗牛了。但是他们力出一孔,围绕着Matlab不断增加功能,使Matlab成为一个行业领先的工具软件。

.1997年,MathWorks的营业额达到了5000万美元,380名员工。

.如今2019年MathWorks公司营业额是10亿美元,3000多员工,全球有400多万用户。虽然从营业额看并不大,但其实我们更应该学习这种模式——不断积累。把一项技术做到极致,成为某个细分领域的隐形冠军。

最后总结一下,当我们在思考如何解“Matlab被禁这个解燃眉之急的同时,更需要考虑如何才能在未来做出像Matlab那样的工作,做出能卡别人脖子的技术。

这需要我们做出改变,观念上的改变,行动上的改变。至于哪些具体的改变,我想前面梳理的四点就算是抛砖引玉吧:

把东西做出来,而不是追求把论文发出来。

把东西用起来,而不是做完就扔了。

把教学场景用起来,而不是把教学当作负担。

把持久战意识树立起来,而不是期望速胜论。



延伸阅读:从Matlab被禁,看国内科研现状


作者 | Claire

转载自 | 微信公众号“毛毛虫 Claire”







想了半天要不要写这篇文儿,我其实一般不太关注政治类新闻。

但这两天的一条消息让我感触挺深的。昨天一大早还迷糊着,我老公大厨就和我说“你知道哈工大和哈工程已经不让用Matlab了吗?买了版权也不行!” 

大厨本科毕业于哈工大,博士毕业论文又用Matlab完成,说起来分外激动。

我急忙拿着手机看新闻,才发现这条消息已经在理工科的研究圈炸了锅。

哈工大的学生纷纷表示收到了正版软件取消激活的通知,而在与 MATLAB 开发公司 MathWorks 交涉之后,才得知因为美国政府实体名单的原因,相关授权已被中止。

很多人会说,我们一直用盗版啊,正版不让用也罢!

正是因为我们缺乏相关的版权意识,也是我们长久以来在软件开发上相当被动的原因之一。

要知道相关单位发表文章时,如果提供的数据,图表,图片等没有正规授权,商业软件公司有权利起诉要求赔偿,而且往往都是千万元级别的。

前两年北京某高校就不幸被盯上,庭外商讨的结果是每年赔80万,连续10年。

之前不管是因为矛盾没有激化,一旦被盯上,开始全方位多角度的打击,我们该怎么办?换其他软件?那是长久之计吗?

大家也不要想着找个第三方公司购买,然后租赁给上名单的高校。一旦上了名单,上下游交易都会被查,根本躲不过去。四川大学不就是替九院(1997年就上了美国商务部的名单)买器材而上榜的吗?

上个月传遍全网的一份美国商务部公布的「实体名单」想必很多人都看到了。里面包含 13 所中国大学:北京航空航天大学、中国人民大学、国防科技大学、湖南大学、哈尔滨工业大学、哈尔滨工程大学、西北工业大学、西安交通大学、电子科技大学、四川大学、同济大学、广东工业大学以及南昌大学。

这类高校的特点就是涉及到了航空航天技术、材料、仪器、计算机、工程、人工智能等多个领域。

记得当时大厨边看名单边感慨,这要是晚几年出国,我在哈工大学航天技术的学术背景,申请海外高校应该没有那么容易了吧!毫无疑问,如果阻止这类高校的相关专业学生出国访学交流,对中国的高科技发展来说绝对损失惨重。

但最最令人担心的不是Matlab而是这个软件,被封禁也可能只是一个开始,更多来自美国和其他欧美国家的软件,例如CAD、CAM、CAE以后会是什么情况呢?

工业仿真软件在我国似乎像个无人区,短时间内很难在国内找到替代品。一旦失去授权,对于机械,汽车,电气,水利等行业都是致命的打击

可这类工业仿真软件又偏偏不是一群只会写代码的人就能搞定的。仿真层面各种求解,各种plant model的约束关系,各种力学运动学求解,是交叉学科的结晶

想到这里,我还特意取查了下Matlab的历史:

70年代和80年代初期,美国教授Cleve Moler在新墨西哥大学教线性代数和数值分析。当时为了让学生更方便地使用LINPACK及EISPACK,所以他独立编写了第一个版本的MATLAB,当作一个教学工具分发给学生使用。

到了1979-80年,Cleve Moler又去了斯坦福任教,在那里教数值分析的研究生课程。当时班里的学生大部分也都在学控制理论和信号处理等课程。其中一个学生向自己当时正在读工程学的朋友Jack Little展示了Matlab,Jack Little如获至宝,开始在自己的科研学习中使用。

1983年,Jack Little就提议开发基于商用的MATLAB的产品。这个时候,IBM台式机才推出两年,并且并不支持MATLAB这样的程序的运行。但Jack Little他辞掉了工作,用C语言开始编写了MATLAB的新版本。

1984年,商用版本的Matlab在IEEE的会议上首发。而到了现在,目前世界上已经有180多个国家的超过三百万工程师和科学家在使用MATLAB。

看完之后不仅感慨,Matlab从首次商业版本发布到现在,已经过去36年了,比我年纪都要大。而这30多年,也正是我们的生活逐渐走向国际化的过程。

所以很多人也包括我自己在出国后,并没有觉得国外有多么发达,反而看到到处都是大农村,房屋老旧,街道狭窄。于是我们穿着光鲜亮丽,拿着最新款的手机,看完几个帖子后觉得我们已经赶超英美,世界第一了!

可做科研的人都知道,从武器,机床,芯片,材料这些实体制造,到软件,数据库,操作系统这些虚拟产品,甚至是基因,太空空间这些,我们面临的挑战还太大太大。

尤其是目前我们高端医疗器械和科研仪器严重依赖于进口。像我在材料领域用的透射电镜TEM就要依赖于美国和日本。

美国的软件日本的镜头德国的机械装了满满当当一个实验室。

就连一般的实验室耗材和试剂,90%也都是进口材料。让你想不到的是,就连取容液的移液枪和一次性的塑料枪头也依赖于进口。

是大家崇洋媚外吗?当然不是,而是国产的准确度低,重复性差,不耐用。

工欲善其事,必先利其器。

哪个科研人员愿意浪费自己宝贵的时间做没有意义的事情呢?

可对于科研人员来说,什么才是有意义的事情呢?

是像某高校老师一样,4年发300多篇论文吗?

我国SCI论文发表量目前世界第二,可这真的能代表我们的科研实力和工业竞争力吗?

中国也是全球出产博士最多的国家,甚至已经超越美国。

可为什么大部分博士生的关注点都在如何达到发表文章的数量而顺利毕业,如何找到一个有编制的岗位,如何快速解决住房问题?

我曾经写过一篇“如何降低论文重复率”的文章,是我所有文章里收藏数最多的一篇。

说实话,心情蛮复杂的。

为什么学校要逼迫学生们去完成一篇篇粗制滥造的文章,而不是引导大家完成一些基础而有实际意义的工作?例如改善某种材料的性能,开发一个软件,以后让同专业的学生逐年完善。这不比逼着学生绞尽脑汁的给文章灌水更有价值吗?

每年都在提创新,可是起点很高,基础的东西没人做。就拿我们学材料的来说,没有哪个项目愿意把资金用在实际的基础研究上,因为产出比太低

人人都在追求前沿,因为发的paper等级高,看起来好看呀!于是产学严重脱节,材料学博士毕业后无法从工业界找到合适的工作,只能进入高校开始新一轮的灌水。

生物,化学,环境,材料四大劝退专业就是这么来的。

我在英国读博时,曾遇到一个国内来的访问学者,得意洋洋的告诉我他一年能出8篇文章。我好奇的说怎么做到的,就目前来看他这个实验的重复性不是很高,我们无法控制颗粒的大小啊!

”只要有一次结果看起来可以就行!好看的图片可以用西米露随便拍一拍,然后把比例尺改成微米就行!”

这位学者聪明又刻苦,知识面广泛。如果没有科研产出的压力,没有要在一线城市买房的压力,没有一个孩子等着上幼儿园,我相信他踏踏实实做下去也能有专利和Nature & Science。

说到这里,真心希望我国能够真心实意的提高科研,研发人员的待遇。而不是签个合同就把人当廉价劳动力,不然面对生活的压力,谁还有心思踏实做事?

我们的优点是能吃苦,又聪明勤奋。如果没有高房价,消费主义,996,领导们不仅仅追求政绩,相信我国科技能进一步蓬勃发展。

就说到这里吧,免得这篇文章被封。

但最后还是想说句鼓舞人心的话:任重道远,自强不息。


免责声明:文章来源于包云岗微博 & 微信公众号“毛毛虫 Claire”,版权归原作者所有,侵权删除。




阅读更多精彩文章

请关注:维罗阳光






感谢点亮“在看”,欢迎转发分享!


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存