摘要:语言之争是无谓之争,最重要的是设计+lib。
(相应某些网友的呼唤,当帖子长度太长的时候写个摘要)
作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身,
我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库,
汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统
是上PhD的时候跟一些水平极烂的教授补上的。
先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿
真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队
做中型系统(100k行左右)的开发,后来做这个团队的lead。
做PhD的时候开始用Matlab,java,python,perl,R,javascript
和php。每接触一个语言,我都维护自己的一套lib,像数据读取,
visualization,socket,数值计算等,所有lib的格式和名称向
Matlab靠拢对齐,后来连继续使用C/C++的时候也如此。
后来你会发现,其实每套语言真的很像,至少在我自己的project里如此。
我的project模块基本上都能分得很清楚:UI/Data Interface,核
心数据处理(有内存和计算速度要求),外围逻辑。由于我维护了自己一
套Data Interface和核心数据计算的lib,连名称都几乎一样,我的每个
project的不同语言版本几乎没什么区别。
回到语言之争,对我来说是无谓之争。或者争论的核心问题会有所不同。
1 各种语言孰优孰劣?
就像把那些明星一次排开,问谁比较漂亮?每个明星都有自己的粉丝,有人
fan多个明星,每个明星的粉丝数量不一,萝卜白菜而已,对我来说不是
核心问题。
2 哪个语言快?
我会用另外一种方式问:对于同一个问题,把优化做到极致,哪个语言最快?
这是一个核心问题。由于我自己的project的特点,就是有内存和计算速度
要求的核心数据处理模块个数有限,而且前人有大量的实现,例如奇异值分解
或者矩阵乘法运算。我觉得目前大家关于这个issue的讨论没到骨子上。真
正有意义的讨论是找出若干个好的简单的模块,征集各方粉丝优化,定期做
运算速度比赛。这种比赛结果比宗教式的讨论有意义多了。
就奇异值分解,我做过大量实验。语言主要分两派:python和Matlab。
python安装Nympy,Scipy。结果发现如果针对CPU做编译优化,
Python with Numpy, Scipy比Matlab快,快大概3倍左右。而没有做过优化
和Matlab差不多。
而矩阵乘法Matlab全面胜出,胜出的比例似乎矩阵的形状和大小。
据我了解,Nympy关于这些数值计算部分所调用的库其实是用Fortran写的。
所以如果要做到极致,让我重新实现那些别人写过的核心模块,我会选择
Fortran,或者汇编,如果有必要。上层逻辑随便,差别不大的。
3 哪个语言的代码编写和管理成本低?
对我来说,各个语言都差不多,因为这些问题的答案取决于每个人的思维习惯和
project的设计本身。一个好的语言配上一个不好的设计,可能比一个不好的语言
配上一个恰当的设计来得还要差。
4 哪个语言的lib最好?
对于我来说,lib是最重要的核心问题。说实话,如果你对某个语言很喜欢但有羡慕
另外一个语言的某些feature,干脆改写一下你喜欢的那个语言的编译器就可以了。
剩下的问题就是lib。说实话,如果没有stl,我是不会使用c++的。我的所有project
都可以用C来写。甚至有些时候为了避免C++,自己实现stl里的某些功能。
哪个语言的Lib最好?只能说各有千秋,所以我坚持用自己的方式维护各个语言的lib。
说到这里,可能很多科班出身的CSer会对我嗤之以鼻:没有面向对象,做个屁?我
的经验是一个好的非面向对象比一个好的面向对象设计更容易一点编写,管理成本
一样。
CSer是面向对象为宗教,神圣不可侵犯。有个叫Yin Wang的怪人可能大家都有些印象,
他有提起这个CSer的面向对象情结,在他早期的言论中也颇为鄙视,不过后来好像
改口了。
5 你总有一个最喜欢的语言吧?
这问题的答案对我来说是会变的,一开始是C,后来是matlab,现在是python。
C像初恋情人,爱得莫名其妙,挥之不去。能想象,如果入门语言是java,我一定
也视java为我最初的最爱。Matlab是因为她的简洁和丰富的lib。python,
热恋中,优雅?简洁?开源?lib?其实没什么特别理由,喜欢就喜欢。
(相应某些网友的呼唤,当帖子长度太长的时候写个摘要)
作为一个非CS科班出身的CS PhD,我想谈谈语言之争。所谓非CS出身,
我指的是本科的时候学的不是CS的核心课程,只学过C/C++,数据库,
汇编之类功能性课程,而CS核心课程如编译器,离散数学,操作系统
是上PhD的时候跟一些水平极烂的教授补上的。
先讲一下自己的经历。我最早接触的语言是BASIC,自学的,做一些电路仿
真,后入大学后规规矩矩学C,后来自学C++,加入学校里一个大型的团队
做中型系统(100k行左右)的开发,后来做这个团队的lead。
做PhD的时候开始用Matlab,java,python,perl,R,javascript
和php。每接触一个语言,我都维护自己的一套lib,像数据读取,
visualization,socket,数值计算等,所有lib的格式和名称向
Matlab靠拢对齐,后来连继续使用C/C++的时候也如此。
后来你会发现,其实每套语言真的很像,至少在我自己的project里如此。
我的project模块基本上都能分得很清楚:UI/Data Interface,核
心数据处理(有内存和计算速度要求),外围逻辑。由于我维护了自己一
套Data Interface和核心数据计算的lib,连名称都几乎一样,我的每个
project的不同语言版本几乎没什么区别。
回到语言之争,对我来说是无谓之争。或者争论的核心问题会有所不同。
1 各种语言孰优孰劣?
就像把那些明星一次排开,问谁比较漂亮?每个明星都有自己的粉丝,有人
fan多个明星,每个明星的粉丝数量不一,萝卜白菜而已,对我来说不是
核心问题。
2 哪个语言快?
我会用另外一种方式问:对于同一个问题,把优化做到极致,哪个语言最快?
这是一个核心问题。由于我自己的project的特点,就是有内存和计算速度
要求的核心数据处理模块个数有限,而且前人有大量的实现,例如奇异值分解
或者矩阵乘法运算。我觉得目前大家关于这个issue的讨论没到骨子上。真
正有意义的讨论是找出若干个好的简单的模块,征集各方粉丝优化,定期做
运算速度比赛。这种比赛结果比宗教式的讨论有意义多了。
就奇异值分解,我做过大量实验。语言主要分两派:python和Matlab。
python安装Nympy,Scipy。结果发现如果针对CPU做编译优化,
Python with Numpy, Scipy比Matlab快,快大概3倍左右。而没有做过优化
和Matlab差不多。
而矩阵乘法Matlab全面胜出,胜出的比例似乎矩阵的形状和大小。
据我了解,Nympy关于这些数值计算部分所调用的库其实是用Fortran写的。
所以如果要做到极致,让我重新实现那些别人写过的核心模块,我会选择
Fortran,或者汇编,如果有必要。上层逻辑随便,差别不大的。
3 哪个语言的代码编写和管理成本低?
对我来说,各个语言都差不多,因为这些问题的答案取决于每个人的思维习惯和
project的设计本身。一个好的语言配上一个不好的设计,可能比一个不好的语言
配上一个恰当的设计来得还要差。
4 哪个语言的lib最好?
对于我来说,lib是最重要的核心问题。说实话,如果你对某个语言很喜欢但有羡慕
另外一个语言的某些feature,干脆改写一下你喜欢的那个语言的编译器就可以了。
剩下的问题就是lib。说实话,如果没有stl,我是不会使用c++的。我的所有project
都可以用C来写。甚至有些时候为了避免C++,自己实现stl里的某些功能。
哪个语言的Lib最好?只能说各有千秋,所以我坚持用自己的方式维护各个语言的lib。
说到这里,可能很多科班出身的CSer会对我嗤之以鼻:没有面向对象,做个屁?我
的经验是一个好的非面向对象比一个好的面向对象设计更容易一点编写,管理成本
一样。
CSer是面向对象为宗教,神圣不可侵犯。有个叫Yin Wang的怪人可能大家都有些印象,
他有提起这个CSer的面向对象情结,在他早期的言论中也颇为鄙视,不过后来好像
改口了。
5 你总有一个最喜欢的语言吧?
这问题的答案对我来说是会变的,一开始是C,后来是matlab,现在是python。
C像初恋情人,爱得莫名其妙,挥之不去。能想象,如果入门语言是java,我一定
也视java为我最初的最爱。Matlab是因为她的简洁和丰富的lib。python,
热恋中,优雅?简洁?开源?lib?其实没什么特别理由,喜欢就喜欢。
Comments
Post a Comment
https://gengwg.blogspot.com/