TensorFlow 2.0 VS PyTorch？

hankcs · December 26, 2019, 12:14am

虽然HanLP 2.0采用了TensorFlow 2.0，但我保留在未来版本部分或完全采用PyTorch的可能性。两个DL框架各有好处，特别是在2020这个时间点附近，两个框架都往彼此擅长的领域学习。目前看来，学术界顶会基本是PyTorch占主导，而工业界则是TensorFlow部署起来比较方便稳定。另外，在我个人的经验中，PyTorch的运行效率有时候比tf.keras还高。有时候，Keras默认的超参数比PyTorch要差一些。论API设计的话，Keras还是要优雅一些。不过我甚至会用PyTorch写原型，然后转换成Keras格式部署。关于两者的较量，一个比较全面的比较是The State of Machine Learning Frameworks in 2019。

总之，TensorFlow和PyTorch各有利弊。不知道大家平时主要用什么，能否分享一下自己的领域场景（学校还是公司，NLP还是CV之类）？欢迎参与投票和讨论。

TensorFlow
PyTorch

0 投票者

seven · December 27, 2019, 6:06am

公司，CV/NLP tensorflow 主要是一套流程完善，如果pytorch有类似tensorflow的 serving model 部署方式，就会考虑转torch，但是我去torch官方上看，暂时他们还不考虑做这块。

Sizhao_Xu · December 27, 2019, 7:45am

接触深度学习的时候，正好tensorflow2.0出来了，但是GitHub上面好多代码都是tensorflow1.x的，这两周改代码改的脑壳疼（来自萌新的吐槽）

hankcs · December 30, 2019, 1:43am

他们不做的原因我猜是，PyTorch如同它的名字一样，是个Python项目，什么都围绕着Python来。后面搞出来的TorchScript都是迫不得已的拓展，而不是原生的功能。TensorFlow其实是个C++项目，Python只是TensorFlow的前端。Python做前端虽好，计算密集的领域就不行了。

ewrfcas · March 25, 2020, 2:37am

基于tf2.0的全tensorIO个人感觉修改起来难度比较高

hankcs · March 25, 2020, 3:39am

你指的是张量运算吗？PyTorch有很多人性化的接口很方便调用，不过99%的接口都可以用tf实现。目前发现唯一无法实现的是as_strided，因为tf不支持strides。不过这个功能很少用，基本是写一些后处理的算法用到。实在要用可以转成numpy也无所谓。

我目前选择tensorflow的原因也不是被目前tf的部署能力绑架，而是看中tensorflow的发展前景。5年10年后，神经网络作为一门玄学的泡沫破裂，研究岗位减少，开发岗位增加。那时候，写实验原型的速度不再是重点，能否将一种具有暴力美感的网络结构（BERT之类）大规模工程化才是决定性因素，而这恰好是Google和tensorflow擅长的。这种征兆已经显现出来了，你可以在GitHub上听到某些研究人员抱怨PyTorch pretrain BERT消耗显存更多。

10年后可能python都不再是ml社区的首选。那时候一门类似swift/rust之类的编译语言，同时语法糖比python还甜，没有兼容包袱的新语言可能会成为新时代的新宠儿。这时候tensorflow这种C++项目是非常容易出language binding的，并且tf用户早已具备心理准备：Python只是个前端语言而已。而PyTorch就没有这个优势了，因为它跟Python（包括Python哲学）绑定得太紧了，一旦改成其他语言，老用户会觉得没那味儿了，新用户会觉得别扭。我的预言不一定对，毕竟技术发展很快。也许未来会出现新的技术一举把tf和PyTorch都击败也说不准呢。

作为研究者，我喜欢用PyTorch快速出原型。作为工程师，我喜欢Keras的优雅设计和tensorflow的工程设计。给定HanLP的定位，目前觉得tensorflow还是更合适一些。但我鼓励百家争鸣，也从不排除在HanLP中实现PyTorchComponent的可能性。

ewrfcas · March 25, 2020, 5:26am

同意，pretrian我也是用tensorflow的，一些技巧可以减少显存占用

hankcs · March 27, 2020, 9:02pm

我好像说了够多tf的好话，其实我也说了很多tf的坏话。如果这个issue tf没有很快解决的话，可能就要上torch了。

BitVoyage · August 17, 2020, 12:14pm

我从2016年使用TF，自从2019年转pytorch之后，人生都清爽了

hankcs · August 21, 2020, 4:59pm

不考虑部署的话，PyTorch用起来非常顺滑。当然部署本来就是个脏活，这个帖子里投票TF的大概也都是用1.x。我5个月前给TF 2.x提的两个bug到现在都没有解决，于是决定主力转PyTorch。等要部署的时候，用TF写一遍inference就行了。

loveJasmine · January 20, 2021, 2:56pm

tf的bug好多，真的有辱google

hankcs · January 20, 2021, 3:50pm

同意，听说Google内部都很嫌弃，感觉是原团队跟Keras团队磨合不了，相互甩锅的结果。

zyh3826 · March 29, 2021, 2:13am

NLP领域，目前用的pytorch，写起来很爽，但是要部署的时候就头痛了，tf server部署确实方便。目前也遇到了使用cpu部署的困境，没找到合适的方法，不知道博士对cpu部署有经验没

hankcs · April 3, 2021, 1:52am

抱歉没有那么多的工程经验，听说(Deep-Learning-with-PyTorch)就算用C++，顶多提速10%。