ITPub博客

首页 > IT职业 > IT职场 > 你见过最大的Python项目是多大?十万行的你见过?还说代码量少?

你见过最大的Python项目是多大?十万行的你见过?还说代码量少?

原创 IT职场 作者:dashujux 时间:2018-11-22 10:42:38 0 删除 编辑




上表已经按代码行数排了序。有意思的一点是,  代码规模最大的前4名中除了 CPython 之外其他三个全部是运维性质的项目 ,本来我猜测代码应该比较多的项目比如 Odoo 排名反而很靠后。我对运维项目了解有限,不太清楚为什么这些项目的代码规模会名列前茅,或许是因为要支持的内容比较多而杂?学习资料也可以加下Python扣扣裙:304零5零799自己下载学习下


本次统计中纯 Python 代码量最大的 Sentry 几乎达到了 70W 行,这是相当有规模的项目了。30W~50W 行代码的项目有三个,包括基础项目 CPython 在内。20W 和 10W 行代码规模的分别有三个,剩下 7 个则在 10W 行以内。

看过这个列表你应当相信, 动态语言至少在几十W行代码的项目上是完全没有问题的。 这也是绝大多数普通应用的上限了, 如果代码真的达到数百万行规模的话,那么无论用什么语言,都势必面临着拆分项目的问题。

在这里相信有许多想要学习Python的同学,大家可以+下Python学习分享裙:叁零肆+零伍零+柒玖玖,即可免费领取一整套系统的 Python学习教程


第一个指标是每个文件的平均代码行数。按照模块化的观点,单个文件中堆砌太多内容显然是不合理的,这通常意味着耦合太多、难于理解和修改。然而到底多少算是合适,并没有一个明确的标准。我希望通过这些项目的分析,了解一下开源作者们在实践中做出的选择。


第二个指标是注释和代码的比例,这个问题也有着类似的情况。注释并非越详尽越好,但总是需要一定量的注释来解释 Why 的问题。 注释太少,说明项目的作者没有给后来的维护人员留下足够的线索,可能会造成维护上的问题。 另一方面,我们考察的全部是开源项目,没有公司考核或者 KPI 的约束,所以我们可以放心的相信不会存在作者故意多写注释的问题。

前面提到的 Sentry 毫无争议的因为注释太少排到了最后,这未必说明这个项目很差,但至少是一个信号,说明该项目在维护方面可能是存在问题的。而对于那些作者愿意投入精力来写注释的项目(Ansible, NumPy, Fabric, Salt 等), 足以反映作者在项目上投入了相当大的心力,这是一个好的信号,说明这些项目是值得信赖的。


最后一项统计是关于文件类型的。Python 项目中绝大多数应该是 Python 代码,这点没有什么疑问,但同时我也想看看除了 Python 代码之外,一个项目还包括哪些主要文件。C/HTML/Javascipt 的上榜是毫不意外的, 但有一种文件我事先没有想到,那就是 .PO (开源项目常用的语言资源文件)。

对于 Django 和 Django-CMS 这两个项目, PO 代码数量甚至比 Python 代码还要多。大概看了一下,Django 支持 90 种以上的语言,这也无怪乎语言文件的数量如此之多了。


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31530319/viewspace-2221104/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2018-04-06

  • 博文量
    26
  • 访问量
    19784