加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

简单有效地提高代码质量!

发布时间:2021-03-07 14:42:10 所属栏目:外闻 来源:互联网
导读:、tn、clf、reg、xi、yi、ii这样的变量名和许多未命名的常量值。坦率地说,数据科学家(包括本人)并不擅长于命名变量。 很多人经历过从为一次性分析编写研究导向的数据科学代码到编写生产水平代码的过程,所以不得不摒弃从数据科学书籍、课程和实验室中获得的




、tn、clf、reg、xi、yi、ii这样的变量名和许多未命名的常量值。坦率地说,数据科学家(包括本人)并不擅长于命名变量。

很多人经历过从为一次性分析编写研究导向的数据科学代码到编写生产水平代码的过程,所以不得不摒弃从数据科学书籍、课程和实验室中获得的实践来改进编程方式。可实际应用的机器学习代码与数据科学家的编程方法有许多不同之处,但本文将从两个影响力较大的常见问题开始:

  • 无用的/混淆的/不明确的变量名
  • 未命名的“魔幻”常数

这两个问题都导致了数据科学研究(或Kaggle项目)和生产机器学习系统之间的脱节。是的,你可以在只运行一次代码的Jupyter Notebook中侥幸逃脱这些问题,但是当任务中关键的机器学习管道需要每天准确无误地运行数百次时,编写可读以及可理解的代码就十分必要了。幸运的是,数据科学家可以采用软件工程中的优秀实践,本文也将对其进行介绍。

注意:本文主要讨论Python,因为它是目前为止工业数据科学中应用最广泛的语言。在Python中:

  • 变量名/函数名小写并且用下划线隔开
  • 命名常数的名称全部大写
  • 类的名称采用驼峰式大小写命名规则

命名变量

命名变量时要记住三个基本原则:

  • 变量名必须描述变量所表示的信息。变量名应该用词明确,来体现变量代表的内容。
  • 代码读取的次数将多于编写的次数。所以优先考虑代码的可读性而不是编写速度。
  • 采用标准的命名规范,才可以做出一个全局决策,而不是做出多个局部决策。

在实践中又如何呢?下面对变量名进行一些改进:

  • x和y。如果多次阅读了解的话会知道它们是特性和目标,但是对于阅读代码的其他开发人员来说,这可能并不明确。相反,要使用可以描述这些变量含义的名称,如house_features和house_prices。
  • value。value代表什么?它可以是velocity_mph, customers_served, efficiency, revenue_total。像value这样的名称并不能体现变量的用途,而且容易混淆。
  • temp。即使只将变量用作临时值存储,也要给它一个有意义的名称。这可能是用于转换单位的值,因此在这种情况下,请明确说明:

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读