本文目的
『动态类型一时爽,代码重构火葬场』,说的是:动态语言在初期开发比较爽,但是到后期维护起来比较困难。Python 作为动态语言之一,自然也会有这样的缺点。其实说『火葬场』,也没有那么严重,只要严格的遵守一组规范,也能做到『重构的时候,也一样爽』。
不以规矩不成方圆,规范自然是十分重要的,而在动态语言中,尤其重要(很多人拿Python写脚本,基本是随心所欲地写,自然后期维护困难)。所谓『兵马未动粮草先行』,我们应该在写代码前,就做好充足的 “表面功夫”。
本文不涉及哪些
不做『文档复读机』。PEP 8中已经有了的,就不重复了,复述一些“低级(大家都知道了的)” 内容,没啥意思。
不迷信权威,这里指『Google Python Guide』,那是适合Google的规范,并不是社区规范,其实我觉得这份规范既不完整,同时,净是一些『众人皆知』的内容,并不推荐之。
不搞宗教信仰,奉承实用主义。比如典型的『import this』,只有我一个人觉得不过是一堆空洞的废话吗,况且 Python 标准库中很多地方,也没有做到『import this』 中的『simple, explicit, and powerful』。每次各种文章(无节操的营销文章,以各种培训机构为主体)提及这个东西,我真是浑身不自在&尴尬(写代码是很工程很严肃的事情,搞这种玄学干嘛呢)。
适用范围 & 原则
- Python 2.7 - Python 3.x 。虽然官方宣布了 Python 2的寿命是2020,而且似乎现在 Python 3已经是主流了。但是同学,legacy code 可不是说去掉就去掉的,Python 2仍然会存在相当长一段时间。况且,Python 3 有相对于 Python 2 的 『killer feature』 吗,并没有。
- 以 PEP 8 为蓝本,紧紧团结在 PEP 8 周围。任何非官方的文档,只是参考之(同理,本文亦是某种参考资料)。
- PEP 8 已经有了的,就不要重复了。
规范
【强制 + 强制】【挑选『静态检查』工具,并自始至终都严格使用】
简单来说,就是:1. Pylint2. Flake83. pytest一开始就要使用,并且从严使用(发点时间了解这几个工具,带来的收益是无限的,如果你是比较正式的项目的话)。复制代码
【强制+】【多写UT】
其他编程语言,同理。有一份UT在手,重构起来,心里放心很多。Python的话,只需要了解unittest就够了,pytest也可以。复制代码
【强制】【文件编码 & Unicode】
PS:下面这几条,能帮你避免很多无聊的编码解码问题,所以我觉得很重要
- 使用 4 空格缩进,禁用任何 TAB 符号
- 源码文件使用 UTF-8 无 BOM 编码格式
- 总是使用 Unix \n 风格换行符
- 在每一个 py 文件头,都添加如下内容:
#!/usr/bin/env python# -*- coding: utf-8 -*-# # 只导入 future 空间的这两个特性就够了,其他特性容易造成其他方面的『不兼容』,没有使用的必要性。from __future__ import (absolute_import, unicode_literals)所以,你需要了解 editorconfig 这个东西,从根源上统一规范,不符合规范的,直接拒绝 PUSH or MERGE复制代码
###【强制】【命名】
- class,function 该如何命名,不赘述,严格照着PEP8做就行了,不用多想。
- 全局变量(全局变量,一般是常量,我们认为:凡是全局的,都是常量),应该始终使用全大写,如:
GLOBAL_PUBLIC = "G1"_GLOBAL_PRIVATE = "G2"class Person: _GLOBAL_IN_CLASS = 'G3' 按照这条要求,其实很多库or开源库,都是不符合要求的。为什么这么强硬呢?Python中的变量定义,是不分『声明』、『定义』、『初始化』、『赋值』这几个概念的,所以一个a = 1如果没有上下文,你是很难确定其作用域的,也很难确定 这到底是初始化还是赋值(a已经存在过),如果全局变量还不用全大写,带来的麻烦只会更多。如果始终坚持这个原则,将会给代码的可读性带来极大提升。复制代码
【强制】定义枚举,始终加 Enum后缀;定义异常始终加Exception后缀;定义mixin,始终加Mixin后缀,如
class DirectionEnum: UP = 1 DOWN = 2 class MyException(Exception): passclass MyError(Exception): pass class SomeMixin: pass复制代码
【强制】【强化private的概念】
即:最小知识原则,对外暴露的东西越少越好翻译成大白话就是:1. 实例属性,一般定义成private的2. class,对外提供的方法越少越好3. module,对外提供的接口越少越好4. package,对外提供的 module 越少越好翻译成代码就是:1. 项目布局package/ __init__.py _private_mod.py public_mod.py 2. 某模块内容public_mod.pyPUBLIC_GLOBAL = 'G1'_PRIVATE_GLOBAL = 'G2'class _Class: passclass PublicClass: _PRIVATE_GLOBAL = 'G3' def __init__(self, name,age): self._name = name self._age = age def public_method(self): pass def _private(self): pass 所有东西,一开始就要定义成私有的,等到确实需要开放访问了,才开放出去。复制代码
【强制&重要】【关注公开接口的复杂性】
最好的接口是这样的,调用者无脑使用def interface(): pass 次等接口是这样的def interface(param1): pass 次次等接口是这样的def interface(p1, p2): pass最大忍受限度的接口是这样的def interface(p1, p2, p3='SOME DEFAULT'): passdef interface(p1, *args): pass 不可接受的接口是这样的def interface(p1, p2, **kwargs): pass令人无语的接口是这样的def interface(*args, **kwargs): # 尽量不要使用 **kwargs, 某些流行库有这样的毛病,我是觉得:极大地增加了调用者的心理负担,反映了接口设计者的懒惰 pass 一直觉得,**kwargs只适用于极少数明确的场合,并且需要辅以很明确的文档说明(解释为什么要使用),然而现实是,这个特性已经被大家滥用了,有必要单独说明之。复制代码
PS:我一直觉得,滥用 **kwargs 的API,几乎都不是好 API,无形增加心理负担。
【推荐】【以package去设计命名空间,而不是基于module】
【推荐】【了解如下内容】
__init__.py 的作用__main__.py 的作用if __name__ == '__main__': 的作用Python的命名空间加载机制,即:sys.path sys.modules 的内容复制代码
【推荐】【合理设计项目目录结构】
如果是使用某种框架(如Django),那么按照框架的规范来;如果是“非框架”项目,则按照如下结构project project/ __init__.py core/ utils/ constants/ __main__.py tests/ docs/ examples/ README.md .pylintrc .flake8 复制代码