项目管理 | 笔记

根据应用开发指南，实践到具体项目中。

Flask + MySQL + Redis + Celery + Gunicorn + Nginx + PDM + Docker + Github Actions

开发环境搭建
- 开发工具 - WSL2 Python IDE
  - IDE 扩展和配置
- 版本控制 - Git
  - commit message: 满足 Conventional Commits 规范（基于 Angular Commit Guidelines）
  - Semantic version: https://semver.org/
  - changelog: https://keepachangelog.com/en/1.1.0/
  - 用到的工具 commitizen 或 czg
  - .gitignore
- 容器环境 - Docker
  - Dockerfile
  - compose.yaml
  - .dockerignore
- 依赖管理 - PDM

开发流程

版本控制（git）

git init
git add .
git commit -m "msg"
git remote add origin <url>

依赖管理

pdm init -n
pdm add flask
pdm add -d ruff black

文档管理（document）
质量管理（workflow）

业务开发
- 基础知识
- 统一环境变量
- 模块化（分层组织、协议约束）
- 数据流向（数据驱动，根据数据的流动来构思框架）
持续优化
- 并行、
- 异步、
- 调度、
- 池化、
- 分层、
- 缓存。

Install Backing Services

使用 docker compose 搭建本地开发后端服务支持。

MySQL
Redis
Celery
Nginx
Meilisearch

开发规范

Project Structure

对于应用程序使用 flat layout 更合适，如果作为包发布可能 src layout 更好。about

Project Structure

project_root/
┣ .venv/                        # virtual environment
┣ .vscode/                      # vscode settings
┃ ┣ extensions.json
┃ ┗ settings.json
┣ app/                          # application code
┃ ┣ __init__.py
┃ ┗ app.py
┣ compose/                      # docker compose files
┃ ┣ mysql/
┃ ┃ ┗ my.cnf
┃ ┣ nginx/
┃ ┃ ┣ Dockerfile
┃ ┃ ┗ nginx.conf
┃ ┣ redis/
┃ ┃ ┣ Dockerfile
┃ ┃ ┗ redis.conf
┃ ┗ web/
┃ ┃ ┣ celery/
┃ ┃ ┃ ┣ beat/
┃ ┃ ┃ ┃ ┗ start.sh
┃ ┃ ┃ ┣ flower/
┃ ┃ ┃ ┃ ┗ start.sh
┃ ┃ ┃ ┗ worker/
┃ ┃ ┃ ┃ ┗ start.sh
┃ ┃ ┣ Dockerfile
┃ ┃ ┗ entrypoint.sh
┣ docs/
┣ .env                       # environment variables
┣ CHANGELOG.md
┣ CONTRIBUTING.md
┣ LICENSE
┣ README.md
┣ compose.yaml               # docker compose entry point
┣ pdm.lock
┗ pyproject.toml                # dependency management

┣ app/
┃ ┣ core/                       # base app logic
┃ ┃ ┣ config.py
┃ ┃ ┣ exceptions.py
┃ ┃ ┣ log_config.py
┃ ┃ ┗ __init__.py
┃ ┣ util/                       # app specific tasks
┃ ┃ ┣ do_thing.py
┃ ┃ ┣ do_other_thing.py
┃ ┃ ┗ __init__.py
┃ ┣ main.py                     # entry point to application
┃ ┗ __init__.py
┣ tests/                        # tests live outside application

Code Style

规范：

PEP 8 – Style Guide for Python Code
- .editorconfig
- naming
  - 单数、小写（常量大写）
  - 连字符：- or _
  - 尽可能全称
Google Docstrings Style
Optional Spelling

工具

black formatter
ruff linter
VS Code plugis - autoDocstring docstrings

Static Type Checking

规范：

PEP 484 – Type Hints 在 PEP3107 基础上规范 type hint 标准语义。2014.9.29
- PEP 593 – Flexible function and variable annotations 使用一个特定于上下文的元数据包装现有类型，Annotated[T, x] T作为静态类型检查，x作为运行时实际值。2019.4.26 3.9
- PEP 613 – Explicit Type Aliases 显示类型别名 2020.1.21 3.10

工具：

mypy static type checker for Python
pyright/pylance another static type checker for Python，与 vscode 集成(pylance)。

Type Hints 将动态的Python语言有了静态类型检查的能力，这对于在编码阶段发现bug，提高代码可读性，IDE自动补全等都有很大的帮助。但是，Type Hints并不会影响运行时的行为，也就是说，Type Hints只是一种静态检查，而不是强制性的类型约束。不过，pydantic这个库可以将Type Hints转换成强制性的类型约束，这样就可以在运行时强制检查类型了。

RESTful API

遵循 RESTful API，考虑以下内容：

版本：/api/v1/
资源：URI表示某一资源
动作：HTTP方法表示对资源的操作
数据：JSON格式数据(请求和响应)
状态码：HTTP状态码表示请求结果
认证：OAuth 2使用了承载令牌(Bearer tokens) 并且依赖于SSL的底层传输加密。
缓存：ETag和Last-Modified
错误

异常处理

错误处理：定义常见错误码和错误信息，使得应用在出现错误时能够快速响应并给出明确的错误提示信息。

Flask 内部错误（HTTPException），通过 errorhandler形式转换成dict，从而可以 json 化。
手动触发自定义错误（APIException），类似手段，自动化处理成 JSON 格式。
调用第三方产生错误。TODO

全局 json 处理异常处理

python

# 1. 拦截函数处理 make_response，在真正处理 rv之前将返回的data转换成 JSON Response。
# 2. 替换app.json.proverder.dumps ，处理那些不支持的数据类型，比如 pydantic 的 BaseModel。也可以直接将内置json替换成为 orjson。
# 3. 处理其它，在json中没有处理的类型，比如Exception，因为 Flask 提供了错误处理装饰器，所以还是按照其逻辑处理
# 3.1 app.errorhandler(HTTPException) 使其data返回 dict 类型
# 3.2 自定义错误，app.errorhandler(APIException)，也将 data 返回 dict 类型
class OrJSONProvider(JSONProvider):
    def dumps(self, obj: t.Any, **kwargs: t.Any) -> str:
        try:
            res = orjson.dumps(obj)
        except Exception:
            # deal with other type
            if isinstance(obj, ToDictLike):
                res = orjson.dumps(obj.dict())
            if isinstance(obj, ToAsDictLike):
                res = orjson.dumps(obj.as_dict())
            raise
        return res.decode()

    def loads(self, s: str | bytes, **kwargs: t.Any) -> t.Any:
        return orjson.loads(s)

class APIFlask(Flask):
    json_provider_class = OrJSONProvider

    def make_response(self, rv: ResponseReturnValue) -> Response:
        """change to json Response"""
        if isinstance(rv, tuple):
            data, *other = rv
            rv = self.json.response(data), *other  # type: ignore
        elif not isinstance(rv, Response):
            rv = self.json.response(rv)

        return super().make_response(rv)

python

# 自定义异常
class APIException(Exception):
    code: int = 500
    error_code: int = 10000
    message: str = "内部错误"

    def __init__(self, code: int | None = None, error_code: int | None = None, message: str | None = None) -> None:
        if code is not None:
            self.code = code
        if error_code is not None:
            self.error_code = error_code
        if message is not None:
            self.message = message
        super().__init__()

    def dict(self) -> dict[str, t.Any]:
        return {
            "code": self.code,
            "error_code": self.error_code,
            "message": self.message,
        }
# 之后将其注册到errorhandler，通过 error.dict()将data转换成dict即可。

Details

Flask 2.2+ 在内部实现了返回 dict 和 list 时的自动 json 化，但对于更多类型没有支持，需要黑魔法支持一下——在解析返回值（app.make_response）之前，全部将返回数据变成 dict 或者 list。

str、int、byte -> dict
HTTPException -> dict
Pydantic BaseModel -> dict

参数校验

日志来源：Flask、werkzeug、Gunicorn等。需要将这些都统一取消后使用自定义的日志。
日志形式：自定义两种日志：access_log(请求记录)、error_log(错误收集、主动触发)。
日志级别：INFO、WARNING、ERROR。
日志格式：时间、请求信息、错误信息、堆栈信息等。
日志输出：控制台（开发）、文件（生产）。

缓存对象：对象缓存、函数缓存
缓存策略：缓存时间、缓存大小
缓存位置：本地缓存、redis缓存
缓存安全：缓存击穿、缓存穿透

核心概念：

Model：定义缓存对象（value）
Node：定义缓存大 key，相对于普通的字符串 key，Node 除了key()来确定字符串key外，还包括了指定缓存位置和缓存时间，并负责从后端数据库获取 Model
- storages：指定存储后端: ["local", {"storage": "redis", "ttl": timedelta(seconds=120)}]，按顺序获取，后端必须注册到 Manager 中
- key()：定义key
- load()：缓存不存在时加载函数
Storage：缓存后端，负责存储和获取缓存对象
Manager：缓存管理器，负责操作 Node
- register_storage(name, Storage) 注册后端存储
- all_storage：{"key": Storage} 所有已注册的后端存储
- serializer: JSONSerializer 指定序列化方式，目前只有 JSONSerializer
- get(node)：通过 node 获取缓存对象
- remove(node, storage_name)：从指定后端删除缓存

Manager 的 get 方法通过同步锁避免缓存击穿，即当缓存不存在时，只有一个线程会去加载数据，其它线程会等待，直到缓存加载完成。

cache

TODO list：

[ ] 缓存穿透使用布隆过滤器
[ ] 错误处理，参数校验

后台任务

Celery

搜索服务

Meilisearch

短信服务

https://cloud.tencent.com/document/product/382/43196

通知服务

Websocket

静态资源

自动化

包括 pre-commit、CI/CD 等。

pre-commit

在提交代码前，自动运行一些代码检查工具，如：black、ruff、mypy，如果检查失败，则不允许提交。

pip install -d pre-commit

.pre-commit-config.yaml

yaml

repos:
  - repo: https://github.com/pre-commit/pre-commit-hooks
    rev: v4.4.0
    hooks:
      - id: trailing-whitespace
      - id: check-yaml
      - id: end-of-file-fixer
  - repo: https://github.com/charliermarsh/ruff-pre-commit
    rev: v0.0.274
    hooks:
      - id: ruff
        args: [--fix, --exit-non-zero-on-fix]
  - repo: https://github.com/psf/black
    rev: 23.3.0
    hooks:
      - id: black
        args: [--check]
  - repo: https://github.com/RobertCraigie/pyright-python
    rev: v1.1.314
    hooks:
      - id: pyright

安装 hooks

pdm run pre-commit install

手动触发

pdm run pre-commit run --all-files

大部分时候只需要在 commit 时自动运行。

format commit

commit 信息格式化，如：feat: add new feature。也可以交给自动化工具。目前选择的是 https://www.conventionalcommits.org/en/v1.0.0/ 规范

commitizen 是一个集成了 git cz 的工具，可以帮助我们生成符合规范的 commit message，同时也可以帮助我们生成 changelog，还可以帮助我们自动检查 commit message 是否符合规范。

交互式生成 commit message （cz commit）
- git commit 不会有交互式界面
- cz commit 会提示需要填写的信息
自动检查 commit message 是否符合规范（使用 pre-commit） https://commitizen-tools.github.io/commitizen/tutorials/auto_check/#automatically-check-message-before-commit
暂时不需要版本管理，生成 changelog （cz bump）和发布相关内容

CI/CD

CI: 向远程仓库提交代码后，自动运行测试、计算代码覆盖率、构建文登等
CD：部署网站、发布包等

这里使用 Github Actions 工具实现。

.github/workflows/ci.ymltest.ymldoc.ymlanalysis.yml

yaml

name: CI
on:
  push:
    branches: [main]
  # 允许手动触发
  workflow_dispatch:
jobs:
  build:
    strategy:
      fail-fast: false
      matrix:
        python-version: ['3.11']
        pdm-version: [2.4.7]
        os: [ubuntu-latest]
    runs-on: ${{ matrix.os }}
    steps:
      - name: Checkout Repository
        uses: actions/checkout@v3
      - uses: actions/setup-python@v4
        with:
          python-version: ${{ matrix.python-version }}
      - name: Check by pre-commit
        uses: pre-commit/action@v3.0.0

yaml

name: Test
on: [push]

jobs:
  test:
    name: Testing
    strategy:
      fail-fast: false
      matrix:
        python-version: ['3.11']
        pdm-version: [2.7.4]
        os: [ubuntu-latest]
    runs-on: ${{ matrix.os }}
    steps:
      - uses: actions/checkout@v3
      - name: Set up PDM (with Python)
        uses: pdm-project.setup-pdm@v3
        with:
          python-version: ${{ matrix.python-version }}
          version: ${{ matrix.pdm-version }}
      - name: Install dependencies
        run: |
          pdm sync -d -G test
      - name: Run Test
        run: |
          pdm run pytest --cov=./ --cov-report=xml tests
      - name: Upload coverage to Codecov
        uses: codecov/codecov-action@v3

yaml

name: Deploy Doc
on:
  push:
    branches:
      - main
  workflow_dispatch:
jobs:
  deploy:
    strategy:
      matrix:
        python-version:
          - 3.11
        pdm-version:
          - 2.7.4
        os:
          - ubuntu-latest
    runs-on: ${{ matrix.os }}
    permissions:
      pages: write
      id-token: write
    environment:
      name: github-pages
      url: ${{ steps.deployment.outputs.page_url }}
    steps:
      - name: Checkout Repository
        uses: actions/checkout@v3
        with:
          fetch-depth: 0
      - name: Set up PDM (with Python)
        uses: pdm-project/setup-pdm@v3
        with:
          python-version: ${{ matrix.python-version }}
          version: ${{ matrix.pdm-version }}
      - name: Install dependencies
        run: pdm sync -d -G doc
      - name: Build Site
        run: pdm run mkdocs build
      - name: Enable Pages App
        uses: actions/configure-pages@v3
      - name: Packaging and Uploading to Stage
        uses: actions/upload-pages-artifact@v1
        with:
          path: site
      - name: Deploy from Stage
        id: deployment
        uses: actions/deploy-pages@v2

yaml

# find security vulnerabilities
name: Code Scanning - CodeQL

on:
  push:
    branches: [main]
  pull_request:
    branches: [main]
  schedule:
    - cron: '11 1 * * 6'

jobs:
  analyze:
    name: Analyze
    runs-on: ubuntu-latest
    permissions:
      actions: read
      contents: read
      security-events: write

    strategy:
      fail-fast: false
      matrix:
        language: [python]

    steps:
      - name: Checkout repository
        uses: actions/checkout@v2

      - name: Initialize CodeQL
        uses: github/codeql-action/init@v2
        with:
          languages: ${{ matrix.language }}

      - name: Perform CodeQL Analysis
        uses: github/codeql-action/analyze@v2

References

https://www.pythonbynight.com/blog/starting-python-project 项目布局
https://py-pkgs.org/04-package-structure 关于 src 布局，还有开发规范介绍
https://scikit-hep.org/developer 另一个开发规范介绍
https://realpython.com/docker-continuous-integration/#dockerize-your-flask-web-application Docker 环境
https://keepachangelog.com/zh-CN/1.0.0/ 维护 changelog
https://builtwithdjango.com/blog/improve-your-code-with-pre-commit

Install Backing Services

开发规范

Project Structure

Code Style

Static Type Checking

API 规范

RESTful API

异常处理

参数校验

统一日志

缓存设计

后台任务

搜索服务

短信服务

通知服务

静态资源

自动化

pre-commit

format commit

CI/CD

References

Install Backing Services ​

开发规范 ​

Project Structure ​

Code Style ​

Static Type Checking ​

API 规范 ​

RESTful API ​

异常处理 ​

参数校验 ​

统一日志 ​

缓存设计 ​

后台任务 ​

搜索服务 ​

短信服务 ​

通知服务 ​

静态资源 ​

自动化 ​

pre-commit ​

format commit ​

CI/CD ​

References ​

Install Backing Services

开发规范

Project Structure

Code Style

Static Type Checking

API 规范

RESTful API

异常处理

参数校验

统一日志

缓存设计

后台任务

搜索服务

短信服务

通知服务

静态资源

自动化

pre-commit

format commit

CI/CD

References