数据科学家的VSCode工作流搭建完整指南

31次阅读

vscode 做数据科学的关键是打通 python、jupyter、git、sql 和调试环节：用 venv + pyproject.toml 隔离复现环境；Jupyter Kernel 绑定项目环境并禁用远程服务；Git 通过 .gitignore 和 nbdime 精准管理代码与 notebook；配合 black 格式化、SQLTools 查询及原生调试提升效率。

用 VSCode 做数据科学，关键不是装一堆插件，而是让 Python、Jupyter、Git、SQL 和调试几个环节真正串起来，不卡顿、不丢上下文、能复现。

Python 环境：隔离 + 可复现

别用系统 Python 或全局 pip。每个项目配独立虚拟环境，推荐 venv + pyproject.toml 管理依赖：

终端里运行 python -m venv .venv 创建环境
在项目根目录放 pyproject.toml，写明 Python 版本和依赖（用 [project.dependencies]）
VSCode 自动识别 .venv 文件夹，按 Ctrl+Shift+P → “Python: select Interpreter” 指向 .venv/bin/python（macOS/linux）或 .venvScriptspython.exe（windows）
安装包统一用 pip install -e .（可编辑模式），改了代码不用重装就能 import

Jupyter 工作流：本地 Kernel + 轻量笔记

VSCode 内置 Jupyter 支持已很成熟，重点是让它跑在你自己的环境里，而不是默认的“Jupyter Server”：

确保已激活项目虚拟环境后，在终端运行 pip install ipykernel，再执行 python -m ipykernel install --user --name myproject --display-name "Python (myproject)"
新建 .ipynb 文件，点击右上角 Kernel 选择刚注册的名字，这样所有 import 和变量都走你项目的依赖
禁用自动启动远程 Jupyter Server（设置里搜 jupyter.enableRemote，关掉）
写探索性代码优先用 .ipynb，逻辑稳定后及时拆成 .py 模块，避免 notebook 越来越重

Git 集成：跳过中间层，直接管好数据与输出

VSCode 的 Git ui 足够用，但数据项目容易误提交大文件或中间结果：

Claude

Anthropic发布的与ChatGPT竞争的聊天机器人

1166

查看详情

根目录加 .gitignore，至少包含：__pycache__/、.venv/、data/raw/（原始数据）、outputs/、*.ipynb（或用 nbdime 差分，见下条）
想保留 notebook 版本对比？装官方插件 nbdime，它能让 Git diff 显示 cell 级别变更，而不是一整段 jsON
敏感配置（如 API keys）绝不硬编码，用 .env + python-dotenv 加载，把 .env 加进 .gitignore
Commit 前养成习惯：看一眼源码管理侧边栏，确认只选中了该提交的改动

效率增强：小配置，大不同

几个不显眼但每天省 10 分钟的设置：

格式化统一：装 black 或 ruff，在 VSCode 设置里搜 “format on save”，勾选；再设默认格式化工具为 black（需 pip install black）
SQL 快速查看：装 SQLTools 插件，连 sqlite / postgresql，右键 SQL 文件可直接“Run Query”，结果以表格展示
快速调试：在 Python 文件里打 F9 设断点，F5 启动调试；对 notebook，点 cell 左侧的 ▶️ 小图标即可单 cell 调试，变量面板实时显示
终端联动：设置终端默认为 bash/zsh（非 PowerShell），并开启“split terminal”，一边跑训练，一边查日志或 git status

基本上就这些。不需要追求插件数量，核心是环境干净、Kernel 可控、Git 不踩坑、操作有反馈。搭好一次，后续新项目复制粘贴配置，十分钟内就能开工。

发表于：开发工具

2025-12-07

复制链接

vscode代码折叠功能出错怎么办_vscode修复代码折叠功能教程

VSCode的Settings Profiles功能详解

sublime怎么在侧边栏显示git状态_Sublime侧边栏Git状态显示配置指南

怎样在VSCode中为React项目启用Emmet缩写_如何提高JSX编写效率【教程】

sublime如何将当前文件与版本库对比_sublime GitGutter差异查看

数据科学家的VSCode工作流搭建完整指南

Python 环境：隔离 + 可复现

Jupyter 工作流：本地 Kernel + 轻量笔记

Git 集成：跳过中间层，直接管好数据与输出

效率增强：小配置，大不同

如何在 JSON-RPC 方法中获取 WebSocket 连接上下文信息

为全站启用全局平滑滚动效果的完整实现指南

如何正确实现价格输入框的本地化格式化（如法语空格分隔）

Phpstorm怎样配置PHP错误级别_Phpstorm配置PHP错误级别途径【分享】

mysql触发器适合做审计日志吗_mysql设计实践分析

Vue 中实现 v-list-item 点击高亮的完整方案

composer怎么在离线环境自建库_composer内网镜像分发方法

Golang单例模式(Singleton)实现_Sync.Once的优雅方案

CSS块级元素与行内元素的盒模型差异_为什么高度不生效

mysql如何设置mysql防火墙和权限_mysql安全配置教程