如何在VSCode中使用Jupyter Notebook进行数据分析?【教程】

13次阅读

vscode中正确配置jupyter Notebook需四步:一、手动指定jupyter可执行文件路径;二、统一python解释器与内核环境;三、用%matplotlib inline避免图形渲染问题;四、规范变量命名并预检数据加载,防止内核崩溃。

如何在VSCode中使用Jupyter Notebook进行数据分析?【教程】

VSCode 里用 Jupyter Notebook 做数据分析,核心不是装插件就完事——得让 jupyter 内核真正被识别、能连上、且不卡在依赖冲突或路径错误上。

确认 Python 环境和 jupyter 可执行文件位置

VSCode 不自动继承系统终端的 PATH,常导致它找不到 jupyter 命令。先在终端运行:

which jupyter

windows 上:

where jupyter

拿到路径后,在 VSCode 设置里搜 jupyter.jupyterCommand,填入完整路径(例如 /opt/anaconda3/bin/jupyterC:UsersAliceAnaconda3Scriptsjupyter.exe)。否则即使装了插件,新建 notebook 也会报 command 'jupyter.runCell' not found

选择正确的 Python 解释器和内核

Ctrl+Shift+PmacOS 是 Cmd+Shift+P),输入 Python: select Interpreter,选你装了 pandasnumpymatplotlib 的环境(比如 conda env 或 venv)。然后打开一个 .ipynb 文件,右上角点击内核选择器(显示类似 Python 3.11.5 ('myenv': conda)),确保它和上面选的解释器一致。常见坑:pip install jupyter 在 base 环境,但 VSCode 用了虚拟环境,结果 kernel 启动失败,报 No module named 'ipython'

处理 matplotlib 图形不显示或弹窗卡死

默认后端可能触发 GUI 阻塞。在 notebook 第一个 cell 运行:

%matplotlib inline

而不是 %matplotlib widget%matplotlib qt。如果非要交互式,需额外装 ipympl 并重启内核:

pip install ipympl
jupyter nbextension enable --py --sys-prefix ipympl

但注意:ipympl 在 VSCode 的 Remote-ssh 或某些 linux 桌面环境下可能无法渲染,此时老实用 inline 最稳。

避免变量名冲突和 kernel 意外重启

VSCode 的 notebook 默认共享 kernel,但「Run All Cells」时若某 cell 报错(比如 NameErrorMemoryError),后续 cell 可能因变量未定义而连锁失败。建议:

  • 写分析前先清空所有变量:加一个 cell 运行 %reset -f
  • 避免用 dfdata 这类泛化变量名,改用带业务含义的(如 sales_q3_2024
  • 大文件读取加 low_memory=Falsenrows=1000 快速试跑,别一上来就 pd.read_csv('huge.csv')

内核崩溃往往不是 VSCode 的问题,而是 pandas 版本和 numpy 不兼容,或者某个 cell 里写了无限循环 —— 这些细节比界面操作更决定你能不能把分析跑通。

text=ZqhQzanResources