news 2026/6/12 8:27:27

如何使你的数据科学/机器学习工程师工作流程更有效

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何使你的数据科学/机器学习工程师工作流程更有效

原文:towardsdatascience.com/how-to-make-your-data-science-ml-engineer-workflow-more-effective-4f857c36bbc1

任何从事编程工作的人都需要一个有效的流程。许多任务都很耗时,你希望尽可能多地自动化以减少手动工作。在这篇文章中,我讨论了我最近如何作为一个数据科学家更新我的工作流程,从使用 Jupyter 笔记本转向使用 VS Code 交互式窗口。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3d3af8e48c80d9b57c3b44f0844b688c.png

本文讨论了如何使用 VS Code 交互式窗口来优化你的数据科学/机器学习工程工作流程。图片由 ChatGPT 提供

为了展示新的工作流程,我将使用一些简单的代码来突出如何使用新的工作流程更快地工作。然而,你应该注意,我认为新工作流程的好处随着项目的复杂度增加而增加。当项目变得更大时,Jupyter 笔记本的问题就会增多,更难对你的数据进行概述。因此,我认为我在本文中展示的工作流程的好处将随着实际项目而增加。我将在整篇文章中使用图片和视频来直观地展示如何使用 VS Code 交互式窗口。我写这篇文章的灵感来自 Dave Ebbelaar 的这个 YouTube 视频(https://www.youtube.com/watch?v=qFvInA7DKuE&t=395s),关于他如何停止使用 Jupyter Notebook。

目录

· 动机 · 使用 VS Code 交互式窗口 ∘ 设置 ∘ 好处 · 结论

动机

我写这篇文章的动机是,作为一个数据科学家,我一直在寻找改进我工作方式的方法。我认为在我的工作中,保持对最新趋势的了解至关重要,无论是跟上最新的机器学习模型,使用新的 IDE 如 Cursor,还是通过使用交互式窗口来改进我的工作流程。因此,在这篇文章中,我分享了我在数据科学相关项目中最近的工作流程变化,从在 Jupyter 笔记本中工作到使用 VS Code 中的交互式窗口。改变工作流程后,我在编写代码和实验方面变得显著更有效率,这对于你想要在数据科学项目中取得成功至关重要。

使用 VS Code 交互式窗口

设置

要开始使用 VS Code 中的交互式窗口,你必须在设置中激活它。打开 VS Code 的设置,搜索 Jupyter 交互式窗口,并启用表示“按 shift+enter 时,发送所选代码”的复选框。下面是一个设置图片的示例:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/950016c6becd04dad6caede266d25ab4.png

在 VS Code 中激活交互式窗口设置的图片。图片由作者提供。

现在,你已经准备好使用交互式窗口了。打开一个 Python 文件,标记你想要运行的代码,然后按住 shift 键并按下 enter 键。只有标记区域内的代码会被运行,并且变量会被存储。这允许你直接从 Python 文件中工作,同时获得使用 Jupyter Notebooks 的大部分好处。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5b834cb2011850016a7092f5c6d938e6.png

此图片展示了我标记了左侧所有代码并按下 shift enter 后的 VS Code 视图。这打开了右侧的交互式窗口,运行了你所选的所有代码(你只看到第一行,但你也可以扩展该行,如图片下方所示。图片由作者提供。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/61e37828ddf1c1147f63ecf2f75e9113.png

展示如何扩展运行单元格以增强清晰度的图片。图片由作者提供。

现在,变量ab已经被定义,例如,为了理解加法函数的工作原理,我可以通过按行标记第 5 行,按下 shift enter,然后只标记单词 result 来打印出结果值。请注意,在这个例子中,函数非常容易理解,但随着你处理更复杂的编程,这会非常有用,便于轻松理解和调试函数。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8cd45c315ec5354884c0b383151444e5.png

运行第 5 行,定义变量 result 后,标记变量 result,并运行它以查看变量的值。图片由作者提供。

你可以在这里使用的另一个有用功能是打开终端窗口(在 Windows 上使用 ctrl+j,在 Mac 上使用 cmd+j)。然后,你可以选择 Jupyter 标签来查看所有变量的值。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/39a07d08bd778b80a33a36e9329a3b52.png

在底部打开 Jupyter 终端后的我的 VS Code 视图,以查看所有变量的值。这有助于快速检查所有变量的值,便于轻松调试和理解代码。图片由作者提供。

您可以观看以下我解释的视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.loom.com%2Fembed%2F1e5ec8dec00e40be9ccc6f4e130cf810&display_name=Loom&url=https%3A%2F%2Fwww.loom.com%2Fshare%2F1e5ec8dec00e40be9ccc6f4e130cf810%3Fsid%3Dace6f471-ca4a-42f7-8555-a05537cfb18a&image=https%3A%2F%2Fcdn.loom.com%2Fsessions%2Fthumbnails%2F1e5ec8dec00e40be9ccc6f4e130cf810-d3135cc5319d4086.gif&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=loom

优点

使用交互式窗口有许多好处。以下列出了主要优点:

  • 更快。我认为使用交互式窗口比使用 Jupyter 笔记本工作更快。你不需要创建单元格;你可以简单地标记代码并运行它。例如,要打印变量,你只需要选择变量并按 shift enter 键,而不是创建一个新的单元格,编写变量名,然后运行单元格。

  • 更干净的代码。我认为在 .py 文件中编写代码通常迫使你编写更干净的代码,例如,通过尽可能多地使函数模块化。Py 文件通常也比 Jupyter 笔记本更容易阅读。

  • 生产就绪。在 Py 文件中编写代码意味着你的代码已经准备好推送到生产环境,这样可以节省更多时间。

结论

在这篇文章中,我讨论了您如何使用 VS Code 交互式窗口来提高作为数据科学家或机器学习工程师的工作流程效率。我发现从 Jupyter 笔记本切换到交互式窗口后,生产力显著提升,因此我认为这绝对是一个值得尝试的改变。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 1:24:36

PaddlePaddle镜像与AutoDL结合:自动化训练新体验

PaddlePaddle镜像与AutoDL结合:自动化训练新体验 在AI项目落地的现实场景中,开发者常常面临一个尴尬局面:模型设计得再精巧,一旦进入部署阶段,却因“环境不一致”“依赖冲突”“调参靠玄学”等问题导致训练失败。尤其在…

作者头像 李华
网站建设 2026/5/31 2:36:58

AgentScope的主要开源竞品框架对比

AgentScope的主要开源竞品框架对比 AgentScope是阿里推出的企业级多智能体管控框架,专注于多智能体协作与企业级应用开发。以下是其主要开源竞品框架,按定位和技术特点分类: 一、国内大厂开源的多智能体管控框架 1. JoyAgent-JDGenie&#xf…

作者头像 李华
网站建设 2026/5/29 21:06:49

对传入的 x , y 两个数组做折线图, x 对应 x 轴, y 对应 y 轴。并保存到 Task1/image1/T2.png

本文介绍了使用Python的Matplotlib库绘制折线图的方法。代码展示了如何创建图形对象、设置尺寸为(10,10),绘制带标记点和连接线的折线图,并添加标题、坐标轴标签和网格线。最后将图形保存为PNG文件并释放内存。该示例演示了数据可视化的基本流程&#xf…

作者头像 李华
网站建设 2026/6/10 16:07:11

Fritzing中Arduino电路设计:新手教程(零基础入门)

从零开始用 Fritzing 设计 Arduino 电路:新手也能看懂的实战指南 你有没有过这样的经历?脑子里有个酷炫的电子点子——比如做个自动浇花系统,或者一个会随音乐闪烁的灯带。可一想到要画电路图、接线、搞不清哪个引脚连哪里,顿时就…

作者头像 李华
网站建设 2026/6/10 22:46:23

当大厂以生态碾压:Rokid Glasses的“用户共创”护城河还牢靠吗?

出品 | 何玺排版 | 叶媛2025年,坚持“用户共创”的Rokid Glasses强势领跑智能眼镜赛道。年初,凭借创始人祝铭明“发言稿就在我的眼镜里”的脱稿演讲引爆关注,随后在CES、WAIC等国际展会频频出圈,产品力获全球认可。Rokid Glasses首…

作者头像 李华
网站建设 2026/6/10 17:01:54

Java计算机毕设之基于springboot的旅拍在线婚纱摄影网站的设计与实现订单对接旅拍路线、筛选摄影风格、预约拍摄服务(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华