原文:
towardsdatascience.com/my-honest-advice-for-someone-who-wants-to-become-a-data-scientist-1ecc018fb0b2
因此,我收到了许多请求建议和技巧的信息,希望进入数据科学领域。尽管我已经写了几篇文章,详细说明了我会遵循的路线图和流程,但我认为有时候听听残酷的真相也是好的。这就是为什么,在这篇文章中,我想给你们这些想要成为数据科学家的人提供我完整、真诚的建议。
注意:您还可以观看这篇博客文章的视频版本。
cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2Ffx5GP00IcHs%3Ffeature%3Doembed&display_name=YouTube&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3Dfx5GP00IcHs&image=https%3A%2F%2Fi.ytimg.com%2Fvi%2Ffx5GP00IcHs%2Fhqdefault.jpg&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=youtube
立即开始
我经常被问及是否应该使用平台 A或平台 B。在课程 X和课程 Y中,哪门课程更好?
我以前说过很多次,现在再说一次,这不重要。
任何大型课程提供商或高评级课程都会教你相同的东西,尤其是在初学者和入门级别。你用来决定选择哪门课程的时间,不如花在实际做工作上,这样会让你领先一步,推动你朝着目标前进。
同样,人们经常问我他们应该做什么项目。我的回答总是相同的:选择任何你喜欢的,然后去做。再次强调,浪费时间选择“正确”的项目是徒劳的,因为这样的东西是不存在的。你最好只是挑选一个项目并着手去做,你总是可以在以后改变或选择你更喜欢的另一个。
正如著名的名言所说
你无法驾驭一艘静止的船
或者,正如成功的企业家Noah Kagan所说:
现在,不是如何
如果您感兴趣,我已经写了一份我喜欢的数据科学和机器学习资源的完整列表。
📖 我最好的数据科学资源
这需要付出努力
几年前,你可以获得在线认证,可能几个月内就能找到工作,但现实已经不再是这样了。
在线认证可以帮助你学习数据科学和机器学习的内容,这非常宝贵。然而,它们现在很少能帮助你找到工作,尤其是在我们艰难的就业市场。
你必须做很多额外的工作,比如自我营销、创建作品集和完成几个高质量的项目,以在众多申请者中脱颖而出。你必须更加努力工作,这就是残酷的现实。
我知道“更加努力工作”远非有益,我并不提倡“拼命工作”的心态,但现在你必须投入比以前的数据科学家供应量增加呈指数更多的人的时间。
如果你有一份全职工作,你可能需要在下班后或周末晚上学习。如果你是学生,你需要在大学课程的同时参加课程。
需要做出牺牲,你可能需要为此做几个月,甚至在某些情况下可能需要一年,才能感到足够准备好申请工作。
我明白这对每个人来说可能都不切实际,我理解这一点。然而,如果你真的想从事数据科学,为了一个你将享受数十年的职业牺牲一两年似乎是一个明智的决定,但当然,我有所偏见!
如果你想详细了解如何让你的数据科学申请脱颖而出,请查看我之前的文章。
如何让你的数据科学申请脱颖而出
现在就开始使用数据吧
即使你可能需要在工作时间外学习,也要尽可能在你的当前角色中使用数据。这不仅会促进你的学习,还会帮助你决定数据科学职业是否适合你。
你可以从简单的工具如 Excel 开始,并将它们更多地融入你的日常任务中。通过实验复杂函数,你可以逐渐建立自信。你甚至可以用 Excel 探索 VBA,为你的技能集增加另一层熟练度,并更熟悉编程。
如果可能的话,你可以尝试学习一点 SQL 和 Python,因为这样你已经在做数据工作了,这会使你以后在这个领域找工作容易得多。不用说,你对这些工具的熟练度也会呈指数增长。
每家公司都可以以某种方式使用数据,因为数据量随着时间的推移呈指数增长。因此,在每个组织中都有很多机会使用这些数据,你只需要有点创意!
你甚至可能会发现,你在当前公司使用数据技能创造的价值非常好,以至于他们永久性地雇佣你作为数据科学家。我听说过几个这样的案例。
不要担心人工智能
媒体和非专业人士在炒作人工智能方面做得很好,这导致了一些恐慌。请别误会,这项技术仍然很神奇,并在某些领域确实有帮助。我甚至每天都在用它提高我的生产力。
有几个人给我发消息,质疑他们是否应该因为人工智能而仍然尝试进入数据科学领域。在我看来,目前人工智能绝对无法取代数据科学家,所以你不必担心这一点。
NeetCode 制作了一个很好的视频,解释了当前的人工智能无法取代程序员。
cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.youtube.com%2Fembed%2FU_cSLPv34xk%3Ffeature%3Doembed&display_name=YouTube&url=https%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DU_cSLPv34xk&image=https%3A%2F%2Fi.ytimg.com%2Fvi%2FU_cSLPv34xk%2Fhqdefault.jpg&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=youtube
当然,人工智能可以编写代码并执行众多其他任务。然而,它肯定达不到数据科学家的技能水平,尤其是在任何形式的数学推理方面。试着让 ChatGPT 证明费马大定理;它根本无法正确完成。
即使是所谓的“软件工程师杀手”Devin,也不如其创造者最初宣传的那么好。不是那么出色。许多公司试图通过炒作人工智能来增加他们的投资,而他们的结果往往是夸大其词。
当我构建一个网站时,GPT 甚至难以处理简单的 HTML 和 CSS,这可以说是它的本职工作。
有许多例子表明这些大型语言模型在许多任务中失败或不太有用。这是因为它们拥有知识,但没有自然智能,正如著名计算机科学家杨立昆所说:
cdn.embedly.com/widgets/media.html?type=text%2Fhtml&key=a19fcc184b9711e1b4764040d3dc5c07&schema=twitter&url=https%3A//x.com/ylecun/status/1646897310465490949&image=
一个 4 岁的孩子看到的数据比今天最大的 LLM 多 50 倍:
cdn.embedly.com/widgets/media.html?type=text%2Fhtml&key=a19fcc184b9711e1b4764040d3dc5c07&schema=twitter&url=https%3A//x.com/ylecun/status/1750614681209983231%3Flang%3Den&image=
总的来说,不要担心 AI;这并不是你想要成为数据科学家的借口。
找到工作只是开始
就像任何事一样,真正的挑战从你得到第一份工作开始。找到第一份工作很困难,但一旦你开始了,你的旅程中会有许多心理斗争。
外面的职业生涯可能看起来一片光明,但并不总是这样。你可以期待……
终身学习-> 你需要在你的职业生涯中持续提升技能。
持续的冒充者综合症-> 你永远不会觉得自己真正了解。
倦怠感-> 总是有新东西要学习,所以跟上所有事情都是精神上的消耗。
领域中的持续变化-> 每年都会有新的进步和技术出现,你需要跟上这些变化。
模糊的工作定义-> 数据科学仍然是一个新兴职业,所以它的角色和责任并不完全明确。
那只是冰山一角。
这些是每个数据科学家在其职业生涯的某个时刻都可能遇到的普遍经历。如果这些挑战看起来令人畏惧,这可能表明这条职业道路不适合你。
这不是要让你气馁,而是要完全透明地告诉你你将面临什么。
查看我之前的帖子,了解成为数据科学家的现实情况的全部分析。
导航数据科学家的现实
**我的第一年作为数据科学家的 7 个遗憾
摘要 & 进一步思考
我希望这篇文章没有显得过于“严厉的爱”,我只是想对一些即将成为数据科学家的建议直言不讳。我希望它在某种程度上帮助了你,并澄清了你进入数据科学之路。
另一件事!
我提供一对一的辅导通话,我们可以聊任何你需要的事情——无论是项目、职业建议,还是只是确定你的下一步。我在这里帮助你前进!
[与 Egor Howell 的一对一辅导通话]
职业指导、工作建议、项目帮助、简历审查topmate.io](https://topmate.io/egorhowell/1203300)
与我联系
YouTube
LinkedIn
Instagram
网站