写下来

写下来

最小读数

|作者:Charlie Close|

我想谈谈技术记录保存的优点。说真的。

在盖尔做数据科学家的工作中,金宝搏彩票我将各种数据集转化为度量,并使用这些指标来推断如何制造更好的产品和更多的销售。这些推论通常以电子表格和图表的形式表示。

在那之前,我在软件开发团队工作了很多年。软件工程师不知道他们想要记录他们的代码做了什么或者为什么要这样做。他们说密码文件,他们有充分的理由这么说。

因此,您可以理解,我在处理数据时可能不会选择写下我在做什么。但我学到了,有时候很难,记录我的工作有多重要。

你不会记得的

有时候同事的工作对我来说是一次性的信息需求。一个典型的请求可能是,“告诉我们新产品功能是否按预期使用。”,或者“我这周给德克萨斯州的客户打电话。我应该尝试销售哪些产品?”

像大多数任务一样,这些来来去去去。无论请求目前看起来多么清晰和重要,几天之后,它将看起来像是古代历史。

每当我收到请求时,我在我们的工作跟踪系统中打开了一个新任务,并记录了以下信息。

  • 是谁要求的。
  • 原始请求的内容。
  • 我做的任何假设。
  • 任何初始数据集(电子表格,文本文件,请求者给我的。
  • 我在满足请求时使用或创建的任何数据集。
  • 如果数据随时间变化,然后,我使用了什么数据,以及当时跨越的时间范围。例如,当我查询使用数据时,我记录了从“本月”到“本月”的数据。
  • 任何数据库查询,数据处理脚本,或者我运行的服务器命令,整齐。

以上所有变量都会影响我发送回请求者的输出,他们中的许多人都愿意接受解释。我可能决定本周处理一个请求,与上周处理类似请求的方式不同。如果我需要记住为什么我做了改变,写下来是很重要的。

有人会问细节

你可能会认为过去是过去,记住你上周所做的并不重要。那是真的,除非以后有人问你。你知道以后会有人问你。不是每个请求,但有些要求,你不知道是哪一个。您发送并忘记的报告:请求者现在正四处查看,并有问题。它只覆盖了她市场上的图书馆吗?还是所有的图书馆?你看过前五个搜索结果吗?还是前十名?你是怎么计算的?

让我告诉你,当我被问到我应该能够回答但不能回答的问题时,我的感觉就像在一个高的过山车跌落之前到达它的顶部。构建数据集感觉更糟,在此基础上构建报告,然后不知道如何重新创建数据集,因为我没有写下步骤。

有人可能是你

尽管请求者经常问后续问题,使用我记录最多的人是我。

我工作的一个好处是我可以一直学习。我可能知道我要如何处理一批给定的数据,但我并不总是知道如何执行每一步。我得想清楚。(处理数据就像和蛇搏斗,这说明,我敢肯定,为什么叫Python语言。)

每当我学到一点新技术,在工作跟踪系统中,作为保存请求工件的副作用,该学习被存储为一个真实的例子。当我再次遇到同样的问题时,这是有用的,我记得那个我解决了,但我不记得了怎样我解决了它。现在我可以查一下了。工作跟踪系统是,实际上,一个个人的知识基础,我正在建立。

另一件事是当有人要求我像我为同事做的那样做报告时,但不同。例如,“你为加利福尼亚的Madeline做的报告……你能为我为佛罗里达做同样的事吗?”

我有一份我为马德琳做的报告的记录,我可以用马德琳的名字查一下。把它改成佛罗里达州:很简单。更好的是,如果我的记录显示某个特定的数据产品拥有广泛的受众,基于多个请求,我可以实现自动化,这样Madeline和她的同事就可以随心所欲地运行它,并根据个人需要进行配置。把权力交给请求者,让我有更多的时间提出有趣的问题,并从数据中产生有价值的见解:双赢。

给像Madeline这样的人很好的支持,避免偶尔的过山车已经证明了随着时间的推移,保持我的文档比自己支付更多。


关于作者


Charlie Close是Gale的数据科学家,也是Gale搜索引擎团队金宝搏彩票的前分析师。他的研究包括对用户行为的研究,以改善Gale产品。金宝搏彩票



留下评论