信息周刊丽莎摩根最近“商业专业人士传统上把世界具体而言,有时甚至是圆的数字。相比的灰色数据科学产生的色调即遗留立体是黑色和白色。代替产生一个单一的数字结果,例如40%,其结果是概率性的,结合的有误差的裕度的置信水平“。或者,说得更简洁,数据科学不是一门精确的科学。

有许多原因是这种情况,其中包括:

数据

这是可能的公司可能没有回答特定问题的所有数据要求。即使有一个完整的数据集,如果有与数据质量的任何问题,然后有一个很好的机会,分析可以偏向或倾斜。这强调了投资的一个扎实的基础平台,可以解决数据质量问题,并确保外部和内部数据的重要性是干净的,一致的,并准备以获得理想的结果。

问题

作为摩根所说的那样,“这是说,如果一个人想更好的答案,应该提出更好的问题。更好的问题来自与领域专家一起工作,以框定问题的数据科学家“。预先存在的假设,可利用的资源,约束,目标和成功标准是其他因素可以影响的问题是如何提出的,反过来,得到的答案。

预期

在外地工作的那些明白,数据科学,机器学习和人工智能有显著的局限性。其他从一天到多天去除往往有不同的观点,而这些不切实际的期望往往会产生挑战。

上下文

语境中发挥了分析倡议,一个模式的成功或失败可以在一个场景中完美地工作和产量的另一个令人失望的结果了很大的作用。摩根指出,“即使在相同的使用情况下,预测模型可能不准确。例如,基于历史数据的流失模型可能更多的权重对最近购买比年长的购买,反之亦然“。

标签

图像识别是通过标记数据推动,但它并不总是很容易标签的所有内容。图像分类可能基于文化差异,社会规范和时事。Morgan elaborates, “Similarly, if a neural network is trained to predict the type of image coming from a mobile phone, if it has been trained on songs and photos from an iOS phone, it won’t be able to predict the same type of content coming from an Android device and vice versa.”

这些变量,难以总是绝对的答案,但正如摩根指出,这并不一定是坏事。检查出她的拼凑其全文在这里阅读更多。

发表评论

请输入您的评论!
请在此输入你的名字