深度学习还是数据科学
还没发文章的小羊
2024-11-04 11:21:10
谁能构建出最好的模型呢?
在我过去的工作经历中,我既担任过数据科学家,也做过深度学习算法开发。如果你问我这两者之间的区别,其实并不那么明显,两者都使用相似的指标和工作原理。那么,它们的区别在哪里呢?我认为是态度。
大胆概括来说,深度学习开发者(尤其是初级开发者)往往更专注于模型,而数据科学家则恰恰相反——他们会分析和操控数据,使得几乎任何模型都可以解决问题。
或者更简单地说:
深度学习 = 模型导向
数据科学 = 数据导向
尽管如此,这种区分在近年来开始逐渐模糊。这种融合的速度还不够快,因为这两种方法可以而且应该相互受益。
当我们对比在不同变换数据上训练的模型错误率时,发现了一个显著的趋势:
所有模型的错误率降低了约5倍,RandomForestClassifier的表现几乎提升了6倍,从47.5%下降到6.0%! 神经网络模型Fast-kAN和MLP在两种数据情况下的表现都稍逊于简单的RandomForestClassifier和LogisticRegression模型。
因为标准的深度学习模型在这种表格数据上表现通常较差。
不过,这些模型之间的表现差异与通过逆转变换特征工程获得的性能提升相比,可以说是微不足道的!
0
阅读:4