当前位置:首页 > 天道酬勤 > 正文内容

说到这份上(我对这份工作)

张世龙2021年12月20日 15:56天道酬勤1400

点击上面关注,All in AI中国

作者——Jyoti Nigania

我相信所有专家都期待着2019年有新的开始。 我想进一步提高他们的数据分析技能。 于是,我收集了一些书。 希望我的推荐能有助于提高数据科学家的知识和技能。

1. 《The Elements of Statistical Learning: Data Mining, Inference, and Prediction》

作者:qkdqd Hastie,罗伯特Tibshirani,Jerome Friedman

链接: https://web.Stanford.edu/~ hastie/elemstatlearn /索引. html

在过去的十年里,信息技术得到了爆炸性的发展。 随之,医学、生物学、金融、市场营销等多个领域都在进步。 近几十年来,统计领域发生了翻天覆地的变化。 这种变化是计算机革命的结果。 在这场革命开始之前,研究者们可以避开一些麻烦或者他们不想涉及的领域。 但是,随着科学技术的进步和数据量的增加,他们必须走出“舒适区”大胆探索。 计算机革命带来的还有机械/工具的革新。 许多工具有共同的基础,但通常都有自己的特性。

这本书的主要内容是在共同的概念框架中描述这些工具的深层思想。 这本书理论性强,比较枯燥,但作者给出了许多例子,多使用彩色图形来帮助理解。

这本书的另一个特点是涵盖范围广泛,从监督学习到非监督学习。 课程内容包括神经网络、支持向量机、分类树和图像模型、随机森林等。 另一章是关于如何应对大量数据,如测试方法、错误识别方法等。

这绝对是一本美丽的书。 不仅在排版和色彩的运用上,也在内容和风格上。 是很多本科和研究生都应该读的书,是所有真正的数据科学家的“枕边书”。

2. 《Think Stats: Probability and Statistics for Programmers》

作者: Allen B. Downey

链接: https://绿色tea新闻.com/WP/think-stats-2e /

如果你知道编程方法,就有使用统计工具将数据转换为知识的技能。 这个简短的介绍展示了如何使用用Python编写的程序执行统计分析。 本书鼓励使用简单的技术探索实际的数据集,回答有趣的问题,并鼓励使用实际的数据集进行项目。

如果掌握了Python的基本技能,就可以使用它们来学习概率和统计的概念,并练习使用短程序来帮助理解。 本书提供了一个生动的案例,让您学习整个数据分析过程。 在这个过程中,我们会了解概率规则、可视化和许多其他工具和概念。

3. 《Street-Fighting Mathematics - The Art of Educated Guessing and Opportunistic Problem Solving》

作者: Sanjoy Mahajan

链接: https://毫米新闻.毫米. EDU /图书/街道匹配

在传统的数学教育中,我们面临的问题大多是作者预先选择的。 但是,在很多情况下,生活给我们带来的问题是非常不确定的。 这意味着我们不能照搬教科书上的“金科玉条”。 这本书教你如何在没有证明和正确计算的情况下推测答案。 在《Street-Fighting Mathematics》中,Sanjoy Mahajan介绍了六种常用的统计工具,并以许多示例说明了每种工具。 他从例子中分别提炼和论述了工具的一般原理,使读者不仅能掌握特定的例子,还能迅速掌握工具本身。

第一次看到这本书的标题时,我以为它是一本面向大众的通俗数学书,但我发现它是一本纯粹的、理论素养很高的着作。 作为物理学家和数学家,我非常喜欢它。 而且,我不得不向作者学习,学习他对问题的看法,以及深入的思考角度、时间的控制和实践方法。 另一方面,我不建议有数学困难的人学习它。 如果没有对微积分、微分方程、统计学、基础物理的深入了解,这本书对你来说,就起不到那个作用。

4. 《Exploratory Data Analysis with R》

作者: Roger D. Peng

链接: https://lean pub.com/ex数据

数据科学已经席卷了世界。 人们越来越意识到大量的数据意味着大量的价值所有的研究领域和商业领域都受到了影响这本书是对相关技术的探索和总结

结。

探索性数据分析是数据科学过程的一个关键部分,因为它允许你锐化你的问题和细化你的建模策略,以开发更复杂的统计模型。本书涵盖了构建信息数据图形的一些基本原则,以及对高维数据可视化的一些常见统计技术。所涉及的主题包括绘制探索性图形、分析图形的原理、聚类方法和降维技术等等。

5.《Statistical Inference For Data Science》

作者:Brian Caffo

链接:https://leanpub.com/LittleInferenceBook

《Statistical Inference》是从数据中得出关于人口或科学事实的结论的过程。有许多执行推理的模式,包括统计建模、面向数据的策略以及在分析中进行设计和随机化处理。

这本书,还包括在线课程《Coursera Course on Statistical Inference》。该课程会通过一系列的方法向你展示推理的基本原理,旨在帮助你更好的理解统计推理,并利用你所得到的知识在分析数据时做出明智的选择。它涉及到的主题非常广泛,希望可以满足你多元的需求。

6.《Correlation Is Not Causation》

作者:Lee Baker

链接:https://www.chi2innovations.com/lm-correlation-is-not-causation/

《Correlation Is Not Causation》解释了如何系统地测试五种最常见的因果关系陷阱,即使是专业人士(偶尔)也会陷入其中。我们将学习创建策略来分析数据并以一种易于理解的方式解释结果。

最明显的特点是,它的语言更加直白,没有那些太过专业的术语。它充满了直观的例子帮助你理解,哪怕你没有相关经验。简而言之,它是初学者最好的选择。

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/25724.html

分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。