80本值得一读的最佳数据科学书籍(二)

2019-11-14    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

数据科学是近几年最受欢迎的概念。我相信很多人都在寻找进入该行业的入口,最近刚读了一篇文章,其中列出了一些对大家可能有帮助的数据科学书籍。因此,我在本文中进行了总结,同时还对书籍进行了简要介绍,以便可以选择要阅读的书籍。部分可以在网上找到一些数据科学书籍,文中给出了链接。但其中大多数可能需要在亚马逊上才能找到。

目录

第一部分:数据科学家的核心技能

♦ Data Science
♦ Math
♦ Probability and Statistics
♦ Machine Learning
♦ Data Mining
♦ SQL
♦ R
♦ Python
♦ Data Scientist Interview
♦ Algorithm
♦ Handbook
♦ Web Scraping and Data Wrangling
♦ Data Visualization and Storytelling
♦ A/B Testing

第二部分:数据科学高级技能

♦ Neural Network and Deep Learning
♦ Information Theory
♦ Causal Inference
♦ Sampling
♦ Convex
♦ Growth Analytics
♦ Text Mining and Natural Language Processing
♦ Anomaly Detection
♦ Recommender Systems
♦ Social Network Analysis
♦ Time Series Analysis and Forecasting
♦ Reinforcement Learning and Artificial Intelligence

第三部分:休闲阅读

 

第一部分:数据科学家的核心技能

 

第二部分:数据科学高级技能 Data Science Advanced Skills

神经网络与深度学习Neural Network and Deep Learning

53.建立自己的神经网络Make Your Own Neural Network

 

 

本指南将带您进行有趣而轻松的旅程,从非常简单的想法开始,逐步建立起对神经网络如何工作。

54.深度学习Deep Learning

 

 

深度学习的广泛主题的介绍,涵盖数学和概念背景,行业中使用的深度学习技术以及研究视角。

55.Hands-On Machine Learning with Scikit-Learn and TensorFlow

 

 

这本实用的书展示了如何使用简单有效的工具来实现能够从数据中学习的程序。

信息论Information Theory

56.数据科学与信息理论Data Science and Information Theory

这是一篇文章,介绍了信息理论在数据科学领域的重要性。

57.信息理论:教程简介

 

 

这的书插图丰富,在探索更高级的主题之前,使用了一些易于访问的示例来介绍诸如“ 20个问题”之类的日常游戏方面的信息理论。

58.Information, Entropy, Life and the Universe: 我们所知道的和我们所不知道的

 

 

如果有兴趣探索信息,Entropy 和概率的世界,或者只是探索整个世界,那么这是一个不错的起点。Arieh为读者详细介绍了这些主题,同时提供了许多常见示例来帮助解决这些有时难以掌握的主题

Causal Inference

59.Causal Inference in Statistics: 入门

 

 

Judea Pearl为统计初学者提供了一本理想的书,全面介绍了因果关系领域。

60.Field Experiments: 设计,分析和解释

 

 

社会科学领域实验的简要,权威介绍。

Sampling

61.Sampling

 

 

采样提供了对经典和现代采样设计和估计方法的最新处理,以及针对稀有,聚类和难以检测的总体的采样方法。

Convex

62.Convex Optimization

 

本书是对该主题的全面介绍,详细显示了如何以数字方式高效解决这些问题。

Growth Analytics

63.Lean Analytics: 使用数据更快地建立更好的启动 (Lean Series)

 

 

该书由Alistair Croll(Coradiant,CloudOps,Startupfest)和Ben Yoskovitz(Year One Labs,GoInstant)共同撰写,列出了切实可行的,切实可行的步骤,使您的创业公司从最初的想法发展到适合产品/市场以及其他方面。

64. Web Analytics 2.0:在线问责制和以客户为中心的科学

 

 

Web Analytics 2.0为创建可行的策略,正确地应用分析技术,解决诸如测量社交媒体和多渠道活动之类的挑战,通过利用实验获得最佳成功以及采用策略来真正听取客户的建议提供了具体建议。

文本挖掘和自然语言处理Text Mining And Natural Language Processing

65.使用Python进行自然语言处理:使用自然语言工具包分析文本

 

 

本书提供了对自然语言处理的高度可理解的介绍,自然语言处理是支持各种语言技术的领域,从预测性文本和电子邮件过滤到自动摘要和翻译。

在线阅读:http: //www.nltk.org/book/

66.使用Python进行文本分析:一种从数据中获取可行见解的实用现实方法

 

 

使用Python进行文本分析可以教您与自然语言处理和文本分析相关的技术,并且您将掌握掌握哪种技术最适合解决特定问题的技能。

67.信息检索导论 Introduction to Information Retrieval

 

 

这本具有开创性的新教科书经过了等级测试和连贯性,它教授网络时代的信息检索,包括网络搜索以及有关文本分类和文本聚类的基本概念的相关领域。

在线阅读:https : //nlp.stanford.edu/IR-book/

异常检测 Anomaly Detection

68.Fraud Analytics Using Descriptive, Predictive, and Social Network Techniques:欺诈检测数据科学指南

 

 

使用描述性,预测性和社交网络技术进行欺诈分析 是建立全面的欺诈检测分析解决方案的权威指南。

69.Outlier Analysis

 

 

本书从计算机科学的角度全面介绍了异常值分析领域。它在计算框架内集成了来自数据挖掘,机器学习和统计的方法,因此吸引了多个社区。

推荐系统

70.推荐系统:The Textbook

 

 

本书全面涵盖了推荐系统的主题,该系统根据用户以前的搜索或购买向他们提供个性化的产品或服务推荐。

社交网络分析Social network analysis

71.网络科学

 

 

这本开创性的教科书涵盖了从物理学到计算机科学,工程学,经济学和社会科学的广泛主题,向跨学科的读者介绍了网络科学。

72.Social and Economic Networks

 

 

在社会经济网络中,马修·杰克逊(Matthew Jackson)借鉴了经济学,社会学,计算机科学,物理学和数学的最新发现,对社会经济网络进行了全面介绍。

73.初创企业的社交网络分析:在社交网络上查找联系

 

 

您将学习识别社交媒体,政治团体,公司,文化趋势和人际网络中的模式的概念和技术。

时间序列分析和预测Time Series Analysis and Forecasting

74.用R语言进行实用时间序列预测Practical Time Series Forecasting with R: A Hands-On Guide

 

 

本书介绍了在各种业务应用程序中使用的流行预测方法和方法。该书提供了清晰的解释,实用示例以及本章末尾的练习和案例。

75.Forecasting: 原则和实践

 

 

该教科书全面介绍了预测方法,并提供了有关每种方法的足够信息,以使读者可以明智地使用它们。

强化学习与人工智能

76.强化学习:简介

 

 

理查德·萨顿(Richard Sutton)和安德鲁·巴托(Andrew Barto)对强化学习的关键思想和算法进行了清晰而简单的说明。他们的讨论范围从该领域的知识基础的历史到最新的发展和应用。

77.人工智能:一种现代方法

 

 

人工智能:一种现代方法,3e提供了有关人工智能理论和实践的最全面,最新的介绍。该教科书是该领域的佼佼者,非常适合一两个学期的人工智能本科生或研究生课程。

第三部分:休闲阅读 Leisure Reading

78. Soft Skills: 软件开发人员的生活手册

 

 

软技能:软件开发人员的生活手册是一本独特的指南,提供了使您更满意的专业软件开发人员生活所需的技术和实践。

79.The Healthy Programmer: Get Fit, Feel Better, and Keep Coding

 

对于任何想胜任这份工作的专业人士来说,这都是一本好书。它包含有用的建议,可以通过适合您忙碌的一天的方式来改善您的健康。这本书与众不同的是它的实用建议适合忙碌的生活方式。

80.Exposing the Magic of Design

 

 

本书提供了一种思考复杂且多方面的问题的方法,并具有可重复的成功程度。设计综合方法可以应用于商业中,以生产出新颖而引人注目的产品和服务,也可以将这些方法应用于政府,以改变文化并改善社会。

81.Thinking, Fast and Slow

 

 

这本书在亚马逊上有大约3000条评论。没有给出任何描述,但是我相信这对所有人来说都是一本非常有趣的书。

82.Naked Statistics: 从数据中删除恐惧

 

 

也许是你读过的最有趣的统计教科书。

83.Uncertainty:建模,概率与统计的灵魂

 

 

这本书提出了一种概率论和概率思维的哲学方法,同时考虑了概率推理和建模的基础,这些基础有效地构成了数据科学中的所有基础。

资料来源:Octoparse

标签: 数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:AI人才稀缺:全面解读数据科学家成长的4个阶段

下一篇:官宣!开源Delta Lake正式加入Linux基金会,共同打造数据湖开放标准