首页 文章

    《Spark快速大数据分析》PDF清晰版

    作者简介  · · · · · · Holden Karau是Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。 Andy Konwinski是Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。 Patrick Wendell是Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark

    作者:RainNight 2021-04-11 所属分类:[数据分析]

    《Spark高级数据分析》PDF清晰版

    内容简介  · · · · · · 本书是使用Spark进行大规模数据分析的实战宝典,由著名大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个最常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据

    作者:RainNight 2021-04-11 所属分类:[数据分析]

    《PYTHON自然语言处理(中文版)》PDF清晰版

    内容简介 自然语言处理( natural language processing , nlp )是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作。 《 python 自然语言处理》是自然语言处理领域的一本实用入门指南,旨在帮助读者学习如何编写程序来分析书面语言。本书基于 python 编程语言以及一个名为 nltk 的自然语言工具包的开源库;但并不要求读者有 python 编程的经验。全书共

    作者:RainNight 2021-04-11 所属分类:[自然语言]

    《Python网络数据采集》PDF清晰版

    《Python网络数据采集》是2016年人民邮电出版社出版的图书,作者是【美】米切尔 ( RyanMitchell )。   内容简介 本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第1部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。   目录

    作者:RainNight 2021-04-11 所属分类:[爬虫]

    《Java设计模式(第2版)》PDF清晰版

    作品简介 本书本书通过一个完整的Java项目对经典著作Design Patterns一书介绍的23种设计模式进行了深入分析与讲解,实践性强,却又不失对模式本质的探讨。本书创造性地将这些模式分为5大类别,以充分展现各个模式的重要特征,并结合UML类图与对应的Java程序,便于读者更好地理解。全书给出了大量的练习,作为对读者的挑战,以启发思考,督促读者通过实践练习的方式来掌握设计模式。同时,作者又给出了这些练习的参考答案,使读者可以印证比较,找出自己的不足,提高设计技能。本书适合各个层次的Java开

    作者:RainNight 2021-04-11 所属分类:[设计模式]

    《自私的基因》PDF高清版

    内容简介  · · · · · · 虽然黑猩猩和人类的进化史大约有99.5%是共同的,但人类的大多数思想家把黑猩猩视为畸形异状、与人类毫不相干的怪物,而把他们自己看成是上升为万物之主的阶梯。对一个进化论者来说,情况绝非如此。认为某一物种比另一物种高尚是毫无客观依据的。不论是黑猩猩和人类,还是蜥蜴和真菌,他们都是经过长达约三十亿年之久的所谓自然选择这一过程进化而来。每一物种之内,某些个体比另一些个体留下更多的生存后代,因此,这些

    作者:RainNight 2021-04-11 所属分类:[遗传学]

    《自然语言处理综论》PDF清晰版

    《自然语言处理综论》本书是一本全面系统地讲述计算机自然语言处理的优秀教材。 内容简介 本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论

    作者:RainNight 2021-04-11 所属分类:[自然语言]

    《智能Web算法(中文版)》PDF清晰版

    内容简介  · · · · · · 本书涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web应用中的角色及要注意的问题。除了第1章的概要性介绍以及第7章对所有技术的整合应用外,第2~6章以代码示例的形式分别对这五类算法进行了介绍。 本书面向的是广大普通读者,特别是对算法感兴趣的工程师与学生,所以对于读者的知识背景并没有过多的要求。本书中的例子和思想应用广泛,所以对于希望从业务角度更好

    作者:RainNight 2021-04-11 所属分类:[算法]

书籍归档