Python笔记之符号计算 Python笔记 在学习机器学习等内容时, 我们经常遇到需要公式推导的情景. 但实际上我们往往只需要理解其中的概念, 具体的计算过程并不重要. 因此如果符号推导过程可以由计算机完成, 则可以节省很多时间, 从而把...
机器学习之基础概念 机器学习 Deep learning is a specific kind of machine learning. In order to understand deep learning well, ...
Python笔记之科学计算 Python笔记 本文介绍Python科学计算中经常使用的一些第三方库, 包括数据计算模块numpy, 科学计算模块scipy, 数据处理模块pandas, 绘图模块matplotlib等. 上述这些模块都是其他...
Python笔记之内置模块 Python笔记 本文介绍Python常用的内置模块, 包括全部的内建函数(builtins), 以及文件操作, 系统功能, 进程调度和绘图等模块的基本内容. 内置函数Python提供了一些重要的内置函数, 可以...
Python笔记之基础知识 Python笔记 本文对Python语言进行一个简单的回顾, 对Python中各种语法进行了简单的介绍, 并且对帮助系统进行了测试, 从而保证在阅读Python代码时不至于遇到无法理解的语法. 在本文的最后, 介...
Java单元测试之有效测试 Java单元测试 什么是优秀的测试测试的价值 测试帮助捕获错误,因此一个永远正确的测试是一个无效的测试,而一个永远错误的测试也不能提供有效的信息. 在另一个层面,测试提供一个实际使用的环境,从而明确实际的需求并给...
Java单元测试之基础类库 Java单元测试 本文介绍Java的单元测试中经常使用的Junit和JMock库的主要API和使用方法. 阅读本文前需要对Maven有基本的了解, 如果对其不了解, 可以阅读 Maven笔记之基本概念 . Jun...
Java多线程之核心类库 Java多线程 本文介绍Java中关于多线程的类库, 包括各种类的实现原理和使用方法, 关于多线程的基础知识, 可以阅读Java多线程之基础知识. 无锁可变量从Java 5开始, java.util.concu...
Java多线程之基础知识 Java多线程 用Java开发了一些大大小小的项目了, 虽然在这些项目的开发过程中都使用了一些Java多线程技术, 但对于Java多线程的原理, 细节等诸多方面的认识都是空白. 因此有必要系统的学习一次Java...
Java特性之文件与时间API Java特性 从Java 1.4之后, Java引入了新的Java I/O 库来替代原有的File类, 到了Java 8, Java又引入了新的Base64编码和解码库, 使用新的API可以避免原来...
Java特性之StreamAPI Java特性 Stream是Java8中处理集合的关键抽象概念. 使用Stream API, 编译器可以针对性的使用并行操作来对运算进行加速, 同时使用这些API也能让我们从处理低层次循环中脱离出来, 从更高...
Java特性之Lambda表达式 Java特性 在很多函数式编程的语言中,都具有lambda表达式. lambda表达式可以视为一段可以被引用的代码, Java中经常使用的匿名类就可以视为一种lambda表达式的替代品. 在Java 8中, ...
JDK辅助工具介绍 JDK笔记 本文介绍JDK中提供了一系列辅助工具的使用方法, 包括打包程序jar, 监控程序Visual VM等. Jar指令使用jar指令对Java的的代码和资源文件进行压缩或解压 压缩包:jar cv...
Java特性之基础特性 Java特性 本文介绍一些零散的Java特性, 虽然这些知识都比较零散, 但是合理使用可以有效的简化程序的逻辑, 降低开发难度. Java泛型简介定义泛型函数任何一个泛型函数都需要在函数的返回类型前声明使用到...
大数据导入和分析 大数据分析案例 本文是大数据分析案例系列文章. 本文主要介绍将前一步生成的数据导入Hadoop平台,并进一步将数据导入Hive. 数据导入以后,可以使用SQL语句进行查询和分析, 最后对比统计分析结果和之前随机...
大数据环境配置和数据生成 大数据分析案例 这是一个系列的文章, 介绍了一个完整的大数据分析案例, 包括有关的软件安装, 数据集的生成, 数据分析以及最终的数据可视化. 本文介绍软件安装和数据集生成. 前置知识要求 linux基本知识,...
The Google File System 阅读记录 论文阅读 本文是对论文《The Google File System》的记录. 这篇论文也是谷歌关于大数据的三大论文之一, 主要讲述了一种新的可扩展的分布式文件系统的设计与实现. 大数据处理系统Hado...
MapReduce:Simplified Data Proessing on Large Clusters 阅读记录 论文阅读 本文是对论文《MapReduce:Simplified Data Proessing on Large Clusters》的记录. 这篇论文是Google的关于大数据的三篇论文之一, 主要介绍了...
SQL语法精简笔记 由于日常开发过程中不经常使用SQL, 对于其中的一些高级语法比较容易遗忘. 因此本文简要介绍了SQL的各种语法, 用于快速回顾有关的知识. 关于详细的数据库理论, 可以阅读数据库系统原理的有关章...
大数据技术原理 大数据 本文的主要介绍大数据原理与技术, 对大数据的基本概念, 大数据处理架构, Hadoop平台及其生态系统进行概要性的介绍. 本文的主要内容都基于中国大学MOOC上的<<大数据技术原理与...