AI-agents_and_environments Posted on 2022-02-22 Words count in article: 1.1k | Reading time ≈ 3 Agents and Environments我们所学的课程主要是 CS188,那么要入门AI,首先要搞明白,什么是智能体,什么是环境。 举一个很简单的例子,有一个小孩子,当它伸左手的时候,给他一颗糖;伸右手的时候,打他一下,那么久而久之,他再也不会伸右手了。显然,这里小孩子是个智能体,而我们的行为 ... Read more »
Hadoop核心-HDFS Posted on 2022-02-21 Words count in article: 7.4k | Reading time ≈ 25 Hadoop核心-HDFS现在我们来详细学习一下HDFS和MR的原理 HDFS的设计思想HDFS的全称是 The Hadoop Distributed File System, 即Hadoop分布式文件系统。那么作为分布式数据管理系统,HDFS最主要要解决这几个问题: 如何存储上百GB/TB级别大 ... Read more »
了解Hadoop Posted on 2022-02-20 Words count in article: 5k | Reading time ≈ 18 了解HadoopHadoop 可以理解为一个开源的软件平台,它的作用是在计算机集群上分布式存储和分布式处理非常大的数据集。 Hadoop的框架最核心的设计就是:HDFS和 MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算 那么我们为什么要用Hadoo ... Read more »
Django学习3 Posted on 2022-01-16 Words count in article: 5.1k | Reading time ≈ 20 Django学习3Uploading Files在这一章,我们将学习如何搭建一个RESTFul API,能实现图片上传的操作 Managing Media Files首先我们要把用户上传的图片给存储到特定地方,然后能够被 url检索到。在这里,我们可以创建一个 media 文件夹。 然后,我们需要修 ... Read more »
数据科学算法ch1-算法评价标准 Posted on 2022-01-05 Words count in article: 469 | Reading time ≈ 1 数据科学算法ch1-算法评价标准分类问题以二分类为例,真实的样本标签有两类,分类器预测的标签也有两类,真是标签和预测标签的不同组合构成了一个混淆矩阵。其中: 真阳性(true positive, TP): 正例样本被分类器预测为正例 假阳性(false positive, FP): 负例样本被分类 ... Read more »
机器学习-隐马尔可夫模型 Posted on 2022-01-04 Words count in article: 4.3k | Reading time ≈ 20 隐马尔可夫模型基本概念首先,我们要了解,什么是隐马尔科夫模型? 隐马尔科夫模型,是关于时序的概率模型 它描述一个隐藏的马尔科夫链随机生成不可观测的状态随机序列(state sequence),再由各个状态随机生成一个观测而产生观测随机序列的过程,序列的每一个位置又可以看做是一个时刻 三要素隐马尔科夫 ... Read more »
机器学习-支持向量机 Posted on 2022-01-03 Words count in article: 2.1k | Reading time ≈ 8 机器学习-支持向量机学习支持向量机的时候,我们要一步一步来,从线性可分到线性不可分,一共有三种支持向量机。 线性可分支持向量机和线性支持向量机:输入空间和特征空间的元素一一对应,并将输入空间中的输入映射为特征空间中特特征向量 非线性支持向量机:利用一个从输入控件到特征空间的非线性映射将输入映射为特 ... Read more »
机器学习-朴素贝叶斯 Posted on 2022-01-02 Words count in article: 2.2k | Reading time ≈ 10 机器学习-朴素贝叶斯概要 朴素贝叶斯法是典型的生成学习方法生成方法由训练数据学习联合概率分布$P(X,Y)$ 然后求得后验概率分布$P(Y |X)$. 具体来说, 利用训练数据学习 $P(X|Y)$ 和 $P(Y)$ 的估计,得到联合概率分布: P(X,Y)= P(Y)P(X|Y)概率估计方法 ... Read more »
机器学习-感知机 Posted on 2022-01-02 Words count in article: 413 | Reading time ≈ 1 机器学习-感知机破防了,还有4天就要期末考了,现在才开始做机器学习的第一份笔记 概要其实感知机就是一个神经元。 它有如下几个特点 输入为实例的特征向量,输出为实例的类别,取+1和-1 感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型 导入基于误分类的损失函数 利用梯度下降 ... Read more »
数据科学与算法-流算法补充 Posted on 2022-01-01 Words count in article: 2.7k | Reading time ≈ 10 流算法补充Queries over a sliding window在第五章流算法中,我们讲了一些数据挖掘算法:Basic Count Sketch,Count Sketch 和 Count-min Sketch。当时我们提了一嘴滑动窗口模型,但没有细讲。现在我们来对这个数据流模型做一个补充 比如说 ... Read more »