数据科学算法ch1-算法评价标准 Posted on 2022-01-05 Words count in article: 469 | Reading time ≈ 1 数据科学算法ch1-算法评价标准分类问题以二分类为例,真实的样本标签有两类,分类器预测的标签也有两类,真是标签和预测标签的不同组合构成了一个混淆矩阵。其中: 真阳性(true positive, TP): 正例样本被分类器预测为正例 假阳性(false positive, FP): 负例样本被分类 ... Read more »
机器学习-隐马尔可夫模型 Posted on 2022-01-04 Words count in article: 4.3k | Reading time ≈ 20 隐马尔可夫模型基本概念首先,我们要了解,什么是隐马尔科夫模型? 隐马尔科夫模型,是关于时序的概率模型 它描述一个隐藏的马尔科夫链随机生成不可观测的状态随机序列(state sequence),再由各个状态随机生成一个观测而产生观测随机序列的过程,序列的每一个位置又可以看做是一个时刻 三要素隐马尔科夫 ... Read more »
机器学习-支持向量机 Posted on 2022-01-03 Words count in article: 2.1k | Reading time ≈ 8 机器学习-支持向量机学习支持向量机的时候,我们要一步一步来,从线性可分到线性不可分,一共有三种支持向量机。 线性可分支持向量机和线性支持向量机:输入空间和特征空间的元素一一对应,并将输入空间中的输入映射为特征空间中特特征向量 非线性支持向量机:利用一个从输入控件到特征空间的非线性映射将输入映射为特 ... Read more »
机器学习-朴素贝叶斯 Posted on 2022-01-02 Words count in article: 2.2k | Reading time ≈ 10 机器学习-朴素贝叶斯概要 朴素贝叶斯法是典型的生成学习方法生成方法由训练数据学习联合概率分布$P(X,Y)$ 然后求得后验概率分布$P(Y |X)$. 具体来说, 利用训练数据学习 $P(X|Y)$ 和 $P(Y)$ 的估计,得到联合概率分布: P(X,Y)= P(Y)P(X|Y)概率估计方法 ... Read more »
机器学习-感知机 Posted on 2022-01-02 Words count in article: 413 | Reading time ≈ 1 机器学习-感知机破防了,还有4天就要期末考了,现在才开始做机器学习的第一份笔记 概要其实感知机就是一个神经元。 它有如下几个特点 输入为实例的特征向量,输出为实例的类别,取+1和-1 感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型 导入基于误分类的损失函数 利用梯度下降 ... Read more »
数据科学与算法-流算法补充 Posted on 2022-01-01 Words count in article: 2.7k | Reading time ≈ 10 流算法补充Queries over a sliding window在第五章流算法中,我们讲了一些数据挖掘算法:Basic Count Sketch,Count Sketch 和 Count-min Sketch。当时我们提了一嘴滑动窗口模型,但没有细讲。现在我们来对这个数据流模型做一个补充 比如说 ... Read more »
OLAP Posted on 2022-01-01 Words count in article: 2k | Reading time ≈ 7 OLAP参考 :https://www.zhihu.com/question/24110442/answer/851671343 OLTP(on-line transaction processing)翻译为联机事务处理, OLAP(On-Line Analytical Processing)翻译为 ... Read more »
数据库扩展性问题 Posted on 2022-01-01 Words count in article: 5.2k | Reading time ≈ 18 数据库扩展性问题NoSQLNoSQL数据库有四大分类: 分类 Examples 典型应用场景 数据模型 优点 缺点 键值 key-value Riak,Redis,Voldmort 内容缓存,用于处理大量数据的高访问负载,也用于一些日志系统等 Key指向Value的键值对,通常用哈希 ... Read more »
分布式数据库事务 Posted on 2022-01-01 Words count in article: 5.8k | Reading time ≈ 20 分布式数据库事务概述对于部署在云上的服务,仅仅由一台服务器来承载流量是不够的,因此数据库会被扩展到多台主机上。主要有两种扩展模式: 分库/分表的扩展模式。这意思就是,在每一个节点(服务器)上,运行一套独立的数据库,然后在上面铺一层中间件,在收到了用户的请求之后,由中间件分发给节点来处理。运用这种模 ... Read more »
计算机视觉-检测和分割 Posted on 2021-12-23 Words count in article: 2k | Reading time ≈ 7 计算机视觉-检测和分割在第一章我们了解过常见的CV任务,主要有:图像分类、语义分割、分类+定位、目标检测、实例分割 图像分类CV最常见的就是图像分类了,比如说利用AlexNet对图像进行分类,最后输出对图像的预测分数 在图像分类的基础上,延伸出来几个其他作用,下面一一介绍 语义分割语义分割就是对 ... Read more »