Elasticsearch集群(不同云服务器上)的搭建与可视化测试
准备工作: 两台服务器,服务器的版本分别如下 Linux VM-20-14-centos 4.18.0-305.10.…
准备工作: 两台服务器,服务器的版本分别如下 Linux VM-20-14-centos 4.18.0-305.10.…
百度百科对TF-IDF的定义:TF-IDF(term frequency–inverse document frequenc…
概念:利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到…
支持向量机(Support Vector Machine),是一类按监督学习(supervised learning)方式对数据进行二元…
随机森林算法可用于分类,也可用于回归任务。 随机森林采用集合算法(bagging),利用统计学采样原理,训练出成千上百个不同的算…
机器学习的基本问题是利用模型对数据进行拟合,学习的目的并非是对有限训练集进行正确预测,而是对未曾在训练集合出现的样本能够正确预测。模型对…
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 在网上找到一张关于K-means算法的图片,很形象。 …
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 在建模时,70%的时间用于清洗数据都是很正常的。 目的:…
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 数据预处理 合并数据如下 data.head…
分类问题中最简单的是二分类,但其实多分类也可以分解成一个个二分类来解决。Logistic Regression 虽然被称为回归,但其实际…
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此…
关于多元线性回归,指的是在回归分析中,如果有两个或两个以上的自变量,例如方程式 y=a*x1+b*x2+c*x3+d …
百度百科中对线性回归的定义:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达…