Python制作GUI可视化程序的尝试
之前帮朋友写过一个数据预处理的python程序,听说这个需求还是蛮多的,于是便想着能否写一个GUI图形用户界面(Graphical Use…
之前帮朋友写过一个数据预处理的python程序,听说这个需求还是蛮多的,于是便想着能否写一个GUI图形用户界面(Graphical Use…
最近学了一些数据分析、机器学习的基础知识,刚好朋友有一个需求,希望能对两份数据进行清洗,把里面的缺失值按照条件替换成平均值,数据清洗步骤…
百度百科对TF-IDF的定义:TF-IDF(term frequency–inverse document frequenc…
概念:利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到…
机器学习的基本问题是利用模型对数据进行拟合,学习的目的并非是对有限训练集进行正确预测,而是对未曾在训练集合出现的样本能够正确预测。模型对…
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 在网上找到一张关于K-means算法的图片,很形象。 …
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 在建模时,70%的时间用于清洗数据都是很正常的。 目的:…
以下数据源来自于互联网公开的北京二手房成交数据,仅作个人学习使用。 数据预处理 合并数据如下 data.head…
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此…
关于多元线性回归,指的是在回归分析中,如果有两个或两个以上的自变量,例如方程式 y=a*x1+b*x2+c*x3+d …
百度百科中对线性回归的定义:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达…
numpy的合并。 a = np.arange(4).reshape(2,2) a >array([[0, 1], …
机器学习的开始-Numpy初了解(如何创建Ndarray数组+numpy数据类型+切片+广播)