关注分享主机优惠活动
国内外VPS云服务器

【物联网】30。物联网数据分析基础-机器学习

摘要:机器学习可以说是高级分析的典型代表。机器学习领域集合了很多技术,用来让计算机基于大量数据学习数据的倾向,并做出一些判断。机器学习的算法根据输入数据的类型可以分为有监督学习和无监督学习。

机器学习可以说是高级分析的典型代表。机器学习领域集合了很多技术,用来让计算机基于大量数据学习数据的倾向,并做出一些判断。根据输入数据的类型,机器学习的算法可以分为有监督学习和无监督学习。

监督学习和非监督学习在使用机器学习算法使计算机学习数据趋于一致时,根据用于学习的数据是否包含“正确答案”数据,算法会有所不同。比如,假设需要从传感器数据中判断分析设备故障、建筑物损坏等异常情况。如果采用监督学习算法,则需要输入过去实际发生异常情况时的数据,即需要显式输入“异常”数据。说白了,算法要学习“正确答案”和“错误答案”的区别。相对而言,无监督学习不区分输入数据是否异常,即无监督学习算法会学习整个数据的倾向,找出整体中倾向不同的数据,判断为“异常值”。

如果要还原场景,需要根据当时是否有数据来判断是使用监督学习还是非监督学习。尤其是对于那些罕见的异常情况,如果不能准备正确答案,就需要考虑使用无监督学习。另外,如果无法预测未来会发生什么异常情况,那么利用无监督学习建立正常状态的模型,可以检测出与正常状态不同的状态(即异常)。

如果你想要发现的异常类型已经确定,并且收集了足够的数据,那么监督学习将更准确地检测到异常。

分析方法的类型那么,在了解有监督学习和无监督学习的基础上,我们将以聚类和类别分类为切入点来了解这些分析方法。根据其用途,分析方法可以分为几种类型。其中,图中所示的三种方法使用频率非常高,接下来将对这三种方法进行详细说明。

聚类分析聚类分析的目的是根据样本(样本数据)的特征,将相似的样本分成多个组(簇)。具体的聚类算法包括K-均值算法、自组织映射、层次聚类等。这些方法可以根据数据的特点发现并整合具有相同特征的数据。

K-均值算法是一种预先指定将数据分成多少个块,也就是将数据分成多少个簇,从而机械地生成数据块的算法。

类别分类类别分类分析的目的是将数据分成两组或更多组。虽然有些人可能会觉得类似于聚类分析,但是当要分类的对象已经想清楚了,根据过去的数据来区分对象组和非对象组时,就使用类别分析。分类算法包括线性判别分析、决策树分析、支持向量机(SVM)等。特别是,支持向量机还用于图像识别算法,即识别图像中被拍摄的内容。

维度压缩维度压缩也叫“降维”或“降维”,即对于大数据中的大量数据,尽量留下重要信息,压缩冗余信息,从而减少数据量。维度压缩包括主成分分析、因子分析、多维标度法等。很多时候设备发送的传感器信息太多,或者当我们要分析无数设备发送的海量信息时,会有很多不必要的信息,也就是对获取结果毫无用处的信息。此时,通过维度压缩,我们可以切掉不必要的信息,将数据转化为更容易分析的形式。

未经允许不得转载:主机频道 » 【物联网】30。物联网数据分析基础-机器学习

评论 抢沙发

评论前必须登录!