百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Java机器学习库(Java ML)(一、分类)

bigegpt 2024-09-08 11:32 6 浏览

本文章翻译至Java ML技术文档classification。pdf,代码部分是参考该文档使用IDEA编写,同时加入了运行结果。

分类

本文介绍与分类相关的功能。

该文章假设您已熟悉Java ML的基础知识,如入门教程中所述(http://java-ml.sourceforge.net)。数据集下载地址:https://download.csdn.net/download/dbzzcz/12274719

分类基础知识

本文介绍了设置分类器、训练算法和评估其性能的基础知识。首先我们需要初始化一个分类器,然后我们可以用一些数据来训练它,最后我们可以用它来对新的样本进行分类。创建一个分类器

下面的示例从iris数据集中加载数据,然后我们构造一个K-nearest分类器并用数据来训练它。

注:分类器的构建方法可能会修改作为参数的数据集。

评估分类器的性能

现在我们已经构造并训练了一个分类器,我们可以使用它来分类新的实例,在这个例子中,我们将重新加载iris数据集,并使用训练好的分类器来预测每个实例的类标签。

这个例子将遍历iris数据集中的所有样本,并试图通过对其5-nearest的多数投票来预测其分类。在本例中,这将导致145个正确的预测和5个错误的预测。

注:这不是验证该模型是否正确的方法。至于正确的验证方法,请查阅交叉验证法。

在数据集上评估分类器

本文向您展示如何在数据集上测试分类器的性能。这里将介绍两个类。EvaluateDataset,它允许您在数据集上测试分类器。还将引入PerformanceMeasure,此类用于存储有关分类器性能的信息。

此示例加载iris数据集,构造5-nearest分类器并再次加载iris数据。

testDataset方法使用经过训练的分类器来预测所提供数据集中所有样本的标签。分类器的性能作为映射返回,映射包含每个类的性能度量。性能度量是围绕着真阳性、真阴性、假阳性和假阴性的值的包装。该类还提供了许多方便的方法来计算许多聚合度量,如准确性、f-score、召回率、精确度、敏感性、特异性等。

分类交叉验证

在本文中,我们将讨论如何使用Java-ML执行交叉验证。

在本文中,我们假设您知道如何从文件加载数据、如何创建aclassifier以及如何使用PerformanceMeasure。Java ML中的交叉验证可以使用CrossValidation类完成。下面的代码展示了如何使用这个类。

本例首先加载iris数据集,然后构造一个K-nearest分类器,该分类器使用5-nearest对样本进行分类,在下一步中,我们使用所构造的分类器创建一个交叉验证,最后指示交叉验证在加载的数据上运行。默认情况下,将执行10倍的交叉验证,每个类的结果将返回到映射类标签到其相应PerformanceMeasure的映射中。

以相同folds执行多次

上面的示例对数据集执行三轮交叉验证。前两个使用的folds与用于创建folds的随机生成器使用相同的种子初始化的folds完全相同。第三个则运行在不同的折叠,因为它使用不同的种子。

在本例中,我们使用了相同的分类器,可以将分类器与不同的分类器交换,并在完全相同的折叠上测试不同的分类器。

Weka分类

通过使用Weka Classification桥,可以从Java ML中访问来自Weka的分类算法,并使用与本机算法相同的方法。这个类可以包装在Weka分类器上,使它们对基于Java ML的程序透明可用。

在下面的例子中,我们首先加载iris数据集。接下来,我们使用默认设置从Weka创建一个支持SMO的vectormachine。然后,我们将SMO包裹在WekaClassifierbridge中。最后,我们对分类器进行交叉验证并写出结果。

参考网站:http://java-ml.sourceforg.net/content/classification

相关推荐

Redis集群对比:主从复制、哨兵模式、Cluster一文看懂所有优缺点

在分布式系统中,Redis作为高性能的内存数据库,其集群方案的选择直接影响到系统的稳定性、可用性和扩展性。本文将全面对比Redis的三种主流集群方案:主从复制、哨兵模式和Cluster模式,帮助开发者...

redis的主从复制,读写分离,主从切换

当数据量变得庞大的时候,读写分离还是很有必要的。同时避免一个redis服务宕机,导致应用宕机的情况,我们启用sentinel(哨兵)服务,实现主从切换的功能。redis提供了一个master,多个sl...

# Redis 入门到精通(九)-- 主从复制(3)

#Redis入门到精通(九)--主从复制(3)##一、redis主从复制-常见问题(1)###1、伴随着redis系统的运行,master的数据量会越来越大,一旦master重启...

redis - 主从复制(Redis主从复制时序图)

1引言在上一篇文章中,我们了解了Redis两种不同的持久化方式,Redis服务器通过持久化,把Redis内存中持久化到硬盘当中,当Redis宕机时,我们重启Redis服务器时,可以由RDB文件或AO...

# Redis 入门到精通(九)-- 主从复制(2)

#Redis入门到精通(九)--主从复制(2)##一、redis主从复制--数据同步阶段注意事项###1、数据同步阶段master说明1)如果master数据量巨大,数据同步阶段应...

Redis主从复制(redis主从复制主节点挂了)

介绍Redis有两种不同的持久化方式,Redis服务器通过持久化,把Redis内存中持久化到硬盘当中,当Redis宕机时,我们重启Redis服务器时,可以由RDB文件或AOF文件恢复内存中的数据。不过...

深入解析 Redis 集群的主从复制实现方式

在互联网大厂的后端开发领域,Redis作为一款高性能的内存数据库,被广泛应用于缓存、消息队列等场景。而Redis集群中的主从复制机制,更是保障数据安全、实现读写分离以及提升系统性能的关键所在。今...

Redis主从架构详解(redis主从架构高可用如何实现)

Redis主从架构搭建Redis主节点配置创建主节点目录(/opt/redis-master),复制redis.conf到该目录下,redis.conf配置项修改#后台启动daemonizeyes...

抖音“四大包塘战神”:承包了全网的快乐

在抖音钓鱼垂类领域,"包塘战神"军团正掀起一场黑色幽默风暴。空军华、大表坑、李赔光、透心良四位创作者,以承包鱼塘为舞台,用连续翻车的钓鱼直播构筑起流量奇观。当钓鱼佬在抖音集体转型喜剧人...

ORACLE 11G RAC 安装-通过VM配置共享磁盘

简介:在自己的电脑上通过VM软件搭建Oracle11GRAC,通过修改VM的参数文件来实现磁盘共享!目标:搭建RAC环境实现:使用VMwareWorkstation8.0.0+ORACLE...

Linux操作系统安全配置(linux系统安全配置包括)

一、服务相关命令systemctlenable服务名#开机自启动systemctldisable服务名#禁用开机自启动systemctlstop服务名#停止服务systemctls...

关于Linux性能调优中网络I/O的一些笔记

写在前面和小伙伴分享一些Linux网络优化的笔记,内容很浅,可以用作入门博文内容结合《Linux性能优化》读书笔记整理涉及内容包括常用的优化工具(mii-tool,ethtool,ifconfig,i...

从 Sonatype Nexus Repository Manager 迁移到 Artifactory

1.Nexus1.1下载下载链接:https://help.sonatype.com/repomanager3/product-information/download/download-archiv...

Ubuntu20安装zabbix5.0企业监控系统亲测教程

前言示例主机:zabbix10.0.100.10,将安装在UbuntuServer上教程说明:因使用官方教程无法安装成功,所以本教程与官方教程有所不同安装前提:已安装UbuntuServer2...

Linux内核设计与实现—进程管理(linux内核程序设计)

进程进程就是处于执行期的程序(目标码存放在某种存储介质上)。进并不仅仅局限于一段可执行程序代码(Unix称其为代码段,textsection)。通常进程还要包含其他资源,像打开的文件,挂起的信号,...