百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Java机器学习库(Java ML)(一、分类)

bigegpt 2024-09-08 11:32 5 浏览

本文章翻译至Java ML技术文档classification。pdf,代码部分是参考该文档使用IDEA编写,同时加入了运行结果。

分类

本文介绍与分类相关的功能。

该文章假设您已熟悉Java ML的基础知识,如入门教程中所述(http://java-ml.sourceforge.net)。数据集下载地址:https://download.csdn.net/download/dbzzcz/12274719

分类基础知识

本文介绍了设置分类器、训练算法和评估其性能的基础知识。首先我们需要初始化一个分类器,然后我们可以用一些数据来训练它,最后我们可以用它来对新的样本进行分类。创建一个分类器

下面的示例从iris数据集中加载数据,然后我们构造一个K-nearest分类器并用数据来训练它。

注:分类器的构建方法可能会修改作为参数的数据集。

评估分类器的性能

现在我们已经构造并训练了一个分类器,我们可以使用它来分类新的实例,在这个例子中,我们将重新加载iris数据集,并使用训练好的分类器来预测每个实例的类标签。

这个例子将遍历iris数据集中的所有样本,并试图通过对其5-nearest的多数投票来预测其分类。在本例中,这将导致145个正确的预测和5个错误的预测。

注:这不是验证该模型是否正确的方法。至于正确的验证方法,请查阅交叉验证法。

在数据集上评估分类器

本文向您展示如何在数据集上测试分类器的性能。这里将介绍两个类。EvaluateDataset,它允许您在数据集上测试分类器。还将引入PerformanceMeasure,此类用于存储有关分类器性能的信息。

此示例加载iris数据集,构造5-nearest分类器并再次加载iris数据。

testDataset方法使用经过训练的分类器来预测所提供数据集中所有样本的标签。分类器的性能作为映射返回,映射包含每个类的性能度量。性能度量是围绕着真阳性、真阴性、假阳性和假阴性的值的包装。该类还提供了许多方便的方法来计算许多聚合度量,如准确性、f-score、召回率、精确度、敏感性、特异性等。

分类交叉验证

在本文中,我们将讨论如何使用Java-ML执行交叉验证。

在本文中,我们假设您知道如何从文件加载数据、如何创建aclassifier以及如何使用PerformanceMeasure。Java ML中的交叉验证可以使用CrossValidation类完成。下面的代码展示了如何使用这个类。

本例首先加载iris数据集,然后构造一个K-nearest分类器,该分类器使用5-nearest对样本进行分类,在下一步中,我们使用所构造的分类器创建一个交叉验证,最后指示交叉验证在加载的数据上运行。默认情况下,将执行10倍的交叉验证,每个类的结果将返回到映射类标签到其相应PerformanceMeasure的映射中。

以相同folds执行多次

上面的示例对数据集执行三轮交叉验证。前两个使用的folds与用于创建folds的随机生成器使用相同的种子初始化的folds完全相同。第三个则运行在不同的折叠,因为它使用不同的种子。

在本例中,我们使用了相同的分类器,可以将分类器与不同的分类器交换,并在完全相同的折叠上测试不同的分类器。

Weka分类

通过使用Weka Classification桥,可以从Java ML中访问来自Weka的分类算法,并使用与本机算法相同的方法。这个类可以包装在Weka分类器上,使它们对基于Java ML的程序透明可用。

在下面的例子中,我们首先加载iris数据集。接下来,我们使用默认设置从Weka创建一个支持SMO的vectormachine。然后,我们将SMO包裹在WekaClassifierbridge中。最后,我们对分类器进行交叉验证并写出结果。

参考网站:http://java-ml.sourceforg.net/content/classification

相关推荐

恢复软件6款汇总推荐,帮你减轻数据恢复压力!

在当今数字化生活中,数据丢失的风险如影随形。无论是误删文件、硬盘故障,还是遭遇病毒攻击,丢失的数据都可能给我们带来不小的麻烦。此时,一款优秀的数据恢复软件就成为了挽救数据的关键。今天,为大家汇总推荐...

中兴星星一号刷回官方原版recovery的教程

【搞科技教程】中兴星星一号的官方recovery也来说一下了,因为之前给大家分享过了第三方的recovery了,之前给大家分享的第三方recovery也是采用一键刷入的方式,如果细心的朋友会发现,之前...

新玩机工具箱,Uotan柚坛工具箱软件体验

以前的手机系统功能比较单调,各厂商的重视程度不一样,所以喜欢玩机的朋友会解锁手机系统的读写权限,来进行刷机或者ROOT之类的操作,让使用体验更好。随着现在的手机系统越来越保守,以及自身功能的增强,...

三星g906k刷recovery教程_三星g906k中文recovery下载

【搞科技教程】看到有一些机友在找三星g906k的第三方recovery,下面就来说一下详细的recovery的刷入方法了,因为手机只有有了第三方的recovery之后才可以刷第三方的root包和系统包...

中兴星星2号刷recovery教程_星星二号中文recovery下载

【搞科技教程】咱们的中兴星星2手机也就是中兴星星二号手机的第三方recovery已经出来了,并且是中文版的,有了这个recovery之后,咱们的手机就可以轻松的刷第三方的系统包了,如果没有第三方的re...

数据恢复软件有哪些值得推荐?这 6 款亲测好用的工具汇总请收好!

在数字生活中,数据丢失的阴霾常常突如其来。无论是误删工作文档、格式化重要磁盘,还是遭遇系统崩溃,都可能让我们陷入焦虑。关键时刻,一款得力的数据恢复软件便是那根“救命稻草”。今天,为大家精心汇总6...

中兴u956刷入recovery的教程(中兴e5900刷机)

【搞科技教程】这次主要来给大家说说中兴u956手机如何刷入第三方的recovery,因为第三方的recovery工具是咱们刷第三方rom包的基础,可是很我欠却不会刷,所以太这里来给大家整理了一下详细的...

联想A850+刷recovery教程 联想A850+第三方recovery下载

【搞科技教程】联想A850+的第三方recovery出来了,这个第三方的recovery是非常的重要的,比如咱们的手机要刷第三方的系统包的时候,都是需要用到这个第三方的recovery的,在网上也是有...

工具侠重大更新 智能机上刷机一条龙完成

工具侠是针对玩机的机油开发的一款工具,不管是发烧级别的粉丝,还是普通小白用户,都可以在工具侠上找到你喜欢的工具应用。这不,最新的工具侠2.0.16版本,更新了专门为小白准备的刷机助手工具,以及MTK超...

shift+delete删除的文件找回6种硬盘数据恢复工具

硬盘作为电脑的重要存储设备,如同一个巨大的数字仓库,承载着我们日常工作、学习和生活中的各种文件,从珍贵的照片、重要的工作文档到喜爱的视频、音乐等,都依赖硬盘来安全存放。但有时,我们可能会不小心用sh...

使用vscode+Deepseek 实现AI编程 基于Cline和continue

尊敬的诸位!我是一名专注于嵌入式开发的物联网工程师。关注我,持续分享最新物联网与AI资讯和开发实战。期望与您携手探寻物联网与AI的无尽可能。这两天deepseek3.0上线,据说编程能力比肩Cl...

详解如何使用VSCode搭建TypeScript环境(适合小白)

搭建Javascript环境因为TypeScript不能直接在浏览器上运行。它需要编译器来编译并生成JavaScript文件。所以需要首先安装好javascript环境,可以参考文章:https://...

使用VSCode来书写你的Jupyter Notebooks

现在你可以在VScode里面来书写你的notebook了,使用起来十分的方便。下面来给大家演示一下环境的搭建。首先需要安装一个jupyter的包,使用下面的命令安装:pip3install-ih...

使用VSCode模板提高Vue开发效率(vscode开发vue插件)

安装VSCode安装Vetur和VueHelper插件,安装完成后需要重启VScode。在扩展插件搜索框中找到如下Vetur和VueHelper两个插件,注意看图标。添加Vue模板打...

干货!VsCode接入DeepSeek实现AI编程的5种主流插件详解

AI大模型对编程的影响非常之大,可以说首当其冲,Cursor等对话式编程工具渐渐渗透到开发者的工作中,作为AI编程的明星产品,Cursor虽然好用,但是贵啊,所以咱们得找平替,最好免费那种。俗话说,不...