百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

在 R 中运行 Python 脚本

bigegpt 2024-09-05 12:16 65 浏览

以下是如何构建一个简单的包装函数以在 R 中执行 Python 脚本

复杂的统计分析通常需要使用不同编程语言的脚本。 例如,您可能想在 Python 中开发和训练机器学习模型并处理您的数据,但在 R 中运行统计分析。有时,通过 R 中的一个包装函数来执行所有脚本会更容易。在这篇文章中,我将展示 编写一个简单的包装函数的步骤,该函数采用 R 或 Python 脚本的完整路径,执行它,并写入进程中的日志。


设置日志文件

首先,当您执行多个脚本时,您需要保留一个日志文件来跟踪哪些脚本已执行,以及已生成哪些文件和/或图形。 使用以下代码在 R 中轻松设置日志文件。

logfile_name <- gsub('-| |:','_',paste('logfile_',Sys.time(),'.log',sep=''))
log_file <- file(logfile_name)


我总是喜欢使用 Sys.time() 在文件名中包含复制的开始时间(以防万一您想运行多个迭代进行比较)。 gsub 可用于从文件名中删除任何空格和其他不寻常的字符,用下划线替换它们。

通过“打开”日志文件(即建立连接)并使用 cat() 命令添加日志条目,将新消息附加到日志文件中。 使用 paste() 将存储在对象中的信息与其他字符串组合起来(在此示例中,我包含了正在执行的脚本的名称,存储在名为 script_name 的变量中)。 最后,确保在记录日志消息后立即再次关闭日志文件。

log_file <- file(logfile_name, open = 'a')
cat(
	paste(
		'\n\nExecuting ',
		script_name,
		' script (start time: ',
		Sys.time(),')',
		sep=''
		), 
	file = log_file, 
	append = TRUE
	)
close(log_file)


在 R 中执行 Python 脚本

要执行保存在 R 工作目录中的 R 文件,只需调用 source(script_name.R)。在 R 中执行 Python 脚本需要更多步骤。使用输入参数执行 Python 脚本的代码如下所示。

system(paste('python3', script_name, input_params, sep=' '))


让我们一步一步地看一下这段代码。首先,您需要像在终端(在 Mac OS 上)或命令提示符(在 Windows 上)中使用的那样传入 Python 代码,例如python3 myscript.py。但是,您通常会希望包含一些在 Python 代码中使用的输入参数。为此,您可以将输入参数分配给 R 中的一个对象(在此示例中,此对象称为 input_params)。这是什么类型的对象取决于您创建的 Python 函数。例如,它可以是单个值(例如整数或浮点数)或不同类型的不同值的列表。

第二步,您需要对 Python 脚本进行一些更改,以确保您的程序可以实际使用这些参数:sys.argv[index]。这在下面的示例中进行了说明。

import sys
x = float(sys.argv[1])
print(x + 5)

在此示例中,假设我们的脚本名为 add_five.py。 还假设,无论出于何种原因,我们想从 R 中运行这个 Python 代码并将其应用于浮点值 3.0。 这可以通过使用 R 中的 system() 命令结合您的输入数据和以下代码中的 python 脚本来实现:system(paste('python3 add_five.py 3.0')。

sys.argval 允许您从命令中获取输入。 由于 Pyton 按从零开始的整数索引列表,脚本名称可以通过 sys.argv[0] 访问,而浮点值 3.0 可以通过添加参数 sys.argv[1] 包含在 Python 中的计算中使用。 请注意,此参数将作为字符串值在您的命令中读取,因此您必须将其转换为适合您的代码的类型(此处为浮点值)。


把它们放在一起

综上所述,我们有一个简单的包装函数,它从 R 中执行文件,获取日志文件、打印消息、脚本名称、一些输入参数和编程语言(“R”或“Python”)。 完整代码如下所示。

library(types)
library(testit)
logfile_name <- gsub('-| |:','_',paste('logfile_',Sys.time(),'.log',sep=''))
log_file <- file(logfile_name)

execute_script <- function(script_name = ? character,type="R" ? character,input_params=NULL){
  assert("Supported language", type %in% c("R", "Python"))
  log_file <- file(logfile_name, open = 'a')
  cat(paste('\n\nExecuting ',script_name,' script (start time: ',Sys.time(),')',sep=''), file = log_file,append = TRUE)
  close(log_file)
  
  
  if(type=="R"){
    execution_time <- round(system.time({source(script_name)})[3]/60,digits=2)
  }else{
    execution_time <- round(system.time({system(paste('python3',script_name, input_params, sep=' '))})[3]/60,digits=2)  
  }
  
  log_file <- file(logfile_name, open = 'a')
  cat(paste('\n',script_name, ' script run. Execution time: ', execution_time," minutes",sep=''), file = log_file,append = TRUE)
  close(log_file)
  
  message(paste('\n',script_name, ' script run. Execution time: ', execution_time," minutes",sep=''))
  
}

上面显示的函数允许用户执行 R 和 Python 文件,并在脚本执行完成后注册一个简单的日志消息。 您现在可以直接在 R 中使用 execute_script(“myscript.py”, “Python”, 3.0),而不是使用 source()。

当您需要为结合 Python 和 R 的分析执行许多不同的脚本时,使用包装函数是创建简洁复制工作流的更简单方法。


谢谢阅读!

相关推荐

Linux gron 命令使用详解(linux gminer)

简介gron是一个独特的命令行工具,用于将JSON数据转换为离散的、易于grep处理的赋值语句格式。它的名字来源于"grepableon"或"grepable...

【Linux】——从0到1的学习,让你熟练掌握,带你玩转Linu

学习Linux并掌握Java环境配置及SpringBoot项目部署是一个系统化的过程,以下是从零开始的详细指南,帮助你逐步掌握这些技能。一、Linux基础入门1.安装Linux系统选择发行版:推荐...

Linux常用的shell命令汇总(linux中shell的作用)

本文介绍Linux系统下常用的系统级命令,包括软硬件查看、修改命令,有CPU、内存、硬盘、网络、系统管理等命令。说明命令是在Centos6.464位的虚拟机系统进行测试的。本文介绍的命令都会在此C...

零成本搭建个人加密文件保险柜(适用于 Win11 和 Linux)

不依赖收费软件操作简单,小白也能跟着做支持双系统,跨平台使用实现数据加密、防删除、防泄露内容通俗无技术门槛,秒懂秒用使用工具简介我们将使用两个核心工具:工具名用途系统支持Veracrypt创建加密虚...

如何在 Linux 中使用 Gzip 命令?(linux怎么用gzip命令)

gzip(GNUzip)是Linux系统中一个开源的压缩工具,用于压缩和解压缩文件。它基于DEFLATE算法,广泛应用于文件压缩、备份和数据传输。gzip生成的文件通常带有.gz后缀,压缩效率...

Linux 必备的20个核心知识点(linux内核知识点)

学习和使用Linux所必备的20个核心知识点。这些知识点涵盖了从基础操作到系统管理和网络概念,是构建扎实Linux技能的基础。Linux必备的20个知识点1.Linux文件系统层级标...

谷歌 ChromeOS 已支持 7z、iso、tar 文件格式

IT之家6月21日消息,谷歌ChromeOS在管理文件方面进行了改进,新增了对7z、iso和tar等格式的支持。从5月的ChromeOS101更新开始,ChromeOS...

如何在 Linux 中提取 Tar Bz2 文件?

在深入解压方法之前,我们先来了解.tar.bz2文件的本质。.tar.bz2是一种组合文件格式,包含两个步骤:Tar(TapeArchive):tar是一种归档工具,用于将多个文件或目录打包...

如何在 CentOS 7/8 上安装 Kitematic Docker 管理器

Kitematic是一款流行的Docker图形界面管理平台,适用于Ubuntu、macOS和Windows操作系统。然而,其他发行版(如CentOS、OpenSUSE、Fedora、R...

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

爬虫搞崩网站后,程序员自制“Zip炸弹”反击,6刀服务器成功扛住4.6万请求

在这个爬虫横行的时代,越来越多开发者深受其害:有人怒斥OpenAI的爬虫疯狂“偷”数据,7人团队十年心血的网站一夜崩溃;也有人被爬虫逼到极限,最后只好封掉整个巴西的访问才勉强止血。但本文作者却走...

Ubuntu 操作系统常用命令详解(ubuntu必学的60个命令)

UbuntuLinux是一款流行的开源操作系统,广泛应用于服务器、开发、学习等场景。命令行是Ubuntu的灵魂,也是高效、稳定管理系统的利器。本文按照各大常用领域,详细总结Ubuntu必学...

Linux面板8.0.54 测试版-已上线(linux主机面板)

Linux面板8.0.54测试版【增加】[网站]Java项目新增刷新列表按钮【增加】[网站]PHP项目-Apache-服务新增守护进程功能【增加】[网站]Python项目创建/删除网站时新增同时创建...

开源三剑客——构建私有云世界的基石

公共云原生的浪潮正在席卷这个世界,亚马逊AWS、谷歌GCP和微软的Azure年收入增长超过了30%,越来越多的公司和个人开始将自己的服务部署到云环境中,大型数据中心的规模经济带来了成本的降低,可以在保...

2.2k star,一款业界领先的私有云+在线文档管理系统

简介kodbox可道云(原KodExplorer)是业内领先的企业私有云和在线文档管理系统,为个人网站、企业私有云部署、网络存储、在线文档管理、在线办公等提供安全可控,简便易用、可高度定制的私有云产品...