百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Python通过replace实现sed替换功能

bigegpt 2024-09-25 14:34 3 浏览

1、实验环境

1.1、场景设计

我在一个文本中存放了一些IP跟端口的信息,文本内容如下:



现在我需要把文本跟端口进行切割,然后再打印切割后的数据并进行变量赋值,源码如下:

from os import path
#设置文件path变量
url_file = "./list.txt"
#判断文件是否存在
if path.exists(url_file):
    #打开文件
    file = open(url_file, "r", encoding='utf-8')
    #遍历文件行内容
    for (num, li) in enumerate(file, 1):
        print("正在检测第[ %s ]行内容: [ %s ] " %(num, li))
        xi = li.split(' ', 2)
        xi2 = [li]
        for i in xi2:
            domain_port = i.split(' ')
            domain = domain_port[0]
            port = domain_port[1]
            print("第[ %s ]行获取的域名:[ %s ] " %(num, domain))
            print("第[ %s ] 行获取的端口:[ %s ] " %(num, port))
            print(domain)
            print(port)
    file.close()
else:
    exit("找不到文件[%s]" %url_file)

可是在打印的过程中出现了预期之外的现象,如下:


可以看出,下面这个符合出现了不该有的断层


[]

作为强迫症患者,这怎么能忍受呢!

2、查找问题

程序出了问题,最好的解决办法就是一点一点的还原最初的信息,所以我们可以先看一下获取到的整行内容有什么,所以代码修改成这样:

from os import path
#设置文件path变量
url_file = "./list.txt"
#判断文件是否存在
if path.exists(url_file):
    #打开文件
    file = open(url_file, "r", encoding='utf-8')
    #遍历文件行内容
    for (num, li) in enumerate(file, 1):
        print("正在检测第[ %s ]行内容: [ %s ] " ,(num, li))
        xi = li.split(' ', 2)
        xi2 = [li]
        for i in xi2:
            domain_port = i.split(' ')
            domain = domain_port[0]
            port = domain_port[1]
            print("第[ %s ]行获取的域名:[ %s ] " ,(num, domain))
            print("第[ %s ] 行获取的端口:[ %s ] " ,(num, port))
            print(domain)
            print(port)
    file.close()
else:
    exit("找不到文件[%s]" %url_file)

也就是把打印的变量独立出来,不作为


%

的引用,然后运行,得出的结果如下:


此时可以看出,在每一行后面都有一个转义,也就是换行符,所以这个换行符就把符号的后一部分换行到下一行了,所以出现了符合不对称的问题,既然问题找到了,那么就解决一下!

3、解决问题

3.1、解决思路

对于此类问题,我在编写shell脚本的过程中也会遇到,所以如果是换到shell语言的话,一个sed就解决了,也就是通过替换,那么在Python也是一样的,虽然工具有点不一样,但是解决的思路是一致的。

3.2、解决工具

在Python中,处理字符串替换的工具是str.replace,菜鸟教程解释链接如下:https://www.runoob.com/python/att-string-replace.html
通过菜鸟教程的案例,可以看出语法是非常的简洁的,但是在这个案例中使用的只是其中一个语法,另一个语法如下:

str.replace("str", "old", "new")

举个例子:

liuyi@l:~$ more d.py 
li = 'baidu'
lis = str.replace(li, "du", "da")
print(lis)

执行结果如下:

liuyi@l:~$ python3 d.py 
baida
liuyi@l:~$ 

3.2.1、增加str.replace语句


代码改造如下:

from os import path
#设置文件path变量
url_file = "./list.txt"
#判断文件是否存在
if path.exists(url_file):
    #打开文件
    file = open(url_file, "r", encoding='utf-8')
    #遍历文件行内容
    for (num, li) in enumerate(file, 1):
        li = str.replace(li, "\n", "")
        print("正在检测第[ %s ]行内容: [ %s ] " %(num, li))
        xi = li.split(' ', 2)
        xi2 = [li]
        for i in xi2:
            domain_port = i.split(' ')
            domain = domain_port[0]
            port = domain_port[1]
            print("第[ %s ]行获取的域名:[ %s ] " %(num, domain))
            print("第[ %s ] 行获取的端口:[ %s ] " %(num, port))
            print(domain)
            print(port)
    file.close()
else:
    exit("找不到文件[%s]" %url_file)

运行结果如下:


这时候就完美解决了输出格式问题

相关推荐

C#.NET Autofac 详解(c# autoit)

简介Autofac是一个成熟的、功能丰富的.NET依赖注入(DI)容器。相比于内置容器,它额外提供:模块化注册、装饰器(Decorator)、拦截器(Interceptor)、强o的属性/方法注...

webapi 全流程(webapi怎么部署)

C#中的WebAPIMinimalApi没有控制器,普通api有控制器,MinimalApi是直达型,精简了很多中间代码,广泛适用于微服务架构MinimalApi一切都在组控制台应用程序类【Progr...

.NET外挂系列:3. 了解 harmony 中灵活的纯手工注入方式

一:背景1.讲故事上一篇我们讲到了注解特性,harmony在内部提供了20个HarmonyPatch重载方法尽可能的让大家满足业务开发,那时候我也说了,特性虽然简单粗暴,但只能解决95%...

C# 使用SemanticKernel调用本地大模型deepseek

一、先使用ollama部署好deepseek大模型。具体部署请看前面的头条使用ollama进行本地化部署deepseek大模型二、创建一个空的控制台dotnetnewconsole//添加依赖...

C#.NET 中间件详解(.net core中间件use和run)

简介中间件(Middleware)是ASP.NETCore的核心组件,用于处理HTTP请求和响应的管道机制。它是基于管道模型的轻量级、模块化设计,允许开发者在请求处理过程中插入自定义逻辑。...

IoC 自动注入:让依赖注册不再重复劳动

在ASP.NETCore中,IoC(控制反转)功能通过依赖注入(DI)实现。ASP.NETCore有一个内置的依赖注入容器,可以自动完成依赖注入。我们可以结合反射、特性或程序集扫描来实现自动...

C#.NET 依赖注入详解(c#依赖注入的三种方式)

简介在C#.NET中,依赖注入(DependencyInjection,简称DI)是一种设计模式,用于实现控制反转(InversionofControl,IoC),以降低代码耦合、提高可...

C#从零开始实现一个特性的自动注入功能

在现代软件开发中,依赖注入(DependencyInjection,DI)是实现松耦合、模块化和可测试代码的一个重要实践。C#提供了优秀的DI容器,如ASP.NETCore中自带的Micr...

C#.NET 仓储模式详解(c#仓库货物管理系统)

简介仓储模式(RepositoryPattern)是一种数据访问抽象模式,它在领域模型和数据访问层之间创建了一个隔离层,使得领域模型无需直接与数据访问逻辑交互。仓储模式的核心思想是将数据访问逻辑封装...

C#.NET 泛型详解(c# 泛型 滥用)

简介泛型(Generics)是指在类型或方法定义时使用类型参数,以实现类型安全、可重用和高性能的数据结构与算法为什么需要泛型类型安全防止“装箱/拆箱”带来的性能损耗,并在编译时检测类型错误。可重用同一...

数据分析-相关性分析(相关性 分析)

相关性分析是一种统计方法,用于衡量两个或多个变量之间的关系强度和方向。它通过计算相关系数来量化变量间的线性关系,从而帮助理解变量之间的相互影响。相关性分析常用于数据探索和假设检验,是数据分析和统计建模...

geom_smooth()函数-R语言ggplot2快速入门18

在每节,先运行以下这几行程序。library(ggplot2)library(ggpubr)library(ggtext)#用于个性化图表library(dplyr)#用于数据处理p...

规范申报易错要素解析(规范申报易错要素解析)

为什么要规范申报?规范申报是以满足海关监管、征税、统计等工作为目的,纳税义务人及其代理人依法向海关如实申报的行为,也是海关审接单环节依法监管的重要工作。企业申报的内容须符合《中华人民共和国海关进出口货...

「Eurora」海关编码归类 全球海关编码查询 关务服务

  海关编码是什么?  海关编码即HS编码,为编码协调制度的简称。  其全称为《商品名称及编码协调制度的国际公约》(InternationalConventionforHarmonizedCo...

9月1日起,河南省税务部门对豆制品加工业试行新政7类豆制品均适用投入产出法

全媒体记者杨晓川报道9月2日,记者从税务部门获悉,为减轻纳税人税收负担,完善农产品增值税进项税额抵扣机制,根据相关规定,结合我省实际情况,经广泛调查研究和征求意见,从9月1日起,我省税务部门对豆制品...