Python之txt数据预定替换word预定义定位标记生成word报告(三)

liftword2个月前 (03-29)技术文章16

需接Python之txt数据预定替换word预定义定位标记生成word报告(一)和(二),续写第三部分python代码,本部分代码为:数据处理模块 - DataProcessor类

Python之txt数据预定替换word预定义定位标记生成word报告(一)

https://mp.toutiao.com/profile_v4/graphic/preview?pgc_id=7482354347595088424

Python之txt数据预定替换word预定义定位标记生成word报告(二)

https://mp.toutiao.com/profile_v4/graphic/preview?pgc_id=7482355993293160994

数据处理模块 - DataProcessor类,代码如下:

class DataProcessor:
    """TXT数据处理引擎,功能:
    1. 从文件名提取IP
    2. 解析检查项数据
    """

    @staticmethod
    def extract_data(file_path):
        """从TXT文件提取结构化数据
        :param file_path: 文件完整路径
        :return: 字典格式 {标记: 数据内容}
        """
        data = {}
        current_section = None

        with open(file_path, 'r', encoding='utf-8-sig') as f:
            content = f.read()

        for marker, (start_pat, end_pat) in CHECK_BLOCKS.items():
            pattern = re.compile(rf"{start_pat}\n(.*?)\n{end_pat}", re.DOTALL | re.MULTILINE)
            if match := pattern.search(content):
                cleaned = re.sub(r"^-{4,}$", "", match.group(1).strip(), flags=re.MULTILINE)
                data[marker] = cleaned
                print(f"提取成功:{marker}({len(cleaned)}字符)")
            else:
                data[marker] = "[数据缺失]"
                print(f"未找到:{marker}")

        return data
- **类定义**:`DataProcessor`类用于处理TXT文件数据。
- **`extract_data`静态方法**:读取TXT文件内容,根据`CHECK_BLOCKS`中定义的正则表达式模式提取每个检查项的数据,返回一个字典,键为检查项标记,值为提取的数据内容,如果未找到则返回`[数据缺失]`。

相关文章

一文掌握Python找到文件操作

阅读文件读取文件的全部内容:with open('example.txt', 'r') as file: content = file.read() print(content)2....

Python 文件读写(txt、json、xml、ini)

在进行接口自动化测试时,我们经常需要处理各种格式的文件。熟练掌握对这些文件的读写能力对于提升测试效率至关重要。今天我们就来一起学习如何用Python来操作常见的文件类型,包括文本文件(.txt)、JS...

怎么用Python提取txt的章节目录?

提取txt文本中的章节在网络上下载的小说,一般是txt格式的,并且往往是没有目录的。那么有没办法提取出小说的目录呢?下面是一个示例代码,用于提取txt文本中的章节作为目录: import re #...

python初学者系列:windows下载python

合集说明这是一个针对python3初学者的合集,将持续更新。 本合集主要内容是一些代码案例,帮助初学者学习发散,主体包含知识点、结果展示、思路分析、实现流程四大模块。初学者可以根据知识点判断是否继续阅...

22-3-Python高级特性-上下文管理器

4-上下文管理器4-1-概念上下文管理器是一种实现了 `__enter__()` 和 `__exit__()` 方法的对象;用于管理资源的生命周期,如文件的打开和关闭、数据库连接的建立和断开等。使用...

21-Python-文件操作

在Python中,文件操作是非常重要的一部分,它允许我们读取、写入和修改文件。下面将详细讲解Python文件操作的各个方面,并给出相应的示例。1-打开文件在Python中,使用`open()`函数来打...