电话
400 9058 355
本文介绍使用 python 内置 `zip()` 函数高效转置竖排文本(如字谜式排列)为横排单词的方法,并支持列偏移与空格清理,适用于固定行宽的字符矩阵解析。
在处理某些特殊格式的文本文件(例如谜题、编码数据或手动生成的字符矩阵)时,我们常遇到“竖排书写”的情况:每一行代表一列字母,整体构成多个横向单词。例如以下内容存储在 fruits.txt 中:
AOPL PREE PAAM LNCO EGHN E
目标是将其还原为逗号分隔的横排单词:APPLE,ORANGE,PEACH,LEMON。
关键在于理解该文本本质上是一个字符矩阵的转置——原矩阵按行读是杂乱字母,但按列读(即逐列取字符)即可拼出正确单词。Python 的 zip(*lines) 正是实现行列转置的经典技巧。
path = "fruits.txt"
with open(path) as f:
lines = [line.rstrip('\n') for line in f] # 统一去除换行符,保留末尾空格(如有)
# 转置:zip(*lines) 将第0列、第1列……各组成元组,如 ('A','P','P','L','E',' ') → "APPLE "
result = ["".join(chars).strip() for chars in zip(*lines)]
print(result)
# 输出:['APPLE', 'ORANGE', 'PEACH', 'LEMON']? 原理说明:zip(*lines) 等价于 zip(line0, line1, line2, ...),它把所有行的第 0 个字符、第 1 个字符……分别聚合为元组。只要各行长度一致(本例中均为 4 或补空格后对齐),即可安全转置。
若需忽略第 0 列(例如首列为索引或分隔符),可结合 itertools.islice 截取从第 1 列开始的转置结果:
from itertools import islice
with open(path) as f:
lines = [line.rstrip('\n') for line in f]
# 从第 1 列开始(即跳过索引列),取 zip(*lines) 的第1个及后续元素
result = ["".join(chars).strip() for chars in islice(zip(*lines), 1, None)]
print(result)
# 输出:['ORANGE', 'PEACH', 'LEMON']max_len = max(len(line) for line in lines) lines = [line.ljust(max_len) for line in lines] # 左对齐,右补空格
output = ",".join(result) # → "APPLE,ORANGE,PEACH,LEMON"
此方法无需依赖 pandas,轻量、高效、可读性强,是处理规则竖排文本的首选方案。
邮箱:8955556@qq.com
Q Q:8955556
本文详解如何将Go官方present工具(用于生成HTML5...
PySNMP在不同版本中对SNMP错误状态(errorSta...
time.Sleep仅阻塞当前goroutine,其他gor...
PHPfopen()创建含特殊符号的文件名失败主因是操作系统...
WooCommerce中通过代码为分组产品动态聚合子商品的属...
io.ReadFull返回io.ErrUnexpectedE...
本文详解Yii2中控制器向视图传递ActiveRecord数...
本文详解为何通过wp_set_object_terms()为...
Pytest中使用@mock.patch类装饰器会导致补丁泄...
带缓冲的channel是并发安全的FIFO队列;make(c...