查看: 965|回复: 4
收起左侧

[软件] docx 如何使用通配符匹配英文段落

[复制链接]
eremiter
发表于 2026-1-3 22:22:38 | 显示全部楼层 |阅读模式
本帖最后由 eremiter 于 2026-1-4 10:04 编辑

目的:
· 匹配所有英文的段落,修改颜色或替换或删除
· 如果段落中有英文和中文混在一起,则不匹配
· 如果英文或中文段落有背景色,则不匹配
。如果是空行,则不匹配

wps 或 word都行

附件是 docx 文档,本来限制匹配每段开头字符,但开头不能以 ^ 开头,所以始终没法解决,搜索百度和ai问题,都无法解决

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?快速注册

x
随便注册
发表于 2026-1-4 11:43:00 | 显示全部楼层
恐怕你复制出txt用正则删除,再新建一个word粘回去,重新刷格式都更快
word只是排版美工,不识字
大批量,还一个办法,作为压缩包打开docx,直接处理word\document.xml,需要自己写脚本
eremiter
 楼主| 发表于 2026-1-5 10:10:13 | 显示全部楼层
随便注册 发表于 2026-1-4 11:43
恐怕你复制出txt用正则删除,再新建一个word粘回去,重新刷格式都更快
word只是排版美工,不识字
大批量 ...

1300多页,复制 Txt 手功操作,不现实
随便注册
发表于 2026-1-5 12:14:45 | 显示全部楼层
eremiter 发表于 2026-1-5 10:10
1300多页,复制 Txt 手功操作,不现实

那就试第二种办法,先备份
大致看了看,思路是先提取<w:p...>...</w:p>标签,有背景色或者不是默认背景色,就跳过
背景色没问题了,再提取其中的<w:t...>...</w:t>标签中的内容,看有无[\u0391-\uFFE5],没有就删掉该标签
按英文、中文判断,第一句那个“¶”就漏掉了,用[\u0391-\uFFE5]判断可能更好点

中文部分,不知道是微软蠢,还是因为从别的格式转来的,几乎一字一样式。如果中文段落里混有字母数字,又单独标签,会误删。
匹配


英文
段落,
修改
颜色

替换
eremiter
 楼主| 发表于 3 天前 | 显示全部楼层
随便注册 发表于 2026-1-5 12:14
那就试第二种办法,先备份
大致看了看,思路是先提取...标签,有背景色或者不是默认背景色,就跳过
背 ...

谢谢热心的朋友,我再研究一下
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2026-1-24 07:51 , Processed in 0.073094 second(s), 3 queries , Redis On.

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表