Python脚本从XML文件中删除所有注释

安全技术
22年1月12日
编辑

aqzt

释放双眼，带上耳机，听听看~！

我正在尝试构建一个 python脚本,它将接收 XML文档并从中删除所有注释块.

我尝试过以下方面：


1
2
3
4
5
6
7
1tree = ElementTree()

2tree.parse(file)

3commentElements = tree.findall(&#x27;//comment()&#x27;)

4

5for element in commentElements:

6    element.parentNode.remove(element)

7

这样做会从python中产生一个奇怪的错误：“KeyError：'()’

我知道有很多方法可以使用其他方法(如sed)轻松编辑文件,但我必须在python脚本中完成.

comment()是ElementTree不支持的XPath节点测试.

你可以在lxml上使用comment().这个库与ElementTree非常相似,它完全支持XPath 1.0.

以下是使用lxml删除注释的方法：


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
1from lxml import etree

2

3XML = &quot;&quot;&quot;&lt;root&gt;

4  &lt;!-- COMMENT 1 --&gt;

5  &lt;x&gt;TEXT 1&lt;/x&gt;

6  &lt;y&gt;TEXT 2 &lt;!-- COMMENT 2 --&gt;&lt;/y&gt;

7&lt;/root&gt;&quot;&quot;&quot;

8

9tree = etree.fromstring(XML)

10

11comments = tree.xpath(&#x27;//comment()&#x27;)

12

13for c in comments:

14    p = c.getparent()

15    p.remove(c)

16

17print etree.tostring(tree)

18

输出：


1
2
3
4
5
1&lt;root&gt;

2  &lt;x&gt;TEXT 1&lt;/x&gt;

3  &lt;y&gt;TEXT 2 &lt;/y&gt;

4&lt;/root&gt;

5

{{userData.name}}已认证

Python脚本从XML文件中删除所有注释

C++中引用和指针的区别

滴滴优步回应《细则》：新政让更多低排量车辆符合规定

{{userData.name}}已认证

Related posts:

C++中引用和指针的区别

滴滴优步回应《细则》：新政让更多低排量车辆符合规定

一个简单的监控redis性能的python脚本

python zabbix批量添加主机 脚本

html table 转 Markdown表格 （python脚本实现）

一个监控挂载盘的python脚本

python zabbix批量添加主机脚本

html table 转 Markdown表格（python脚本实现）