加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python:存储在列表中的连接和写入(XML.etrees)树

发布时间:2020-12-16 21:47:36 所属栏目:Python 来源:网络整理
导读:我正在循环一些XML文件并生成我想要以defaultdict(list)类型存储的树.每个循环和下一个找到的子项将存储在字典的单独部分中. d = defaultdict(list)counter = 0for child in root.findall(something): tree = ET.ElementTree(something) d[int(x)].append(tr

我正在循环一些XML文件并生成我想要以defaultdict(list)类型存储的树.每个循环和下一个找到的子项将存储在字典的单独部分中.

d = defaultdict(list)
counter = 0
for child in root.findall(something):
    tree = ET.ElementTree(something)
    d[int(x)].append(tree)
    counter += 1

因此,对多个文件重复此操作将导致精确索引的结果;跨越不同解析文件的位置1的一组树,依此类推.问题是,我如何加入所有d,并将树(作为累积树)写入文件?

我可以遍历dict来获取每棵树:

for x in d:
    for y in d[x]:
        print (y)

这给出了我的词典中的完整树木列表.现在,我如何从中生产出一棵大树?

Sample input file 1

Sample input file 2

Required results from 1&2

鉴于这样做有明显的困难,我很高兴接受更一般的答案,这些答案显示我如何从两个或更多文件中获取我正在寻找的结果.

最佳答案
使用Spyne:

from spyne.model.primitive import *
from spyne.model.complex import *

class GpsInfo(ComplexModel):
    UTC = DateTime
    Latitude = Double
    Longitude = Double
    DopplerTime = Double
    Quality = Unicode
    HDOP = Unicode
    Altitude = Double
    Speed = Double
    Heading = Double
    Estimated = Boolean

class Header(ComplexModel):
    Name = Unicode
    Time = DateTime
    SeqNo = Integer

class CTrailData(ComplexModel):
    index = UnsignedInteger
    gpsInfo = GpsInfo
    Header = Header

class CTrail(ComplexModel):
    LastError = AnyXml
    MaxTrial = Integer
    Trail = Array(CTrailData)

from lxml import etree
from spyne.util.xml import *

file_1 = get_xml_as_object(etree.fromstring(open('file1').read()),CTrail)
file_2 = get_xml_as_object(etree.fromstring(open('file2').read()),CTrail)
file_1.Trail.extend(file_2.Trail)
file_1.Trail.sort(key=lambda x: x.index)

elt = get_object_as_xml(file_1,no_namespace=True)
print etree.tostring(elt,pretty_print=True)

在执行此操作时,Spyne还将数据字段从字符串转换为其本机Python格式,因此您可以更轻松地处理此xml文档中的数据.

另外,如果您不介意使用git的最新版本,您可以这样做:

class GpsInfo(ComplexModel):
    # (...)
    doppler_time = Double(sub_name="DopplerTime")
    # (...)

这样您就可以从CamelCased标签获取数据,而不必违反PEP8.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读