Tag: xml

Python ElementTree: анализ строки и получение экземпляра ElementTree

У меня есть строка, содержащая XML-данные, которые возвращаются из HTTP-запроса. Я использую ElementTree для анализа данных, и я хочу, чтобы затем искать рекурсивно для элемента. В соответствии с этим вопросом я могу только рекурсивно искать результат result.findall() если result имеет тип ElementTree а не тип Element . Теперь xml.etree.ElementTree.fromstring() , используемый для синтаксического анализа строки, […]

Пустые строки при использовании minidom.toprettyxml

Я использовал minidom.toprettyxml для префикса моего xml-файла. Когда я создаю XML-файл и использую этот метод, все работы решены, но если я его использую после изменения файла xml (для примера я добавил дополнительные узлы), а затем я возвращаю его в XML , Я получаю пустые строки, каждый раз, когда я его обновляю, у меня все больше […]

Разбор большого RDF в Python

Я хотел бы проанализировать очень большой (около 200 МБ) RDF-файл в python. Должен ли я использовать саксофон или какую-либо другую библиотеку? Я был бы признателен за очень простой код, который я могу использовать, скажем, для получения тега. Заранее спасибо.

Есть ли переключатель для игнорирования неопределенных префиксов пространства имен в LXML?

Я разбираю несоответствующий XML-файл (формат xmlpipe2 Sphinx ) и хотел бы, чтобы LXML-парсер игнорировал тот факт, что существуют неразрешенные префиксы пространства имен. Пример XML Sphinx: <sphinx:schema> <sphinx:field name="subject"/> <sphinx:field name="content"/> <sphinx:attr name="published" type="timestamp"/> <sphinx:attr name="author_id" type="int" bits="16" default="1"/> </sphinx:schema> Я знаю, что нужно передать параметр ключевого слова parser, чтобы попытаться восстановить поврежденный XML, например parser […]

Полнотекстовый поиск XML-данных с помощью Python: лучшие практики, плюсы и минусы

задача Я хочу использовать Python для полнотекстового поиска XML-данных. Примеры данных <elements> <elem id="1">some element</elem> <elem id="2">some other element</elem> <elem id="3">some element <nested id="1"> other nested element </nested> </elem> </elements> Основные функции Самая базовая функциональность, которую я хочу, состоит в том, что поиск «другого» в XPath («/ elements / elem») возвращает хотя бы значение атрибута […]

Пустой список вернулся из ElementTree findall

Я новичок в синтаксическом анализе xml, и Python так несут меня. Я использую lxml для анализа дампа wiki, но я просто хочу, чтобы для каждой страницы, ее названия и текста. На данный момент у меня есть это: from xml.etree import ElementTree as etree def parser(file_name): document = etree.parse(file_name) titles = document.findall('.//title') print titles В настоящий […]

Python XML Parsing

* Примечание: lxml не будет работать в моей системе. Я надеялся найти решение, которое не связано с lxml. Я уже прошел через часть документации, и у меня возникают трудности с тем, чтобы это работало так, как хотелось бы. Я хотел бы проанализировать XML-файл, который выглядит так: <dict> <key>1375</key> <dict> <key>Key 1</key><integer>1375</integer> <key>Key 2</key><string>Some String</string> <key>Key […]

Преобразование Python ElementTree в строку

Я прочитал документацию, и я знаю, что она имеет о ElementTree.tostring(e) но всякий раз, когда я ее вызываю, появляется следующее сообщение об ошибке: AttributeError: 'Element' object has no attribute 'getroot' Есть ли другой способ преобразования объекта ElementTree в строку XML? Выслеживать: Traceback (most recent call last): File "Development/Python/REObjectSort/REObjectResolver.py", line 145, in <module> cm = integrateDataWithCsv(cm, […]

лучший способ реализации пользовательских принтеров

Настройка pprint.PrettyPrinter В документации модуля pprint упоминается, что метод PrettyPrinter.format предназначен для настройки форматирования. Я понимаю, что это возможно переопределить этот метод в подклассе, но это не похоже на то, чтобы методы базового класса применяли перенос строк и отступы. Я что-то упустил? Есть ли лучший способ сделать это (например, другой модуль)? Альтернативы? Я проверил pretty […]

Как создать arrayType для WSDL в Python (используя пенообразование)?

Окружающая среда: Python v2.6.2 пена v0.3.7 WSDL (сервер), с которым я работаю, имеет следующие подразделы схемы (я попытался четко его написать, используя простой текст) – [подраздел № 1] searchRequest: (searchRequest){ userIdentification = (userIdentification){ username = "" password = "" } itineraryArr = (itineraryArray){ _arrayType = "" _offset = "" _id = "" _href = "" […]

Python - лучший язык программирования в мире.