ubiquitour.com

Cómo consumir un átomo de la alimentación en Python

Atom es un vínculo estándar que usa tecnología XML Web. Un feed de la Web es un archivo que contiene las entradas que resumen y enlace al contenido de la Web. Generalmente se utilizan alimentos de web para suscribirse a un sitio web con la ayuda de un lector de feeds. Un lector de feeds es una aplicación que comprueba los feeds suscritos y muestra y actualiza resúmenes sobre el contenido suscrito. Lectores se dicen que consumir un alimento cuando se procesan. Puede escribir un simple script en Python que consume los feeds Atom en pocos minutos.

Instrucciones

1 Abra el editor de texto inactivo en archivos de programa o aplicaciones para Macintosh, en el directorio de Python. Se abre un archivo de código fuente en blanco.

2 Importar el módulo de árbol de elementos XML. Este módulo le permite atravesar fácilmente un archivo XML. La fuente Atom es un archivo XML, así que esto es lo que va a utilizar para consumir los alimentos después de se descarga. Para importar el módulo, escriba lo siguiente en la parte superior del archivo de código fuente:

xml.etree.ElementTree de importación e

3 Importar el módulo de urllib.request. Este módulo le permite abrir sitios de internet (URL) y descarga. Para importar este módulo, escriba la línea siguiente:

importación urllib.request

mespace Declarar una cadena y un conjunto su valor igual a la URL de la Atom feed te desea consumir. Por ejemplo, si desea consumir la web átomo permitió alimentar, puede escribir lo siguiente:

feedString = 'http://www.atomenabled.org/atom.xml'

5 Abrir la dirección URL de la fuente utilizando la función urlopen() Atom. Esta función crea un archivo objeto que puede pasar en el árbol de elementos XML. Puede guardar el archivo como objeto en una variable denominada tmp como esta:

tmp = urllib.request.urlopen(feedString)

6 Analizar el objeto de archivo utilizando el árbol de elementos XML escribiendo la siguiente línea de código:

árbol = etree.parse(tmp)

7 Localizar la raíz del archivo XML con la función getroot() del módulo de árbol de elementos. Los archivos XML se organizan como árboles, y la raíz es la parte superior del archivo. Cada elemento del archivo XML de ramas de la raíz. Al localizar la raíz, usted Dése un buen punto de partida para moverse a través del archivo y deduciendo su información. Para localizar la raíz y almacenarlo en una variable llamada 'root', escriba la siguiente línea de código:

raíz = tree.getroot()

8 Bucle a través del archivo XML mediante un bucle, así:

para un niño en la raíz:

9 Imprimir la información contenida en cada rama del archivo XML pulsando la tecla tab y escribir la siguiente línea de código:

print(child.text)10

Establecer la rama actual como el nodo raíz a un subárbol utilizando la función getchildren(). El propósito de esto es recorrer los elementos XML más profundo de la alimentación. La sintaxis para esta operación se ve así:

nietos = child.getchildren()

11 Bucle a través de la colección de 'nietos' mediante un bucle, así:

para nieto de nietos:

12 Aplicar sangría a la línea siguiente e imprime el texto contenido en el elemento XML, como este:

Print(GrandChild.Text)

13 Ejecutar el programa pulsando "F5". Si su computadora tiene acceso a Internet, se consumirá el feed Atom activado y el texto que contiene se imprimirá en la consola.