ubiquitour.com

Cómo extraer texto entre las etiquetas HTML

Cómo extraer texto entre las etiquetas HTML

A pesar de saber lo que está en su página web, su página web no. Páginas web consisten en HTML. HTML es el lenguaje de marcado que define la apariencia de una página. HTML consiste en etiquetas como "h1" las etiquetas que definen las partidas. Etiquetas vienen en pares. Hay una etiqueta inicial y una etiqueta final. Los desarrolladores web Coloque el texto entre estas etiquetas. Por ejemplo, para crear un párrafo en una página, insertar un par de etiquetas "p". A veces el código de la Página Web necesita extraer el texto entre estas etiquetas HTML. Puede hacerlo mediante JavaScript.

Instrucciones

1 Abrir Bloc de notas y pegar el siguiente código HTML:

<! Html DOCTYPE público "-//W3C//DTD XHTML 1.0 Transitional / / EN" "del http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" >

< html xmlns = "del http://www.w3.org/1999/xhtml" >

< head >

&lt;title>Test Text Extraction&lt;/title>

< script tipo = "texto/javascript" >

INSERTAR LAS FUNCIONES JAVASCRIPT A CONTINUACIÓN

< /script >

< /HEAD >

< cuerpo >

< id h2 = "Título1" > este es un encabezado < / h2 >

< tipo de entrada = "botón" id = "HeadingButton" value = "Mostrar texto de partida" onclick="showHeading()" / >

< id p = "paragraph1" > esto es un párrafo < /p >

< tipo de entrada = "botón" id = "ParagraphButton" value = "Mostrar texto de párrafo" onclick="showParagraph()" / >

< /body >

< / html >

Esto crea un encabezado con un botón y un párrafo con un botón. Clic en el botón "Mostrar texto de encabezado" se llame una función JavaScript que extrae el texto entre las etiquetas de título. Clic en el botón "Mostrar texto de párrafo" llamará a una función que extrae el texto entre las etiquetas de párrafo.

2 Pegue la siguiente función JavaScript en la sección < script > del documento:

función showHeading() {}

partida de var = document.getElementById('Heading1');

headingText var = heading.innerHTML;

ALERT ("Hacia el texto es ->" + headingText);

}

función showParagraph() {}

párrafo var = document.getElementById('Paragraph1');

var paragraphText = paragraph.innerHTML;

ALERT ("el texto de párrafo es ->" + paragraphText);

}

La función de "showHeading" utiliza el método document.getElementById para visibilizar el título de HTML en JavaScript. Entonces extrae el texto de la partida recuperando su propiedad "innerHTML" y guardarlo en la variable denominada "headingText." La función de "showParagraph" realiza la misma tarea utilizando objeto del párrafo de HTML.

3 Presione "CTRL + S" para abrir la ventana "Guardar como" del Bloc de notas. Escriba un nombre para el archivo en el cuadro de texto "Nombre de archivo". Dar el archivo de una extensión de .html. Por ejemplo, si desea el nombre del archivo "MyTest", tipo "Miprueba.html" (sin las comillas) en el cuadro de texto y haga clic en "Guardar" para guardar el documento como un archivo HTML.

4 Presiona "Windows + E" para abrir el explorador de Windows y desplácese al archivo HTML. Haga doble clic. Su navegador abrirá y mostrar el archivo. Haga clic en los botones. Las funciones JavaScript mostrará el texto entre las etiquetas de encabezado y párrafo.

Consejos y advertencias

  • Utilice la propiedad "innerHTML" para establecer o recuperar el texto de cualquier elemento HTML que contiene texto. Cada elemento debe tener un ID como se muestra en estos ejemplos.