ubiquitour.com

Cómo convertir HTML a texto ASP

El lenguaje de programación ASP le permite recuperar la página HTML y convertirlo a texto normal. Esto es beneficioso si quieres extraer información de un sitio web y tira hacia fuera de las etiquetas HTML antes de analizar la información. Puede utilizar la función "Reemplazar" a las etiquetas HTML de los datos HTML de la tira y devolver sólo texto. Tarda solamente unas pocas líneas de código para aplicar una conversión de HTML a texto.

Instrucciones

1 Crear las variables de ASP. Estas variables sostienen el texto HTML y el contenido se puede convertir texto. El código siguiente muestra cómo crear las variables ASP:

Dim html como cadena

Dim texto As String

2 Añadir algunos HTML a la variable "html". Esto puede ser texto introducido por un usuario, HTML creado en el formulario o una página web. El código siguiente agrega una etiqueta de título simple a la variable HTML:

HTML = "< title > mi página Web < / título >"

3 Crear la función que el código HTML. La siguiente función tiras cualquier HTML etiquetas y espacios del código de la página web:

Public Function HTMLtoText (ByVal HTML como cadena) como cadena

Dim strip As _

System.Text.RegularExpressions.Regex

Return strip.Replace(HTML, "&lt;[^>]*>", "")

End Function

4 Convertir HTML a texto y asignarlo a la variable "texto". Llaman a la función creada en el paso 3 para quitar las etiquetas. El resultado vuelve es texto. El código siguiente muestra cómo convertir el código:

texto = HTMLtoText(html)