ubiquitour.com

Cómo convertir HTML a texto en Java

Cuando se trabaja con Java, puede ser especialmente útil para rápidamente convertir código HTML existente en código Java utilizable. Desafortunadamente, convertir manualmente desde HTML en Java es un proceso lento que requiere más busywork que libro-smarts, llevando a muchos programadores a frustrarse rápidamente. Afortunadamente, es un analizador HTML gratuito, de código abierto para Java que puede utilizar para convertir automáticamente HTML en Java sin problemas. El analizador de la configuración es bastante simple, y sólo debe tomar un rato para aprender y dominar.

Instrucciones

1 Vaya a la página de descarga NekoHTML (ver enlace en recursos).

2 Descargar la última revisión del analizador nekoHTML.

3 Descomprima el archivo nekoHTML, luego añadir el archivo "nekohtml.jar" a la "ruta de clases" desde el directorio extraído nekohtml.

4 Vaya a la página de descarga de Xerces Java Parser (ver enlace en recursos).

5 Descargar la última revisión del parser Xerces en su disco duro local.

6 Descomprima el archivo "Xerces-J-bin.2.9.1". Luego añadir el archivo "xercesImpl.jar" a la "ruta de clases" desde el directorio extraído de Xerces. Una vez ambos. Frascos se han añadido correctamente a la ruta de clases, usted debe ser capaz de analizar cualquier código HTML cuando sea necesario.

Consejos y advertencias

  • Si tiene problemas al utilizar el analizador de, asegurar que desempaquetado el. Archivos JAR en la ubicación correcta, y que la ruta del archivo en Java es correcta.