Cómo convertir HTML a texto sin formato en Javascript

Una de las cosas más útiles que puede hacer con el lenguaje de secuencias de comandos JavaScript es manipular y trabajar con el modelo de objetos del documento (o "DOM") de un documento HTML. El DOM de un documento HTML es una convención para representar el contenido de ese documento. Proporciona una forma para que los navegadores web y los lenguajes de secuencias de comandos, como JavaScript, interactúen con los diversos elementos que componen ese documento. Con JavaScript y el DOM de una página web, puede convertir fácilmente HTML en texto sin formato.

Paso 1

Agregue una declaración SCRIPT a la sección HEAD de su documento HTML. La etiqueta SCRIPT define un script del lado del cliente como JavaScript. Su etiqueta SCRIPT debe tener su atributo "tipo" establecido en "text/javascript" para que toda la declaración SCRIPT se lea de la siguiente manera:(donde el código JavaScript va entre las dos etiquetas).

Paso 2

Defina una función de JavaScript que tome una cadena como parámetro. Este parámetro de cadena contiene el HTML que convertirá a texto sin formato.

Paso 3

Cree un elemento DIV temporal dentro de su función JavaScript utilizando el método "createElement()".

Paso 4

Asigne el parámetro de cadena de su función al atributo "innerHTML" de su DIV temporal.

Paso 5

Cree una variable de cadena temporal en su función.

Paso 6

Tome el contenido de texto sin formato de su DIV temporal usando sus atributos "textContent" e "innerText" y asígnelo a su variable de cadena temporal. Debido a problemas de compatibilidad entre navegadores, tanto "textContent" como "innerText" se definirán en algunos navegadores web y no se definirán en otros, pero uno u otro se definirá en todas las versiones de los principales navegadores.

Paso 7

Devuelva el valor que tiene su cadena temporal usando una declaración de "retorno". Esto devolverá el valor de texto sin formato de su HTML convertido.

Consejo

En lugar de usar declaraciones IF-THEN para verificar la compatibilidad entre navegadores y decidir si usar "textContent" o "innerText" en su función, simplemente asigne el valor de texto sin formato de su elemento DIV temporal a su variable de cadena temporal de la siguiente manera:var tmpString =tmpDiv.textContent || tmpDiv.textointerno.