Eliminar etiquetas HTML de un fichero con SED
¿Necesitas eliminar las etiquetas HTML de un fichero de texto? Lo más sencillo puede ser utilizar el siguiente comando SED:
$ sed -e 's/<[^>]*>//g' index.html |
La potencia del comando SED es tremenda. Aquí puedes ver unos pequeños manuales que preparé en su día para entender un poco más de este comando:
Entendiendo el comando sed (1/3)