No, no.
Usar XML para parsear HTML es UN ERROR.
HTML es una bestia animal muy distinta. Se requiere un parser especifico para html. El termino general es "Web Scrapping"
Hice un tutorial basico en python:
http://code.runnable.com/UryhiPR1U0B...-and-wikipedia
Osea:
1- Necesitas un parseador HTML.
A menos que la pagina sea super-estatica y tengas control sobre ella (ie: Mucha seguridad de que no cambiara) no hay vuelta con esto
2- Necesitas usando el parseador, acertar a los tags correctos
La otra, y mejor, si tienes acceso o puedes conseguir la colaboracion de los dueños de la pagina, es que hacer un API rest que te de los datos que realmente necesitas