No, la verdad no entendí.
¿el problema está en el parser?
Los links son todos aquellos que estén en una etiqueta <a></a> (anchor) y tengan un parámetro "href". Recordá que los links pueden ser relativos, por lo que si no inician con un protocolo, lo mejor será "concatenarlos" a la ruta de la página original (solo la ruta, sin la página), a menos que sean una posición de marca dentro de la misma página: el href inicia con el caracter "#". En ese caso, la concatenación debe hacerse a la cadena completa (incluyendo la página).
Hasta luego.