Comment extraire des liens d'une page Web dans Windows
Vous devrez peut-être extraire les liens (URL) d'une page Web à des fins différentes - par exemple, la recherche sur Internet, le développement Web, les évaluations de sécurité ou les tests de pages Web. Cet article vous explique comment extraire des liens d'une page Web ou d'un document HTML dans Windows.
Comment extraire des liens d'une page Web dans Windows
Il existe plusieurs méthodes pour extraire des URL dans une page Web. Commençons par une méthode native - en utilisant la section des outils de développement de votre navigateur Web.
Utilisation des outils de développement de votre navigateur Web
- Ouvrez Chrome pour Firefox et visitez d'abord le site Web ou la page Web.
- Appuyez sur F12 pour ouvrir la fenêtre des outils de développement.
- Cliquez sur l'onglet Console dans Developer Tools.
- Effacez la sortie de la console en cliquant sur le bouton Effacer la console (dans Chrome) ou Effacer la sortie de la console Web (dans Firefox).
- Tapez le code suivant à l'invite de la console:
Array.prototype.slice.call (document.querySelectorAll ('a'), 0) .forEach ((a, i) => console.log (`# $ {i + 1} - $ {a.innerText} - $ {a.href} `));
Cela affiche la liste ordonnée des liens dans cette page Web avec le titre dans la fenêtre de la console.

Si vous souhaitez uniquement récupérer les URL sans le numéro de série ou le texte du titre, utilisez cette commande:
urls = $$ ('a'); for (url in urls) console.log (urls [url] .href);
Copiez la sortie dans le Bloc-notes et enregistrez-la.
Utilisation de PowerShell
Lancez PowerShell et utilisez la syntaxe de ligne de commande suivante:
(Invoke-WebRequest -Uri "//www.winhelponline.com/blog").Links.Href | Sort-Object | Get-Unique | out-gridview

Cela obtient la liste des liens dans la page Web spécifiée et renvoie la liste au contrôle de vue de grille.

Un autre avantage de cette commande PowerShell est qu'elle trie les entrées et supprime également les URL en double de la collection.
Le contrôle d'affichage de la grille vous permet de filtrer la recherche par mot clé clé des URL, ainsi que de copier les listes dans le presse-papiers à l'aide de Ctrl + C
Saisissez le titre et l'URL
Pour afficher le innerText en plus des liens ou URL correspondants, exécutez:
(Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-List innerText, href
Vous obtiendrez une sortie comme celle-ci:

Les URL en double sont supprimées automatiquement dans la sortie.
Vous pouvez même copier la sortie dans le presse-papiers automatiquement en utilisant le | clip
paramètre de | clip
:
(Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-List innerText, href | agrafe
URL de capture d'images uniquement
$config[ads_text6] not foundPour extraire la liste des URL d'images, utilisez cette syntaxe:
(Invoke-WebRequest -Uri "//www.winhelponline.com").Images | Select-Object src

Utiliser AddrView de Nirsoft
L'outil AddrView de Nirsoft extrait automatiquement les liens (y compris les liens d'image) d'une page Web donnée ou d'un fichier HTML local et les répertorie dans une vue de grille.

Vous pouvez même trier les résultats par type et copier uniquement les URL des images dans le presse-papiers ou les enregistrer dans un fichier.
Si vous souhaitez uniquement saisir les liens de l'image, vous pouvez utiliser l'option intégrée Afficher les informations sur la page de Firefox. Dans Firefox, cliquez avec le bouton droit sur la page Web actuelle, cliquez sur Afficher les informations sur la page → Média. L'onglet Média répertorie toutes les URL d'image, y compris lesdata:image
liens d' data:image
. Vous pouvez copier les éléments sélectionnés ou tous les éléments dans le presse-papiers ou enregistrer les entrées dans un fichier. 
Outre les méthodes ci-dessus, pour les navigateurs comme Chrome ou Firefox, il existe de nombreuses extensions ou modules complémentaires qui récupèrent l'URL ou les liens d'image de la page Web actuellement active dans votre navigateur.