Hvordan klone ethvert nettsted med HTTrack

Innholdsfortegnelse

HTTrack er en gratis og gratis og multiplatform -programvare hvis formål er webopptak, det vil si at hele eller deler av et nettsted lastes ned, for senere å kunne navigere det offline. Det er en versjon for Linux som heter WebHTTrack, og versjonen for Windows kalles WinHTTrack. Vi kan laste ned HTTrack -programvaren fra det offisielle nettstedet:

Når det gjelder Linux, kan vi også installere det fra depotene ved å bruke følgende kommando.

 sudo apt-get install httrack

Denne programvaren den brukes mye til å kopiere nettsteder og deretter laste dem opp til en annen server og bruke dem til å omdirigere trafikk til kopisiden, og sende besøkende til en falsk side. Den brukes også av de som ønsker å se koden eller driften av et bestemt nettsted. La oss se på et eksempel med nettstedet httrack.com, der applikasjonen er vert.

 httrack "httrack.com"
Denne kommandoen vil laste ned filene fra nettet til en mappe www.httrack.com, som vi kan se lokalt.

HTTrack tar et hvilket som helst nettsted og tar en kopi i mappen eller stasjonen der vi er plassert. Dette kan være nyttig når du søker etter data på nettstedet offline, for eksempel e -postadresser, nyttig informasjon for seo eller strukturen til et nettsted. HTTrack kommer både i Windows og i en versjon for Linux, og bruken er den samme som den i Windows har visuelt intergaz.

Vi kan bruk Httrack for penetrasjonstesting og sikkerhetstesting, siden det gjør det mulig å analysere hele innholdet og hvilke filer som lastes ned når du lager en kopi av et nettsted, for å fastslå at ingen kritisk fil blir sett av en angriper. Når vi samler inn data og informasjon, kan vi utføre tester, søke og analysere kode eller søkeord, vi kan også samle inn data som kan brukes senere.

Også på denne måten lhackere bruker kopiene som er laget for å laste det opp til en server med et nettlignende domene kopiert for å etterligne nettstedene og deretter bruke dem via phishing for å stjele data fra intetanende brukere eller for å utføre angrep på sosiale ingeniører. Httrack har mange alternativer og parametere å bruke for å forbedre nedlastingen for dette, kommandoen brukes:

 httrack -hjelp

Noen viktige parametere som vi kan bruke med Httrack -verktøyet er:

  • -m: angir for eksempel maksimal filstørrelse i byte for nedlasting -m 20000000 tilsvarer 20 mb.
  • -mime: brukes til å bare laste ned en bestemt filtype som vi vil angi med utvidelsen, for eksempel med kommandoen
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Å bruke httrack er enkelt, vi må legge til domenet til nettstedet vi vil kopiere, og deretter starte skanningen plassert i en katalog på harddisken vår der vi skal lagre nettstedet. Vi må ta hensyn til hvor mange lenker eller innhold et nettsted kan ha på grunn av mengden informasjon som skal lastes ned. Utforske kopien av nettet kan brukes til å lete etter feil og sårbarheter som kan sette surfing i fare, samt for å avgjøre hvilke deler det er praktisk å kryptere eller øke sikkerheten.

Hvis målet med nedlastingen er å finne informasjon om et selskap eller lister over brukere, telefoner eller andre data spesielt for sosial ingeniørfag eller prøve å forfalske et nettsted eller en pålogging for å få brukerdata, er HTTrack et utmerket verktøy for begge oppgavene.

Grafisk grensesnitt med WebHTTrack
WebHTTrack er et grafisk grensesnitt for httrack som brukes fra en nettleser og tillater kopier av hele nettsteder for frakoblet tilgang og endrer koblinger automatisk. Verktøy som WebHTTrack kan hjelpe og tillate oppdatering av kopien uten å måtte huske parametrene for å laste ned eller kopiere et nettsted og dets innhold. Vi kan installere det med kommandoen:

 sudo apt-get install webhttrack
Deretter til kjør den vi skriver den samme kommandoen:
 webhttrack
Til starte det grafiske grensesnittet, kan vi gå direkte gjennom applikasjonsmenyen og vi leter etter programmet Søk gjennom speilede nettsteder.

Et annet alternativ er ganske enkelt, som vi sa før fra terminalvinduet, skriv kommandoen webhttrack for å starte en lokal webserver på port 8080, så åpner vi nettleseren med tanke på at den ikke er i inkognito eller privat modus og i nettleseren skriver vi adressen localhost: 8080.

Dette vil vise oss den grafiske veiviseren som vil hjelpe oss å jobbe med httrack. For å begynne må vi konfigurere språket og klikke Neste. Deretter vil vi konfigurere et nytt prosjekt, fordelen med å ha det grafiske grensesnittet er at vi kan lagre dataene til de nedlastede nettstedene og parametrene som brukes i en tekstfil.

Deretter vil vi tildele nettstedet som vi skal kopiere:

Deretter vil vi i Definer alternativer konfigurere parametrene og filtrene gjennom en veiviser:

Etter at vi har konfigurert filtrene, starter vi på den neste skjermen med skanningen.

Ulemper ved å bruke HttrackÅ bruke Httrack -verktøyet til å utføre denne typen skanning og nedlasting fra et nettsted har noen ulemper, for eksempel følgende:

  • Den fanger ikke opp dynamisk innhold eller skriptede sider.
  • Nedlasting av nettsteder som er for store eller med store filer, kan føre til at serveren krasjer.
  • Hvis vi bruker httrack i for mange samtidige tilkoblinger til det samme nettstedet, kan vi bremse serveren eller ta den ut av drift.

Opplæringen der det lages en kode for å spore lenker, kan være av interesse for deg:

Spor nettlenker med Python

Likte og hjalp du denne opplæringen?Du kan belønne forfatteren ved å trykke på denne knappen for å gi ham et positivt poeng

Du vil bidra til utvikling av området, dele siden med vennene dine

wave wave wave wave wave