Python - eksterne filer

Innholdsfortegnelse

Python tillater oss å jobbe med eksterne filer, kanskje dette ikke høres logisk ut på denne måten, men eksterne filer i dette tilfellet er ikke annet enn forespørsler til websider fra vårt Python -program, grunnen til å gjøre dette kan være fra spørring til REST Web Services som lar oss få verdier ved eller søk direkte på sider og manipuler innholdet.

For å oppnå dette vil vi bruke noen av de mange bibliotekene det tilbyr Python for å jobbe med nettverk, og dermed fjerne tekniske hindringer og bare konsentrere seg om hvor viktig det er i vår programmeringslogikk.

urllib og urllib2
Disse to bokhandlene urllib Y urllib2 De lar oss gjøre arbeidet med å få tilgang til filer gjennom nettverket som om de var i vårt lokale miljø, gjennom et enkelt kall til en funksjon, dette kan tjene oss for mange ting, for eksempel at vi kan bruke et web og med innholdet lage rapporter i programmet om hva vi kan finne i det.

Disse to bibliotekene er like, deres forskjell er at urllib2 Det kan være litt mer sofistikert, hvor hvis vi bare ønsker å stille et spørsmål uten ytterligere implikasjoner vi kan bruke urllib, men hvis vi ønsker å utføre en godkjenningsprosess eller bruke informasjonskapsler, så urllib2 Det kan være det riktige valget for programmet vårt.

Siden vi teoretisk vet hva vi trenger og hvorfor vi trenger det, la oss se et lite kodeeksempel slik at det er klart for oss hva vi kan gjøre, i det følgende eksemplet skal vi åpne et web fra programmet vårt og deretter gjennom regulære uttrykk vi kommer til å trekke ut en lenke til innholdet for dette vi skal bruke urllib:

 >>> fra urllib import urlopen >>> webside = urlopen ('http://www.python.org') >>> import re >>> text = webside.read () >>> m = re.search ( 'Opplæring', tekst, re.IGNORECASE) >>> m.gruppe (1) 

Vi går trinnvis, først fra urllib -biblioteket vi importerer urlopen, så lager vi en variabel som heter nettside som er den som vil inneholde resultatet av urlopen Hva skal vi gjøre med det offisielle nettstedet til Python, med dette importerer vi allerede re For å jobbe med regulære uttrykk, sier vi at tekst er variabelen som vil ha innholdet i sidelesningen, vi søker med et vanlig uttrykk og til slutt grupperer vi resultatet, som skal skrive ut følgende:

http://docs.python.org/

Dette er takket være metoden urlopenDet du gjør er at det lar oss jobbe med websiden som om det var et filobjekt, på denne måten kan vi bruke mange av funksjonene som vi kan bruke med denne typen objekter, selv om vi vil at vi kan laste ned siden og arbeid det fra vår lokale på en veldig enkel måte ved å bruke metoden urlretrieve som følger:

 urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')
Det eneste vi gjør er å passere som den andre parameteren banen i vårt lokale miljø der filen med kopien av siden skal lagres uten store problemer.

Med dette fullfører vi denne opplæringen, ettersom vi ser at mer komplekst arbeid som å bruke sider i programmene våre er ganske enkelt takket være bibliotekene til Python.

Likte og hjalp du denne opplæringen?Du kan belønne forfatteren ved å trykke på denne knappen for å gi ham et positivt poeng

Du vil bidra til utvikling av området, dele siden med vennene dine

wave wave wave wave wave