Come aprire una pagina web con python

Per aprire e leggere una pagina web con il linguaggio python utilizzo il modulo request della libreria urlib. E' la via più semplice per realizzare il fetching di un indirizzo url con il linguaggio di programmazione.

Un esempio pratico

import urllib.request
with urllib.request.urlopen('http://python.org/') as response:
indentazionehtml = response.read()
print(html)

    Come funziona lo script

    La prima istruzione importa il modulo urllib.request nello script.

    La seconda riga apre l'indirizzo url con la funzione urlopen.

    La terza riga legge il contenuto della pagina web con il metodo response.read() e lo salva nella variabile html.

    Il metodo response.read() legge tutto il contenuto del documento ipertestuale in una sola volta. Dall'inizio alla fine. Per leggere un solo record alla volta, si utilizza il metodo readline(). Altri metodi dell'interfaccia sono readlines(), fileno(), close(), info() e geturl().

    La quarta riga visualizza il codice sorgente della pagina web.

    Una volta salvata l'informazione nella variabile, posso procedere con l'elaborazione dati per le applicazioni di text mining.

    Attenzione. Nel seguente script ho utilizzato la versione 3.5 di Python. Lo script potrebbe non funzionare con altre versioni del linguaggio di programmazione.

    FAQ

    • Il modulo urllib.request funziona solo con il protocollo http?
      No, il modulo funziona anche con tutti gli i protocolli internet ( es. https, ftp, ecc. )

     


     

    Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

    FacebookTwitterLinkedinLinkedin
    knowledge base
    1. Il linguaggio Python
    2. Come installare Python sul PC
    3. Come scrivere un programma in Python
    4. Come usare Python in modalità interattiva
    5. Le variabili
    6. I numeri
    7. Gli operatori logici
    8. Le strutture iterative ( o cicli )
    9. Le strutture condizionali
    10. I file in python