Saltar al contenido

Acceso a Internet Python usando Urllib.Request y urlopen()

diciembre 8, 2019

¿Qué es urllib?

urllib es un módulo de Python que puede ser usado para abrir URLs. Define funciones y clases para ayudar en las acciones de la URL.

Con Python también puede acceder y recuperar datos de Internet como XML, HTML, JSON, etc. También puede utilizar Python para trabajar con estos datos directamente. En este tutorial vamos a ver cómo podemos recuperar datos de la web. Por ejemplo, aquí hemos utilizado una URL de vídeo guru99, y vamos a acceder a esta URL de vídeo utilizando Python, así como imprimir el archivo HTML de esta URL.

En este tutorial aprenderemos

  • Cómo abrir una URL usando Urllib
  • Cómo leer un archivo HTML para su URL en Python

Cómo abrir una URL usando Urllib

Antes de ejecutar el código para conectarnos a los datos de Internet, necesitamos importar la declaración para el módulo de la biblioteca URL o «urllib».

  • Importar urllib
  • Definir su función principal
  • Declarar la variable webUrl
  • Luego llame a la función urlopen en la biblioteca URL lib
  • La URL que estamos abriendo es el tutorial de guru99 en youtube
  • A continuación, vamos a imprimir el código del resultado
  • El código de resultado se recupera llamando a la función getcode en la variable webUrl que hemos creado
  • Vamos a convertir eso en una cadena, para que pueda ser concatenada con nuestra cadena «result code»
  • Este será un código HTTP «200» regular, indicando que la petición http se ha procesado correctamente
  • .

Cómo obtener la URL del formulario de archivo HTML en Python

También puede leer el archivo HTML usando la «función de lectura» en Python, y cuando ejecute el código, el archivo HTML aparecerá en la consola.

  • Llamar a la función de lectura en la variable webURL
  • La variable Read permite leer el contenido de los archivos de datos
  • Leer todo el contenido de la URL en una variable llamada datos
  • Ejecutar el código – Imprimirá los datos en formato HTML

Aquí está el código completo

Python 2 Ejemplo

#
# leer los datos de la URL e imprimirlos
#
importar urllib2
def main():
# Abrir una conexión a una URL usando urllib2
   webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#obtener el código del resultado e imprimirlo
   imprimir "código de resultado: " + str(webUrl.getcode())
# leer los datos de la URL e imprimirlos
   data = webUrl.read()
   datos de impresión
si __nombre__ == "__main__":
  main()

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>)

Python 3 Ejemplo

#
# leer los datos de la URL e imprimirlos
#
importar urllib.request
# Abrir una conexión a una URL usando urllib
webUrl = urllib.request.urlopen($0027https://www.youtube.com/user/guru99com$0027)
#obtener el código del resultado e imprimirlo
imprimir ("código de resultado: " + str(webUrl.getcode()))
# leer los datos de la URL e imprimirlos
data = webUrl.read()
print (data)