Forum >> Programmazione Python >> Web e Reti >> ricerca immagini

Pagina: 1

Ciao a tutti,
sto scrivendo un programma che, data una lista di url, per ciascun url ne estrae le immagini.

il problema è che non riesco a tirare fuori tutte le immagini da alcuni siti web.

il codice è il seguente:
dict={}
lista=[]

for url in url_list:
    r = requests.Session()
    html = r.get(url)
    soup = bs4.BeautifulSoup(html.content, "html5lib")
    if re.search(pattern,soup.get_text()): continue
    for img in soup.find_all(name="img"):
        src = img.get("src")
        lista.append(src)
    dict = lista
    lista = []

il problema ad esempio è che per l'url: http://www.morguefile.com/search/morguefile/1/yoga/pop ricevo il seguente output:



http://www.morguefile.com/search/morguefile/1/yoga/pop ['/img/icon_search.svg', '/img/icon_quest.png', '/img/icon_search_close.svg', '/img/prm/iStock_white.png', '/img/icon_sort.svg', '/img/prm/iStock_white.png', '/img/prm/iStock_white.png', '/img/prm/istockclosePopup.png', '/img/prm/iStock ByGI TM white.png']


Non riesco a capire perchè.. analizzando la pagina ci sono molti tag img e questi non vengono catturati..




--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:13:05 ---

--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:14:43 ---

--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:14:53 ---

--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:15:40 ---

--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:15:56 ---


--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:38:00 ---


--- Ultima modifica di Lime In The Coconut in data 2017-01-19 22:38:41 ---


Pagina: 1



Esegui il login per scrivere una risposta.