Quantcast
Channel: ¿Cómo puedo scrapear desde un csv que contiene múltiples URLs en una columna con simple HTML dom? - Stack Overflow en español
Viewing all articles
Browse latest Browse all 2

¿Cómo puedo scrapear desde un csv que contiene múltiples URLs en una columna con simple HTML dom?

$
0
0

Ya tengo mi código trabajando para extraer toda la información que necesito de una URL, pero quiero "automatizar" el proceso.

Este es el código con el que extraigo todo lo que necesito de UNA URL con simple HTML dom:

<?php     require 'libs/simple_html_dom/simple_html_dom.php';    $html = new simple_html_dom();    $html->load_file('http://url1.com/producto1.html');    $names = $html->find('h1');    $manufacturers = $html->find('h2');       echo $manufacturer->innertext;       echo '<br>';       echo $name->innertext;       echo '<br>'; ?>

Este sería el aspecto del archivo CSV, todas las URLS serían diferentes..

introducir la descripción de la imagen aquí

También sé cómo analizar varios enlaces al mismo tiempo, pero eso sirve cuando tienes 1-3 enlaces, no más ya que si no es una locura. Ahora necesito analizar casi 30-50 enlaces de cada archivo csv.

Tengo algunos archivos csv con todos los enlaces que necesito para scrapear, ¿cómo puedo extraer con mi script existente desde un archivo csv (o una lista de url o algo así)?


Viewing all articles
Browse latest Browse all 2

Latest Images

Trending Articles





Latest Images