Home > Secciones

Secciones

Secciones is a project mainly written in Python, it's free.

Scraping tool using Scrapy (python)

  • correr el crawler para restaurantes

    scrapy crawl restaurantes --set FEED_URI=data.csv --set FEED_FORMAT=csv

  • correr el shell de scrapy en una dirección

    scrapy shell http://www.seccionamarilla.com.mx/Resultados/restaurantes/jalisco/guadalajara/1

  • correr el script para agregar taxonomias de ZT

    python scripts/transform.py python scripts/transform.py data.2011.05.10.csv data.2011.06.09.csv