パッケージインストール(対応:tabeLogScraping.py rettyScraping.py)
pip install git+https://github.com/BDA2019TeamA/Scraping
使用方法(ぐるなびはAPIの都合上不可能)
from Scraping import *
retty = rettyScraping()
tabe = tabeLogScraping()
import requests
import pandas
from bs4 import BeautifulSoup
import re
import time
import ast
import json
import copy
import os
import csv
import sys
from pprint import pprint
class rettyScraping を用いる。
基本的にはgetData()を用いてcsvを作成する。
引数は 都道府県名(str), どこから(int), どこまで(int), csv名/None(追記する時、ないときはNone)
出力されるcsv名は追記でない限りPRE{数字}.csvとなっている。
- category:食べ物のカテゴリー
- comment:コメント
- name:店の名前
- phone:電話番号
- restaurantId:Rettyにおける店id
- score:1~3の評価値
- url:url
- userId:コメントした人のid
import requests
import pandas
from bs4 import BeautifulSoup
import re
import time
import ast
import json
import copy
import os
import csv
import sys
from pprint import pprint
class tabeLogScraping を用いる。
基本的にはgetData()を用いてcsvを作成する。
引数は 都道府県名(str), どこから(int), どこまで(int), csv名/None(追記する時、ないときはNone)
出力されるcsv名は追記を行わない限りAREA{都道府県のローマ字}.csvとなっている。
- category:食べ物のカテゴリー
- comment:コメント
- name:店の名前
- phone:電話番号
- restaurantId:Rettyにおける店id
- score:0~5の評価値
- 料理・味:0~5の評価値
- サービス:0~5の評価値
- 雰囲気:0~5の評価値
- CP(コスパ):0~5の評価値
- 酒・ドリンク:0~5の評価値
- url:url
- userId:コメントした人のid
- '店舗ID'
- '店舗名'
- 'カテゴリー'
- 'URL'
- '住所'
- '電話番号'
- '地区名小'
- '店舗ID'
- 'URL'
- '投稿ID'
- 'ニックネーム'
- 'コメント'
- '評価'
- '店舗ID'
- '店舗名'
- 'カテゴリー'
- 'URL'
- '住所'
- '電話番号'
- '地区名小'
- '店舗ID'
- 'URL'
- '投稿ID'
- 'ニックネーム'
- 'コメント'
- '評価'
- '料理・味'
- 'サービス'
- '雰囲気'
- 'CP(コスパ)'
- '酒・ドリンク'
import sys
import urllib
import xml.etree.ElementTree as ET
import json
import requests
import csv
import pandas as pd
import time
ぐるなびのAPI登録をする
それぞれ実行すると対応するcsvが取得できる
- '店舗ID'
- 'URL'
- '投稿ID'
- 'ニックネーム'
- 'コメント'
- '評価'
- '店舗ID'
- '店舗名'
- 'カテゴリー'
- 'URL'
- '住所'
- '電話番号'
- '地区名小'