肯德基爬取


今天晚上搞了一个作业,作业要求是爬取肯德基的餐厅查询:
代码如下:

# -*-coding=utf-8-*-
# 时间:2021/3/31;20:13
# 编写人:刘钰琢
import requests
import json
if __name__=='__main__':
    url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword'
    keyword=input('请输入您要查找的地址')
    data={
        'cname':'',
        'pid':'',
        'keyword':keyword,
        'pageIndex':'1',
        'pageSize':'10'
    }
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.63'
    }
    response=requests.post(url=url,data=data,headers=headers)
    page_text=response.json()
    filename=keyword+'.json'
    fp=open(filename,'w',encoding='utf-8')
    json.dump(page_text,fp=fp,ensure_ascii=False)
    print('over!!!')

这次的过程也是十分的曲折,显示代码能使但是一直是乱码,在之后就是一直是报错,在看完下面评论之后也是找到了标准答案
经过对比我仍然感觉我的代码是是十分正确的
1.jpg
最后还是发现了问题就是在ua的时候 User-Agent我当时是是直接复制的所以一直也就没在关注这个事情
这个也是十分的粗心而造成的问题


文章作者: 毛豆不逗比
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 毛豆不逗比 !
  目录
{% include '_third-party/exturl.swig' %} {% include '_third-party/bookmark.swig' %} {% include '_third-party/copy-code.swig' %} + {% include '_custom/custom.swig' %}