最近人工智能聊天机器人ChatGPT真的是太火了,无论你在哪个媒体上都会看到关于它的新闻。ChatGPT是一种基于大语言模型的生成式AI,可以自动生成类似人类语言的文本,把梳理好的有逻辑的答案呈现在你面前。除了能聊天、写论文、创作诗歌,ChatGPT还可以帮助我们编写Python代码。
今天,我们就讲一讲如何用ChatGPT写Python爬虫脚本?
(相关资料图)
å¾ç
别光看不练,我们亲自尝试一波,如下图所示,我们询问ChatGPT“我想用Python爬取豆瓣电影TOP250的数据,代码要怎么写?”ChatGPT很快给出了答案
我们将上述的代码复制到本地编辑器中运行,会发现并没有打印结果。print(response)看一下,发现返回
“运行刚才的Python代码,response返回
这次,ChatGPT给了我们解决方案:添加请求头部信息。
再次在编辑器中运行Python代码,会发现已经得到了输出结果。
图片
如上所示,我们使用ChatGPT完成了一次简单的爬虫,这个例子相信也是很多爬虫小白学习时的第一个案例。但即便是这个最简单的例子,在编写中也遇到了报错/得不到结果,所以真正实际起来还是需要自己具备一定的Python爬虫基础知识,以及高效利用ChatGPT的能力。
所以在平时的使用中,我更多是将其(ChatGPT)作为写爬虫的助力。比如,在有一点难度的Python爬虫中,往往避不开JavaScript逆向,如果想彻底掌握,就不得不去学那几百页厚厚的爬虫书,还不一定能精通。
而现在,在ChatGPT辅助下,我们可以高效的解决js逆向问题。
再举一个例子,使用Python写爬虫也会经常需要写正则表达式,来从文本中提取待爬取的关键数据/文本信息。
利用ChatGPT也可以辅助我们快速写好一个正则表达式。
如下图所示,我向ChatGPT提问:
帮我写一个正则表达式,可以从 肖申克的救赎9.7https://movie.douban.com/subject/1292052/ 中提取9.7
很快得到了答案:
ChatGPT就像一位全能的员工,对于我们提出的各种编程问题,它都能给出解决方案并落实到代码。
当然了,作为老板的我们也需要对整体概念有全面的认识和判断。