关注分享主机优惠活动
国内外VPS云服务器

使用selenium自动抓取淘宝后台操作数据并填表(爬虫技术抓取淘宝数据)

开始时,请不要运行谷歌浏览器操作说明来打开文件。单击运行以输入目标浏览器的位置。运行程序的第一步是输入谷歌浏览器启动文件的位置。

我帮别人写一个简单的python程序。我很懒。有时间我会再写博客的。先放github链接吧。

使用说明:

1.电脑环境配置电脑:windows系统;

浏览器:Google,建议版本95.0.4638.69(如果是其他版本的浏览器,有很大概率出错;95开头也可以)

浏览器资源:根文件夹里有Google浏览器安装文件,可以自己解压安装。

表单命名:初始表单名称必须是“springLoveShi.xls”或“springLoveShi”。xlsx”逐字逐句,并把压缩文件夹中原本命名为这个文件的表单文件删除,把需要提取身份证的文件拖到文件夹中。

表单模板:模板的第一列必须是订单号,第九列必须是身份证号。

温馨提示:请先不要运行谷歌浏览器;作为标题,第一行应该有一个值,第一行的第一列应该为空。

请先不要运行谷歌浏览器。

操作说明打开springLoveShiLoveShi.exe文件,点击运行。

输入目标浏览器位置

运行程序的第一步是输入Google浏览器启动文件的位置。以下是如何找到谷歌浏览器的位置:

右键单击Google浏览器图标,然后单击属性。

然后单击上面的快捷方式,将目标框中的值复制到开头的提示框中。

登录时如无意外,谷歌浏览器会跳转到淘宝登录页面。

同时提示框会提示“登录后返回本窗口,点击进入”。

然后登录后什么都不要做,只要回到提示框点击回车即可。

在提示框看到成功提示后,可以发现多了一个提取身份证号的文件。xlsx在根文件夹中,那就是我们需要的文件(如果原来存在,原来的最终文件会被覆盖)。

未经允许不得转载:主机频道 » 使用selenium自动抓取淘宝后台操作数据并填表(爬虫技术抓取淘宝数据)

评论 抢沙发

评论前必须登录!