模拟浏览器登录并提交数据(网页qq邮箱采集器)

网络爬虫学习中,简单的静态页面数据,难以满足我们的一颗“好学”之心,且现在我们“好奇”的数据往往藏得很深,要么需要登录,要么为动态加载……今天,就来分享一下模拟浏览器对QQ邮箱(我们只是学习、分享、交流)的登录操作!

1、前期准备

“搞事情”之前,我们需要先准备两个工具,分别是需要模拟浏览器登录的模块selenium和对应的驱动插件chromedriver.exe

这里,我们用了一个模拟浏览器登录的模块selenium

安装selenium模块:

pip install selenium

下载驱动插件chromedriver.exe,插件版本需与浏览器版本相同或相近,此处用的是谷歌浏览器,可在浏览器网页中输入地址chrome://version/,查看浏览器版本:

登录采集——模拟浏览器登录QQ邮箱

接着进入驱动下载页面***/index.html,下载相同或相近版本的chromedriver.exe:

登录采集——模拟浏览器登录QQ邮箱

解压后将放到指定位置(随便放哪里,只要你知道在哪里),此处放于
“F:\PycharmProjects\tensorflow”文件路径下。

2、页面简析(如果着急看效果,跳过此步)

打开QQ邮箱官网(***/),得到如下界面,这里有几种登录方式,其中微信登录只能通过扫码实现,我们既然想用Python去自动化批量发送邮件,微信扫码登录自然不现实(若有高手可攻克此步,还望分享)。

QQ登录方式有两种,要么点击已登录的QQ头像(可通过COOKIE实现),要么直接密码登录,今天我们介绍后者。

登录采集——模拟浏览器登录QQ邮箱

点击账号密码登录,发现网址和之前没有变化,

登录采集——模拟浏览器登录QQ邮箱

抓包后看到,返回的Referer信息一长串,这难道就是登录页面的实际网址?

登录采集——模拟浏览器登录QQ邮箱

复制Referer里的连接信息到浏览器看看,果然!好,那我们就不去请求邮箱官网了,直接对这个连接下手。

登录采集——模拟浏览器登录QQ邮箱

但是这个连接信息还是有扫码登录或是之前的COOKIE信息,我们想要的是账号密码登录,点击密码登录后,进入一个很单纯的表单页面。不错,我们找的就是它,检查密码登录的元素,发现它在类名为switch_btn的a标签下。

登录采集——模拟浏览器登录QQ邮箱登录采集——模拟浏览器登录QQ邮箱

3、完整代码

好了,QQ邮箱的密码登录方式大概就是这个意思,接下来我们直接上代码:

from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsimport time# 初始化以及配置浏览器chrome_optiOns= Options()# 1、添加user-agentchrome_options.add_argument('User-Agent="你自己的user-agent')# 2、禁止图片加载 数字1:可以加载图片 数字2:禁止加载图片No_Image_loading = {"profile.managed_default_content_settings.images": 1}chrome_options.add_experimental_option("prefs", No_Image_loading)path = 'F:\PycharmProjects\tensorflow\chromedriver.exe' # 更改为你自己的插件路径driver = webdriver.Chrome(executable_path=path, chrome_optiOns=chrome_options)# 登录页面driver.get('***/cgi-bin/xlogin?appid=522005705&daid=4&s_url=***/cgi-bin/login?vt=passport%26vm=wpt%26ft=loginpage%26target=&style=25&low_login=1&proxy_url=***/proxy.html&need_qr=0&hide_border=1&border_radius=0&self_regurl=***/chs/index.html?type=1&app_id=11005?t=regist&pt_feedback_link=***/discuss/350_1.shtml&css=***/zh_CN/htmledition/style/ptlogin_input_for_xmail440503.css')time.sleep(2)# 切换进入“账号密码登录”driver.find_element_by_id('switcher_plogin').click() # 点击​# 输入账号信息driver.find_element_by_id('u').send_keys('你自己的QQ')

QQ邮箱的登录你掌握了,那其他网页的登录呢?赶快去试试吧!

——————————————————————————

登录采集——模拟浏览器登录QQ邮箱

(0)
上一篇 2023年4月10日 下午2:12
下一篇 2023年4月10日 下午2:17

相关推荐

  • 笔记本玩游戏帧数不稳定怎么解决

    首先 把你 CPU 在 不加电压的情况下 默认 超频 ,主频 有点低 其次 从 下面 入手: 提高方法一:将桌面的背景图片(壁纸)取消掉,因为他会很大程度的影响图像刷新率。 提高方…

    2022年12月29日
    0
  • exome是什么梗(exo是什么意思啊网络用语)

    exo me是什么梗?这是什么意思呢?本篇文章小编给大家分享一下exo me梗介绍及出处,对此感兴趣的小伙伴们可以来看看。 exo me是什么梗和意思 该词是Excuse Me的网…

    2023年3月18日
    0
  • 原驾校不给你注销档案怎么办

    在我们的生活中,驾照已经成为了一项必要的证件。但是,有时我们可能会遇到一些问题,例如,我们可能需要换驾校,但原驾校却不愿意注销我们的档案。这时候,我们该怎么办呢? 首先,我们需要明…

    生活百科 2023年10月1日
    0
  • 声特耳机怎么样,fostex蓝牙耳机推荐

    提起声特科技(SpearX),相信很多烧友还是有些小陌生。该品牌是一家来自宝岛台湾,成立于于2010年的年轻厂商,在日益紧张激烈的手机市场大环境下,其周边配件却异常火爆,尤其是在手…

    2023年4月16日
    0
  • 家里玻璃上贴膜会不会影响采光

    现如今,越来越多的人喜欢在家里的玻璃上贴膜,这既可以起到美化家居的作用,还能有效隔绝阳光和紫外线。但是,很多人担心贴膜会影响室内的采光效果,那么到底贴膜会不会影响采光呢? 首先,我…

    生活百科 2023年6月29日
    0
  • 冰壶是怎么看玩的,怎么评判的(冰壶怎么看才算取胜)

    冰上溜石比赛时,每场由两支球队对抗进行,每队由4名球员组成。比赛共进行10局。两队每名球员均有两个冰壶,即有两次掷球机会。两队按一垒、二垒、三垒及主力队员的顺序交替掷球,在一名队员…

    生活百科 2023年2月16日
    0
  • 苹果手机关机一个月对电池有影响吗

    苹果手机是现代人生活中必不可少的通讯工具之一。但是,在某些情况下,我们可能需要将手机关机,例如长时间旅行或将手机放置在一边以集中注意力。这时候,人们就会担心关机会对手机电池产生影响…

    生活百科 2023年6月17日
    0
  • 英雄联盟哪个英雄最好

    当初,第一次玩LOL是因为发小的关系,一帮好友在网吧开黑(我不会告诉你们之前,楼主之前只玩小游戏的),带我玩LOL。当时觉得这个游戏好复杂,那么多按键,让我玩一个盖伦辅助就是肉。依…

    2023年1月13日
    0
  • 上海虹桥火车站最新图片,上海虹桥站人流

    “五一”假期即将到来,人从众模式开启。 4月28日,铁路上海站(下辖上海站、上海南站、上海虹桥站、上海西站、南翔北站、安亭北站、安亭西站)迎来今年以来单日最高客流。当日,上海虹桥火…

    2023年5月16日
    0
  • 罗技mx 机械键盘评测

     在日益繁杂的办公、游戏应用中,一款得心应手的键鼠装备毫无疑问不止达到事倍功半的效率,包括其精良的外观设计、超爽的使用质感,都能成为用户的依赖和信仰。日前,罗技推出全新MX机械键盘…

    2023年3月16日
    0

发表评论

登录后才能评论