博客
关于我
python爬虫实战—python破解识别由canvas绘制成的滑块验证码
阅读量:738 次
发布时间:2019-03-21

本文共 1638 字,大约阅读时间需要 5 分钟。

一、网站全面分析

2020中国游戏十强投票网站的自动化操作实验

1.1 网站访问流程

首先,进入投票网站进行注册,发现需要填写姓名、手机号和邮箱信息。虽然现实中存在用户信息真实性的问题,但对于技术实现来说,我们可以通过随机生成百家姓名后的名字、随机号码、随机邮箱来完成自动化操作。

1.2 验证流程

点击"开始投票"后,会跳转到滑块验证码认证界面。这个过程并没有涉及复杂的技术,甚至可以说非常简单。然而,这里有个小陷阱——由于采用了Canvas绘制滑块验证码,传统的图像识别方法已经不再适用。


二、Canvas滑块验证码技术分析

2.1 簡要理解

通过分析发现,该滑块验证码采用了完全不同的实现方式:滑块是通过Canvas绘制出来的,而非传统的图片拼接方式。

2.1.1 背景Canvas
  • Canvas元素在DOM中可以用document.getElementById('puzzle-canvas')找到
  • Canvas绘制的是完全透明的PNG图片
  • PNG图片与背景Canvas的大小完全一致
2.1.2 滑块识别逻辑
  • 通过将Canvas转换为base64编码的图片数据下载下来
  • 只需识别滑块在透明 PNG 图中的像素位置
  • 轻松通过简单的算法找出左端距离顶端像素数值

2.2 实现代码示例

2.2.1 下载Canvas内容
def download_canvas():    # 执行JavaScript获取Canvas内容    canvas_data_url = execute_script('return document.getElementById("puzzle-canvas").toDataURL();'    base64_img = base64.b64decode(canvas_data_url.split(',')[1:])    # 将二进制转换为PNG文件    with open('puzzle.png', 'wb') as f:        f.write(base64_img)
2.2.2 识别滑块位置
import PILdef identify_puzzle_position(puzzle_image):    # 转换为黑白图像    image = PIL.Image.open(puzzle_image).convert('L')    # 遍历找最小x轴位置    for x in range(image.size[0]):        if any(image.getpixel((x, y)) for y in range(image.size[1])):            return x - 10  # 减少10个像素的偏移量    return 0

三、完整实现流程

3.1 下载滑块图片

通过分析发现,传统图片滑块验证需要解析背景图片中的缺口,这对算法要求较高。Canvas实现的滑块只需要找到滑块左端的位置,因为这直接决定了移动距离,这大大简化了验证流程。

3.2 自动化操作的实现细节

  • 前期可以通过简单的CSS选择器定位Canvas元素
  • 使用JavaScript直接调用Canvas的toDataURL方法获取图片
  • 将Base64字符串解码成图片文件
  • 通过简单的像素处理算法识别滑块位置

四、测试案例

通过对多个投票页面进行测试,发现Canvas滑块的实现方式有很大特点:由于滑块是通过移动一个透明的PNG图层进行验证,实际上只需要计算x坐标即可算出移动距离。


五、总结与展望

通过以上实现,充分证明了Canvas滑块验证码其实并没有想象中的那么难。相比于传统的图像识别问题,这种方式反而简化了验证流程,甚至可以说降低了技术门槛。

对于想实现类似自动化操作的人来说,关键在于:

  • 理解Canvas渲染方式
  • 学习如何处理Base64编码
  • 熟悉简单图像处理算法
  • 希望以上内容能够为大家提供一些启发!

    转载地址:http://rengz.baihongyu.com/

    你可能感兴趣的文章
    LiveGBS user/save 逻辑缺陷漏洞复现(CNVD-2023-72138)
    查看>>
    localhost:5000在MacOS V12(蒙特利)中不可用
    查看>>
    logstash mysql 准实时同步到 elasticsearch
    查看>>
    Luogu2973:[USACO10HOL]赶小猪
    查看>>
    mabatis 中出现< 以及> 代表什么意思?
    查看>>
    Mac book pro打开docker出现The data couldn’t be read because it is missing
    查看>>
    MAC M1大数据0-1成神篇-25 hadoop高可用搭建
    查看>>
    mac mysql 进程_Mac平台下启动MySQL到完全终止MySQL----终端八步走
    查看>>
    Mac OS 12.0.1 如何安装柯美287打印机驱动,刷卡打印
    查看>>
    MangoDB4.0版本的安装与配置
    查看>>
    Manjaro 24.1 “Xahea” 发布!具有 KDE Plasma 6.1.5、GNOME 46 和最新的内核增强功能
    查看>>
    mapping文件目录生成修改
    查看>>
    MapReduce程序依赖的jar包
    查看>>
    mariadb multi-source replication(mariadb多主复制)
    查看>>
    MariaDB的简单使用
    查看>>
    MaterialForm对tab页进行隐藏
    查看>>
    Member var and Static var.
    查看>>
    memcached高速缓存学习笔记001---memcached介绍和安装以及基本使用
    查看>>
    memcached高速缓存学习笔记003---利用JAVA程序操作memcached crud操作
    查看>>
    Memcached:Node.js 高性能缓存解决方案
    查看>>