博客
关于我
python爬虫实战—python破解识别由canvas绘制成的滑块验证码
阅读量:738 次
发布时间:2019-03-21

本文共 1638 字,大约阅读时间需要 5 分钟。

一、网站全面分析

2020中国游戏十强投票网站的自动化操作实验

1.1 网站访问流程

首先,进入投票网站进行注册,发现需要填写姓名、手机号和邮箱信息。虽然现实中存在用户信息真实性的问题,但对于技术实现来说,我们可以通过随机生成百家姓名后的名字、随机号码、随机邮箱来完成自动化操作。

1.2 验证流程

点击"开始投票"后,会跳转到滑块验证码认证界面。这个过程并没有涉及复杂的技术,甚至可以说非常简单。然而,这里有个小陷阱——由于采用了Canvas绘制滑块验证码,传统的图像识别方法已经不再适用。


二、Canvas滑块验证码技术分析

2.1 簡要理解

通过分析发现,该滑块验证码采用了完全不同的实现方式:滑块是通过Canvas绘制出来的,而非传统的图片拼接方式。

2.1.1 背景Canvas
  • Canvas元素在DOM中可以用document.getElementById('puzzle-canvas')找到
  • Canvas绘制的是完全透明的PNG图片
  • PNG图片与背景Canvas的大小完全一致
2.1.2 滑块识别逻辑
  • 通过将Canvas转换为base64编码的图片数据下载下来
  • 只需识别滑块在透明 PNG 图中的像素位置
  • 轻松通过简单的算法找出左端距离顶端像素数值

2.2 实现代码示例

2.2.1 下载Canvas内容
def download_canvas():    # 执行JavaScript获取Canvas内容    canvas_data_url = execute_script('return document.getElementById("puzzle-canvas").toDataURL();'    base64_img = base64.b64decode(canvas_data_url.split(',')[1:])    # 将二进制转换为PNG文件    with open('puzzle.png', 'wb') as f:        f.write(base64_img)
2.2.2 识别滑块位置
import PILdef identify_puzzle_position(puzzle_image):    # 转换为黑白图像    image = PIL.Image.open(puzzle_image).convert('L')    # 遍历找最小x轴位置    for x in range(image.size[0]):        if any(image.getpixel((x, y)) for y in range(image.size[1])):            return x - 10  # 减少10个像素的偏移量    return 0

三、完整实现流程

3.1 下载滑块图片

通过分析发现,传统图片滑块验证需要解析背景图片中的缺口,这对算法要求较高。Canvas实现的滑块只需要找到滑块左端的位置,因为这直接决定了移动距离,这大大简化了验证流程。

3.2 自动化操作的实现细节

  • 前期可以通过简单的CSS选择器定位Canvas元素
  • 使用JavaScript直接调用Canvas的toDataURL方法获取图片
  • 将Base64字符串解码成图片文件
  • 通过简单的像素处理算法识别滑块位置

四、测试案例

通过对多个投票页面进行测试,发现Canvas滑块的实现方式有很大特点:由于滑块是通过移动一个透明的PNG图层进行验证,实际上只需要计算x坐标即可算出移动距离。


五、总结与展望

通过以上实现,充分证明了Canvas滑块验证码其实并没有想象中的那么难。相比于传统的图像识别问题,这种方式反而简化了验证流程,甚至可以说降低了技术门槛。

对于想实现类似自动化操作的人来说,关键在于:

  • 理解Canvas渲染方式
  • 学习如何处理Base64编码
  • 熟悉简单图像处理算法
  • 希望以上内容能够为大家提供一些启发!

    转载地址:http://rengz.baihongyu.com/

    你可能感兴趣的文章
    MySQL 日期时间类型的选择
    查看>>
    Mysql 时间操作(当天,昨天,7天,30天,半年,全年,季度)
    查看>>
    MySQL 是如何加锁的?
    查看>>
    MySQL 是怎样运行的 - InnoDB数据页结构
    查看>>
    mysql 更新子表_mysql 在update中实现子查询的方式
    查看>>
    MySQL 有什么优点?
    查看>>
    mysql 权限整理记录
    查看>>
    mysql 权限登录问题:ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost‘ (using password: YES)
    查看>>
    MYSQL 查看最大连接数和修改最大连接数
    查看>>
    MySQL 查看有哪些表
    查看>>
    mysql 查看锁_阿里/美团/字节面试官必问的Mysql锁机制,你真的明白吗
    查看>>
    MySql 查询以逗号分隔的字符串的方法(正则)
    查看>>
    MySQL 查询优化:提速查询效率的13大秘籍(避免使用SELECT 、分页查询的优化、合理使用连接、子查询的优化)(上)
    查看>>
    mysql 查询数据库所有表的字段信息
    查看>>
    【Java基础】什么是面向对象?
    查看>>
    mysql 查询,正数降序排序,负数升序排序
    查看>>
    MySQL 树形结构 根据指定节点 获取其下属的所有子节点(包含路径上的枝干节点和叶子节点)...
    查看>>
    mysql 死锁 Deadlock found when trying to get lock; try restarting transaction
    查看>>
    mysql 死锁(先delete 后insert)日志分析
    查看>>
    MySQL 死锁了,怎么办?
    查看>>