CAPTCHA 网站验证码实际上是如何工作的?

20240119145412920-image

在访问有些网站时,需要验证自已不是机器人的网页,这很烦人。但有必要。

到现在为止,您一定已经填充了数十亿个验证码,但您知道它是什么吗?或者为什么有些网站有一个棘手的验证码来挑战你?那是因为它告诉他们你是人类还是机器人。

机器人占在线流量的 40%。很大一部分网站访问者可能是机器人。这些不是普通的机器人。它们旨在抓取您的网站,寻找访问数据库的方法,并恶意使用数据。

然后,这些机器人可用于数字广告欺诈、个人数据收集和交易欺诈等。当然,任何网站都希望保护自己免受这些有害元素的侵害。

这时验证码就出现了。是的,这很令人沮丧,但归根结底,它们可以保护您的数据。如果您想了解有关验证码及其工作原理的所有信息,请与我保持联系,直到本文结束。我会让你了解这些测试的所有秘密。

什么是验证码?

首先,让我们谈谈房间里的大象。Captcha 是“Fully Automated Public Turing Test to Distinguish Computers and Humans”的首字母缩写词。

顾名思义,它是一种响应测试,可帮助网站区分人类访问者和机器人访问者。将它们视为安全控制措施,旨在防止黑客和垃圾邮件发送者使用网页上的表单插入恶意代码。

该测试告诉他们是否有真人试图访问他们的网站或机器人。人类受到张开双臂的欢迎。机器人?没有那么多。如果您通过了测试,您将被定向到您尝试访问的网页。如果你失败了,你有多少脑细胞并不重要;在网站眼中,你是一个机器人。因此,应认真对待这些测试。

验证码首次出现在 90 年代后期。虽然第一个验证码看起来很像扭曲的字母和数字,但它们已经发生了巨大的变化,变得更具挑战性。

另外:谷歌危险网站警告消息及其含义。

验证码如何工作?

验证码通常在您尝试访问特定网页时触发。他们要求您执行一项简单的任务,根据该任务,他们可以评估是人类还是机器人试图进入。机器人无法回答问题,但人类可以。

使用最广泛的验证码是给你一系列畸形或扭曲的字母或数字,你必须理解它们并输入正确的字母或数字。

20240119145731568-image

机器人无法理解这样的验证码,但作为人类,这对我们来说是小菜一碟。如果你是一个人类,验证码是非常简单的。另一个简单的验证码是,当网页要求你勾选“我不是机器人”框时,你就进去了!

然而,机器人变得越来越聪明,所以验证码也不得不提高他们的游戏水平。您现在会发现不同类型的验证码,从简单的复选标记到更复杂的基于图像的验证码。

还有音频验证码,其中播放随机字母和数字的录音,您必须在听完音符后输入正确的字符。这些是为视障用户设计的。问题是音频有背景噪音。只有人类才能在如此多的噪音中辨认出字母和单词。

由于颜色渐变和背景噪音,机器人往往会无法通过验证码测试。此外,验证码无法复制。机器人成功的可能性很小。

最受欢迎的测试是 Google 的 ReCaptcha。还记得有时谷歌会要求您选择带有特定对象的图像吗?这是 reCaptcha!如果您通过了测试,您将被 Google 或网站视为人类,并且您可以像人类一样访问网站的内容。

如果您失败了,您将被视为机器人,您将被拒绝访问。尽管 Captcha 已被证明在很长一段时间内都很受欢迎,但许多机器人开发人员已经走在了前面。验证码开发者现在也应该加强他们的游戏。

20240119145830162-image

验证码的用途是什么?

验证码的基本用途是区分人类和机器人。网站讨厌机器人。但是为什么?这就是为什么网站不希望机器人访问他们的网站,因此采取验证码等安全控制措施来阻止它们。

#1.机器人可以创建虚假帐户

通过创建虚假帐户并使用网站资源,黑客部署的机器人可以增加流量(虚假流量),使服务器过载,有时还会拒绝向真实用户提供网站服务。

这可能会使网站所有者失去资源、金钱甚至声誉。此外,他们还可以开展网络钓鱼活动并欺骗其他用户。

#2.反垃圾邮件联系表格

许多服务网站都提供联系表格。如果机器人可以免费访问网站,它们可能会发送包含虚假信息的垃圾邮件表单,从而浪费服务提供商的时间。他们很难区分机器人的形状和真实的形状。

除此之外,机器人还可以向网站发送带有虚假评论的垃圾邮件。其中一些可能包含危险链接。点击恶意链接的用户可能会被骗并窃取他们的个人信息。

另请阅读: 您的个人信息在暗网上的价值是什么?

#3.篡改在线调查

机器人攻击网站的主要方式之一是在亚马逊等网站上获取虚假产品评论。这使得一些产品看起来更好或更糟,基于机器人的反馈,而不是真实的评论。

想象一下,仅仅因为一些机器人给它打了 2分(满分 5 分)就失去了一双优质闪亮的靴子。或者花 60 美元买了一双评分为 5 的登山靴,却发现它们质量很差?你没钱了,一双好鞋都没有!

机器人可能是电子商务网站的噩梦,阻止它们访问网站的最佳方法是创建验证码。

验证码的类型

验证码有几种类型。之所以存在许多变体,是因为验证码变得越聪明,机器人就越聪明。因此,验证码开发人员必须不断绞尽脑汁才能在游戏中击败机器人。

以下是网站用来确保其内容安全的一些常见验证码类型:

#1.数学问题

在这个验证码中,你必须解决一个初级数学问题。它就像 1 和 3 或 5 和 10 的总和一样简单。

由于这样的问题需要人类的逻辑,机器人很可能会无法通过测试。这些验证码广泛用于 HTML 和 WordPress 网站。

#2.单词问题

另一种常见的验证码类型是单词问题。你会得到一系列随机的字母和单词,你必须输入它们。您还可以获得音频形式的单词问题,视障用户可以使用它来访问它。

但是,如果您更信任自己的耳朵而不是眼睛,任何人都可以使用音频验证码来访问它。由于此类问题会考验您的逻辑理解能力,因此机器人很可能会再次失败。人类往往会成功,即使不是第一次尝试,至少是第五次。

#3.自信的验证码

此验证码要求您将文本与其提供的某些图像相匹配。它可能会要求您从以网格形式分为几个部分的图像中找到红绿灯。您需要单击图像中包含红绿灯的部分。

如果你遇到过这个验证码,你就会知道通过这个验证码并不容易。我总是很难决定是否应该选择从图像边缘突出的交通信号灯的小金属部分。我认为大多数人都面临着这一挑战。

祝你好运,机器人。你在这里有一个挑战。

#4.蜜罐验证码

现在是所有验证码之王。蜜罐验证码是迄今为止对机器人最严格的测试。这就像寻宝一样,但人类发现它很容易解决。在其中,有隐藏的字段以捕获机器人的形式。

机器人可能被用来破译这个验证码,但自然而然地,开发人员已经推进了他们的游戏,并提出了机器人无法解决的挑战。

#5.基于图像的验证码

基于图像的验证码很常见。您将看到多张图像,并且会收到诸如“选择山脉和丘陵的图像”之类的提示。你得到的图像是非常随机的,有街道、花园、小巷、山脉和丘陵的照片。

由于很容易区分山脉和街道,因此这些验证码对人类来说很容易解决,但对机器人来说却不容易。图像可能在某些验证码中链接,而在其他验证码中则不相关。如果验证码包含不同的图像,您可以选择“跳过”。

#6.文本验证码

它是最古老的验证码形式之一。在这里,你会得到一系列字母和单词,环境非常扭曲。

它们可能模糊、位置不佳、有划痕或点,或者后面有点。从本质上讲,任何使机器人难以破译字母的东西。对于人类来说,这可能很容易。但是,某些验证码可能会令人头疼。

使用验证码的缺点

虽然验证码在保护网站数据方面发挥了重要作用,但它可能有一些缺点。以下是您需要了解的一些信息。

#1.用户体验差

我想不出有哪个人喜欢验证码。恰恰相反,当烦人的弹出窗口弹出时,大多数人都讨厌它,当你只想在布拉格发现梦幻般的景点时,你必须用你的脑细胞来解决一个挑战。

所以是的,验证码会导致糟糕的用户体验,因为它们会中断用户的流动。

一些用户甚至最终完全放弃了该网页。这可能会对网站的受众产生负面影响,因此网站所有者应小心验证码,以免阻止传入流量。

另请参阅: 改善用户体验的最佳真实用户监控工具

#2.效率 低下

不能保证验证码可以阻止机器人窃取您的数据,因为机器人已被反复证明与人类一样聪明。因此,一方面,你有机器人入侵你的网站,另一方面,你让不断离开你网站的用户感到沮丧。这是一个双输的局面。

#3.对于视障观众来说不可行

除非音频验证码伴随着主验证码,否则它们不适合视障观众。这仅适用于基于文本的验证码。其他类型,例如基于图像的验证码、蜜罐和自信的验证码,完全依赖于人类的视觉感知。这将使视障人士难以访问您的网站。

#4.有些验证码难以阅读

一些基于文本甚至基于图像的验证码难以阅读或破译。尽管反复尝试,他们还是无法理解。如果您的网站访问者尽管是人类,但未能破解代码,他们将出于纯粹的挫败感而离开您的网站。这再次会导致流量减少。

最后的思考

验证码是人类与机器人战斗的一种手段。这些是精心策划的测试,旨在区分机器人和人类。有这么多可用的类型,网站所有者有多种选择可供选择。

残酷的事实是,无论您选择哪种验证码,您的听众都会讨厌您,因为您是在浪费他们的时间。因此,您在使用这些安全检查点时需要小心。本文包括您需要了解的有关验证码的所有信息。

接下来,了解不同的爬虫程序检测和缓解解决方案,以防止恶意流量。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容