پژوهشگران انگلیسی و چینی الگوریتم جدیدی مبتنی بر یادگیری ماشین توسعه دادهاند که میتوان کد کپچا متنی را با کمترین تلاش، سریعترین زمان و بالاترین دقت بشکند. این الگوریتم بر اساس مفهومی به نام شبکه خصمانه زایشی (GAN – Generative Adversarial Network) ابداعشده است.
GAN دسته ویژهای از الگوریتمهای هوش مصنوعی است که برای سناریوهایی که الگوریتم در آن به مقدار کمی از دادههای آموزش دسترسی دارد، مفید است. الگوریتمهای یادگیری ماشین معمولاً به میلیونهای نمونه برای آموزش نیاز دارند تا بهاندازه مطلوبی از دقت دست یابند.
مزیت مهم الگوریتمهای GAN این است که این الگوریتمها به تعداد دادههای اولیه کمی نیاز دارند. این ویژگی از مؤلفه «زایشی» الگوریتم حاصل میشود. در حقیقت مؤلفه زایشی وظیفه تولید دادههای مشابه است. این دادهها به الگوریتم حلکننده (solver) میدهد تا خروجی را حدس بزند.
در سناریوهای واقعی یک هکر نمیتواند بدون آنکه بهوسیله وبسایت هدف بلاک شود میلیونهای کپچا را برای آموزش الگوریتم یادگیری ماشین تولید کند. در الگوریتم جدید تنها از ۵۰۰ کپچا متنی از ۱۱ سرویس کد متنی کپچا برای ۳۲ وبسایت از ۵۰ وبسایت برتر الکسا برای آموزش استفاده کردهاند.
برای جمعآوری ۵۰۰ کپچا کمتر از ۲ ساعت و همچنین کمتر از ۲ ساعت نیز برای برچسبگذاری دستی بهوسیله کاربر زمان صرف شده است. این نشان میدهد میزان تلاش و هزینه راهاندازی یک حمله علیه کپچا پایین خواهد بود.
فهرست کپچاهای مورداستفاده برای آموزش الگوریتم که از وبسایتهایی نظیر Wokipedia، Microsoft، eBay، Baidu، Google، Alipay و … در تصویر زیر آمده است.

جدول زیر هم مقایسهای بین الگوریتم یادگیری ماشین فعلی و بهترین الگوریتمهای پیشین برای شکستن کپچا به عملآورده است. این جدول دقت بالای الگوریتم جدید را نسبت به قبل نشان میدهد.

الگوریتم جدید میتواند با استفاده از یک کامپیوتر دسکتاپ، کد متنی کپچا را در کمتر از ۰.۰۵ ثانیه حدس بزند.
چنین وضعی بدان مهنی است که اولین سد دفاعی بسیاری از وبسایتها در برابر حملات (بخصوص DOS) دیگر قابلاعتماد نیست.
گروه توسعه دهنده این الگوریتم توصیه میکنند که توسعه دهندگان وبسایت علاوه بر کپچا می بایست اقدامات دیگری را برای تشخیص ماشین از انسان و ایجاد چندین لایهی امنیتی موردتوجه قرار بدهند؛ برای نمونه می توان به روش هایی نظیر الگوها، موقعیت مکانی و یا دادههای بیومتریک استفاده کنند.
مطالب مرتبط
چگونه از کلمات عبور خود محافظت و مهاجمان را از خود دور کنیم؟
حمله به بیش از ۲۰۰۰۰ وب سایت وردپرس
فهرست ۲۵ مورد از بدترین پسوردهای سال ۲۰۱
منبع: ZDNet
