اخبار

الگوریتم‌های جدید یادگیری ماشین راحت‌تر از همیشه کد کپچا را می‌شکنند

پژوهشگران انگلیسی و چینی الگوریتم جدیدی مبتنی بر یادگیری ماشین توسعه داده‌اند که می‌توان کد کپچا متنی را با کمترین تلاش، سریع‌ترین زمان و بالاترین دقت بشکند. این الگوریتم بر اساس مفهومی به نام شبکه خصمانه زایشی (GAN – Generative Adversarial Network) ابداع‌شده است.

GAN دسته ویژه‌ای از الگوریتم‌های هوش مصنوعی است که برای سناریوهایی که الگوریتم در آن به مقدار کمی از داده‌های آموزش دسترسی دارد، مفید است. الگوریتم‌های یادگیری ماشین معمولاً به میلیون‌های نمونه برای آموزش نیاز دارند تا به‌اندازه مطلوبی از دقت دست یابند.

مزیت مهم الگوریتم‌های GAN این است که این الگوریتم‌ها به تعداد داده‌های اولیه کمی نیاز دارند. این ویژگی از مؤلفه «زایشی» الگوریتم حاصل می‌شود. در حقیقت مؤلفه زایشی وظیفه تولید داده‌های مشابه است. این داده‌ها به الگوریتم حل‌کننده (solver) می‌دهد تا خروجی را حدس بزند.

در سناریوهای واقعی یک هکر نمی‌تواند بدون آن‌که به‌وسیله وب‌سایت هدف بلاک شود میلیون‌های کپچا را برای آموزش الگوریتم یادگیری ماشین تولید کند. در الگوریتم جدید تنها از ۵۰۰ کپچا متنی از ۱۱ سرویس کد متنی کپچا برای ۳۲ وب‌سایت از ۵۰ وب‌سایت برتر الکسا  برای آموزش استفاده کرده‌اند.

برای جمع‌آوری ۵۰۰ کپچا کمتر از ۲ ساعت و همچنین کمتر از ۲ ساعت نیز برای برچسب‌گذاری دستی به‌وسیله کاربر زمان صرف شده است. این نشان می‌دهد میزان تلاش و هزینه راه‌اندازی یک حمله علیه کپچا پایین خواهد بود.

فهرست کپچاهای مورداستفاده برای آموزش الگوریتم که از وب‌سایت‌هایی نظیر Wokipedia، Microsoft، eBay، Baidu، Google، Alipay و … در تصویر زیر آمده است.

کپچا نمونه

جدول زیر هم مقایسه‌ای بین الگوریتم یادگیری ماشین فعلی و بهترین الگوریتم‌های پیشین برای شکستن کپچا به عمل‌آورده است. این جدول دقت بالای الگوریتم جدید را نسبت به قبل نشان می‌دهد.

کپچا نتیجه

الگوریتم جدید می‌تواند با استفاده از یک کامپیوتر دسکتاپ، کد متنی کپچا را در کمتر از ۰.۰۵ ثانیه حدس بزند.

چنین وضعی بدان مهنی است که اولین سد دفاعی بسیاری از وب‌سایت‌ها در برابر حملات (بخصوص DOS) دیگر قابل‌اعتماد نیست.

گروه توسعه دهنده این الگوریتم توصیه می‌کنند که توسعه دهندگان وب‌سایت علاوه بر کپچا می بایست اقدامات دیگری را برای تشخیص ماشین از انسان و ایجاد چندین لایه‌ی امنیتی موردتوجه قرار بدهند؛ برای نمونه می توان به روش هایی نظیر الگوها، موقعیت مکانی و یا داده‌های بیومتریک استفاده کنند.

مطالب مرتبط
چگونه از کلمات عبور خود محافظت و مهاجمان را از خود دور کنیم؟
حمله به بیش از ۲۰۰۰۰ وب سایت وردپرس
فهرست ۲۵ مورد از بدترین پسوردهای سال ۲۰۱

منبع: ZDNet

الگوریتم‌های جدید یادگیری ماشین راحت‌تر از همیشه کد کپچا را می‌شکنند
To Top