Back to Question Center
0

Semalt: وبسایت های غیرقابل شناخته شده مشهور

1 answers:

برای خرد کردن داده های شما به صورت دستی می خواهید، شما نیاز به مهارت های برنامه نویسی عالی. همچنین شما می توانید از طیف وسیعی از ابزار استخراج اطلاعات وب استفاده کنید که هدف آنها خواندن، ساختن و خراش دادن داده ها در فرمت خاص. با این حال، برخی از وبسایتها غیرقابل کشف هستند، به این معنی که آنها هر دو از تکنیکهای ضد خرابکارانه استفاده می کنند و یا به طور مرتب نشانه گذاری خود را تغییر می دهند. به عنوان مثال، LinkedIn، Alibaba و فیس بوک نیاز به اطلاعات ورود، پیشنهاد برای ورود به CAPTCHA، و بلوک آدرس های IP را برای اطمینان از حفاظت از کاربران و حفظ حریم خصوصی خود را.

1. فیس بوک:

فیس بوک یکی از معروف ترین وب سایت های شبکه های اجتماعی است که بیش از 20 میلیون کاربر فعال در سرتاسر جهان دارد - cabin fever slots. تعداد زیادی از برنامه های کاربردی و برنامه های داده های خرابکاری وجود دارد که هدف آنها استخراج اطلاعات فردی از فیس بوک است. متاسفانه اکثر ابزارها اطلاعات ما را دقیق و قابل خواندن ارائه نمی دهند. فیس بوک برای اسپم و هکرها برای جمع آوری اطلاعات در مورد کاربران خود دشوار است. این را می توان تنها با کمک یک تجزیه کننده HTML مانند Python بدست آورد، اما بسیاری از وب مسترها و فارغ التحصیلان حتی نمی دانند مبانی پایتون. اخیرا یک اسکرپ فیس بوک برای استخراج اطلاعات حیاتی از این وب سایت شبکه های اجتماعی راه اندازی شد. با یک اسکرابر فیس بوک، می توانید تنها نام ها و آدرس های ایمیل های کاربران فیسبوک را جمع آوری کنید. اما اگر می خواهید اطلاعات عمیق را جمع آوری کنید، نمی توانید از این ابزار یا سایر اسکرابر های مشابه استفاده کنید.

2. LinkedIn:

LinkedIn یکی دیگر از وب سایت های شبکه های اجتماعی است که غیر ممکن است به خراش. با این حال، شما می توانید بخشی از داده ها را از چند صفحهای وب استخراج کنید، اما اکثر اطلاعات غیرقابل دسترسی است. شما فقط می توانید اطلاعات را از یک پروفایل عمومی LinkedIn با استفاده از واردات پاک کنید. Io یا آزمایشگاه کیمونو. بازاریابان نمی توانند به دلیل استفاده از اقدامات امنیتی قوی LinkedIn از خدمات خرابکارانه استفاده کنند. با این حال، آنها شروع به استفاده از عصاره سرب، که کمک می کند تا پروفایل های عمومی را خراش. این ابزار می تواند لینک های پروفایل، نام ها و آدرس های ایمیل را تنها از بین ببرد. اما اگر میخواهید اسکایپ، یاهو مسنجر، آدرس کامل و توییتر یک کاربر را دریافت کنید، LinkedIn این کار را انجام نخواهد داد.

3. Alibaba:

Alibaba یک کنفرانس تکنولوژیک است که خدمات آنلاین به مصرف کنندگان را در اینترنت فراهم می کند. متاسفانه، هیچ راهی برای خراب کردن داده ها از این وب سایت وجود ندارد. بر خلاف آمازون و eBay، Alibaba برای کاربران خود دشوار است اطلاعات مربوط به محصولات، تصاویر، توضیحات و قیمت های آن را استخراج کند. در سال 2015، تعدادی از ابزارهایی که می توانند اطلاعات را از Alibaba به راحتی از بین ببرند، به طور عمومی معرفی شدند. اکثر ابزارها پرداخت می شوند و انتظارات از راه اندازی ها را ندارند. Alibaba مجموعه ای گسترده از کسب و کار در سراسر جهان عمل می کند و خریداران را با تامین کنندگان متصل می کند. در همین حال، حریم خصوصی آنها را تضمین می کند و اجازه نمی دهد هر کسی اطلاعات را خراب کند. در اکتبر سال 2017، Alibaba دارای بیش از 500 میلیون کاربر فعال ماهانه در سراسر پلت فرم آن است. Alibaba حتی از پردازنده های بزرگ ابر مانند آمازون، گوگل و مایکروسافت در رشد درآمد ابر بهره مند شده است. این بهترین استراتژی ها را برای اطمینان از حریم خصوصی خود تامین کنندگان و بلوک کردن تمام آدرس های مشکوک IP در چند ثانیه اجرا کرده است.

December 22, 2017