کتاب وب اسکرپینگ با پایتون نیما شفیعی رضوانی نژاد + دانلود نمونه رایگان
با کد تخفیف OFF30 اولین کتاب الکترونیکی یا صوتی‌ات را با ۳۰٪ تخفیف از طاقچه دریافت کن.
تصویر جلد کتاب وب اسکرپینگ با پایتون

کتاب وب اسکرپینگ با پایتون

معرفی کتاب وب اسکرپینگ با پایتون

کتاب وب اسکرپینگ با پایتون نوشته‌ی نیما شفیعی رضوانی نژاد و بهاره بهروز راهنمایی گام‌به‌گام برای استخراج و پردازش داده‌ها از وب‌سایت‌ها با استفاده از زبان برنامه‌نویسی پایتون است. موسسه فرهنگی هنری دیباگران تهران آن را منتشر کرده است و متن کتاب نشان می‌دهد که از سطح مقدماتی شروع شده و تا مباحث پیشرفته وب اسکرپینگ و وب کراولینگ پیش می‌رود. نویسندگان ابتدا مفهوم وب اسکرپینگ، کاربردها، چالش‌ها و پرسش‌های رایج درباره قانونی‌بودن و جنبه‌های اخلاقی این کار را توضیح داده‌اند و سپس به‌سراغ ابزارها، کتابخانه‌ها و نمونه‌کدهای عملی رفته‌اند. ساختار کتاب طوری طراحی شده که هم برای کسانی که تجربه‌ای در پایتون ندارند قابل استفاده باشد و هم برای کسانی که می‌خواهند پروژه‌های جدی جمع‌آوری داده از وب انجام دهند. در فصل‌ها و بخش‌های مختلف، علاوه‌بر معرفی مفاهیم، مثال‌های واقعی از خراش‌دادن صفحات، کار با فرم‌ها، مدیریت کوکی‌ها، پردازش متن و تصویر و کار با فرمت‌های مختلف داده ارائه شده است. نسخه‌ی الکترونیکی این اثر را می‌توانید از طاقچه خرید و دانلود کنید.

درباره کتاب وب اسکرپینگ با پایتون

کتاب وب اسکرپینگ با پایتون با تمرکز بر زبان پایتون، وب اسکرپینگ را به‌عنوان مهارتی برای جمع‌آوری، تبدیل و استفاده از داده‌های وب معرفی کرده است. نویسندگان در مقدمه توضیح داده‌اند که هدف برنامه‌نویسی، ساده‌تر و سریع‌ترکردن کارهای انسان است و وب اسکرپینگ به این فرایند «روح و زندگی» می‌دهد؛ چون می‌تواند در صفحات مختلف وب بچرخد و اطلاعات موردنظر را به‌صورت خودکار برگرداند. در همان صفحات ابتدایی، سوءتفاهم‌های رایج درباره قانونی‌بودن وب اسکرپینگ، مدیریت صفحات سنگین جاوااسکریپت، کار با فایل‌ها و شروع پروژه‌های بزرگ مطرح شده و گفته شده که این کتاب به‌دنبال پاسخ‌دادن به این سؤال‌ها است. در ادامه، تعریف وب اسکرپینگ، تفاوت آن با وب کراولینگ، و ارتباط آن با حوزه‌هایی مثل تجزیه‌وتحلیل داده، پردازش زبان طبیعی و امنیت اطلاعات آمده است. کتاب در بخش اول روی مبانی وب اسکرپینگ و وب کراولینگ تمرکز کرده و در بخش دوم به مباحث پیشرفته‌تر و نوشتن اسکریپرهای وب اختصاص یافته است. کتاب وب اسکرپینگ با پایتون در فصل‌های مختلف، هم تصویر کلی از کاربردها و هم جزئیات فنی را پوشش داده است. در فصل «وب اسکرپینگ چیست؟» تعریف، چرایی استفاده از اسکرپرها و مقایسه آن‌ها با APIها مطرح شده و مثال‌هایی مثل جستجوی پرواز، جمع‌آوری داده‌های جغرافیایی، پایش ترندهای شبکه‌های اجتماعی و تحلیل نظرسنجی‌ها آورده شده است. فصل «چه کسی از وب اسکرپینگ استفاده می‌کند؟» به کاربردها در تولید سرنخ فروش، تحقیقات بازار، نظارت بر قیمت، تحلیل داده، محافظت از برند، بهینه‌سازی موتور جستجو و کاهش ریسک می‌پردازد. فصل «اولین وب خراش شما» اصول ارسال درخواست HTTP، خواندن پاسخ HTML و استخراج داده را با مثال‌های ساده نشان داده است. در فصل «معرفی ابزارهای خزش وب» کتابخانه‌هایی مثل BeautifulSoup، Scrapy و Selenium معرفی شده و برای هرکدام مثال‌های کدنویسی، از استخراج لینک‌ها و پاراگراف‌ها تا پیمایش اجداد و فرزندان تگ‌ها و مدیریت فرم‌ها و هشدارهای جاوااسکریپت ارائه شده است. فصل‌های بعدی به خواندن اسناد، رمزگذاری فایل‌ها، کار با CSV، PDF، اسناد متنی و مسائل رمزگذاری متن (ASCII، UTF-8، ISO-8859) می‌پردازند و در بخش‌های پایانی، موضوعاتی مانند پردازش تصویر، تشخیص متن، کار با CAPTCHA، پیمایش موازی، استفاده از سرورهای راه‌دور، جلوگیری از مسدودشدن IP و مباحث اخلاقی و قانونی وب‌کاوی مطرح شده است.

خلاصه کتاب وب اسکرپینگ با پایتون

کتاب وب اسکرپینگ با پایتون از یک مقدمه مفهومی شروع می‌کند که در آن وب اسکرپینگ به‌عنوان فرایند جمع‌آوری خودکار داده از وب‌سایت‌ها تعریف شده است؛ فرایندی که به‌جای مرور دستی صفحات، با ارسال درخواست‌های HTTP به سرورها، دریافت HTML و تجزیه‌وتحلیل آن انجام می‌شود. نویسندگان توضیح داده‌اند که وب اسکرپرها می‌توانند در زمانی کوتاه هزاران یا میلیون‌ها صفحه را بررسی کنند، به بخش‌هایی از وب دسترسی پیدا کنند که موتورهای جستجوی سنتی به آن‌ها نمی‌رسند و داده‌ها را در قالب‌های ساختاریافته مثل فایل CSV یا پایگاه‌داده ذخیره کنند. در همین بخش، تفاوت استفاده از APIها با وب اسکرپینگ، مزایا و محدودیت‌های هرکدام و مثال‌هایی از کاربردهای واقعی مثل پایش قیمت، جمع‌آوری آگهی‌های شغلی، لیست املاک، داده‌های آب‌وهوا و خبرها آورده شده است. در بخش بعدی، کتاب وارد جزئیات فنی می‌شود. ابتدا ساختار کلی یک اسکرپر توضیح داده شده: ارسال درخواست HTTP، دریافت پاسخ، تجزیه HTML، پردازش و تمیزسازی داده‌ها و ذخیره آن‌ها. سپس با استفاده از کتابخانه‌هایی مثل requests و BeautifulSoup، مثال‌هایی از استخراج لینک‌ها، متن پاراگراف‌ها، جستجو بر اساس ویژگی‌ها و کلاس‌ها، پیمایش اجداد و فرزندان تگ‌ها و کار با ساختار درختی DOM ارائه شده است. بعد از آن، Scrapy به‌عنوان چارچوبی برای خزش کارآمد وب معرفی شده و نمونه اسپایدرهایی برای استخراج عناوین خبر، نقل‌قول‌ها و نویسندگان و کار با صفحات دارای اسکرول بی‌پایان نشان داده شده است. Selenium در فصل دیگری برای اتوماسیون مرورگر، کلیک روی دکمه‌ها، پرکردن فرم‌ها، ناوبری بین صفحات و مدیریت هشدارهای جاوااسکریپت به‌کار رفته است. در ادامه، کتاب به خواندن و نوشتن انواع فایل‌ها می‌پردازد: از متن ساده و CSV تا PDF و اسناد آفیس، و نشان می‌دهد چگونه می‌توان فایل‌ها را مستقیماً از وب دریافت کرد، بدون ذخیره روی دیسک آن‌ها را در حافظه خواند و با کتابخانه‌های پایتون پردازش کرد. بخش مفصلی نیز به رمزگذاری متن اختصاص یافته که در آن تاریخچه ASCII، Unicode و UTF-8، استانداردهای ISO-8859، تفاوت رمزگذاری‌ها و نحوه تشخیص و تنظیم صحیح encoding هنگام خراش‌دادن صفحات چندزبانه توضیح داده شده است. در فصل‌های پایانی، موضوعاتی مانند تمیزسازی داده‌های آلوده، تطبیق و ترکیب داده‌ها با منابع دیگر، خلاصه‌سازی، تحلیل واژگانی، پردازش تصویر و تشخیص متن در تصاویر وب، آموزش و استفاده از مدل‌های تشخیص CAPTCHA، کار با سرورهای راه‌دور، پیمایش موازی، قوانین و اخلاق وب‌کاوی، شرایط استفاده وب‌سایت‌ها و راهکارهای جلوگیری از فشار بیش‌ازحد بر سرورها مطرح شده است.

چرا باید کتاب وب اسکرپینگ با پایتون را بخوانیم؟

کتاب وب اسکرپینگ با پایتون چند ویژگی برجسته دارد که آن را برای یادگیری جدی وب اسکرپینگ قابل‌توجه کرده است. نخست این‌که نویسندگان از همان ابتدا، وب اسکرپینگ را در بستر بزرگ‌تری از برنامه‌نویسی، تحلیل داده و کار با وب قرار داده‌اند و فقط به چند مثال سطحی بسنده نکرده‌اند. در متن کتاب بارها تأکید شده که وب اسکرپینگ ترکیبی از مفاهیم شبکه، ساختار وب، پردازش متن، کار با فایل‌ها و حتی امنیت و اخلاق است و فصل‌ها طوری چیده شده‌اند که این پیوستگی دیده می‌شود. ویژگی دوم، پوشش هم‌زمان مبانی پایتون و مباحث پیشرفته وب اسکرپینگ است. در بخش‌های ابتدایی، اصول اولیه پایتون و ساختار اسکریپت‌ها مرور شده تا کسانی که تجربه زیادی در این زبان ندارند بتوانند مثال‌ها را دنبال کنند. سپس به‌تدریج کتابخانه‌های مهم مثل BeautifulSoup، Scrapy و Selenium معرفی شده و برای هرکدام مثال‌های عملی از ساده تا پیچیده ارائه شده است؛ از استخراج چند لینک و پاراگراف تا کار با فرم‌ها، هشدارهای جاوااسکریپت، اسکرول بی‌پایان و خزش موازی. بخش کار با فایل‌ها و رمزگذاری متن نیز کمک می‌کند خواننده فقط به HTML محدود نماند و بتواند با CSV، PDF، اسناد متنی و داده‌های چندزبانه کار کند. در کنار این‌ها، فصل‌های مربوط به قوانین، اخلاق وب‌کاوی، شرایط استفاده وب‌سایت‌ها و خطرات فشار بیش‌ازحد بر سرورها، نگاه مسئولانه‌ای به موضوع داده‌اند و نشان داده‌اند که وب اسکرپینگ فقط یک مهارت فنی نیست. برای کسانی که به‌دنبال اجرای پروژه‌های واقعی جمع‌آوری داده، تحلیل بازار، پایش قیمت یا پژوهش داده‌محور هستند، این ترکیب مفاهیم فنی، مثال‌های عملی و بحث‌های حقوقی و اخلاقی می‌تواند یک مسیر نسبتاً کامل برای شروع و پیشرفت فراهم کند.

خواندن این کتاب را به چه کسانی پیشنهاد می‌کنیم؟

کتاب وب اسکرپینگ با پایتون به کسانی پیشنهاد می‌شود که به برنامه‌نویسی پایتون علاقه‌مند هستند و می‌خواهند داده‌های وب را به‌صورت خودکار جمع‌آوری و تحلیل کنند. این کتاب به دانشجویان و پژوهشگران حوزه‌های مرتبط با داده، بازار، علوم اجتماعی و کسب‌وکار که نیاز به استخراج اطلاعات از وب‌سایت‌ها دارند پیشنهاد می‌شود. همچنین به برنامه‌نویسان و توسعه‌دهندگان وب که می‌خواهند با BeautifulSoup، Scrapy و Selenium کار کنند و پروژه‌های خزش و اسکرپینگ طراحی کنند توصیه می‌شود. برای کسانی که دغدغه درک مسائل قانونی و اخلاقی وب‌کاوی را هم‌زمان با یادگیری جنبه‌های فنی دارند نیز این کتاب مناسب است.

نظری برای کتاب ثبت نشده است

حجم

۴٫۷ مگابایت

سال انتشار

۱۴۰۴

تعداد صفحه‌ها

۱۹۰ صفحه

حجم

۴٫۷ مگابایت

سال انتشار

۱۴۰۴

تعداد صفحه‌ها

۱۹۰ صفحه

قیمت:
۱۵۴,۰۰۰
۱۲۳,۲۰۰
۲۰%
تومان