کتاب آموزش داده کاوی با RapidMiner ساسان کرمی زاده + دانلود نمونه رایگان
با کد تخفیف OFF30 اولین کتاب الکترونیکی یا صوتی‌ات را با ۳۰٪ تخفیف از طاقچه دریافت کن.
تصویر جلد کتاب آموزش داده کاوی با RapidMiner

کتاب آموزش داده کاوی با RapidMiner

دسته‌بندی:
امتیازبدون نظر

معرفی کتاب آموزش داده کاوی با RapidMiner

کتاب آموزش داده‌کاوی با RapidMiner نوشته‌ی ساسان کرمی‌زاده و به‌کوشش موسسه فرهنگی هنری دیباگران تهران منتشر شده است. این کتاب به معرفی علم داده، داده‌کاوی و چرخه‌ی حیات آن می‌پردازد و سپس نرم‌افزار رپیدماینر را به‌عنوان یک محیط گرافیکی برای پیاده‌سازی فرایندهای داده‌کاوی معرفی می‌کند. ساختار اثر از مباحث پایه‌ای مانند تعریف علم داده، داده‌کاوی، چرخه‌ی حیات علم داده و مراحل اصلی فرایند داده‌کاوی آغاز شده و به‌تدریج به سمت کار با داده‌ها، ورود و ذخیره‌سازی داده‌ها، پیش‌پردازش، مدل‌سازی، مصورسازی و خوشه‌بندی در محیط رپیدماینر حرکت کرده است. در فصل‌های میانی و پایانی، کتاب به‌صورت جزئی به عملگرهای مختلف رپیدماینر برای خواندن و نوشتن انواع فرمت‌های داده، اتصال به پایگاه‌های داده، کار با فایل‌های اکسل، CSV، ARFF و SPSS و همچنین عملگرهای مربوط به پایگاه‌های داده، سرویس‌های ابری، اسکریپت‌نویسی پایتون و زیر‌فرایندها می‌پردازد. تمرکز اصلی اثر بر آموزش گام‌به‌گام کار با محیط رپیدماینر، شناخت پنجره‌ها، عملگرها، مخزن داده و نحوه‌ی ساخت فرایندهای داده‌کاوی است تا خواننده بتواند بدون ورود به جزئیات برنامه‌نویسی، الگوریتم‌های متنوع داده‌کاوی و یادگیری ماشین را در این محیط پیاده‌سازی کند. نسخه‌ی الکترونیکی این اثر را می‌توانید از طاقچه خرید و دانلود کنید.

درباره کتاب آموزش داده کاوی با RapidMiner

کتاب آموزش داده‌کاوی با RapidMiner با تمرکز بر نرم‌افزار رپیدماینر، علم داده و داده‌کاوی را از سطح مفاهیم پایه تا سطح کار عملی در محیط نرم‌افزار دنبال کرده است. نویسنده ابتدا جایگاه علم داده در صنایع مختلف، نقش داده‌های حجیم و چرخه‌ی حیات علم داده را در پنج مرحله‌ی ضبط، نگهداری، فرایند، تجزیه‌وتحلیل و ارتباط توضیح داده است. سپس مفهوم داده‌کاوی، تشبیه آن به استخراج معدن، کاربردهای آن در حل مسائل تجاری، پیش‌بینی روندها و کاهش ریسک و نیز نسبت آن با آمار و یادگیری ماشین تشریح شده است. در ادامه، کتاب به‌طور مشخص به معرفی رپیدماینر می‌پردازد؛ نرم‌افزاری که با زبان جاوا توسعه یافته و به‌عنوان یک ابزار متن‌باز داده‌کاوی، طیف گسترده‌ای از الگوریتم‌های رایج داده‌کاوی و یادگیری ماشین را پوشش می‌دهد. در این بخش، محیط کاربری رپیدماینر، اجزای اصلی آن مانند مخزن داده، پنل عملگرها، تنظیمات، راهنما، ناحیه‌ی طراحی فرایند و نحوه‌ی کشیدن و رهاکردن عملگرها روی بوم توضیح داده شده است. همچنین نقش «فرایند» و «عملگر» در این نرم‌افزار و مفهوم پورت‌های ورودی و خروجی برای اتصال اجزای مختلف تشریح شده است. کتاب آموزش داده‌کاوی با RapidMiner در فصل‌های بعدی وارد جزئیات فنی‌تر می‌شود و عملگرهای متعدد رپیدماینر را دسته‌بندی و معرفی می‌کند. فصل «آموزش کار با داده‌ها» به ورود داده‌ها، فیلتر و مرتب‌سازی، گروه‌بندی، ایجاد ویژگی جدید، آماده‌سازی داده‌ها و تعریف نقش ویژگی‌ها اختصاص یافته است. در بخش ورود داده‌ها، عملگرهای خواندن انواع فرمت‌ها مانند ARFF، CSV، Excel، Access، SPSS، فایل‌های پراکنده و فرمت‌های خاص داده‌کاوی معرفی شده و برای هرکدام ورودی‌ها، خروجی‌ها و مولفه‌های تنظیمی مانند مسیر فایل، نوع رمزگذاری، نحوه‌ی تشخیص مقادیر گمشده و نقش ویژگی‌ها توضیح داده شده است. در بخش پایگاه داده، عملگرهای اتصال، خواندن، نوشتن و به‌روزرسانی داده در پایگاه‌های مختلف (مانند Access، MySQL و کاساندرا) شرح داده شده و مفهوم متاداده، مزیت ذخیره‌سازی در مخزن و استفاده از عملگرهای بازیابی و فروشگاه برای مدیریت داده‌ها بیان شده است. فصل‌های بعدی به مدل‌سازی، اعتبارسنجی (اعتبارسنجی متقابل، تقسیم آموزش/آزمون، ارزیابی طرح‌های وزن‌دهی ویژگی)، مصورسازی داده، خوشه‌بندی و نیز عملگرهای سودمند مانند زیر‌فرایندها، ماکروها، کپی‌کردن و ترکیب فرایندها می‌پردازد. در بخش پایانی نیز مراحل اصلی فرایند داده‌کاوی شامل جمع‌آوری اطلاعات، آماده‌سازی داده‌ها، استخراج و یادگیری مدل و ارزیابی و تفسیر مدل به‌صورت منظم مرور شده و تکنیک‌هایی مانند قواعد انجمنی، طبقه‌بندی، خوشه‌بندی، رگرسیون، تحلیل توالی و شبکه‌های عصبی معرفی شده است.

خلاصه کتاب آموزش داده کاوی با RapidMiner

کتاب آموزش داده‌کاوی با RapidMiner از یک خط سیر مشخص پیروی می‌کند: حرکت از «چیستی» علم داده و داده‌کاوی به‌سوی «چگونه»ی پیاده‌سازی آن در محیط رپیدماینر. در ابتدای متن، علم داده به‌عنوان حوزه‌ای معرفی شده که با حجم وسیعی از داده‌های ساختار یافته و بدون ساختار سروکار دارد و با استفاده از ابزارها و الگوریتم‌های یادگیری ماشین، به‌دنبال کشف الگوهای پنهان، استخراج اطلاعات معنادار و پشتیبانی از تصمیم‌گیری تجاری است. چرخه‌ی حیات علم داده در پنج مرحله‌ی ضبط، نگهداری، فرایند، تجزیه‌وتحلیل و ارتباط تشریح شده و جایگاه داده‌کاوی در مرحله‌ی فرایند و تحلیل مشخص می‌شود. سپس داده‌کاوی به‌عنوان فرایند تجزیه‌وتحلیل حجم عظیم داده‌ها برای یافتن الگوها، ناهنجاری‌ها و همبستگی‌ها تعریف شده و نسبت آن با آمار و یادگیری ماشین توضیح داده می‌شود. در ادامه، کتاب وارد معرفی نرم‌افزار رپیدماینر می‌شود؛ نرم‌افزاری که همه‌چیز در آن در قالب «آبجکت» و «عملگر» روی یک بوم گرافیکی کنار هم قرار می‌گیرد. نویسنده اجزای محیط رپیدماینر را معرفی کرده است: مخزن داده‌ها برای نگهداری فرایندها و مجموعه‌داده‌ها، پنل عملگرها که الگوریتم‌های یادگیری ماشین، پردازش متن، دسترسی به داده و غیره را در خود دارد، پنل تنظیمات برای تغییر مولفه‌های هر عملگر، بخش راهنما برای مشاهده‌ی مستندات و ناحیه‌ی طراحی فرایند که در آن زنجیره‌ی عملگرها ساخته می‌شود. سپس مفهوم فرایند، عملگر، پورت‌های ورودی و خروجی و مولفه‌ها توضیح داده شده و نشان داده می‌شود که چگونه می‌توان با کشیدن و رهاکردن عملگرها، یک زنجیره‌ی کامل از ورود داده تا مدل‌سازی و ارزیابی ساخت. بخش مفصل کتاب به عملگرهای ورود و خروج داده اختصاص دارد. برای هر نوع منبع داده (فایل‌های ARFF، CSV، Excel، Access، SPSS، فایل‌های پراکنده، فرمت‌های خاص داده‌کاوی و پایگاه‌های داده) عملگر متناظر معرفی شده و پارامترهایی مانند مسیر فایل، نوع رمزگذاری، نحوه‌ی تشخیص مقادیر گمشده، تعریف نقش ویژگی‌ها، نحوه‌ی ذخیره‌سازی در مخزن و بازنویسی یا افزودن داده توضیح داده می‌شود. سپس عملگرهای نوشتن داده در قالب‌های مختلف (CSV، Excel، PMML، فرمت‌های متنی سفارشی و پایگاه داده) معرفی شده و مثال‌هایی از فرایندهای نمونه برای ذخیره و بازیابی داده‌ها ارائه شده است. در فصل‌های مربوط به آماده‌سازی داده، کتاب به پیش‌پردازش به‌عنوان بخش پرهزینه‌ی پروژه‌های داده‌کاوی می‌پردازد و مسائلی مانند نویز، نمونه‌های پرت، مقادیر مفقود و داده‌های تکراری را به‌عنوان تهدیدهای کیفیت داده فهرست می‌کند. سپس ابزارهایی مانند نمونه‌گیری، تبدیل، حذف نویز، نسبت‌دادن مقادیر مفقود، عادی‌سازی، استخراج ویژگی و کاهش ابعاد معرفی می‌شود. عملگرهای فیلترکردن نمونه‌ها بر اساس محدوده‌ی شاخص یا شرایط منطقی، انتخاب زیرمجموعه‌ی ویژگی‌ها، نرمال‌سازی، گسسته‌سازی و کاهش ابعاد در رپیدماینر توضیح داده شده است. در بخش مدل‌سازی، کتاب به تکنیک‌های مختلف داده‌کاوی مانند قواعد انجمنی، طبقه‌بندی، خوشه‌بندی، رگرسیون، تحلیل توالی و شبکه‌های عصبی اشاره می‌کند و سپس عملگرهای آموزش مدل و اعمال مدل را در رپیدماینر شرح می‌دهد. عملگر Apply Model به‌عنوان حلقه‌ی اتصال بین مدل آموزش‌دیده و داده‌های جدید معرفی شده و مفهوم خروجی‌هایی مانند پیش‌بینی و اطمینان توضیح داده می‌شود. در ادامه، عملگرهای پیشرفته‌تری مانند مدل‌های حساس به هزینه، تحلیل اهمیت ویژگی‌ها برای هر پیش‌بینی، و عملگرهایی که با معکوس‌کردن فرایند پیش‌بینی، ورودی‌های بهینه برای رسیدن به خروجی دلخواه را تجویز می‌کنند معرفی شده است. بخش اعتبارسنجی به عملگرهایی مانند Cross Validation، Split Validation و ارزیابی طرح‌های وزن‌دهی ویژگی اختصاص دارد. کتاب نشان می‌دهد که چگونه می‌توان با تقسیم داده به مجموعه‌های آموزش و آزمون، یا با اعتبارسنجی متقابل، عملکرد مدل را برآورد کرد و با استفاده از عملگر Performance معیارهایی مانند دقت و سایر شاخص‌ها را به‌دست آورد. در فصل مصورسازی، به ایجاد نمودارها و نمایش‌های دوبعدی از داده‌ها و رنگ‌آمیزی آن‌ها بر اساس پیش‌بینی مدل اشاره شده است. در فصل خوشه‌بندی نیز انواع مدل‌های خوشه‌بندی (افرازی، سلسله‌مراتبی، مبتنی‌بر تراکم، شبکه‌ای و مدل‌محور) و کاربردهایی مانند شناسایی مشتریان مشابه، فیلتر هرزنامه، بازاریابی، تحلیل ترافیک شبکه و تحلیل اسناد مطرح شده و پیاده‌سازی الگوریتم‌های خوشه‌بندی در رپیدماینر توضیح داده شده است. در پایان، کتاب با جمع‌بندی مراحل فرایند داده‌کاوی (جمع‌آوری، آماده‌سازی، استخراج و یادگیری مدل، ارزیابی و تفسیر) و تأکید بر نقش پیش‌پردازش و ارزیابی، تصویری یکپارچه از مسیر تبدیل داده‌ی خام به دانش قابل استفاده در محیط رپیدماینر ارائه می‌کند.

چرا باید کتاب آموزش داده کاوی با RapidMiner را بخوانیم؟

کتاب آموزش داده‌کاوی با RapidMiner برای کسانی که می‌خواهند بین مفاهیم نظری داده‌کاوی و کار عملی با یک ابزار نرم‌افزاری پل بزنند، یک مسیر نسبتاً روشن ترسیم کرده است. متن از تعریف علم داده و داده‌کاوی شروع می‌کند و به‌جای توقف در سطح مفاهیم، خواننده را وارد محیط رپیدماینر می‌کند؛ جایی که همه‌چیز در قالب عملگر، فرایند و مخزن داده سازمان یافته است. مزیت اصلی اثر در این است که به‌جای تمرکز صرف بر الگوریتم‌ها، روی «کار با داده» در عمل تأکید کرده است: از ورود داده از منابع مختلف (فایل، پایگاه داده، سرویس‌ها) تا ذخیره‌سازی، فیلترکردن، پاکسازی، نرمال‌سازی، کاهش ابعاد و در نهایت مدل‌سازی و ارزیابی. کتاب آموزش داده‌کاوی با RapidMiner عملگرهای متعدد نرم‌افزار را به‌صورت طبقه‌بندی‌شده معرفی کرده است؛ به‌گونه‌ای که خواننده می‌تواند برای هر نیاز مشخص (مثلاً خواندن فایل اکسل، نوشتن CSV، اتصال به پایگاه داده، اجرای اعتبارسنجی متقابل یا نوشتن مدل در قالب PMML) عملگر متناظر را پیدا کند و با ورودی‌ها، خروجی‌ها و مولفه‌های تنظیمی آن آشنا شود. این ساختار به‌ویژه برای کسانی که در محیط‌های تحلیلی گرافیکی کار می‌کنند و ترجیح می‌دهند به‌جای کدنویسی مستقیم، زنجیره‌ای از عملگرها را کنار هم بچینند، مفید است. از سوی دیگر، کتاب به مراحل فرایند داده‌کاوی و نقش پررنگ پیش‌پردازش داده توجه ویژه‌ای نشان داده است. توضیح مشکلات کیفیت داده (نویز، مقادیر مفقود، داده‌های تکراری) و ابزارهای مقابله با آن‌ها در کنار معرفی عملگرهای متناظر در رپیدماینر، به خواننده کمک می‌کند تا درک کند که چرا بخش عمده‌ی زمان پروژه صرف آماده‌سازی داده می‌شود. همچنین معرفی تکنیک‌های مختلف داده‌کاوی (قواعد انجمنی، طبقه‌بندی، خوشه‌بندی، رگرسیون، تحلیل توالی، شبکه‌های عصبی) در کنار عملگرهای مدل‌سازی و اعتبارسنجی، تصویری نسبتاً کامل از زنجیره‌ی «از داده تا مدل» ارائه کرده است. برای کسانی که با مفاهیم داده‌کاوی آشنا هستند اما در استفاده از رپیدماینر تازه‌کار محسوب می‌شوند، این کتاب می‌تواند نقش یک راهنمای مرجع برای شناخت عملگرها، نحوه‌ی اتصال آن‌ها، مدیریت مخزن داده و ساخت فرایندهای تودرتو را ایفا کند. همچنین برای دانشجویان و علاقه‌مندان به علم داده که می‌خواهند بدون ورود عمیق به برنامه‌نویسی، تجربه‌ی عملی کار با الگوریتم‌های مختلف را به‌دست آورند، متن نمونه‌های متعددی از فرایندهای واقعی (خواندن و نوشتن داده، ادغام مجموعه‌داده‌ها، اجرای مدل و ارزیابی آن) ارائه کرده است.

خواندن این کتاب را به چه کسانی پیشنهاد می‌کنیم؟

خواندن کتاب آموزش داده‌کاوی با RapidMiner به دانشجویان و علاقه‌مندان حوزه‌های علم داده، داده‌کاوی و یادگیری ماشین پیشنهاد می‌شود که می‌خواهند کار با نرم‌افزار رپیدماینر را به‌صورت ساختارمند یاد بگیرند. همچنین به پژوهشگران و متخصصان فناوری اطلاعات که با داده‌های حجیم سروکار دارند و به‌دنبال ابزاری گرافیکی برای پیاده‌سازی فرایندهای داده‌کاوی، پیش‌پردازش، مدل‌سازی و ارزیابی هستند توصیه می‌شود. برای کسانی که در رشته‌هایی مانند مهندسی کامپیوتر، فناوری اطلاعات، آمار و مدیریت داده فعالیت می‌کنند و نیاز دارند داده‌ها را از منابع مختلف وارد کرده، پاکسازی و تحلیل کنند، این کتاب می‌تواند به‌عنوان یک منبع آموزشی برای آشنایی با عملگرها و فرایندهای رپیدماینر مورد استفاده قرار گیرد.

نظری برای کتاب ثبت نشده است

حجم

۵٫۰ مگابایت

سال انتشار

۱۴۰۴

تعداد صفحه‌ها

۱۶۰ صفحه

حجم

۵٫۰ مگابایت

سال انتشار

۱۴۰۴

تعداد صفحه‌ها

۱۶۰ صفحه

قیمت:
۱۱۲,۰۰۰
تومان