
کتاب مبانی بینایی کامپیوتر
معرفی کتاب مبانی بینایی کامپیوتر
کتاب مبانی بینایی کامپیوتر نوشتهی مهدی سیفی پور اثری آموزشی در حوزهی پردازش تصویر و بینایی کامپیوتر است که موسسهی فرهنگی هنری دیباگران تهران آن را منتشر کرده است. نویسنده که سابقهی تدریس و پژوهش دانشگاهی در مهندسی کامپیوتر دارد، در این کتاب تلاش کرده است تصویری منسجم از مسیر حرکت از مفاهیم پایهی تصویر دیجیتال تا الگوریتمهای پیشرفتهی بینایی کامپیوتر ارائه کند. ساختار اثر از معرفی فناوری تصاویر قدیمی و سیستم بینایی انسان آغاز میشود و بهتدریج به مباحثی مانند تبدیل تصاویر آنالوگ به دیجیتال، انواع تصاویر باینری، خاکستری و رنگی، مدلهای رنگ، رزولوشن پیکسلی و مکانی و سپس کاربردهای پردازش تصویر در پزشکی، صنعت، نجوم، سیستمهای نظارتی و خودروهای هوشمند میرسد. در ادامه، کتاب وارد مباحث تخصصیتر مانند فیلترهای حوزهی تصویر، عملیات تقطیع، مورفولوژی، بافت، اپراتورهای مهم بینایی کامپیوتر، الگوریتمهای مبتنیبر یادگیری ماشین و شبکههای عصبی، روشهای فراابتکاری و ملزومات سختافزاری پیادهسازی میشود. در انتها نیز نمونهسؤالات امتحانی برای جمعبندی و سنجش آموختهها آمده است. نسخهی الکترونیکی این اثر را میتوانید از طاقچه خرید و دانلود کنید.
درباره کتاب مبانی بینایی کامپیوتر
کتاب مبانی بینایی کامپیوتر با تمرکز بر آموزش گامبهگام مفاهیم، از سطح پایهی تصویر دیجیتال شروع کرده است. در فصلهای آغازین، مهدی سیفی پور ابتدا فناوری تصاویر قدیمی را بر اساس تشبیه به عملکرد چشم و شبکیهی انسان توضیح داده است؛ از جعبهی تاریک و ثبت تصویر وارونه روی صفحهی حساس به نور تا تبدیل این منطق به دوربینهای امروزی. سپس فناوری تصاویر دیجیتال معرفی شده و مفاهیمی مانند پیکسل، رزولوشن، تفاوت تصاویر باینری، خاکستری و رنگی، و نقش مدلهای رنگی مختلف مثل RGB، CMYK، YUV، HSV و HSL تشریح شده است. نویسنده در همین بخش، تفاوت رزولوشن پیکسلی و رزولوشن مکانی را برجسته کرده است؛ یکی را ویژگی خود تصویر و دیگری را وابسته به کیفیت دوربین و سیستم تصویربرداری دانسته است. فصلهای بعدی کتاب به پردازش حوزهی زمان، مکان و فرکانس میپردازند و نشان میدهند که چگونه تبدیل فوریه و کار در حوزهی فرکانس میتواند محاسبات سنگین کانولوشن را سادهتر کند. در این میان، فرایند تبدیل سیگنالها و تصاویر آنالوگ به دیجیتال در سه گام پیشپردازش، نمونهبرداری و کوانتیزاسیون توضیح داده شده است. کتاب مبانی بینایی کامپیوتر در ادامه مرز بین پردازش تصویر و بینایی کامپیوتر را روشن کرده است؛ پردازش تصویر را بیشتر معطوف به بهبود و دستکاری تصویر و بینایی کامپیوتر را معطوف به درک و تفسیر محیط معرفی کرده است. فصلهای میانی کتاب به کاربردهای پردازش تصویر اختصاص دارد: حذف نویز، افزایش کانتراست، کاهش تارشدگی، تشخیص لبه، بازسازی تصاویر قدیمی، تشخیص ضایعههای مغزی و بیماریهای تنفسی، کنترل کیفیت در خطوط تولید، آنالیز تصاویر هوایی، تشخیص شرایط آبوهوایی و مخفیسازی داده، متن یا تصویر در تصویر. سپس فصل فیلترهای حوزهی تصویر با توضیح تفاوت تابع و فیلتر، مفهوم کرنل، کانولوشن دوبعدی و انواع فیلترهای پایینگذر و بالاگذر (میانگین، گوسین، سوبل، پرویت، کنی، میانه، ماکزیمم و مینیمم) ارائه شده است. در بخشهای پایانی، کتاب به عملیات پیشپردازش، استخراج ویژگی، تقطیع، مورفولوژی، بافت، اپراتورهای مهم (کانتور فعال، هاف، تطبیق الگو)، الگوریتمهای مبتنیبر یادگیری ماشین، شبکههای عصبی و یادگیری عمیق، روشهای فراابتکاری، تصمیمگیری و طبقهبندیکنندهها و در نهایت ملزومات سختافزاری و بسترهای پیادهسازی الگوریتمهای بینایی کامپیوتر میپردازد و با فصل نمونهسؤالات امتحانی جمعبندی میشود.
خلاصه کتاب مبانی بینایی کامپیوتر
کتاب مبانی بینایی کامپیوتر از سطح مفاهیم پایهی تصویر شروع میکند و بهتدریج به سمت ساختن یک درک کامل از زنجیرهی پردازش و تحلیل تصویر حرکت کرده است. ابتدا ماهیت تصویر در سیستم بینایی انسان و نقش چشم، شبکیه، عصب بینایی و مغز توضیح داده میشود تا روشن شود که در بدن انسان، چشم نقش دوربین و مغز نقش پردازنده را دارد. سپس فناوری تصاویر قدیمی بر اساس جعبهی تاریک و صفحهی حساس به نور تشریح شده و بعد به فناوری تصاویر دیجیتال و ساختار پیکسلی تصویر رسیده است. نویسنده سه نوع اصلی تصویر دیجیتال را معرفی کرده است: باینری (صفر و یک)، خاکستری (۰ تا ۲۵۵) و رنگی (سه بایت برای هر پیکسل در مدل RGB). در ادامه، مفهوم رزولوشن و تأثیر تعداد پیکسلها بر وضوح و حجم حافظه، و تفاوت رزولوشن پیکسلی و مکانی توضیح داده شده است. در گام بعد، کتاب به تبدیل سیگنالها و تصاویر آنالوگ به دیجیتال میپردازد: پیشپردازش برای کاهش نویز، نمونهبرداری در زمان یا مکان و کوانتیزاسیون دامنه. سپس پردازش حوزهی مکان، زمان و فرکانس معرفی شده است؛ پردازش مکانی برای کار روی یک تصویر ثابت، پردازش زمانی برای دنبالهی فریمها و ویدئو و پردازش فرکانسی برای کار روی طیف تصویر. نویسنده نشان داده است که چگونه کانولوشن در حوزهی مکان معادل ضرب در حوزهی فرکانس است و چرا بسیاری از فیلترها در عمل در حوزهی فرکانس تحلیل میشوند. بخش مهمی از کتاب به فیلترهای حوزهی تصویر اختصاص دارد: تعریف تابع و فیلتر، کرنلهای کانولوشنی و انتخابگر، نحوهی لغزش کرنل روی تصویر، محاسبهی مقدار پیکسل خروجی و نقش پدینگ. فیلترهای میانگین و گوسین بهعنوان فیلترهای پایینگذر برای تارکردن و حذف نویز، و فیلترهای سوبل، پرویت و کنی بهعنوان فیلترهای بالاگذر برای لبهیابی معرفی شدهاند. فیلترهای میانه، ماکزیمم و مینیمم نیز بهعنوان فیلترهای غیرخطی انتخابگر برای حذف نویز فلفلنمکی و کاربرد در شبکههای عصبی توضیح داده شدهاند. در فصلهای کاربردی، کتاب نشان میدهد که پردازش تصویر چگونه در بهسازی تصویر (افزایش کانتراست، کاهش تارشدگی، حذف نویز)، تشخیص ضایعههای مغزی و بیماریهای تنفسی از روی تصاویر MRI و رادیولوژی، کنترل کیفیت کاشی در خط تولید، آنالیز تصاویر هوایی برای تعیین مرز شهرها، تشخیص ناهمواریها و پیشبینی آبوهوا، و مخفیسازی متن، تصویر یا داده در تصویر بهکار میرود. سپس بینایی کامپیوتر بهعنوان شاخهای از هوش مصنوعی معرفی شده است که فراتر از بهبود تصویر، به درک محیط و تصمیمگیری میپردازد. الگوریتمهای بینایی کامپیوتر در کتاب در قالب زنجیرهای از پیشپردازش، استخراج ویژگی، تصمیمگیری و طبقهبندی توضیح داده شدهاند و کاربردهایی مانند خودروهای خودران، سیستمهای کمکراننده، آنالیز رویدادهای ورزشی، سیستمهای نظارتی، تشخیص چهره، ردیابی اشیاء، تشخیص پلاک، تشخیص خوابآلودگی راننده، سیستمهای پزشکی و رباتیک مطرح شده است. در بخشهای پایانی، نویسنده به الگوریتمهای مبتنیبر فیلتر، یادگیری ماشین، شبکههای عصبی و یادگیری عمیق، روشهای فراابتکاری و آماری، و همچنین ملزومات سختافزاری و بسترهای پیادهسازی الگوریتمهای بینایی کامپیوتر پرداخته و کتاب را با نمونهسؤالات امتحانی به پایان رسانده است.
چرا باید کتاب مبانی بینایی کامپیوتر را بخوانیم؟
کتاب مبانی بینایی کامپیوتر برای کسانی که میخواهند تصویری یکپارچه از مسیر «از پیکسل تا تصمیم» در سیستمهای بینایی بهدست آورند، یک نقشهی راه روشن ترسیم کرده است. این اثر از سطحی شروع میکند که در آن تفاوت تصویر باینری، خاکستری و رنگی، مدلهای رنگ و رزولوشن هنوز سؤال است و به سطحی میرسد که در آن خواننده میتواند دربارهی انتخاب نوع فیلتر، حوزهی پردازش (مکان یا فرکانس)، نوع تصویر (۲ بعدی، ۲.۵ بعدی، ۳ بعدی) و حتی بستر سختافزاری پیادهسازی الگوریتم تصمیم بگیرد. مزیت مهم این کتاب آن است که مفاهیم ریاضی و سیگنالمحور مانند کانولوشن، تبدیل فوریه، پاسخ ضربه، پاسخ فرکانسی و تفاوت فیلترهای FIR و IIR را مستقیماً به مثالهای تصویری و کرنلهای ملموس وصل کرده است؛ بنابراین خواننده فقط با فرمولها روبهرو نیست، بلکه میبیند هر رابطه در تصویر چه تغییری ایجاد میکند. ویژگی دیگر این کتاب، پیوند مداوم بین مباحث نظری و کاربردهای واقعی است. در همان فصولی که دربارهی فیلتر میانگین، گوسین، سوبل، پرویت و کنی صحبت شده، نمونههایی از حذف نویز فلفلنمکی، تیزکردن تصویر، لبهیابی چشم، تشخیص مردمک، کنترل کیفیت کاشی و آنالیز تصاویر هوایی آورده شده است. در بخشهای مربوط به پزشکی، مثالهایی از تشخیص ضایعههای مغزی و بیماریهای تنفسی با استفاده از تقارن تصویر و مقایسهی هیستوگرامها مطرح شده که نشان میدهد چگونه مفاهیم سادهی تصویری میتوانند در کنار روشهای پیشرفتهی یادگیری عمیق قرار بگیرند. همچنین کتاب به چالشهای عملی بینایی کامپیوتر مانند تغییر نور، تغییر پسزمینه، انسداد اشیاء، تغییر شکل ظاهری و کمبود دادهی آموزشی اشاره کرده است تا تصویر واقعبینانهای از پیادهسازی سیستمهای بینایی ارائه شود. وجود فصلهایی دربارهی نرمافزارها و زبانهای برنامهنویسی (متلب، لبویو، پایتون و کتابخانهها)، معرفی وبسایتهای معتبر، و در انتها نمونهسؤالات امتحانی، این اثر را به منبعی تبدیل کرده است که هم برای یادگیری مفهومی و هم برای آمادگی دروس دانشگاهی و پروژههای اولیهی تحقیقاتی قابل استفاده است.
خواندن این کتاب را به چه کسانی پیشنهاد میکنیم؟
مطالعهی کتاب مبانی بینایی کامپیوتر به دانشجویان مهندسی کامپیوتر، مهندسی برق و رشتههای نزدیک که دروس پردازش تصویر، بینایی کامپیوتر یا هوش مصنوعی را میگذرانند پیشنهاد میشود. همچنین به پژوهشگران و علاقهمندان فعال در حوزهی هوش مصنوعی، یادگیری ماشین، رباتیک، خودروهای هوشمند، سیستمهای پزشکی مبتنیبر تصویر، سیستمهای نظارتی و امنیتی و کسانی که میخواهند از سطح مفاهیم پایهی تصویر به سمت درک الگوریتمهای پیشرفتهی بینایی کامپیوتر حرکت کنند توصیه میشود.
حجم
۲۳٫۸ مگابایت
سال انتشار
۱۴۰۴
تعداد صفحهها
۱۸۰ صفحه
حجم
۲۳٫۸ مگابایت
سال انتشار
۱۴۰۴
تعداد صفحهها
۱۸۰ صفحه