بریدههایی از کتاب همه دروغ میگویند
۳٫۰
(۱۱)
سیدر میگوید: «شاید نژاد نشان دهد که اسب شانس کمی برای موفقیت دارد؛ ولی اگر قرار است موفق شود، نژاد چه اهمیتی دارد؟»
f.r
سپس، ۱۲ سال پیش، نخستین کشف بزرگ اتفاق افتاد. سیدر تصمیم گرفت اندازهٔ اندام داخلی اسب را بررسی کند و ازآنجاکه این کار با درنظرگرفتن تکنولوژی روز محال بود، دستگاه سونوگرافی متحرکِ خودش را ساخت. نتیجه خارقالعاده بود. او متوجه شد اندازهٔ قلب، بهویژه بطن چپ، موفقیت اسب را بسیار خوب پیشبینی میکند و تنها معیار مهم در این زمینه است. یکی دیگر از اندامهای ارزشمند در این زمینه طحال بود؛ اسبهایی که طحال کوچکی داشتند هیچ موفقیتی به دست نمیآوردند.
f.r
همهٔ کسانی که میخواهند با بهکارگیری اطلاعات جهان را بهتر درک کنند میتوانند به راه گوگل بروند. انقلاب دادههای بزرگ ربطی به جمعآوری اطلاعات زیاد ندارد، بلکه بر جمعآوری دادههای درست استوار است.
f.r
دیدگاه خود دربارهٔ معنای داده را تغییر دهیم. معمولاً ارزش دادههای بزرگ به اندازهٔ آنها برنمیگردد، بلکه ارزش آنها ناشی از کشف اطلاعات تازه برای مطالعه است؛ اطلاعاتی که تا پیش از این اصلاً جمعآوری نمیشدند.
f.r
هدف پژوهشگرِ داده این است که جهان را درک کند. وقتی نتایج غیرمنتظرهای کشف کردیم، میتوانیم از علوم دادهای بیشتر بهره ببریم و کشف کنیم چرا جهان آنطور که تصور میکردیم نیست
f.r
فرزندان خانوادههای مرفه معمولاً نامهای معمولی مثل کوین، کریس یا جان دارند. کودکانی که در خانوادههای فقیر رشد کردهاند معمولاً اسامی خاصی چون نوشون، اونیک و بریونشی دارند. کودکان آفریقایی ـ آمریکایی که در فقر به دنیا میآیند، دوبرابر بیشتر از دیگر کودکان اسمی میگیرند که در آن سال روی هیچ کودک دیگری گذاشته نشده است.
f.r
حتماً متوجه شدهاید که این پژوهش از چند منبع اطلاعاتی مختلف بهره میبرد که برخی بزرگ و برخی کوچک، برخی اینترنتی و برخی کاغذیاند. با اینکه منابع دادهای دیجیتال بسیار نو و هیجانانگیزند، یک پژوهشگر دادهای خوب هیچگاه از منابع سنتی و قدیمی رویگردان نیست. بهترین روش برای یافتن پاسخ درست این است که همهٔ دادههای ممکن را با هم ترکیب کنیم
f.r
وقتی به غریزهٔ خود تکیه میکنیم ممکن است از شرایط دراماتیکی تأثیر بگیریم که همیشه انسان را مجذوب و شیفتهٔ خود میکنند. ما اغلب چیزهایی را دست بالا میگیریم که خاطرهای را بهیادماندنی میکنند؛ برای مثال مردم در یک نظرسنجی اعلام کردند که گردباد بیشتر از آسم موجب مرگومیر میشود، در حالی که مرگومیر ناشی از آسم هفتاد برابر گردباد است. اما مرگ بر اثر آسم چندان خاص نیست ـ حتی در اخبار هم به آن اشاره نمیشود؛ در صورتی که مرگ بر اثر گردباد بسیار هیجانانگیز است.
f.r
من رابطهٔ میان جستوجوی گوگل دربارهٔ افسردگی را با معیارهای منطقهای مختلف ازجمله شرایط اقتصادی، سطح تحصیلات و میزان مشارکت در کلیسا مقایسه کردم. رابطهٔ آبوهوای زمستانی با افسردگی از همه قویتر بود. در طول زمستان جستوجوی واژهٔ «افسردگی» در نقاطی که آبوهوای گرمتری دارند (مانند هونولولو و هاوایی) ۴۰ درصد کمتر از مناطق سرد (مثل شیکاگو در ایلینوی) است. این رابطه چقدر شدید است؟ یک بررسی خوشبینانه دربارهٔ تأثیر داروهای ضدافسردگی نشان میدهد که حتی بهترین داروها هم تنها ۲۰ درصد در کاهش این بیماری مؤثرند. براساس آمار و ارقام گوگل، اسبابکشی از شیکاگو به هونولولو حداقل دوبرابر مؤثرتر از بهترین داروها برای درمان افسردگی زمستانی است.
f.r
گاهی دادههای کافی در اختیار غریزهٔ فردی ما نیست تا براساس آن نتیجهگیری کند. بعید است شما یا دوستان و خانوادهتان آنقدر بیماران مبتلا به سرطان پانکراس را دیده باشید که بتوانید میان سوءهاضمه و دلدرد با سوءهاضمهٔ صِرف تمایز قائل شوید. در واقع، هر قدر دادههای بزرگ رشد میکنند، پژوهشگران هم الگوهای ظریفتری را در ترتیب زمانی ظهورِ علائم دنبال میکنند که شاید از چشم پزشکان دور بماند.
بهعلاوه، با اینکه غرایز ما میتوانند عملکرد جهان را بهگونهای نسبتاً پذیرفتنی درک کنند، این درک معمولاً دقیق نیست. ما به داده نیاز داریم تا تصویر را دقیقتر کنیم؛ مثلاً تأثیر آبوهوا بر حسوحال فرد را در نظر بگیرید. احتمالاً حدس شما این است که افراد در روزهای سرد بیحوصلهترند تا در روزهای گرم. این درست است، اما شاید ندانید این تفاوت دمایی واقعاً چه تأثیری دارد.
f.r
چه نشانههایی در هفتهها یا ماههای پیش از کشف سرطان در فرد مشاهده شده بود؟
نتایج خارقالعاده بود. جستوجوی مواردی چون کمردرد و زردی پوست بهعنوان نشانههای سرطان پانکراس شناسایی شدند. همچنین، مشخص شد که اگر فرد فقط «کمردرد» را جستوجو کند، به احتمال زیاد به سرطان پانکراس مبتلا نیست. بهطور مشابه، جستوجوی موارد مربوط به سوءهاضمه و دلدرد نیز بهعنوان نشانههای سرطان پانکراس اعلام شدند؛ گرچه جستوجوی سوءهاضمه بدون دلدرد نشان میداد که فرد احتمالاً سرطان پانکراس ندارد. پژوهشگران موفق شدند ۵ تا ۱۵ درصد از موارد را بدون خطا شناسایی کنند. شاید این رقم چندان بزرگ به نظر نرسد، اما اگر کسی سرطان پانکراس داشته باشد، حتی ۱۰ درصد احتمال اینکه شانس بیشتری برای درمان داشته باشد، هم بسیار زیاد است.
f.r
من متوجه شدهام که چون علوم دادهای تا این حد طبیعیاند، مطالعات دادههای بزرگ از سوی هر کس با هوش متوسط درکشدنی است. اگر مطالعهای را درک نکردید، احتمالاً مشکل از مطالعه است نه شما.
f.r
شما هم پژوهشگر دادهای هستید، مثلاً وقتی بچه بودید حواستان به این بود که وقتی گریه میکنید مادرتان بیشتر به شما توجه نشان میدهد؛ این همان علم دادهای است. وقتی بزرگ شدید متوجه شدید اگر زیادی غر بزنید، دیگران زیاد با شما نمیچرخند؛ این هم نوعی علم دادهای است. شما متوجه شدید اگر دیگران به شما توجه نکنند، غمگین و اندوهگین میشوید؛ وقتی اندوهگین هستید، جذابیت خود را از دست میدهید و وقتی جذاب نیستید دیگران حتی کمتر از قبل به شما نزدیک میشوند. همهٔ اینها فقط علوم دادهایاند و بس.
f.r
علوم دادهای اساساً مربوط به کشف الگوها و پیشبینی این است که چطور یک متغیر بر دیگری تأثیر میگذارد. همهٔ مردم در طول عمر خود این کار را میکنند.
f.r
افراد بسیاری از این مسئله نگرانند؛ آنها از اطلاعات میترسند و بهراحتی در جهان اعداد گیجوگم میشوند. آنها فکر میکنند درک عددیِ جهان باید به اقلیت نوابغ با نیمکرهٔ چپِ غالب سپرده شود، نه همه و به محض اینکه با اعداد روبهرو میشوند، آمادهاند بهسرعت صفحه را ورق بزنند، جلسه را پایان دهند یا حرف را عوض کنند.
اما من ۱۰ سال در حوزهٔ تحلیل داده کار کردهام و آنقدر خوششانس بودهام که با بسیاری از افراد برجسته در این زمینه همکاری داشته باشم. یکی از مهمترین درسهایی که در این مدت آموختم این بود که علوم دادهایِ خوب آنقدرها که مردم فکر میکنند، پیچیده نیست؛ در واقع، بهترین شکل علوم دادهای بسیار غریزی و حسی است.
f.r
مهمتر از همه اینکه اگر میخواهیم با کمک دادههای بزرگ اطلاعات بیشتری به دست بیاوریم، باید پرسشهای درستی مطرح کنیم. همانطور که نمیتوان تلسکوپ را تصادفاً به نقطهای در آسمان نشانه رفت و انتظار داشت پلوتو کشف شود، نمیتوان یک مشت داده را دانلود کرد و انتظار داشت اسرار ذات انسانی را افشا کنند. شما باید در جای درست دست به جستوجو بزنید.
f.r
برای درک مسائل مهم همیشه به اطلاعات زیاد نیاز نیست، بلکه باید اطلاعات درست را در اختیار داشت. یکی از دلایل ارزشمندیِ جستوجوهای گوگل نه حجم آنها، بلکه صداقتی است که افراد در آنها نشان میدهند
f.r
شاید فکر کنید مردم بیشتر هنگامی به جستوجوی لطیفه میپردازند که احساس افسردگی میکنند؛ بسیاری از متفکران بزرگ تاریخ هم ادعا کردهاند که ما از شوخطبعی برای فرار از درد و رنج بهره میبریم و سالهاست شوخطبعی را یکی از راههای سازگاری با سرخوردگی، درد و رنج و ناامیدیهای طبیعی زندگی میدانند. همانطور که چارلی چاپلین گفته است: «خنده دارو، درمان و [راه] رهایی از درد است.» اما جستوجوی لطیفه در روزهای دوشنبه از همیشه کمتر است؛ یعنی روزی که مردم گزارش دادهاند از همیشه غمگینترند. در روزهای ابری یا بارانی هم افزایشی مشاهده نشده است. حتی پس از وقوع تراژدیهای عظیم مانند انفجار دو بمبی که در ماراتن بوستون سال ۲۰۱۳ موجب مرگ دو نفر و آسیبدیدن صدها نفر شد، جستوجوی لطیفه از همیشه کمتر بود. در واقع، افراد وقتی پی لطیفه و شوخطبعی میروند که اوضاع زندگیشان بر وفق مراد باشد.
f.r
شاید فکر کنید استرس و اضطراب در شهرهای بزرگ با مردم تحصیلکرده بیشتر از همهجاست. شهرنشینهای عصبی به یک کلیشهٔ معروف تبدیل شدهاند؛ اما جستوجوهای گوگل نشان دادهاند که استرس (عباراتی چون «علائم اضطراب» یا «کمک برای رفع اضطراب») در مناطقی بیشتر است که سطح تحصیلات پایین و درآمد از حد متوسط کمتر است و درصد زیادی از جمعیت در مناطق روستایی زندگی میکنند. جستوجو دربارهٔ استرس در مناطق روستایی نیویورک بیشتر از خود شهر نیویورک است.
f.r
ادعای من این است که اثبات بعضی مسائل بدیهی که مدرکی برایشان نداریم، ارزشمند است. شکداشتن یک چیز است و اثبات چیز دیگری. اما اگر کار دادههای بزرگ این باشد که فقط تردیدهای ما را برطرف کنند، دیگر انقلابی نمیشوند. خوشبختانه دادههای بزرگ تواناییهای بسیار بیشتری دارند. دادهها بارها و بارها به من نشان دادهاند که جهان کاملاً خلاف آنچه انتظار میرود، عمل میکند. اجازه دهید چند مثال غافلگیرکننده برایتان بیاورم.
f.r
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
قیمت:
۶۵,۰۰۰
تومان