بریدههایی از کتاب همه دروغ میگویند
۳٫۲
(۱۲)
چه نشانههایی در هفتهها یا ماههای پیش از کشف سرطان در فرد مشاهده شده بود؟
نتایج خارقالعاده بود. جستوجوی مواردی چون کمردرد و زردی پوست بهعنوان نشانههای سرطان پانکراس شناسایی شدند. همچنین، مشخص شد که اگر فرد فقط «کمردرد» را جستوجو کند، به احتمال زیاد به سرطان پانکراس مبتلا نیست. بهطور مشابه، جستوجوی موارد مربوط به سوءهاضمه و دلدرد نیز بهعنوان نشانههای سرطان پانکراس اعلام شدند؛ گرچه جستوجوی سوءهاضمه بدون دلدرد نشان میداد که فرد احتمالاً سرطان پانکراس ندارد. پژوهشگران موفق شدند ۵ تا ۱۵ درصد از موارد را بدون خطا شناسایی کنند. شاید این رقم چندان بزرگ به نظر نرسد، اما اگر کسی سرطان پانکراس داشته باشد، حتی ۱۰ درصد احتمال اینکه شانس بیشتری برای درمان داشته باشد، هم بسیار زیاد است.
f.r
من متوجه شدهام که چون علوم دادهای تا این حد طبیعیاند، مطالعات دادههای بزرگ از سوی هر کس با هوش متوسط درکشدنی است. اگر مطالعهای را درک نکردید، احتمالاً مشکل از مطالعه است نه شما.
f.r
شما هم پژوهشگر دادهای هستید، مثلاً وقتی بچه بودید حواستان به این بود که وقتی گریه میکنید مادرتان بیشتر به شما توجه نشان میدهد؛ این همان علم دادهای است. وقتی بزرگ شدید متوجه شدید اگر زیادی غر بزنید، دیگران زیاد با شما نمیچرخند؛ این هم نوعی علم دادهای است. شما متوجه شدید اگر دیگران به شما توجه نکنند، غمگین و اندوهگین میشوید؛ وقتی اندوهگین هستید، جذابیت خود را از دست میدهید و وقتی جذاب نیستید دیگران حتی کمتر از قبل به شما نزدیک میشوند. همهٔ اینها فقط علوم دادهایاند و بس.
f.r
علوم دادهای اساساً مربوط به کشف الگوها و پیشبینی این است که چطور یک متغیر بر دیگری تأثیر میگذارد. همهٔ مردم در طول عمر خود این کار را میکنند.
f.r
افراد بسیاری از این مسئله نگرانند؛ آنها از اطلاعات میترسند و بهراحتی در جهان اعداد گیجوگم میشوند. آنها فکر میکنند درک عددیِ جهان باید به اقلیت نوابغ با نیمکرهٔ چپِ غالب سپرده شود، نه همه و به محض اینکه با اعداد روبهرو میشوند، آمادهاند بهسرعت صفحه را ورق بزنند، جلسه را پایان دهند یا حرف را عوض کنند.
اما من ۱۰ سال در حوزهٔ تحلیل داده کار کردهام و آنقدر خوششانس بودهام که با بسیاری از افراد برجسته در این زمینه همکاری داشته باشم. یکی از مهمترین درسهایی که در این مدت آموختم این بود که علوم دادهایِ خوب آنقدرها که مردم فکر میکنند، پیچیده نیست؛ در واقع، بهترین شکل علوم دادهای بسیار غریزی و حسی است.
f.r
مهمتر از همه اینکه اگر میخواهیم با کمک دادههای بزرگ اطلاعات بیشتری به دست بیاوریم، باید پرسشهای درستی مطرح کنیم. همانطور که نمیتوان تلسکوپ را تصادفاً به نقطهای در آسمان نشانه رفت و انتظار داشت پلوتو کشف شود، نمیتوان یک مشت داده را دانلود کرد و انتظار داشت اسرار ذات انسانی را افشا کنند. شما باید در جای درست دست به جستوجو بزنید.
f.r
برای درک مسائل مهم همیشه به اطلاعات زیاد نیاز نیست، بلکه باید اطلاعات درست را در اختیار داشت. یکی از دلایل ارزشمندیِ جستوجوهای گوگل نه حجم آنها، بلکه صداقتی است که افراد در آنها نشان میدهند
f.r
شاید فکر کنید مردم بیشتر هنگامی به جستوجوی لطیفه میپردازند که احساس افسردگی میکنند؛ بسیاری از متفکران بزرگ تاریخ هم ادعا کردهاند که ما از شوخطبعی برای فرار از درد و رنج بهره میبریم و سالهاست شوخطبعی را یکی از راههای سازگاری با سرخوردگی، درد و رنج و ناامیدیهای طبیعی زندگی میدانند. همانطور که چارلی چاپلین گفته است: «خنده دارو، درمان و [راه] رهایی از درد است.» اما جستوجوی لطیفه در روزهای دوشنبه از همیشه کمتر است؛ یعنی روزی که مردم گزارش دادهاند از همیشه غمگینترند. در روزهای ابری یا بارانی هم افزایشی مشاهده نشده است. حتی پس از وقوع تراژدیهای عظیم مانند انفجار دو بمبی که در ماراتن بوستون سال ۲۰۱۳ موجب مرگ دو نفر و آسیبدیدن صدها نفر شد، جستوجوی لطیفه از همیشه کمتر بود. در واقع، افراد وقتی پی لطیفه و شوخطبعی میروند که اوضاع زندگیشان بر وفق مراد باشد.
f.r
شاید فکر کنید استرس و اضطراب در شهرهای بزرگ با مردم تحصیلکرده بیشتر از همهجاست. شهرنشینهای عصبی به یک کلیشهٔ معروف تبدیل شدهاند؛ اما جستوجوهای گوگل نشان دادهاند که استرس (عباراتی چون «علائم اضطراب» یا «کمک برای رفع اضطراب») در مناطقی بیشتر است که سطح تحصیلات پایین و درآمد از حد متوسط کمتر است و درصد زیادی از جمعیت در مناطق روستایی زندگی میکنند. جستوجو دربارهٔ استرس در مناطق روستایی نیویورک بیشتر از خود شهر نیویورک است.
f.r
ادعای من این است که اثبات بعضی مسائل بدیهی که مدرکی برایشان نداریم، ارزشمند است. شکداشتن یک چیز است و اثبات چیز دیگری. اما اگر کار دادههای بزرگ این باشد که فقط تردیدهای ما را برطرف کنند، دیگر انقلابی نمیشوند. خوشبختانه دادههای بزرگ تواناییهای بسیار بیشتری دارند. دادهها بارها و بارها به من نشان دادهاند که جهان کاملاً خلاف آنچه انتظار میرود، عمل میکند. اجازه دهید چند مثال غافلگیرکننده برایتان بیاورم.
f.r
شاید این حرف بزرگنمایی به نظر برسد، اما من باور دارم دادههای تازهای که در این عصر دیجیتال روزبهروز بیشتر در دسترس قرار میگیرند میتوانند درک ما از انسان را بهطور بیسابقهای متحول کنند. میکروسکوپ نشان داد یک قطره آب بسیار بیشتر از آن است که با چشم میبینیم. تلسکوپ نشان داد آسمان شب بسیار عظیمتر از آن است که با چشم میبینیم. حالا دادههای دیجیتال به ما نشان میدهند جامعهٔ انسانی بسیار بیشتر از آن است که فکرش را میکردیم. شاید این میکروسکوپ یا تلسکوپ عصر ما باشد ـ چیزی که اکتشافات مهم و حتی انقلابی را ممکن میکند.
f.r
سیلور متوجه شد تنها یک معیار در مناطق جمهوریخواه وجود دارد که رابطهٔ معناداری را با حمایت از ترامپ نشان میدهد و این همان متغیری بود که من چهار سال زودتر کشف کردم؛ مناطقی که بیشتر از ترامپ حمایت کردند، همانهاییاند که بیشتر از دیگران کلمهٔ «کاکاسیاه» را در گوگل جستوجو میکنند.
f.r
مردم زیاد دروغ میگویند، هم به خودشان و هم به دیگران.
f.r
در انتخابات سال ۲۰۱۶ بین ترامپ و هیلاری کلینتون، برخی افراد عبارت «ترامپ کلینتون انتخابات» و برخی دیگر «کلینتون ترامپ مناظره» را جستوجو میکردند. در واقع، ۱۲ درصد از جستوجوهای انجامشده با «ترامپ» شامل «کلینتون» هم میشد و بیش از یکچهارم جستوجوها برای «کلینتون»، «ترامپ» را هم در بر میگرفت.
ما متوجه شدیم که این جستوجوهای ظاهراً خنثی میتوانند نشان دهند فرد طرفدار کدام کاندیداست. چطور؟ باید به ترتیبِ آمدنِ نام کاندیداها توجه کرد. پژوهشهای ما نشان دادند که افراد با احتمال بیشتری ابتدا نام کاندیدای محبوب خود را در جستوجوهای مشترک میآورند.
در سه انتخابات پیشین، کاندیدایی که بیشتر از دیگران بهعنوان نفر اول در جستوجوها ظاهر میشد بیشترین رأی را هم به دست میآورد.
f.r
مثلاً اطلاعاتی وجود دارد که نشان میدهند دقیقاً چه افرادی رأی خواهند داد. بیش از نیمی از شهروندانی که رأی نمیدهند درست پیش از انتخابات در نظرسنجیها اعلام میکنند که قصد رأی دادن دارند و همین تخمین ما را دربارهٔ میزان مشارکت دچار اشتباه میکند؛ در حالی که جستوجوی عباراتی چون «چطور رأی دهیم» یا «کجا رأی دهیم» درست چند هفته پیش از انتخابات میتواند مشخص کند که کدام بخش از کشور بیشترین مشارکت انتخاباتی را خواهد داشت. شاید حتی اطلاعاتی به دست بیاید که نشان دهد افراد به چه کسی رأی خواهند داد.
f.r
هرچه بیشتر پژوهش میکردم بیشتر میفهمیدم که گوگل چه اطلاعات ارزشمندی به نسبتِ نظرسنجیها دارد و این اطلاعات در چه زمینههای متنوعی، از جمله انتخابات، کاربرد دارند.
f.r
در شب انتخابات، جستوجو و ثبتنام در سایت «جبههٔ طوفان»، متعلق به ملیگرایان سفیدپوست، به بالاترین میزان در کل ایالات متحده و ۱۰ برابر حالت عادی رسید. در برخی ایالات جستوجوی «رئیسجمهور کاکاسیاه» بسیار بیشتر از «اولین رئیسجمهور سیاهپوست» بود.
f.r
تبلیغات ادعا میکرد که گوگل ـ ترندز ابزاری بامزه و سرگرمکننده است؛ شاید به گروهی از دوستان کمک میکرد دربارهٔ محبوبیت ستارهها یا مدهایی که یکشبه طرفدار پیدا میکردند، با هم گپ بزنند. نسخههای اولیه شامل یک جملهٔ تبلیغاتی بامزه هم میشد که میگفت کسی با این دادهها «پایاننامهٔ دکتری خود را نمینویسد»؛ به همین دلیل، بلافاصله انگیزه گرفتم که پایاننامهٔ خودم را براساس آن بنویسم.
f.r
النبرگ که ریاضیدان دانشگاه ویسکانسین است، میخواست بداند چند نفر واقعاً کتابها را به انتها میرسانند. او راه هوشمندانهای برای بهکارگیری دادههای بزرگ پیدا کرد. آمازون گزارش میدهد که چند نفر جملات مختلف یک کتاب را نقلقول کردهاند. النبرگ متوجه شد که او میتواند نقلقولهای اوایل کتاب را با نقلقولهای اواخر کتاب مقایسه کند؛ بهاینترتیب، میشد بهطور کلی مشخص کرد که چه درصدی از خوانندگان تا پایان کتاب را میخوانند. با احتساب او، بیش از ۹۰ درصد خوانندگان توانستهاند رمان سهره از دونا تارت را تا انتها بخوانند؛ در مقابل فقط ۷ درصد به انتهای کتاب شاهکار تفکر سریع و آهسته از اقتصاددان برندهٔ جایزهٔ نوبل، دنیل کانهمان، و کمتر از ۳ درصد به انتهای سرمایه در قرن بیستویکم، کتاب معتبر و تحسینشدهٔ اقتصاددان دیگری به نام توماس پیکتی رسیدهاند. به عبارت دیگر، معمولاً کتاب اقتصاددانان نیمهکاره رها میشود.
f.r
حالا میدانم که نتیجهگیریهای بزرگ کارهای بسیار بیشتری میکنند. نتیجهگیریهای بزرگ باید دوپهلو باشند؛ باید هیجانآور، عمیق و سرزنده باشند. نتیجهگیریهای بزرگ باید پرمعنا، شیطنتآمیز و اندوهناک باشند. نتیجهگیریهای بزرگ باید بتوانند در یکی دو جمله چیزی بگویند که همهٔ حرفهای پیشین و آنچه را در راه است، جمع بزند. نتیجهگیریهای بزرگ این کار را بهگونهای منحصربهفرد و داستانی، با پیچش روایت میکنند. هر کتاب خوب باید بهنحوی هوشمندانه و جذاب به پایان برسد و خواننده را به فکر فرو ببرد.
f.r
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
قیمت:
۶۵,۰۰۰
تومان