بریدههایی از کتاب همه دروغ میگویند
۳٫۰
(۱۱)
شاید این حرف بزرگنمایی به نظر برسد، اما من باور دارم دادههای تازهای که در این عصر دیجیتال روزبهروز بیشتر در دسترس قرار میگیرند میتوانند درک ما از انسان را بهطور بیسابقهای متحول کنند. میکروسکوپ نشان داد یک قطره آب بسیار بیشتر از آن است که با چشم میبینیم. تلسکوپ نشان داد آسمان شب بسیار عظیمتر از آن است که با چشم میبینیم. حالا دادههای دیجیتال به ما نشان میدهند جامعهٔ انسانی بسیار بیشتر از آن است که فکرش را میکردیم. شاید این میکروسکوپ یا تلسکوپ عصر ما باشد ـ چیزی که اکتشافات مهم و حتی انقلابی را ممکن میکند.
f.r
سیلور متوجه شد تنها یک معیار در مناطق جمهوریخواه وجود دارد که رابطهٔ معناداری را با حمایت از ترامپ نشان میدهد و این همان متغیری بود که من چهار سال زودتر کشف کردم؛ مناطقی که بیشتر از ترامپ حمایت کردند، همانهاییاند که بیشتر از دیگران کلمهٔ «کاکاسیاه» را در گوگل جستوجو میکنند.
f.r
مردم زیاد دروغ میگویند، هم به خودشان و هم به دیگران.
f.r
در انتخابات سال ۲۰۱۶ بین ترامپ و هیلاری کلینتون، برخی افراد عبارت «ترامپ کلینتون انتخابات» و برخی دیگر «کلینتون ترامپ مناظره» را جستوجو میکردند. در واقع، ۱۲ درصد از جستوجوهای انجامشده با «ترامپ» شامل «کلینتون» هم میشد و بیش از یکچهارم جستوجوها برای «کلینتون»، «ترامپ» را هم در بر میگرفت.
ما متوجه شدیم که این جستوجوهای ظاهراً خنثی میتوانند نشان دهند فرد طرفدار کدام کاندیداست. چطور؟ باید به ترتیبِ آمدنِ نام کاندیداها توجه کرد. پژوهشهای ما نشان دادند که افراد با احتمال بیشتری ابتدا نام کاندیدای محبوب خود را در جستوجوهای مشترک میآورند.
در سه انتخابات پیشین، کاندیدایی که بیشتر از دیگران بهعنوان نفر اول در جستوجوها ظاهر میشد بیشترین رأی را هم به دست میآورد.
f.r
مثلاً اطلاعاتی وجود دارد که نشان میدهند دقیقاً چه افرادی رأی خواهند داد. بیش از نیمی از شهروندانی که رأی نمیدهند درست پیش از انتخابات در نظرسنجیها اعلام میکنند که قصد رأی دادن دارند و همین تخمین ما را دربارهٔ میزان مشارکت دچار اشتباه میکند؛ در حالی که جستوجوی عباراتی چون «چطور رأی دهیم» یا «کجا رأی دهیم» درست چند هفته پیش از انتخابات میتواند مشخص کند که کدام بخش از کشور بیشترین مشارکت انتخاباتی را خواهد داشت. شاید حتی اطلاعاتی به دست بیاید که نشان دهد افراد به چه کسی رأی خواهند داد.
f.r
هرچه بیشتر پژوهش میکردم بیشتر میفهمیدم که گوگل چه اطلاعات ارزشمندی به نسبتِ نظرسنجیها دارد و این اطلاعات در چه زمینههای متنوعی، از جمله انتخابات، کاربرد دارند.
f.r
در شب انتخابات، جستوجو و ثبتنام در سایت «جبههٔ طوفان»، متعلق به ملیگرایان سفیدپوست، به بالاترین میزان در کل ایالات متحده و ۱۰ برابر حالت عادی رسید. در برخی ایالات جستوجوی «رئیسجمهور کاکاسیاه» بسیار بیشتر از «اولین رئیسجمهور سیاهپوست» بود.
f.r
تبلیغات ادعا میکرد که گوگل ـ ترندز ابزاری بامزه و سرگرمکننده است؛ شاید به گروهی از دوستان کمک میکرد دربارهٔ محبوبیت ستارهها یا مدهایی که یکشبه طرفدار پیدا میکردند، با هم گپ بزنند. نسخههای اولیه شامل یک جملهٔ تبلیغاتی بامزه هم میشد که میگفت کسی با این دادهها «پایاننامهٔ دکتری خود را نمینویسد»؛ به همین دلیل، بلافاصله انگیزه گرفتم که پایاننامهٔ خودم را براساس آن بنویسم.
f.r
النبرگ که ریاضیدان دانشگاه ویسکانسین است، میخواست بداند چند نفر واقعاً کتابها را به انتها میرسانند. او راه هوشمندانهای برای بهکارگیری دادههای بزرگ پیدا کرد. آمازون گزارش میدهد که چند نفر جملات مختلف یک کتاب را نقلقول کردهاند. النبرگ متوجه شد که او میتواند نقلقولهای اوایل کتاب را با نقلقولهای اواخر کتاب مقایسه کند؛ بهاینترتیب، میشد بهطور کلی مشخص کرد که چه درصدی از خوانندگان تا پایان کتاب را میخوانند. با احتساب او، بیش از ۹۰ درصد خوانندگان توانستهاند رمان سهره از دونا تارت را تا انتها بخوانند؛ در مقابل فقط ۷ درصد به انتهای کتاب شاهکار تفکر سریع و آهسته از اقتصاددان برندهٔ جایزهٔ نوبل، دنیل کانهمان، و کمتر از ۳ درصد به انتهای سرمایه در قرن بیستویکم، کتاب معتبر و تحسینشدهٔ اقتصاددان دیگری به نام توماس پیکتی رسیدهاند. به عبارت دیگر، معمولاً کتاب اقتصاددانان نیمهکاره رها میشود.
f.r
حالا میدانم که نتیجهگیریهای بزرگ کارهای بسیار بیشتری میکنند. نتیجهگیریهای بزرگ باید دوپهلو باشند؛ باید هیجانآور، عمیق و سرزنده باشند. نتیجهگیریهای بزرگ باید پرمعنا، شیطنتآمیز و اندوهناک باشند. نتیجهگیریهای بزرگ باید بتوانند در یکی دو جمله چیزی بگویند که همهٔ حرفهای پیشین و آنچه را در راه است، جمع بزند. نتیجهگیریهای بزرگ این کار را بهگونهای منحصربهفرد و داستانی، با پیچش روایت میکنند. هر کتاب خوب باید بهنحوی هوشمندانه و جذاب به پایان برسد و خواننده را به فکر فرو ببرد.
f.r
امروز تقریباً برای هر موردی دادههای زیادی وجود دارد و منطقی است پی یافتن پاسخ برای پرسشهای مهم و بزرگی برویم که هسته و انسانیت ما را تعریف میکنند.
آیندهٔ تحلیل داده روشن است. من حدس میزنم که کینزیِ بعدی یک پژوهشگر دادهای باشد؛ فوکوی بعدی هم پژوهشگر دادهای خواهد بود؛ فروید بعدی و حتی مارکس بعدی هم پژوهشگران دادهای خواهند بود؛ شاید سالک بعدی هم یک پژوهشگر دادهای باشد.
f.r
اگر کمی مهارتهای آماری دارید، خلاقیت و کنجکاوی فراوانی هم دارید، وارد حوزهٔ تحلیل داده شوید.
f.r
لویت به ما گفت که ترکیب کنجکاوی، خلاقیت و داده میتواند درک ما از جهان را بهطور خارقالعادهای بهبود بخشد. داستانهایی در داده پنهان شدهاند که فقط باید بیان شوند و این مسئله بارها و بارها خودش را ثابت کرده است.
f.r
مشخص است که بسیاری از جستوجوهای ترسناک هرگز در واقعیت عملی نمیشوند.
f.r
گاهی قدرت دادههای بزرگ چنان زیاد است که انسان را میترساند و پرسشهای اخلاقی را پیش میکشد.
f.r
پیشبینی من بروز انقلابی بر پایهٔ دادههای بزرگ است؛ اما این مسئله دلیل نمیشود به هر قیمتی از دادههای بزرگ استفاده کنیم. بهعلاوه، دادههای بزرگ منکر دیگر روشهای کشف و بررسی انسانی نیست که در عرض چند هزاره برای درک بهتر جهان توسعه یافتهاند؛ در واقع، ایندو یکدیگر را تکمیل میکنند.
f.r
راهکار مناسب همیشه بررسی دادههای بزرگتر نیست؛ معمولاً به یک سُس ویژه نیاز است تا دادههای بزرگ بهتر کار کنند: منظور قضاوت انسانی و نظرسنجیهای کوچک یا همان دادههای کوچک است.
f.r
حتی اعتیاد اندک به اعداد هم میتواند مشکلساز باشد؛ مثلاً تأکید مدارس آمریکایی قرن بیستویکم بر امتحانگرفتن را در نظر بگیرید؛ معلمان هم براساس امتیاز دادهشده از سوی دانشآموزان قضاوت میشوند. با اینکه تلاش برای یافتن معیارهای بیطرفانه به هدف قضاوت دربارهٔ کلاس درس کاملاً بجاست، اتفاقات زیادی در کلاس درس رخ میدهند که نمیتوان با اعداد آنها را گزارش کرد. بهعلاوه، اینهمه آزمون سبب شدهاند معلمان فقط به هدف امتحان و حتی بدتر از گذشته تدریس کنند. برایان جیکوب و استیون لویت نیز با ارائهٔ مقالهای ثابت کردهاند که درصد اندکی از معلمان در این آزمونها تقلب میکنند.
مشکل اینجاست: چیزهایی که سنجشپذیرند، معمولاً چیزهای باارزشی نیستند. ما میتوانیم عملکرد دانشآموزان در امتحانات چهارگزینهای را آزمایش کنیم؛ اما نمیتوانیم تفکر انتقادی، کنجکاوی یا رشد فردی را اندازهگیری کنیم.
f.r
اعداد میتوانند اعتیادآور باشند. ممکن است ما دچار وسواس اعداد شویم و مسائل مهمتر را از یاد ببریم
f.r
این آزمایشها نشان میدهند دادههای بزرگ قدرت آن را دارند که به جای حدس و گمان، خِرد جمعی و همبستگیهای مبهم، از علت و معلول واقعی بهره ببرند.
f.r
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
قیمت:
۶۵,۰۰۰
تومان