بریدههایی از کتاب همه دروغ میگویند
۳٫۰
(۱۱)
درواقع، من فکر میکنم دادههای بزرگ میتوانند توصیهٔ معروف «باطن زندگی خود را با ظاهر زندگی دیگران مقایسه نکنید» را به صورت قرن بیستویکمی آن ارتقا دهند. نسخهٔ دادههای بزرگ از این قرار است: «هیچگاه جستوجوهای گوگل خود را با پستهای دیگران در رسانههای اجتماعی مقایسه نکنید.»
f.r
وقتی کوچکتریم شاید معلم به ما بگوید اگر سؤال داریم باید دستمان را بالا ببریم و سؤال کنیم؛ چون اگر شما چیزی را نفهمیده باشید احتمال دارد بسیاری دیگر نیز متوجه آن نشده باشند. اگر شما هم مانند من باشید، احتمالاً این نصیحت معلم را پشت گوش انداخته، در سکوت و ترسان از اینکه دهان خود را باز کنید، سر جایتان میماندید. احتمالاً با خودتان فکر میکردید پرسشهایتان احمقانه است یا اینکه دیگران بهتر از شما میفهمند. دادههای انبوه و ناشناس گوگل میتوانند یک بار برای همیشه به ما ثابت کنند که حق با معلمان است. بسیاری از پرسشهای ساده و اساسی در ذهن دیگران نیز بیپاسخ ماندهاند.
f.r
در رسانههای اجتماعی یا نظرسنجیها ما انگیزهٔ کافی داریم برای اینکه حقیقت را نگوییم. در رسانههای اجتماعی بیشتر از نظرسنجیها انگیزه داریم که سعی کنیم خودمان را خوب جلوه دهیم؛ زیرا هویت اینترنتی ما ناشناس نیست. شما پیش چشم مخاطب قرار دارید و خود را به دوستان، اعضای خانواده، همکاران، آشنایان و غریبهها معرفی میکنید.
f.r
این روزها هر بار احساس میکنم افراد به مشکلاتی دچارند که از چشم کتابها دور مانده است، سراغ دادههای گوگل میروم. یکی از مزایای احتمالی این دادههای جدید و دانستن روش تفسیر آنها این است که به افراد دردمندی که از چشم مقامات دور میمانند، کمک میکنیم.
f.r
من دریافتم که برخی کودکان در گوگل جستوجوهای دردآور و حتی تراژیکی میکنند؛ جستوجوهایی مانند «مادرم من را کتک میزند» یا «پدرم من را کتک میزند.» این جستوجوها تصویری متفاوت و دردناک را از اتفاقات آن زمان نشان میدهد. در زمان رکود بزرگ این جستوجوها افزایش یافتند و شانهبهشانهٔ نرخ بیکاری بالا رفتند.
به نظر من، ماجرا از این قرار بود: در واقع، گزارش موارد کودکآزاری کاهش یافت، نه خود کودکآزاری.
f.r
بهطور خلاصه، اینترنت میتواند افرادی با دیدگاههای سیاسی مختلف را به یکدیگر نزدیک کند. شاید یک لیبرال متوسط هر روز صبح در کنار همسر و فرزندان لیبرال خود باشد، عصرها در کنار همکاران لیبرال خود باشد و در مسیر خانه برچسبهای لیبرالیسم ببیند و با دوستان لیبرال خود به کلاس یوگا برود، اما وقتی به خانه میآید و نوشتههای محافظهکارانه را در cnn.com میخواند یا لینک یکی از دوستان جمهوریخواهش در فیسبوک را دنبال میکند، این نزدیکترین تماس او با محافظهکاران در کل روز خواهد بود.
f.r
گروهی از پژوهشگران دادهای به نامهای ایتان باکشی، سولومون مسینگ و لادا آدامیک متوجه شدهاند که بخش چشمگیری از اطلاعاتی را که افراد از فیسبوک میگیرند، افرادی منتقل میکنند که دیدگاه متضادی با آنها دارند.
چطور چنین چیزی ممکن است؟ مگر دوستان ما جهتگیری سیاسی مشابهی ندارند؟ چرا، دارند؛ اما فعالیت در فیسبوک به یک دلیل عمده بیشتر از حالت واقعی به تنوع در بحثهای سیاسی منجر میشود. بهطور متوسط تعداد دوستان افراد در فیسبوک بیشتر از دنیای واقعی است. این روابطِ تضعیفشده که به لطف فیسبوک ممکن شدهاند، با احتمال بیشتری افرادی با دیدگاههای سیاسی متفاوت را در بر میگیرد.
به عبارت دیگر، فیسبوک ما را در معرض روابط اجتماعی تضعیفشده قرار میدهد؛ آشنایان دبیرستانی، نوهعمو یا دوستِ دوستی که خود او را خیلی خوب نمیشناسید. اینها افرادیاند که با آنها بولینگ بازی نمیکنید یا به پیکنیک نمیروید. شاید آنها را به مهمانی شام خود دعوت نکنید، اما در فیسبوک با آنها دوست میشوید. بهاینترتیب، لینکهای پستشدهٔ آنها مربوط به دیدگاههای متفاوت را میبینید.
f.r
معیار دوم که توضیح میدهد چرا اینترنت دچار دستهبندی نیست، این است که بسیاری از افراد با دیدگاههای سیاسی افراطی سراغ سایت مخالف میروند تا عصبانی شوند و بحث راه بیندازند. معتادان سیاست خود را به سایتهای موافق محدود نمیکنند. کسی که از دو سایت thinkprogress.org و moveon.org، دو سایت بهشدت لیبرال، بازدید میکند، بیشتر از یک کاربر معمولی احتمال دارد سراغ foxnews.com هم برود که سایتی بهشدت راستگراست. کسی که از rushlimbaugh.com و glennbeck.com، دو سایت بهشدت محافظهکار، دیدن میکند، بیشتر از یک کاربر معمولی سراغ nytimes.com میرود که لیبرالترین سایت دنیاست.
f.r
چیزهایی که به نظر ما مؤثرند میتوانند نتایجی کاملاً متفاوت با انتظار ما داشته باشند. گاهی ما به دادههای اینترنت نیاز داریم تا غریزهٔ خودموفقپنداریمان را اصلاح کنیم.
f.r
هر قدر شرایط غیرفردیتر باشد افراد نیز صداقت بیشتری نشان میدهند. برای دستیابی به پاسخهای صادقانه، نظرسنجیهای اینترنتی بسیار بهتر از نظرسنجیهای تلفنیاند و نظرسنجیهای تلفنی نیز از نظرسنجیهای فردی بهترند. اگر افراد تنها باشند و کسی کنارشان نباشد، با احتمال بیشتری حقیقت را میگویند.
اما دربارهٔ موضوعات خاص، هر روش نظرسنجی را که به کار گیریم باز هم با حجمی از گزارش اشتباه روبهرو خواهیم بود. در اینجا تورانگیو کلمهای را به کار میبرد که اقتصاددانان هم به آن علاقه دارند: «انگیزه.» مردم انگیزهای ندارند که به نظرسنجیها راست بگویند.
f.r
اگر کسی به خودش دروغ بگوید، در نظرسنجی هم این کار را تکرار خواهد کرد.
f.r
در سال ۱۹۵۰ یک مقالهٔ بسیار مهم منتشر شد که با شواهد قدرتمندی نشان میداد نظرسنجیها به این خطا دچارند. پژوهشگران از منابع رسمی اطلاعاتی را دربارهٔ ساکنان دِنوِر به دست آوردند؛ اینکه چنددرصد از آنها در انتخابات شرکت میکنند، چند نفر به خیریه کمک میکنند و چند نفر کارت کتابخانه دارند. آنها سپس از شهروندان نظرسنجی کردند تا ببینند این درصدها با یکدیگر همخوانی دارند یا نه. نتایج در آن زمان شوکهکننده بود. آن چیزی که شهروندان در نظرسنجی گزارش داده بودند با دادههای جمعآوریشدهٔ پژوهشگران تفاوت بسیار داشت. با اینکه کسی هویت خودش را فاش نمیکرد، بیشتر مردم دربارهٔ میزان مشارکت خود در انتخابات و کمک به خیریهها اغراق کرده بودند.
f.r
براساس عکسهای مربوط به فعالیتهای مختلف، Premise میتواند کمکم خروجی اقتصادی و تورم را تخمین بزند. در کشورهای درحالتوسعه صف طولانی پمپ بنزین یکی از شاخصهای اصلی است که از مشکلات اقتصادی خبر میدهد؛ نبود سیب یا کال بودن سیبها هم همینطورند. تصاویر زمینی Premise از چین سبب شد آنها تورم مربوط به خوراکی را در سال ۲۰۱۱ و کاهش تورم مربوط به خوراکی را در سال ۲۰۱۲ کشف کنند؛ آن هم مدتها پیش از اینکه دادههای رسمی در این زمینه منتشر شوند
f.r
به ادعای من، سرچ انقلابیترین نوع داده است و ظاهراً تصاویر نیز دادهاند.
درست مانند کلمات که روزگاری به کتاب و روزنامه در طبقات خاکگرفته محدود بودند، حالا تصاویر دیجیتالی نیز توانستهاند از بند آلبوم و جعبههای مقوایی خلاص شوند؛ اینها هم به بیت تبدیل شده و در ابر قرار گرفتهاند و درست مانند متن، اینها هم درسهای جالبی از تاریخ با خود دارند؛ برای مثال، چنانکه گفته شد، تغییر کلمات نشاندهندهٔ تغییر در نحوهٔ حرفزدن مردم است و تصاویر هم میتوانند تغییر در نحوهٔ ژستگرفتن انسانها را نشان دهند.
f.r
مهمتر از آن، من درمجموع به پستهای مردم در فیسبوک شک دارم و دلیل این مسئله را در فصل بعد توضیح میدهم؛ اما در کل دلیلش این است که ما عادت داریم در رسانههای اجتماعی دربارهٔ زندگی خود دروغ بگوییم.
اگر شما در کریسمس تنها باشید و احساس بیچارگی کنید، شکی نیست که دلتان نمیخواهد با پستگذاشتن دربارهٔ ناراحتی خود حال دوستان و آشنایانتان را هم بد کنید. من حدس میزنم خیلیها کریسمسهای غمانگیزی را تجربه میکنند و بااینحال دربارهٔ «زندگی فوقالعاده، عالی و شاد» خود در فیسبوک پست میگذارند. اینها میتوانند نرخ خوشحالی ناخالص آمریکا را تا حد زیادی بالا ببرند؛ اما اگر قرار است نرخ خوشحالی ناخالص را بهطور واقعی محاسبه کنیم، باید از منابعی جز فیسبوک استفاده کنیم.
f.r
درواقع زبان همیشه موضوعی جالبتوجه برای پژوهشگران اجتماعی بوده است؛ ولی مطالعهٔ زبان معمولاً نیازمند بررسی دقیق متون است و تبدیل حجم زیاد متن به داده همیشه ممکن نیست. اما اکنون با ظهور کامپیوتر و دنیای دیجیتال، کشف کلمات در حجم زیادی از اسناد، کار راحتی شده است؛ بنابراین، کلمه نیز یکی دیگر از موضوعات تازه در تحلیل دادههای بزرگ است. لینکهایی که گوگل به کار میبرد همگی از کلمه تشکیل شدهاند و جستوجوهای گوگلی که من مطالعه میکنم نیز از جنس کلمهاند. مهمترین ابزار بهکاررفته در این کتاب، کلمه است. اما زبان چنان برای انقلاب دادههای بزرگ مهم است که باید بخش ویژهای را به آن اختصاص دهیم. در واقع، استفاده از زبان چنان رایج شده است که حالا حوزهای به نام «کلمه بهعنوان داده» را به آن اختصاص دادهاند.
f.r
برای مثال والمارت به کمک آمار فروش در همهٔ شعب خود میتواند پیشبینی کند که تولید کدام محصول باید متوقف شود. پیش از طوفان فرانسیس که سال ۲۰۰۴ جنوبشرقی کشور را تخریب کرد، والمارت بهدرستی حدس زده بود که الگوی خرید مردم در شهری که در خطر طوفان است تغییر میکند. آنها دادههای فروش مربوط به طوفانهای پیشین را بررسی کردند تا بفهمند مردم به خرید چه چیزهایی علاقه نشان میدهند. میدانید پاسخ چه بود؟ کیک آمادهٔ توتفرنگی. در روزهای پیش از طوفان، فروش این محصول هفتبرابر حالت عادی میشود.
براساس همین تحلیلها والمارت چند کامیون کیک آمادهٔ توتفرنگی به اتوبان شمارهٔ ۹۵ فرستاد تا فروشگاههای موجود در مسیر طوفان را تجهیز کنند و این کیکها فروش فوقالعادهای را تجربه کردند.
f.r
در حوزهٔ پیشبینی همین کافی است که بدانید چه چیزی مؤثر است؛ دلیلش اهمیتی ندارد.
f.r
درس دوم این است که وقتی قصد پیشبینی دارید لازم نیست چندان نگران درستبودن مدل باشید. خود سیدر هم نمیدانست چرا بزرگبودن بطن چپ تا این اندازه در موفقیت اسبهای مسابقه مؤثر است و نمیتوانست تأثیر بزرگ بودن طحال در این موفقیت را توضیح دهد. شاید یک روز متخصصان قلب و عروق و خونشناسان اسب بتوانند این اسرار را رمزگشایی کنند؛ اما حالا این مسئله اهمیتی ندارد. کار سیدر پیشبینی است نه اینکه چنین نکاتی را توضیح دهد. در حوزهٔ پیشبینی همین کافی است که بدانید چه چیزی مؤثر است؛ دلیلش اهمیتی ندارد.
f.r
بهطور کلی، سیدر دریافته است که در مسابقات اسبدوانی هرچه بطن چپ بزرگتر، بهتر؛ اما بطن چپ به این بزرگی زمانی نشانهٔ بیماری است که دیگر اعضای داخلی کوچک باشند. در فرعون آمریکایی همهٔ اعضای داخلیِ مهم بزرگتر از حد معمولاند و بطن چپ او فوقالعاده بزرگ است. این دادهها نشان میدهند که در میان صدهزار یا حتی یکمیلیون اسب، شمارهٔ ۸۵ از همه برتر است.
f.r
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
حجم
۱٫۳ مگابایت
سال انتشار
۱۴۰۱
تعداد صفحهها
۲۴۸ صفحه
قیمت:
۶۵,۰۰۰
تومان