نمونهگیری دادهها در تجزیه و تحلیل گسترده است و یک روش استاندارد برای برخی از بازیگران اصلی است. مهم است که از خطرات بالقوه نمونه برداری و تأثیر مالی منفی آن بر سازمان خود آگاه باشید.
نمونه داده در تحلیل چیست؟
نمونهگیری داده، عمل تجزیه و تحلیل زیرمجموعهای از دادههای ترافیکی است که برای تخمین نتایج کلی استفاده میشود. بهجای جمعآوری همه دادهها، فقط به نمونه محدودی دسترسی دارید، به این معنی که هر تحلیلی که بعدا انجام میدهید، بر اساس الگوهای موجود حدس میزند.
هدف از نمونهگیری دادهها، سرعت بخشیدن به زمان گزارشدهی است و در عین حال قادر به کشف تمام اطلاعات معنیدار و ارزشمند در مجموعه دادههای بزرگتر است.
نمونه گیری داده ها چگونه کار می کند؟
روش های نمونه گیری داده ها به دو دسته نمونه گیری احتمالی و نمونه گیری غیراحتمالی تقسیم می شوند:
- نمونهگیری احتمالی زمانی است که نمونههای تصادفی از جمعیت بزرگتری با استفاده از روشهای آماری متنوع (شامل نمونهگیری طبقهای، سیستماتیک، چند مرحلهای و خوشهای) انتخاب میشوند. با انتخاب اعداد تصادفی که با نقاط (کاربران) در یک مجموعه داده مطابقت دارند، اطمینان حاصل می کنید که همه افراد در مجموعه شما شانس مساوی برای انتخاب شدن دارند. نمونه گیری احتمالی به شما این امکان را می دهد که نمونه ای جزئی از جامعه به دست آورید. می تواند برخی از خطاها و سوگیری های نمونه برداری را حذف کند و قابل اعتمادتر است.
- نمونه گیری غیر احتمالی زمانی است که نمونه ای از داده ها به طور خاص توسط یک تحلیلگر شناسایی می شود. این امر تصادفی سازی را حذف می کند و به این معنی است که نقاطی از جمعیت انتخاب نمی شوند. نمونه گیری غیر احتمالی به این معنی است که شما شانس کمتری برای ایجاد نمونه ای دارید که به طور دقیق نشان دهنده جمعیت بزرگتر باشد. با این حال، پیچیدگی آن بسیار کمتر از نمونهبرداری احتمالی و همچنین سریعتر و ارزانتر است.
نسخه رایگان گوگل آنالیتیکس از نمونهگیری احتمالی استفاده میکند و دادههای شما جمعآوری شده و بهصورت مجموعه دادههای تصادفی به شما تحویل داده میشود. این بدان معناست که گزارشهای استانداردی که ارائه میکنند، شامل گزارشهای مخاطب، کسب، رفتار و تبدیل، بر اساس دادههای نمونه است. هنگام ایجاد یک گزارش سفارشی، داده های GA نیز در نظر گرفته می شود. نمی توان مطمئن بود که آیا گزارش های شما کل ترافیک و هر روند قابل توجهی را نشان می دهد یا اینکه مجموعه انتخاب شده اطلاعات دقیقی به شما می دهد. و در پایین دست، فقدان دید مانع تصمیم گیری می شود و تأثیر مستقیمی بر عملکرد کسب و کار – به ویژه برای سازمان های بزرگتر دارد. به همین دلیل است که گوگل کاربران را تشویق می کند تا به پیشنهاد برتر خود ارتقا دهند.
محدودیت های نمونه داده چیست؟
1. نمونه های نمایندگی
در آمار، قاعده استاندارد این است که هنگام بررسی جمعیتی از داده های رفتاری، نمونه باید معرف باشد. اگر این نمونه را محدود کنید، ممکن است به دلیل دادههایی که قبلاً پیشبینی شدهاند، نتوانید الگوهای واقعی در حال ظهور را مشاهده کنید، و میتوانید فرصتهایی را که در غیر این صورت اگر تصویر کامل به شما داده میشد، از دست بدهید.
یک مثال: اگر سایت شما به طور متوسط 50 میلیون بازدید در ماه و 50000 بازدید در روز داشته باشد، نمونه ممکن است شما را به 10 میلیون بازدید در ماه و 10000 بازدید در روز یا کمتر محدود کند. این امر باعث میشود که نتوانید نمایش مناسبی از همه دادهها داشته باشید و هرچه وبسایت شما بیشتر رشد کند، گزارشهای شما نادرستتر میشوند.
2. سهمیه نمونه محدود
نمونه همچنین داده های تجمعی را در نظر نمی گیرد زیرا نمونه هر روز متفاوت است. این بدان معنی است که نتایج تجمعی برای ماه، سه ماهه یا سال نشان داده نمی شود. در اینجا چند نمونه عملی آورده شده است:
مثال 1: توقف جمع آوری داده ها پس از رسیدن به سهمیه نمونه شما
تصور کنید بخش تولید شما در روزهای چهارشنبه و جمعه ساعت 5 بعدازظهر بهروزرسانیهایی را منتشر میکند، از جمله پیشنهادات فلش. در روز چهارشنبه، اگر در ساعت 18:00 به سهمیه نمونه برداری خود برسید، به روز رسانی های شما فقط تا حدی در نظر گرفته می شود. در روز جمعه، اگر ساعت 16:00 به سهمیه خود برسید، بهروزرسانیهای شما به هیچ وجه محاسبه نخواهد شد، حتی اگر رفتار اینترنتی بازدیدکنندگان سایت شما در ساعت 17:00 با کسانی که در ساعت 16:00 از سایت شما بازدید میکنند تفاوت چشمگیری داشته باشد. PM
اگر خبرنامه فروش خود را صبح سه شنبه منتشر کنید، مقایسه نمونه سه شنبه (که در ساعت 11 صبح رسیده است) با (و اضافه کردن به) نمونه چهارشنبه یا جمعه غیرممکن خواهد بود. شما به سادگی نمی توانید بینش معناداری را بر اساس موارد زیر بدست آورید:
- سه جمعیت مختلف که خواسته های متفاوتی دارند.
- که با چیزهای کاملاً دیگری تحریک می شوند;
- و نشان دهنده سهم متفاوتی از مخاطبان در روز مرجع هستند.
این همچنین می تواند برای تعداد کل بازدیدهای تجمعی برای یک ماه مشخص اعمال شود. به عنوان مثال، اگر در ماه نوامبر فقط 10 میلیون بازدید از 20 میلیون و در دسامبر فقط 10 میلیون بازدید از 100 میلیون صرفه جویی کنید، 20 میلیون بازدید صرفه جویی شده مشخصاً معرف کل 110 میلیون نیست. همچنین میانگین تعداد بازدیدها امکان پذیر نیست.
مثال 2: استفاده از درصدی از داده های نمونه
حالا تصور کنید داستان شما 14 میلیون بازدید و 360000 بازدید را نشان می دهد. شما فقط می توانید 70 درصد از داده ها را جمع آوری کنید تا سهمیه نمونه برداری خود را برآورده کنید. این می تواند تأثیر قابل توجهی با تغییرات فصلی داشته باشد. به عنوان مثال، اگر ترافیک ماه دسامبر دو برابر هر ماه دیگری باشد، سهمیه 70 درصد خیلی زیاد است. با این کار این رقم به 35 درصد کاهش می یابد، به این معنی که پس از رسیدن به محدودیت 35 درصد، داده ها جمع آوری نمی شوند. از طرف دیگر، اگر بهمن ماه یک ماه کم چرب (نیم ماه عادی) باشد، نمونه برداری فایده ای ندارد زیرا مقدار واقعی کمتر از سهمیه است.
اهمیت مجموعه داده های جامع
راه حل تجزیه و تحلیل شما باید بتواند هر تعاملی که کاربر با پلتفرم های دیجیتال شما دارد را در هر زمان و همیشه جمع آوری و اندازه گیری کند. و در دورههای ترافیک سنگین که نیاز به تجزیه و تحلیل استراتژیک دارد (مانند فروش یا رویدادهای مهم)، حتی مهمتر این است که راهحل شما بتواند تمام دادهها را بدون از دست دادن یک ضربه ثبت کند.
فرض کنید شما یک تبلیغ مهم را اجرا می کنید و کمپین شما شامل اسپک های تلویزیونی برای هدایت ترافیک به وب سایت شما است. در چند دقیقه پس از پخش آگهی شما، سایت شما افزایش قابل توجهی در ترافیک دریافت می کند، اما سرور مجموعه راه حل تجزیه و تحلیل شما نمی تواند حجم ترافیک را مدیریت کند و به ناچار از کار می افتد. نه تنها دادههای زیادی را از دست میدهید، بلکه به نظر میرسد که این بخش بسیار مهم است، زیرا یک معدن طلا از اطلاعات است که نشان میدهد آیا تبلیغات تلویزیونی شما به نتایج دلخواه دست مییابد و چقدر خوب ROI ایجاد میکند. اکنون به دلیل داده های نمونه، دید ناقص و در نتیجه نادرستی از عملکرد کمپین خود دارید.
داده های شما باید به اندازه کافی کامل و غنی باشد تا بتواند به سوالات بسیار خاص از تمام بخش های مختلف شرکت شما پاسخ دهد، مانند:
- کمپین های مختلف برای یک مکان و ماه خاص چگونه عمل کردند؟
- در مورد محصولات خاص چطور؟
- چگونه فروش یک محصول خاص بین کاربران گوشی های هوشمند و کاربران دسکتاپ مقایسه می شود؟
اگر دادههای شما لایه خاصی از اطلاعات، مانند دادههای موقعیت جغرافیایی یا اطلاعات مربوط به دستگاه مورد استفاده را ندارند، بخش ارزشمندی از تصویر را از دست دادهاید.
برای جلوگیری از نمونه گیری داده ها از چه راه حل هایی می توانید استفاده کنید؟
استفاده از مجموعه داده های نمونه کوچک می تواند به طور قابل توجهی تصمیم گیری در سازمان شما را تضعیف کند. اگرچه دادههای نمونه میتوانند روندهای کلی را برجسته کنند، اما هرچه نمونه شما کوچکتر باشد، کمتر نماینده حقیقت است. این امر به ویژه در هنگام انجام تجزیه و تحلیل دقیق بر روی مجموعه داده های نمونه کوچک صادق است.
برای اینکه تصمیمات مبتنی بر داده شما واقعاً دقیق باشد، باید بر اساس داده هایی باشد که کامل، جامع و به اندازه کافی غنی باشند. بنابراین، ابزار تجزیه و تحلیل شما باید تمام داده های لازم را جمع آوری کند و همچنین پردازش و غنی سازی مناسبی را ارائه دهد که شما را قادر می سازد آن داده ها را به عمل تبدیل کنید. هنگامی که داده ها گم یا خراب می شوند، شما در معرض خطر تصمیم گیری استراتژیک بر اساس اطلاعات تحریف شده ای هستید که به طور کامل واقعیت را منعکس نمی کند.
AT Internet از هیچ داده نمونه ای استفاده نمی کند و به شما این امکان را می دهد تا با اطمینان خاطر که تصمیمات شما بر اساس اطلاعات کامل، قابل اعتماد و دقیق است، عمل کنید.
پنج معیار برای داده های جامع
- نمونه داده تهی: دادههای نمونه میتوانند روندهای کلی را برجسته کنند، اما هر چه نمونهها کوچکتر باشند، کمتر نماینده واقعیت هستند.
- روش های کنترل داده ها: به عنوان بخشی جدایی ناپذیر از مدیریت خوب داده ها، رویه های منظم (مثلاً آزمایش خودکار) به شما این امکان را می دهد که بررسی کنید که همه برچسب ها وجود دارند.
- ممیزی کامل: این باید به خصوص در صورت تغییر بسیار مهم سایت و/یا برنامه های کاربردی شما انجام شود.
- قراردادهای خدمات (SLA): ارائه دهنده تجزیه و تحلیل وب شما به طور قراردادی موظف است نرخ جمع آوری داده ها را نزدیک به 100٪ به شما تضمین کند.
- اولین اندازه گیری دامنه: شما ترافیک مسدود شده توسط مسدود کننده های تبلیغات یا ITP ها را با یک راه حل جمع آوری با استفاده از نام دامنه خود بازیابی می کنید.