مدیر تیم داده و محصول Romain Lhote حدود 15 کارمند را رهبری می کند که مسئول توسعه داده ها، تجزیه و تحلیل رفتار کاربر، نظارت بر پایگاه مشترکین و پروژه های علم داده هستند تا محصول دیجیتال L'Équipe را توسعه دهند. در این مصاحبه عمیق، رومن تمام کارهایی را که L'Équipe در چند سال گذشته انجام داده است برای ایجاد پایه های مدیریت داده و راه پیش رو برای بهینه سازی مدیریت داده ها و فرآیندهای دموکراتیک کردن توضیح می دهد.
———————————————————————————————————————————
این تیم در چندین آمار…
- 2.5 میلیون بازدیدکنندگان منحصر به فرد در روز
- 1.5 میلیارد بازدید از صفحه در روز
- 80% بازدید از صفحه در دستگاه های تلفن همراه
- 300000 مشترکین
- 5 بار در روز، میانگین زمانی که کاربران در برنامه می گذرانند
———————————————————————————————————————————
آیا می توانید به ما بگویید که L'Équipe چگونه در داخل سازماندهی شده است؟
چهار واحد تجاری در بخش دیجیتال وجود دارد: تیم فروش، اکتساب و وفاداری. واحد رسانه های اجتماعی؛ بخش فنی و تیم محصول و داده که من در شش ماه گذشته مدیریت کردم. در سطح گروه، تیم داده دیگری متشکل از مهندسان داده وجود دارد که ماموریت آنها ساختاربندی مدل داده است تا اطمینان حاصل شود که جریان ها به درستی کار می کنند و داده ها در مکان مناسب ذخیره می شوند. تیم تحریریه هسته اصلی برند ما است و در هر دو نسخه چاپی و دیجیتال “منحصر به فرد” است، اما به فوتبال و ورزش های عمومی تقسیم می شود. ما روزانه با همه این افراد کار می کنیم تا خط مشی داده L'Équipe را توسعه دهیم. ما همچنین باید تیم های مدیریتی، تلویزیونی، مالی و ASO و غیره را در بر بگیریم.
چگونه برای اولین بار با اصل مدیریت داده آشنا شدید؟ مشکل اصلی در ابتدا که باعث شد به عنوان راه حل به مدیریت داده نگاه کنید چه بود؟
وقتی به L'Équipe ملحق شدم، با مدیریت داده آشنایی چندانی نداشتم، زیرا اساساً تجزیه و تحلیل وب انجام می دادم و از همه مسائل علم داده بسیار دور بودم. بنابراین من همه چیز را در اواخر بازی یاد گرفتم. در سال 2017، زمانی که تیم داده را به عهده گرفتم، می خواستم تجزیه و تحلیل وب را در مرکز اکوسیستم داده خود قرار دهم، زیرا در نشریه رسانه ای مانند L'Équipe، مسیرهای مرور و روند مصرف کاربران ما به نظر من است. با ارزش ترین دارایی های ما
از آن زمان متوجه شدم که بسیاری از تیمها خودشان «دادهها» را انجام میدهند و برای یک KPI معین میتوانیم حداقل چهار نتیجه متفاوت داشته باشیم. این وضعیت پایدار نبود. ضروری بود که داده ها با متمرکز کردن آنها در یک تیم قابل اعتمادتر شوند. بنابراین ما به سرعت به تعداد زیادی داشبورد که در داخل در گردش بودند پایان دادیم. همه داشبوردهای L'Équipe اکنون توسط بخش داده با پشتیبانی بخش فناوری اطلاعات برای ساختار داده ها توسعه یافته و برچسب گذاری شده اند.
مدیریت داده در سازمانی مانند L'Équipe دقیقاً برای چه کسی است؟
خیلی ساده، برای همه کارمندانی است که روزانه با آنها کار می کنیم. هدف از خط مشی حاکمیت داده این است که به همه کارکنان بفهماند که تیم داده در اختیار آنها است و همیشه می توانند تمام داده ها را – تا آنجا که ممکن است – در اختیار آنها قرار دهد و اینکه هر داده ای که از جای دیگر می آید ارزشی ندارد، نه اصالت اما اگر حاکمیت داده بر همه تیمهای دیجیتال از منظر بسیار عملیاتی تأثیر میگذارد، باید مدیریت را نیز شامل شود. دومی باید بداند که داده ها نمی توانند (و نباید) از چند نفر، بلکه از یک واحد باشند. این یک نکته اساسی برای موفقیت پروژه است.
چه زمانی پایه و اساس سیاست مدیریت داده در L'Équipe گذاشته شد؟ دلایل اجرای آن چه بود؟
قبل از ورود من، شروع مدیریت داده در سطح گروه بود، در زمانی که برندهای Les Echos و Le Parisien بخشی از گروه Amaury بودند. به طور کلی مدیریت داده های گروهی وجود داشت، اما ما همچنین در هر واحد تحلیلگران وب داشتیم که روی تجزیه و تحلیل ترافیک کار می کردند. پس از فروش دو شرکت رسانه ای، مجبور شدیم تیم های داده را سازماندهی مجدد کنیم. در واقع، در آن زمان ما دو تیم داده جداگانه در L'Équipe داشتیم، یکی برای تیم های خدمات مشتری و فروش و دیگری برای تجزیه و تحلیل وب. وقتی من مدیر داده شدم، این دو تیم را گرد هم آوردیم.
از همان ابتدا ارتباط ما با کارمندان بهتر شد و روانتر شد زیرا از شر بسیاری از تکراری ها خلاص شدیم. به عنوان مثال، ما در تجزیه و تحلیل های خود نتایج متفاوتی به دست آوردیم زیرا روش های محاسبه ما از تیمی به تیم دیگر متفاوت بود. همچنین چند قانون وجود داشت که به طور گسترده شناخته شده نبودند مانند:
- مجموع بازدیدها غیرممکن است
- بازدیدکنندگان وب در روز محاسبه می شوند
در نتیجه، ما مرتباً نتیجهگیریهای نادرستی دریافت میکردیم، با تمام پیامدهایی که این امر میتوانست بر تصمیمگیری داخلی و اجرای تجارت دیجیتال ما داشته باشد. مدیریت همچنین میخواست با ایجاد کمیتههایی برای همکاری تیمها و ایجاد نقشههای راه مشترک، چشماندازی برای دادههای گروهی – در تبلیغات، دادههای چاپی و دیجیتال – القا کند.
از منظر عملی، اولین اقدامات مدیریت داده شما چه بود؟
در دسترس قرار دادن دادهها برای افراد زیادی که ممکن است به نظر من یک عنصر کلیدی در ایجاد یک سیاست حاکمیت داده در یک سازمان است. بین سالهای 2017 و 2018، ما چندین داشبورد پویا را ایجاد و به تیمها تحویل دادیم، به ویژه در موارد زیر:
- این پایگاه مشترک دیجیتال جهانی به شما امکان میدهد اشتراکها را ببینید و در کل پایگاه مشترک ما در زمان واقعی بچرخید.
- اشتراک های مستقیم به شما امکان می دهد سهم مقالات منتشر شده در یک موضوع ورزشی، حجم اشتراک های ورزشی ایجاد شده و جزئیات اشتراک های تولید شده برای هر مقاله را تجسم کنید.
- این کل بازدیدهای صفحه، به ازای هر ورزش و داده های هر مقاله.
این اولین داشبوردها برای کارکنان تحریریه طراحی شدند تا تمام فعالیت های تحریریه را مدیریت کنند. بعداً داشبوردهای دقیقتری ایجاد کردیم که بیشتر جنبه تجاری داشتند: پایه مشترک، لغو و اشتراک، گروههای کاربر، نرخ ریزش و غیره.
علاوه بر این، متحد کردن همه تیم ها حول داده ها شامل رویه های ماهانه برای به اشتراک گذاشتن ارقام کلیدی، تجزیه و تحلیل آنها و تصمیم گیری در مورد محصول است.
آیا داشبوردهای تحلیلی را با همکاری تیم های تجاری طراحی می کنید؟ آیا خودشان می توانند آنها را ایجاد کنند؟
در ابتدا، زمانی که داده ها به اندازه امروز دموکراتیک نبود، کارمندان ما نیازهای اساسی داشتند. آنها ایده مبهمی داشتند، اما نمی دانستند که واقعاً چه کاری می توانند انجام دهند. بنابراین کار با هم نادر بود. امروز، ما بیشتر با آنها کار می کنیم، زیرا آنها می دانند که ما چگونه کار می کنیم، چه نوع داده هایی را ذخیره می کنیم و چه چیزهایی را می توانیم تجزیه و تحلیل کنیم. بنابراین بحث های ما سازنده تر از قبل است.
از سوی دیگر، کارمندان ما به دادههایی که از طریق داشبوردهای پویا با آنها به اشتراک میگذاریم، دسترسی ندارند. هدف از این کار متمرکز کردن همه چیز و قابل اعتمادتر کردن داده ها در قلب مرکز داده است. بنابراین شاید آنها در آینده به داده های بیشتری نیاز داشته باشند، اما در این مرحله ما هنوز در مرحله پذیرش داده ها و تبشیر هستیم.
پیاده سازی و کنترل طرح برچسب گذاری برای رویکرد مدیریت داده های کیفیت بسیار مهم است. چگونه این مرحله مهم را در L'Équipe سازماندهی می کنید؟
امروزه تیم های محصول به خوبی می دانند که باید به محض راه اندازی یک پروژه یا ایده ویژگی، تیم داده را در جریان و در جریان نگه دارند. هدف من این است که تیم داده را از مرحله طراحی درگیر کنم تا بتوانند در هنگام ایجاد رابط ها به KPI فکر کنند. در بخش عملیاتی، ما یک تجزیه کننده وب داریم که تقریباً به طور انحصاری روی نشانه گذاری کار می کند. به محض راهاندازی وبسایت یا برنامه تلفن همراه، آزمایشی را انجام میدهند تا بررسی کنند که هیچ رگرسیون یا عوارض جانبی در پلتفرمهای ما وجود ندارد.
این تست ها به صورت دستی انجام می شود زیرا تست های خودکاری که ما به خصوص در اپلیکیشن موبایل امتحان کردیم هرگز موفق نشدند. ربات ها نتوانستند سناریوهای خاصی را روی صفحه نمایش ما بازتولید کنند. و از آنجایی که 80 درصد از ترافیک ما در یک برنامه تلفن همراه است، تصمیم گرفتیم کیفیت برچسب گذاری خود را به صورت دستی بررسی کنیم. ما درک می کنیم که برچسب زدن دستی بسیار خسته کننده است، اما برای کار تحلیلی ما ضروری است. بدون برچسب گذاری قابل اعتماد و بدون جریان داده در مکان مناسب، ما نمی توانیم کاری انجام دهیم. طرح نشانه گذاری تضمین می کند که فرآیندهای تولید ما تا حد امکان قابل اعتماد هستند: تجزیه و تحلیل، امتیازدهی، شخصی سازی و مدیریت محتوا.
آیا کمیته یا ارگانی دارید که به اعتبار سنجی پروژه های داده اختصاص دارد؟
خیر، در حال حاضر هیچ راه حلی در سطح گروه وجود ندارد. ما شروع یک پروژه یا تاخیر آن را با رئیس بخش دیجیتال تایید می کنیم. هر پروژه داده باید اهداف ما را برآورده کند: ایجاد تعامل یا اشتراک.
چه منابعی را برای تکمیل پروژه خود بسیج کردید؟
ابتدا، ما روی یک ابزار و پلتفرم تجسم داده سرمایه گذاری کردیم. ما همچنین افراد زیادی را برای گسترش تیم داده استخدام کردیم. ما تیم خود را با یک فرد نشانهگذاری، کارشناسان زبان SQL، و پروفایلهای ترکیبی SQL و بازاریابی گسترش دادهایم که به ما امکان میدهد دادهها را به زبان بیاوریم. در نهایت، یک نفر روی علم داده کار می کند و به ما این امکان را می دهد که به سرعت در تعدادی از موضوعات به سرعت بالا برویم.
آیا سند یا منابع مرجعی دارید که تمام فرآیندهای داخلی را رسمیت می دهد؟
ما این پروژه را در دوران قرنطینه سال گذشته آغاز کردیم. تا به حال، ما هیچ سند کاربردی برای جریان داده های خود نداشتیم. حتی گاهی اوقات به آنها نام هایی می دادیم که برای افرادی که تازه وارد محصول شده اند بسیار غیرمعمول یا به اندازه کافی بی معنی بودند. به عنوان مثال، ما یک جریان به نام رویداد جریان داده داریم. اگر تازه وارد AT Internet هستید، چنین نامی برای شما بی معنی است.
در اواسط سال 2020، ما یک فرهنگ لغت فضای کاری مشترک Confluence ایجاد کردیم که به ما امکان می دهد هر یک از جریان های خود را با مشخص کردن طرح داده، ارائه دهنده خدمات درگیر، زمان دریافت، ایجاد یا عدم ایجاد جداول میانی مرتبط و تعریف، شناسایی و نمایش دهیم. فیلدهای همه مجموعه داده های ما و غیره این یک کار بزرگ است. ما هنوز تا اتمام آن فاصله داریم، اما زمان زیادی را صرف کار روی آن می کنیم.
چگونه از کیفیت داده های خود به صورت روزانه اطمینان حاصل می کنید؟
در سمت سایت، همانطور که قبلا توضیح دادم، فردی داریم که کیفیت اجرای طرح نشانه گذاری ما را تضمین می کند. ما همچنین افرادی را داریم که از قابلیت اطمینان جریان های داده ورودی در سمت پرس و جو بزرگ مراقبت می کنند. پاکسازی داده ها توسط DPO ما با مشورت تیم های داده، بازاریابی و فنی انجام می شود و شامل پاکسازی داده های نظارتی است. علاوه بر این، ما معیارهای نظارتی نیز برای شناسایی خطاهای احتمالی یا خرابی های سیستم داریم. برای این کار استفاده می کنیم یادگاری جدید در شبکه و Crashlytics در برنامه های موبایل؛ اما این ابزار بیشتر برای تیم های فنی است.
در این محیط، اهداف تیم داده چیست؟
اهداف تیم ما به سادگی با مدل کسب و کار ناشر، یعنی. ایجاد بازدیدهای بیشتر از صفحه، بنابراین تبلیغات نمایشی بیشتر و اشتراک بیشتر. تمام پروژه های داده ما باید با این هدف هماهنگ باشد. امروزه از داده ها برای ارائه مقاله مناسب به کاربر مناسب استفاده می شود، اما به طور خاص بر تولید تأثیر نمی گذارد. در واقع، گاهی اوقات میتوانیم علاقه یک کاربر به موضوعی را شناسایی کنیم (مثلاً اخیراً MMA یا فرمول 1) و این روند را مستقیماً در قالب توصیههایی با تیمهای تحریریه به اشتراک بگذاریم. اما داده ها خط تحریریه اتاق خبر را هدایت نمی کنند.
پروژه های آینده مدیریت داده چیست؟
در L'Équipe، من فکر می کنم که ما از منظر داده به اندازه کافی بالغ هستیم، اما هنوز کارهای زیادی برای ساختن ما در سطح مدیریت داده وجود دارد. ما باید فرآیندهای واقعی را تنظیم کنیم تا مدل داده خود را ایجاد کنیم تا جمع آوری داده ها قابل اطمینان تر شود. ما همچنین باید یک محیط توسعه و تولید برای داده ها راه اندازی کنیم، زیرا امروزه هر کسی می تواند یک جدول یا نما در اکوسیستم ما ایجاد کند. همچنین به زودی همه موضوعات داده های خود را که با سایر بخش ها به اشتراک گذاشته شده است (تبلیغات، تلویزیون، چاپ) در سطح گروهی برای انتقال از دیدگاه داده های ناشر به رویکرد داده های برند جهانی قرار خواهیم داد.