نوشته قبلی نوشته بعدی نحوه کشف داستانهای قدرتمند داده با پایتون

نحوه کشف داستانهای قدرتمند داده با پایتون

نحوه کشف داستانهای قدرتمند داده با پایتون منتشر شده در آوریل 3, 2020ارسال دیدگاه

علاقه مند به حوزه Seo & Sem

بسیاری از داستانهای عاطفی و قدرتمند وجود دارد که در قسمتهای داده ها پنهان شده اند و فقط منتظرند تا پیدا شوند.

هنگامی که این داستان ها روایت می شوند ، آنها می توانند مشاغل ، مشاغل و گروه های مختلف مردم را تغییر دهند.

مثلاً گرداب را بگیرید. آنها یک مشکل اقتصادی و اجتماعی را کشف کردند که می توانند با استفاده از مارک تجاری خود از آن استفاده کنند.

تبلیغات
ادامه خواندن زیر

آنها داده ها را برای یافتن یک علت اجتماعی برای همسویی با آنها استخراج کردند و دریافتند که هر روز ۴۰۰۰ دانش آموز از مدرسه خارج می شوند زیرا آنها نمی توانند لباس خود را تمیز نگه دارند.

گرداب لباسشوئی و خشک کن را به کودکانه هایی که بیشترین خطر را در اختیار داشتند به مدارس اهدا کرد و حضور در آن را پیگیری کرد.

این مارک نشان می دهد که ۹۰٪ از این دانشجویان میزان حضور در کلاس را بهبود بخشیده اند و نزدیک به همان تعداد کودک مشارکت در کلاس را بهبود بخشیده اند. این کمپین به حدی مؤثر بود که جوایز متعددی را کسب کرد ، از جمله آنها می توان به Grand Cayen Grand Prix برای جمع آوری و تحقیقات داده خلاق اشاره کرد.

در حالی که مارک های بزرگ قادر به استخدام آژانس های خلاق برنده جوایزی نیستند که بتوانند برای بیشتر مشاغل کوچک کمپین هایی مانند این تولید کنند ، این مسئله غیرقابل استفاده است.

یک راه برای توجه به مرکز توجه ، یافتن داستانهای قدرتمندی است که به دلیل شکافی که بین بازاریابان و دانشمندان داده وجود دارد ، هنوز کشف نشده اند.

تبلیغات
ادامه خواندن زیر

من یک چارچوب ساده برای انجام این کار را معرفی کردم که حول آن است که از تجسم های رایج در حال حاضر استفاده مجدد باشد. امکان تغییر نام مجدد وجود دارد زیرا بازاریابان و توسعه دهندگان در سیلوها فعالیت می کنند.

به عنوان یک بازاریاب ، وقتی یک پروژه داده را به یک توسعه دهنده واگذار می کنید ، اولین کاری که انجام می دهند حذف زمینه است.

وظیفه توسعه دهنده تعمیم است. اما ، هنگامی که نتایج آنها را برگردانید ، باید زمینه را به آن اضافه کنید تا بتوانید شخصی سازی کنید.

تبلیغات
ادامه خواندن زیر

بدون داشتن زمینه کاربر ، توسعه دهنده قادر به پرسیدن سوالات مناسب نیست که می تواند منجر به ایجاد روابط عاطفی قوی شود.

در این مقاله ، قصد دارم شما را بیش از یک مثال به شما نشان دهم تا به شما نشان دهم که چگونه می توانید با نمایش piggybacking در مورد محبوب ، به تجسم قدرتمند و داستانهای داده ای دست پیدا کنید.

در اینجا برنامه عمل ما است.

  • ما قصد داریم تا تجسم اطلاعات محبوب را از داده های Subreddit Beautiful بازسازی کنیم.
  • ما داده ها را از صفحات وب عمومی (از جمله برخی از نمودارهای متحرک) جمع آوری خواهیم کرد.
  • ما با پرسیدن سؤالات متفاوتی نسبت به نویسنده اصلی ، تجسم را تغییر خواهیم داد.

تجسم مجدد ما

تبلیغات
ادامه خواندن زیر

این همان چیزی است که تجسم مجدد ما به نظر می رسد. این بهترین راهپیمایی های دیزنی را نشان می دهد که در گروه های سنی مختلف چقدر سرگرم کننده هستند.

این اصلی است که در Reddit به اشتراک گذاشته شده است . این بهترین راهپیمایی های دیزنی را نشان می دهد که در مقایسه با مدت زمان ماندگاری آنها و مدت زمان انتظار شما در صف انتظار است.

تبلیغات
ادامه خواندن زیر

تجسم مجدد ما

اولین قدم ما بازسازی تجسم اصلی به اشتراک گذاشته شده در subreddit است. دانشمند داده ها منابع داده ای را که او استفاده کرده است به اشتراک گذاشت ، اما نه کد.

پیشنهاد ویژه  5 Things You Should Know Before Buying SEO Software

این یک فرصت عالی برای یادگیری چگونگی ضبط داده ها و تجسم آن در پایتون به ما می دهد.

من به طور معمول چند قطعه کد را به اشتراک می گذارم ، اما می توانید تمام کد را در این نوت بوک Google Colab پیدا کنید.

تبلیغات
ادامه خواندن زیر

استخراج داده های منبع ما

تجسم اصلی شامل دو مجموعه داده است ، یکی با مدت زمان سواری و دیگری با میانگین زمان انتظار آنها.

بیایید ابتدا طول دوره های سواری را از این صفحه https://touringplans.com/disneyland/attractions/duration جمع آوری کنیم.

ما قصد داریم این مراحل را برای استخراج مدت زمان سواری انجام دهیم:

  1. از Google Chrome برای انتخاب یک انتخابگر عنصر HTML DOM با مدت زمان استفاده از سوار استفاده کنید.
  2. برای استخراج عناصر از صفحه منبع از درخواست-html استفاده کنید.
  3. از عبارات منظم ساده برای شماره های مدت استفاده کنید.

تبلیغات
ادامه خواندن زیر

در مرحله بعد ، باید میانگین زمان انتظار از این صفحه https://touringplans.com/disneyland/wait-times را جمع آوری کنیم.

این استخراج چالش برانگیزتر است زیرا داده های مورد نظر ما در نمودارهای متحرک قرار دارند.

ما می خواهیم این مراحل را برای استخراج میانگین زمان انتظار انجام دهیم:

  1. برای استخراج قطعات JavaScript از صفحه منبع از درخواست-html استفاده کنید.
  2. برای استخراج سطرهای داده از کد JavaScript و همچنین نام سوار / عنوان نمودار ، از عبارات منظم استفاده کنید.
  3. از یک الگوی Jinja2 برای تداخل یک عملکرد JavaScript که مقادیر استخراج شده در مرحله ۲ را برمی گرداند ، استفاده کنید.
  4. از Py_mini_racer برای اجرای عملکرد جاوا اسکریپت سفارشی و گرفتن داده ها با فرمت Python استفاده کنید.
تبلیغات
ادامه خواندن زیر

برای تبدیل داده های جاوا اسکریپت تعبیه شده در نمودارها به پایتون ، قصد داریم یک ترفند هوشمندانه را انجام دهیم.

ما می خواهیم توابع جاوا اسکریپت را با استفاده از قطعاتی از کدی که می خواهیم ضمیمه کنیم ، قرار دهیم.

ما از تعیین کننده ها استفاده خواهیم کرد تا مشخص کنیم کدام قطعات را استخراج می کنیم و از یک الگو Jinja2 استفاده می کنیم تا آنها را با هم در یک عملکرد JavaScript که به درستی اجرا می شود ، کار کنیم. این تابع یک فرهنگ لغت را با مدت زمان سواری ما برمی گرداند.

ما چنین عملکردهایی را با استفاده از یک کتابخانه مبهم به نام Py_mini_racer انجام خواهیم داد . آن کتابخانه کد JavaScript را از Python اجرا می کند و اشیاء پایتون را که می توانیم از آنها استفاده کنیم ، بازمی گرداند.

من سعی کردم از موتور PyV8 از گوگل استفاده کنم ، اما نتوانستم آن را عملی کنم. به نظر می رسد این پروژه از بین رفته است.

تبلیغات
ادامه خواندن زیر

اکنون ، دو مجموعه داده مورد نیاز برای تهیه نمودار خود را در اختیار داریم ، اما ابتدا پردازشی وجود دارد که باید انجام دهیم.

پردازش داده منبع ما

ما باید مجموعه داده هایی را که جمع کردیم ترکیب کنیم ، آنها را تمیز کنیم ، میانگین را محاسبه کنیم و غیره.

ما در حال انجام این مراحل هستیم:

  1. مجموعه داده های استخراج شده را به دو دیکشنری پایتون تقسیم کنید. یکی با نشانگرهای زمانی و دیگری با زمان انتظار در هر سواری.
  2. برای نگه داشتن همین تعداد ردیف داده در هر سوار ، فیلتر با کمتر از ۶۴ نقطه داده حرکت می کند.
  3. میانگین تعداد انتظار در هر بار را محاسبه کنید.
  4. میانگین زمان انتظار برای هر بار سواری و مدت زمان سوار را در یک قاب داده ترکیب کنید.
  5. ردیف ها را با ستون های خالی از بین ببرید.
پیشنهاد ویژه  ویژگی های جستجوی جدید Google به ارتباط داشتن افراد با گزینه های بهداشت مجازی کمک می کند

این همان چیزی است که فریم داده نهایی به نظر می رسد.

تجسم داده های ما

ما تقریبا در خط پایان هستیم. در این مرحله ، ما می توانیم قسمت جالب را انجام دهیم! تجسم فریم داده ای که ایجاد کردیم.

تبلیغات
ادامه خواندن زیر

ما در حال انجام این مراحل هستیم:

  1. قاب داده های پاندا را به یک فرهنگ لغت ردیف گرا تبدیل کنید. محور X میانگین زمان انتظار است و محور Y نیز Ride Duration است. برچسب نام Ride است.
  2. از Plotly برای ایجاد یک طرح پراکندگی دارای برچسب استفاده کنید.

برای اینکه خوانایی بیشتری داشته باشید ، باید برچسب ها را به صورت دستی بکشید.

سرانجام تصویری داریم که از نزدیک شبیه اصلی است که در Reddit پیدا کردیم.

تبلیغات
ادامه خواندن زیر

در مرحله آخر ، ما یک تجسم اصلی ساخته شده از همان داده هایی را که برای این یکی جمع آوری کرده ایم ، تولید خواهیم کرد.

تغییر داده های ما

بازسازی تجسم اصلی کار جدی گرفت و ما چیز جدیدی تولید نمی کنیم. در این بخش نهایی به آن خواهیم پرداخت.

تجسم اصلی فاقد قلاب عاطفی بود. چه اتفاقی می افتد اگر سوار شدن برای من سرگرم کننده نباشد؟

ما یک مجموعه اطلاعات اضافی را به دست خواهیم آورد: رتبه بندی ها در هر سوار توسط گروه های سنی مختلف. این به ما کمک می کند تا بهترین راهپیمایی هایی که مدت زمان انتظار کمتری دارند را تجربه کنیم ، بلکه برای گروه سنی خاص سرگرم کننده تر است.

ما قصد داریم این مراحل را برای تغییر مجدد تجسم اصلی انجام دهیم:

  1. ما می خواهیم بدانیم که گروه های سنی بیشترین تفریح را در هر بار سواری خواهند داشت.
  2. میانگین امتیازات سواری را در هر گروه سنی از https://touringplans.com/disneyland/attractions دریافت خواهیم کرد.
  3. ما در هر گروه سواری و سنی "نمره لذت" را محاسبه می کنیم ، که تعداد دقایقی در هر دوچرخه سواری است که بر اساس میانگین دقایق زمان انتظار تقسیم می شود.
  4. ما از Plotly برای نمایش نمودار نوار با نتایج استفاده خواهیم کرد.
تبلیغات
ادامه خواندن زیر

این صفحه با داده های اضافی ما است.

ما درست مثل اینکه دوچرخه سواری را کشیدیم ، آنرا خرد می کنیم.

بیایید خلاقیت داده های اصلی را با استفاده از یک متریک جدید خلاصه کنیم: Score Enlargement . 🙂

ما آن را به عنوان میانگین مدت زمان انتظار تعریف می کنیم. هرچه تعداد این تعداد بزرگتر باشد ، باید سرگرم کننده تر باشد زیرا باید در خط کمتر صبر کنیم.

تبلیغات
ادامه خواندن زیر

این همان چیزی است که فریم داده به روز شده با متریک امتیاز جدید لذت بردن ما به نظر می رسد.

حال ، بیایید آن را تجسم کنیم.

سرانجام ، ما این تجسم زیبا و فوق العاده با ارزش را به دست می آوریم.

منابع و پروژه های جامعه

در ژانویه گذشته ، من ایمیلی را دریافت کردم که "صلیب جنگی پایتون" را شروع کرد. Braintree درخواست RankSense را برای یک حساب بازرگان رد کرده بود زیرا آنها SEO را از رده های پرخطر می دیدند.

تبلیغات
ادامه خواندن زیر

درست در کنار فروشندگان ثروتمند ، عروس سفارش دهید و برنامه های "سریع ثروتمند شوید!"

پیشنهاد ویژه  6 نکته برای ساخت یک ناوبری اصلی SEO + UX-Minded

ما سه هفته روی ادغام کار کرده بودیم. واقعاً احساس عصبانیت و خجالت کردم.

سال گذشته از وقت خود در دانش داده و انجمن هوش مصنوعی لذت می بردم. من چیزهای جالب زیادی یاد می گرفتم و تفریح می کردم.

من احتمالاً خیلی طولانی در فضای سئو بوده ام. متأسفانه ، نسل من اشتباه بزرگی مرتکب این شد که اجازه دهد حدس و گمانها و ترفندهای جادویی بر درک آنچه در مورد SEO وجود دارد ، حاکم باشند.

در نتیجه این ، بسیاری از مشاغل طعمه شارلاتان افتاده اند.

من این انتخاب را داشتم که از جامعه سئو خارج شوم یا سعی کنم نسل جدید را ترغیب به ایجاد تغییر کنم تا جامعه ما بتواند مکانی سرگرم کننده و افتخار باشد.

تبلیغات
ادامه خواندن زیر

من تصمیم گرفتم که بمانم ، اما می ترسیدم که تلاش برای تغییر وضعیت خودم با حداقل حضور اجتماعی غیرممکن باشم.

خوشبختانه من این فیلم قدرتمند را تماشا کردم ، این نوع مانیفست را نوشتم و سرم را گذاشتم تا هر ماه مقالات عملی پایتون را بنویسم.

من هیجان زده ام که می بینم در کمتر از شش ماه ، پایتون در همه جا در جامعه سئو قرار دارد و حرکت روز به روز در حال رشد است.

من واقعاً از جامعه خود و آینده درخشان پیش رو هیجان زده ام.

اکنون ، اجازه دهید من همچنان به پروژه های بسیار جذاب که هر ماه همچنان در حال چانه زدن هستیم ادامه دهم. بنابراین ، هیجان انگیز است برای دیدن تعداد بیشتری از مردم به باند پایتون پیوستند. 🐍 🔥

تایلر یک پروژه را برای تولید خودکار توضیحات متا با استفاده از یک جمع بندی متن رتبه بندی به اشتراک گذاشت.

تبلیغات
ادامه خواندن زیر

هوگو اولین فیلمنامه خود را که به صورت خودکار گزارشات SEMrush را صادر می کند به اشتراک گذاشت.

جفری در حال کار بر روی یک ابزار هوش مصنوعی برای شکستن بلاک نویسنده و پس زمینه پایتون با منبع باز است.

Charly روی مترجم URL و طبقه بندیگر کار می کند.

تبلیغات
ادامه خواندن زیر

منابع بیشتر:


اعتبار تصویر

تمام تصاویر گرفته شده توسط نویسنده ، اکتبر ۲۰۱۹
تصاویر درون پست: تهیه شده توسط نویسنده

منبع مقاله

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *