سرمایه گذاری متفاوت در سال نو 🍎🌱 ۳۵٪ تخفیف نوروزی ➕ حضور رایگان در مسترمایند نخبگان صنعت نرم‌افزار 💻✅
۰ ثانیه
۰ دقیقه
۰ ساعت
۲ دانشجوی سون‌لرن
کمک برای تفسیر بهتر
محسن موحد حل شده توسط محسن موحد
image-l2vdbt9j.png

سلام و خسته نباشید. خواستم ببینم تفسیری که از خط به خط دارم درست است یا نه. و همینطور چندجا را درست متوجه نشدم:
یک  متغیر میانگین (اختلاف داده‌ی اعمال شده با داده فیک) درست میکنیم. با n سطر و یک ستون.

با حلقه (پیمایش) میخواهیم پر میکنیم.

به تعداد n که میدهیم پیمایش و تکرار میکنیم. یک سوال نمی‌شود در رنج N حساب کرد بجای np.arange؟؟

در هر بار کار زیر انجام می‌شود:

داده‌های برچسب گذاری شده = که بصورت رندوم، به تعداد داده اصلی، عدد 0 و 1 تولید میکنه.

این خط برای تولید چه داده ای است؟ که در ادامه این خط، دو سطر تولید میشه، سطر اول 0 و 1‌های رندوم است و سطر بعد داده‌های (ستون دوم) واقعی فروش است. که بعد ترنزیشن میشه.

اینجا متغییر میانگین را در هر سطر اضافه میکنیم. اینجا را درست متوجه نشدم چرا آنهایی که یک است منهای صفر می‎شود؟

سلام،

تفسیرت از خطوط درسته،

سؤال اولت:

بله، میتونی از range(N) هم استفاده کنی. فرقش اینه که np.arange یک آرایه NumPy میسازه، ولی range یک شیء قابل پیمایش (iterable) معمولیه. در این موقعیت، هر دو جواب میده و فرقی ندارن، ولی چون داری با NumPy کار میکنی، np.arange هم‌خوانیه بیشتری داره.

 

سؤال دومت:
این خط برچسب‌های رندوم (0 و 1) برای داده‌ها تولید میکنه. مثلاً اگر یک آزمایش A/B Testing شبیه‌ سازی کنی، 0 میتونه گروه کنترل و 1 گروه آزمایش باشه. این برچسب‌ها بعداً با داده‌های واقعی (sales_t) ترکیب میشن تا اختلاف میانگین‌ها محاسبه بشه.

 

سؤال آخر:
منها کردن میانگین‌ها برای مقایسه تأثیر بین دو گروه (آزمایش و کنترل) انجام میشه.

این روش معمولاً در A/B Testing انجام میشه. درواقع داری اختلاف میانگین بین دو گروه (آزمایش و کنترل) رو حساب میکنی تا ببینی تأثیر برچسب 1 (مثلاً یک تغییر توی سایت) چقدر روی فروش تأثیر گذاشته. اگر میانگین گروه 1 بیشتر از گروه 0 باشه، یعنی تغییرت تأثیر مثبت داشته.

بهترین پاسخ
محسن موحد ۰۳ فروردین ۱۴۰۴، ۰۲:۲۵

ممنون از شما. ولی بصورت منطقی و تفسیر جواب سوال دوم رو متوجه نشدم. مجدد باید فیلم را ببینم. سوالی بود مجدد مطرح میکنم

 

محمدمهدی یوسفی ۰۳ فروردین ۱۴۰۴، ۱۰:۲۸