آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون
آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون
در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون خواهیم پرداخت.
پیشنهاد ویژه : پکیج آموزش صفر تا صد پایتون
هر زمان هر سازمانی نظرسنجی انجام می دهد، آنها سعی می کنند هرچه بیشتر اطلاعات را از مشتری جمع کنند، با این ایده که این اطلاعات در یک زمان دیگر برای سازمان مفید باشد. برای حل مشکل فعلی، ما باید اطلاعاتی را که مستقیماً با مشکل ما مرتبط هستند، جمع آوری کنیم.
نمایش تمام زمینه ها
اکنون بیایید ببینیم که چگونه می توان فیلدهای داده ای را که برای ما مفید هستند، انتخاب کرد. عبارت زیر را در ویرایشگر کد اجرا کنید.
1 |
In [6]: print(list(df.columns)) |
خروجی زیر را مشاهده خواهید کرد –
1 2 3 4 |
['age', 'job', 'marital', 'education', 'default', 'housing', 'loan', 'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays', 'previous', 'poutcome', 'emp_var_rate', 'cons_price_idx', 'cons_conf_idx', 'euribor3m', 'nr_employed', 'y'] |
خروجی نام تمام ستون های پایگاه داده را نشان می دهد. ستون آخر “y” یک مقدار بولی است که نشان می دهد این مشتری سپرده مدت دار نزد بانک دارد یا خیر. مقادیر این قسمت یا “y” یا “n” است. می توانید شرح و هدف هر ستون را در پرونده bank-name.txt که به عنوان بخشی از داده بارگیری شده است ، بخوانید.
حذف زمینه های ناخواسته
با بررسی نام ستون ها ، خواهید فهمید که برخی از فیلدها هیچ اهمیتی برای مشکل موجود ندارند. به عنوان مثال، زمینه هایی مانند ماه ، روز_هفته ، کمپین و غیره هیچ فایده ای برای ما ندارد. ما این زمینه ها را از پایگاه داده خود حذف خواهیم کرد. برای رها کردن یک ستون، از دستور drop مانند شکل زیر استفاده می کنیم –
1 2 3 |
In [8]: #drop columns which are not needed. df.drop(df.columns[[0, 3, 7, 8, 9, 10, 11, 12, 13, 15, 16, 17, 18, 19]], axis = 1, inplace = True) |
این دستور می گوید که ستون شماره 0 ، 3 ، 7 ، 8 و غیره را رها کنید. برای اطمینان از اینکه فهرست به درستی انتخاب شده است ، از عبارت زیر استفاده کنید –
1 2 |
In [7]: df.columns[9] Out[7]: 'day_of_week' |
این نام ستون را برای فهرست داده شده چاپ می کند.
پس از رها کردن ستونهایی که لازم نیست، داده ها را با عبارت head بررسی کنید. خروجی صفحه در اینجا نشان داده شده است –
1 2 3 4 5 6 7 8 |
In [9]: df.head() Out[9]: job marital default housing loan poutcome y 0 blue-collar married unknown yes no nonexistent 0 1 technician married no no no nonexistent 0 2 management single no yes no success 1 3 services married no no no nonexistent 0 4 retired married no yes no success 1 |
اکنون، ما فقط زمینه هایی را داریم که احساس می کنیم برای تجزیه و تحلیل و پیش بینی داده های ما مهم هستند. اهمیت Data Scientist در این مرحله نمایان می شود. دانشمند داده ها باید ستون های مناسب را برای ساخت مدل انتخاب کند.
در درس بعدی، داده های خود را برای ساخت مدل آماده می کنیم.
لیست جلسات قبل آموزش رگرسیون لجستیک در پایتون
- آموزش رگرسیون لجستیک در پایتون
- معرفی رگرسیون لجستیک در پایتون
- آموزش مطالعه موردی رگرسیون لجستیک در پایتون
- آموزش راه اندازی یک پروژه رگرسیون لجستیک در پایتون
- آموزش دریافت داده ها رگرسیون لجستیک در پایتون
- آموزش تجدید ساختار داده ها رگرسیون لجستیک در پایتون
- آموزش آماده سازی داده ها رگرسیون لجستیک در پایتون
- آموزش تقسیم داده ها رگرسیون لجستیک در پایتون
- آموزش طبقه بندی کننده ساختمان رگرسیون لجستیک در پایتون
- آموزش تست رگرسیون لجستیک در پایتون
- محدودیت های رگرسیون لجستیک در پایتون
دیدگاه شما