آموزش اکوسیستم یادگیری ماشین با پایتون 

4 سال پیش
امتیاز دهید post

آموزش اکوسیستم یادگیری ماشین با پایتون 

 

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش اکوسیستم یادگیری ماشین با پایتون  خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش پایتون

مقدمه ای بر پایتون

پایتون یک زبان برنامه نویسی شی گرا محبوب است که دارای قابلیت های زبان برنامه نویسی سطح بالا است. قابلیت نحو و قابلیت حمل آسان آن باعث محبوبیت این روزها شده است. حقایق زیر مقدمه ای برای پایتون است –

  • پایتون توسط گیدو ون روسوم در Stichting Mathematisch Centrum در هلند ساخته شد.
  • این به عنوان جانشین زبان برنامه نویسی به نام ‘ABC’ نوشته شده است.
  • اولین نسخه آن در سال 1991 منتشر شد.
  • نام پایتون توسط گیدو ون روسوم از یک برنامه تلویزیونی به نام Monty Python’s Flying Circus انتخاب شد.
  • این یک زبان برنامه نویسی منبع باز است که به این معنی است که ما می توانیم آن را آزادانه بارگیری کرده و از آن برای توسعه برنامه ها استفاده کنیم. از سایت www.python.org بارگیری می شود.
  • زبان برنامه نویسی پایتون دارای هر دو ویژگی Java و C است. این کد دارای کد زیبا ‘C’ است و از طرف دیگر دارای کلاس ها و اشیایی مانند جاوا برای برنامه نویسی شی گرا است.
  • این یک زبان تفسیر شده است، به این معنی که کد منبع برنامه پایتون ابتدا به bytecode تبدیل شده و سپس توسط ماشین مجازی Python اجرا می شود.

نقاط قوت و ضعف پایتون

هر زبان برنامه نویسی دارای نقاط قوت و همچنین نقاط ضعفی است ، پایتون نیز همینطور است.

نقاط قوت

طبق مطالعات و بررسی ها، پایتون پنجمین زبان مهم و همچنین محبوب ترین زبان برای یادگیری ماشین و علم داده است. به دلیل نقاط قوت زیر است که پایتون دارد –

  • یادگیری و درک آن آسان است – نحو پایتون ساده تر است. از این رو ، یادگیری و درک زبان نسبتاً آسان است ، حتی برای مبتدیان نیز.
  • زبان چند منظوره – پایتون یک زبان برنامه نویسی چند منظوره است زیرا از برنامه نویسی ساختار یافته، برنامه نویسی شی گرا و همچنین برنامه نویسی کاربردی پشتیبانی می کند.
  • تعداد زیادی ماژول – پایتون دارای تعداد زیادی ماژول برای پوشش دادن هر جنبه از برنامه نویسی است. این ماژول ها به راحتی برای استفاده در دسترس هستند از این رو پایتون را به یک زبان قابل گسترش تبدیل می کنند.
  • پشتیبانی از جامعه متن باز – به عنوان زبان برنامه نویسی منبع باز، پایتون توسط یک جامعه توسعه دهنده بسیار بزرگ پشتیبانی می شود. به همین دلیل، اشکالات توسط انجمن پایتون به راحتی برطرف می شوند. این ویژگی پایتون را بسیار مقاوم و سازگار می کند.
  • مقیاس پذیری – پایتون یک زبان برنامه نویسی مقیاس پذیر است زیرا ساختار بهتری نسبت به اسکریپت های پوسته برای پشتیبانی از برنامه های بزرگ فراهم می کند.

نقاط ضعف

اگرچه پایتون یک زبان برنامه نویسی محبوب و قدرتمند است، اما ضعف سرعت اجرای پایین خود را دارد.

سرعت اجرای پایتون در مقایسه با زبانهای کامپایل شده کند است زیرا پایتون یک زبان تفسیر شده است. این می تواند زمینه اصلی بهبود جامعه Python باشد.

نصب پایتون

برای کار در پایتون، ابتدا باید آن را نصب کنیم. شما می توانید نصب پایتون را به هر دو روش زیر انجام دهید –

  • نصب پایتون به صورت جداگانه
  • با استفاده از توزیع پایتون از پیش بسته بندی شده – آناکوندا

بگذارید در مورد اینها به طور مفصل بحث کنیم.

نصب پایتون به صورت جداگانه

اگر می خواهید پایتون را روی رایانه خود نصب کنید ، پس باید فقط کد باینری مربوط به سیستم عامل خود را بارگیری کنید. توزیع پایتون برای سیستم عامل های ویندوز، لینوکس و مک در دسترس است.

  • در زیر خلاصه ای از نصب پایتون در سیستم عامل های فوق ذکر شده است –
  • در پلت فرم یونیکس و لینوکس
  • با کمک مراحل زیر، ما می توانیم پایتون را بر روی پلت فرم Unix و Linux نصب کنیم –
  • ابتدا به www.python.org/downloads/ بروید.
  • بعد روی لینک کلیک کنید تا کد منبع فشرده موجود برای Unix / Linux را بارگیری کنید.
  • اکنون فایل ها را دانلود و استخراج کنید.
  • در مرحله بعدی  اگر بخواهیم برخی گزینه ها را سفارشی کنیم ، می توانیم پرونده Modules / Setup را ویرایش کنیم.
  • بعد، دستور run ./configure script را بنویسید
  • make
  • make install

 

در سیستم عامل ویندوز

با کمک مراحل زیر، ما می توانیم پایتون را بر روی سیستم عامل ویندوز نصب کنیم –

  • ابتدا به www.python.org/downloads/ بروید.
  • بعد روی پیوند Windows installer فایل python-XYZ.msi کلیک کنید. در اینجا XYZ نسخه ای است که می خواهیم نصب کنیم.
  • اکنون  ما باید فایلی را که دانلود شده است، اجرا کنیم. این کار ما را به جادوگر نصب پایتون می برد که استفاده از آن آسان است. اکنون ، تنظیمات پیش فرض را بپذیرید و منتظر بمانید تا نصب به پایان برسد.

در سیستم عامل Macintosh

برای Mac OS X ، Homebrew ، نصب پکیج بسیار ساده و آسان برای نصب پایتون 3 توصیه می شود. در صورتی که Homebrew ندارید، می توانید با کمک دستور زیر آن را نصب کنید –

 

می توان آن را با دستور زیر به روز کرد –

 

اکنون، برای نصب Python3 بر روی سیستم خود، باید دستور زیر را اجرا کنیم –

 

استفاده از توزیع پایتون از پیش بسته بندی شده: آناکوندا

Anaconda یک مجموعه بسته بندی شده از پایتون است که دارای تمام کتابخانه هایی است که به طور گسترده در علم داده استفاده می شود. برای تنظیم محیط پایتون با استفاده از Anaconda می توانیم مراحل زیر را دنبال کنیم –

مرحله 1 – ابتدا ، ما باید بسته نصب مورد نیاز را از توزیع Anaconda دانلود کنیم. پیوند مربوط به همان سایت www.anaconda.com/distribution/ است. بنا به نیاز خود می توانید از سیستم عامل ویندوز ، مک و لینوکس انتخاب کنید.

مرحله 2 – بعد نسخه پایتون را که می خواهید روی دستگاه خود نصب کنید انتخاب کنید. آخرین نسخه پایتون 3.7 است. در اینجا گزینه های نصب کننده گرافیکی 64 بیتی و 32 بیتی را خواهید یافت.

مرحله 3 – پس از انتخاب نسخه سیستم عامل و پایتون، این برنامه نصب Anaconda را در رایانه شما دانلود می کند. اکنون ، روی پرونده دوبار کلیک کنید و نصب کننده بسته Anaconda را نصب می کند.

مرحله 4 – برای بررسی نصب یا عدم نصب آن ، یک خط فرمان باز کرده و Python را به صورت زیر تایپ کنید –

Python Distribution

 

چرا پایتون برای علم داده مناسب است؟

پایتون پنجمین زبان مهم و همچنین محبوب ترین زبان برای یادگیری ماشین و علوم داده است. در زیر ویژگی های پایتون وجود دارد که آن را به زبان برتر برای علوم داده انتخاب می کند –

مجموعه گسترده ای از بسته ها

پایتون دارای مجموعه ای گسترده و قدرتمند از بسته ها است که آماده استفاده در دامنه های مختلف است. این بسته همچنین دارای بسته هایی مانند numpy ،scipy ، pandas ، scikit-learn و غیره است که برای یادگیری ماشین و علم داده مورد نیاز است.

 

نمونه سازی آسان

یکی دیگر از ویژگی های مهم پایتون که آن را به انتخاب زبان برای علم داده تبدیل می کند ، نمونه سازی سریع و سریع آن است. این ویژگی برای توسعه الگوریتم جدید مفید است.

 

ویژگی همکاری

حوزه علم داده اساساً به همکاری خوبی نیاز دارد و پایتون ابزارهای مفیدی را فراهم می کند که این امر را فوق العاده می کند.

یک زبان برای بسیاری از دامنه ها

یک پروژه علوم داده معمولی شامل حوزه های مختلفی مانند استخراج داده ، دستکاری داده ها ، تجزیه و تحلیل داده ها ، استخراج ویژگی ها ، مدل سازی ، ارزیابی ، استقرار و به روزرسانی راه حل است. از آنجا که پایتون یک زبان چند منظوره است ، به دانشمند داده این امکان را می دهد تا همه این حوزه ها را از یک بستر مشترک بررسی کند.

اجزای اکوسیستم یادگیری ماشین پایتون

در این بخش، اجازه دهید در مورد برخی از کتابخانه های اصلی Data Science که اجزای اکوسیستم یادگیری ماشین پایتون را تشکیل می دهند بحث کنیم. این مولفه های مفید پایتون را به زبانی مهم برای Data Science تبدیل می کنند. اگرچه بسیاری از این اجزا وجود دارد ، اما اجازه دهید در اینجا برخی از اجزای مهم اکوسیستم پایتون را مورد بحث قرار دهیم –

 

نوت بوک ژوپیتر

نوت بوک های Jupyter اساساً یک محیط محاسباتی تعاملی را برای توسعه برنامه های علوم داده مبتنی بر پایتون فراهم می کند. آنها قبلاً به عنوان دفترهای ipython شناخته می شدند. موارد زیر برخی از ویژگی های نوت بوک های Jupyter است که آن را به یکی از بهترین اجزای اکوسیستم Python ML تبدیل کرده است –

  • نوت بوک های ژوپیتر می توانند مراحل تجزیه و تحلیل را با تنظیم مواردی مانند کد، تصاویر، متن، خروجی و غیره به صورت گام به گام مرحله به مرحله نشان دهند.
  • این به یک دانشمند داده کمک می کند تا ضمن توسعه فرآیند تجزیه و تحلیل، فرآیند فکر را مستند کند.
  • همچنین می توان نتیجه را به عنوان بخشی از دفترچه یادداشت گرفت.
  • با کمک نوت بوک های ژوپیتر می توانیم کارهای خود را با یک همکار نیز به اشتراک بگذاریم.

نصب و اجرا

اگر از توزیع Anaconda استفاده می کنید ، نیازی نیست که نوت بوک jupyter را جداگانه نصب کنید زیرا از قبل با آن نصب شده است. شما فقط باید به Anaconda Prompt بروید و دستور زیر را تایپ کنید –

 

پس از فشار دادن enter ، یک سرور نوت بوک در localhost: 8888 رایانه شما شروع به کار می کند. در عکس زیر نشان داده شده است –

Jupyter Notebook

اکنون پس از کلیک بر روی برگه جدید، لیستی از گزینه ها دریافت خواهید کرد. پایتون 3 را انتخاب کنید و برای شروع کار در آن ، شما را به سمت نوت بوک جدید می برد. نگاهی اجمالی به آن را در عکسهای زیر خواهید دید –

Python Table

 

Python Table
از طرف دیگر، اگر از توزیع استاندارد پایتون استفاده می کنید ، نوت بوک jupyter را می توانید با استفاده از نصب کننده بسته محبوب پایتون، pip نصب کنید.

 

انواع سلول ها در نوت بوک ژوپیتر

در زیر سه نوع سلول در یک نوت بوک ژوپیتر وجود دارد –

  • سلول های کد – همانطور که از نامش پیداست ، می توانیم از این سلول ها برای نوشتن کد استفاده کنیم. پس از نوشتن کد / محتوا ، آن را به هسته مرتبط با دفترچه یادداشت ارسال می کند.
  • سلولهای Markdown – ما می توانیم از این سلولها برای یادآوری روند محاسبه استفاده کنیم. آنها می توانند شامل مواردی مانند متن ، تصاویر ، معادلات لاتکس ، برچسب های HTML و غیره باشند.
  • سلولهای خام – متن نوشته شده در آنها همانطور که هست نمایش داده می شود. این سلول ها اساساً برای افزودن متنی مورد استفاده قرار می گیرند که ما نمی خواهیم توسط مکانیسم تبدیل خودکار نوت بوک ژوپیتر تبدیل شود.

برای مطالعه دقیق تر نوت بوک jupyter ، می توانید به لینک www.tutorialspoint.com/jupyter/index.htm بروید.

NumPy

این یک مولفه مفید دیگر است که پایتون را به عنوان یکی از زبانهای مورد علاقه Data Science در می آورد. در اصل مخفف Numerical Python است و از اشیا ar آرایه ای چند بعدی تشکیل شده است. با استفاده از NumPy ، می توانیم عملیات مهم زیر را انجام دهیم –

  • عملیات ریاضی و منطقی روی آرایه ها.
  • تحول فوریه
  • عملیات مرتبط با جبر خطی.

همچنین می توانیم NumPy را به عنوان جایگزین MatLab ببینیم زیرا NumPy بیشتر به همراه Scipy (پایتون علمی) و Mat-plotlib (کتابخانه رسم) مورد استفاده قرار می گیرد.

نصب و اجرا

اگر از توزیع Anaconda استفاده می کنید ، دیگر نیازی به نصب NumPy به صورت جداگانه نیست زیرا قبلاً با آن نصب شده است. شما فقط باید بسته را به اسکریپت پایتون خود با کمک موارد زیر وارد کنید –

 

از طرف دیگر، اگر از توزیع استاندارد پایتون استفاده می کنید ، NumPy را می توانید با استفاده از نصب کننده محبوب بسته python ، pip نصب کنید.

 

برای مطالعه دقیق تر NumPy ، می توانید به لینک www.tutorialspoint.com/numpy/index.htm بروید.

 

Pandas

این یکی دیگر از کتابخانه های مفید پایتون است که پایتون را به یکی از زبانهای مورد علاقه Data Science تبدیل می کند. Pandas اساساً برای دستکاری ، درگیری و تجزیه و تحلیل داده ها استفاده می شود. این توسط وس مک کینی در سال 2008 ساخته شده است. با کمک Pandas ، در پردازش داده ها می توانیم پنج مرحله زیر را انجام دهیم –

  • بارگذاری کردن
  • آماده کردن
  • دستکاری کردن
  • مدل
  • تجزیه و تحلیل

نمایش داده در Pandas

نمایش کامل داده ها در Pandas با کمک سه ساختار داده زیر انجام می شود –

سری – این اساساً یک جداسازی یک بعدی با برچسب محور است که به این معنی است که مانند یک آرایه ساده با داده های همگن است. به عنوان مثال ، سری زیر مجموعه ای از اعداد صحیح 1،5،10،15،24،25 …

1 5 10 15 24 25 28 36 40 89

فریم داده – مفیدترین ساختار داده است و تقریباً برای همه نوع نمایش داده ها و دستکاری در پانداها استفاده می شود. این اساساً یک ساختار داده ای دو بعدی است که می تواند حاوی داده های ناهمگن باشد. به طور کلی ، داده های جدولی با استفاده از فریم های داده نشان داده می شوند. به عنوان مثال ، جدول زیر اطلاعات دانش آموزان را نشان می دهد که دارای نام و نام خانوادگی خود هستند ، سن و جنسیت –

نام شماره رول سن جنسیت
Aarav 1 15 مرد
Harshit 2 14 مرد
Kanika 3 16 زن
Mayank 4 15 مرد

پانل – این یک ساختار داده ای 3 بعدی است که شامل داده های ناهمگن است. نمایش پانل در نمایش گرافیکی بسیار دشوار است ، اما می توان آن را به عنوان ظرف DataFrame نشان داد.

جدول زیر ابعاد و توصیفی را در مورد ساختارهای داده فوق الذکر مورد استفاده در Pandas به ما می دهد –

ساختار داده ابعاد شرح
Series 1-D داده های همگن تغییرناپذیر ، اندازه 1 بعدی
DataFrames 2-D  اندازه دو بعدی قابل تغییر ، داده های ناهمگن به صورت جدول
Panel 3-D آرایه قابل تغییر اندازه ، ظرف DataFrame.

ما می توانیم این ساختارهای داده را درک کنیم ، زیرا ساختار داده های بعدی ، ظرف ساختار داده های بعدی است.

نصب و اجرا

اگر از توزیع Anaconda استفاده می کنید ، دیگر نیازی به نصب جداگانه Pandas نیست زیرا قبلاً با آن نصب شده است. شما فقط باید بسته را به اسکریپت پایتون خود با کمک موارد زیر وارد کنید –

 

از طرف دیگر ، اگر از توزیع استاندارد پایتون استفاده می کنید ، Pandas را می توان با استفاده از نصب کننده محبوب بسته python ، pip نصب کرد.

 

پس از نصب Pandas، می توانید همانند بالا آن را به اسکریپت پایتون خود وارد کنید.

مثال

در زیر نمونه ای از ایجاد یک سریال از ndarray با استفاده از Pandas است –

 

 

Scikit-learn

یکی دیگر از کتابخانه های مفید و مهم پایتون برای Data Science و یادگیری ماشین در پایتون ، Scikit-learn است. موارد زیر برخی از ویژگی های Scikit-learn است که آن را بسیار مفید می کند –

  • این برنامه روی NumPy ، SciPy و Matplotlib ساخته شده است.
  • این یک منبع باز است و تحت لیسانس BSD قابل استفاده مجدد است.
  • این برای همه قابل دسترسی است و در زمینه های مختلف قابل استفاده مجدد است.
  • طیف گسترده ای از الگوریتم های یادگیری ماشین که مناطق عمده ML را پوشش می دهد

نصب و اجرا

اگر از توزیع Anaconda استفاده می کنید ، نیازی به نصب جداگانه Scikit-learn نیست زیرا قبلاً با آن نصب شده است. شما فقط باید از این بسته در اسکریپت پایتون خود استفاده کنید. به عنوان مثال ، با خط زیر خط داده های بیماران سرطانی پستان را از Scikit-learn وارد می کنیم –

 

از طرف دیگر ، اگر از توزیع استاندارد Python استفاده می کنید و NumPy و SciPy را در اختیار دارید ، می توانید با استفاده از نصب کننده محبوب بسته python ، pip ، Scikit-learn را نصب کنید.

 

بعد از نصب Scikit-learn ، می توانید از آن در اسکریپت پایتون خود استفاده کنید همانطور که در بالا انجام دادید.

 

منبع.

 

لیست جلسات قبل آموزش یادگیری ماشین با پایتون 

  1. آموزش یادگیری ماشین با پایتون
  2.  مبانی یادگیری ماشین با پایتون  
امتیاز دهید post
0
برچسب ها :
نویسنده مطلب saber

دیدگاه شما

بدون دیدگاه