آموزش توالی در برنامه نویسی بایوپایتون

4 سال پیش
امتیاز دهید post

آموزش توالی  در برنامه نویسی بایوپایتون

در این درس از آموزش های برنامه نویسی سایت سورس باران، با آموزش توالی در برنامه نویسی بایوپایتون در خدمت شما هستیم.

پیشنهاد ویژه : آموزش طراحی وب سایت با پایتون

توالی مجموعه ای از حروف است که برای نشان دادن پروتئین، DNA یا RNA ارگانیسم استفاده می شود. توسط کلاس Seq نشان داده می شود. کلاس Seq در ماژول Bio.Seq تعریف شده است.

بیایید یک توالی ساده در بایوپایتون ایجاد کنیم همانطور که در زیر نشان داده شده است –

 

در اینجا، ما یک توالی پروتئین ساده AGCT ایجاد کرده ایم و هر حرف آلانین ، گلیسین ، سیستئین و ترئونین را نشان می دهد.

هر شی Seq دارای دو ویژگی مهم است –

  1. dat – رشته توالی واقعی (AGCT)
  2. alphabet – برای نشان دادن نوع توالی استفاده می شود. به عنوان مثال، توالی DNA ، توالی RNA و … به طور پیش فرض، هیچ توای ای را نشان نمی دهد و ماهیتی عمومی دارد.

 

ماژول alphabet

شی Seq حاوی ویژگی Alphabet برای تعیین نوع توالی، حروف و عملکردهای احتمالی هستند. این در ماژول Bio.Alphabet تعریف شده است. alphabet را می توان به صورت زیر تعریف کرد

 

 

ماژول alphabet کلاس های زیر را برای نمایش انواع مختلف توالی ارائه می دهد.

Alphabet – کلاس پایه برای انواع alphabet.

SingleLetterAlphabet : الفبای عمومی با حروف یک اندازه. این از Alphabet و سایر انواع Alphabet از آن گرفته می شود.

 

 

ProteinAlphabet – الفبای پروتئین تک حرفی عمومی.

 

 

NucleotideAlphabet – الفبای عمومی تک حرف نوکلئوتید.

 

 

 DNAAlphabet – الفبای DNA تک حرفی عمومی.

 

 

 RNAAlphabet – الفبای RNA تک حرف عمومی.

 

ماژول Biopython ، Bio.Alphabet.IUPAC انواع توالی پایه را به عنوان تعریف شده توسط جامعه IUPAC فراهم می کند. این شامل کلاسهای زیر است –

 

  • (IUPACProtein (protein – الفبای پروتئین IUPAC از 20 اسید آمینه استاندارد.
  • (ExtendedIUPACProtein (extended_protein – پروتئین بزرگ IUPAC با حروف الفبا شامل X.
  • ( DNA_ IUPACAmbiguousDNA (ambiguous_dna -مبهم IUPAC بزرگ.
  • (DNA _ IUPACUnambiguousDNA (unambiguous_dna بدون ابهام IUPAC بزرگ (GATC).
  • ExtendedIUPACDNA (Extended_dna) – الفبای DNA IUPAC توسعه یافته.
  • (RNA  _IUPACAmbiguousRNA (ambiguous_rna مبهم بزرگ IUPAC.
  •   (RNA _ IUPACUnambiguousRNA (unambiguous_rna بدون ابهام IUPAC بزرگ (GAUC).

 

همانطور که در زیر نشان داده شده است، یک مثال ساده برای کلاس پروتئین IUPAC در نظر بگیرید –

 

 

همچنین، بایوپایتون تمام داده های پیکربندی مربوط به بیوانفورماتیک را از طریق ماژول Bio.Data در معرض دید قرار می دهد. به عنوان مثال ، IUPACData.protein_letters حروف احتمالی الفبای پروتئین را دارد.

 

 

 عملیات کلی

این بخش به طور خلاصه در مورد تمام عملیات کلی موجود در کلاس Seq توضیح می دهد. توالی ها شبیه رشته های پایتون است. ما می توانیم عملیات رشته پایتون مانند برش، شمارش، الحاق، پیدا کردن، تقسیم و نوار را به ترتیب دنبال کنیم.

 

برای بدست آوردن بازده های مختلف از کدهای زیر استفاده کنید.

 

برای بدست آوردن اولین مقدار توالی.

 

برای چاپ دو مقدار اول.

 

 برای چاپ همه مقادیر.

 

برای انجام عملیات طول و شمارش.

 

 

برای اضافه کردن دو توالی.

 

در اینجا، دو شی توالی فوق،seq1 ، seq2 توالی های DNA عمومی هستند و بنابراین می توانید آنها را اضافه کرده و توالی جدید تولید کنید. نمی توانید توالی هایی با حروف ناسازگار مانند توالی پروتئین و توالی DNA به شرح زیر اضافه کنید –

 

 

 

برای افزودن دو یا چند توالی، ابتدا آن را در لیست پایتون ذخیره کنید، سپس با استفاده از ‘for loop’ آن را بازیابی کنید و در آخر همانطور که در زیر نشان داده شده است، با هم اضافه کنید –

 

 

در بخش زیر، کدهای مختلفی برای بدست آوردن خروجی بر اساس نیاز داده شده است.

 

برای تغییر مورد توالی.

 

برای بررسی عضویت و هویت عملگر پایتون.

 

 

برای پیدا کردن یک حرف یا توالی حرف در داخل توالی داده شده.

 

برای انجام عملیات تقسیم.

 

برای انجام عملیات نوار به ترتیب.

 

منبع.

لیست جلسات قبل آموزش برنامه نویسی بایوپایتون

  1. آموزش برنامه نویسی بایوپایتون (Biopython)
  2. معرفی برنامه نویسی بایوپایتون
  3. آموزش نصب بایوپایتون
  4. ایجاد یک برنامه ساده در برنامه نویسی بایوپایتون
امتیاز دهید post
0
برچسب ها :
نویسنده مطلب saber

دیدگاه شما

بدون دیدگاه