انواع اشیا beautiful soup 

4 سال پیش
انواع اشیا beautiful soup 
امتیاز دهید post

 انواع اشیا beautiful soup 

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش انواع اشیا beautiful soup خواهیم پرداخت.

پیشنهاد ویژه : پکیج آموزش طراحی وب سایت با پایتون و جنگو

هنگامی که ما یک سند یا رشته html را به یک سازنده beautifulsoup منتقل کردیم ، beautifulsoup اساساً یک صفحه html پیچیده را به اشیا (objects) مختلف پایتون تبدیل می کند. در زیر قصد داریم چهار نوع اصلی از اشیا را مورد بحث قرار دهیم:

  • Tag
  • NavigableString
  • BeautifulSoup
  • Comments

 

اشیا تگ

از یک HTML برای تعریف انواع مختلف محتوا استفاده می شود. یک شی تگ در BeautifulSoup مربوط به یک تگ HTML یا XML در صفحه یا سند واقعی است.

 

تگ ها حاوی ویژگی ها و روش های زیادی هستند و دو ویژگی مهم یک تگ نام و ویژگی های آن است.

نام (tag.name)

هر تگ دارای یک نام است و از طریق “.name” به عنوان پسوند قابل دسترسی است. tag.name نوع تگ موجود را برمی گرداند.

 

با این حال، اگر نام تگ را تغییر دهیم ، همان مورد در نشانه گذاری HTML تولید شده توسط BeautifulSoup منعکس خواهد شد.

ویژگی ها (tag.attrs)

یک شی تگ می تواند هر تعداد ویژگی داشته باشد. تگ <b class = “boldest”> ویژگی “class” دارد که مقدار آن “boldest” است. هر چیزی که تگ نباشد، در اصل یک ویژگی است و باید حاوی یک مقدار باشد. می توانید از طریق دسترسی به کلیدها (مانند دسترسی به “کلاس” در مثال بالا) یا دسترسی مستقیم از طریق “.attrs” به ویژگی ها دسترسی پیدا کنید.

ما می توانیم همه نوع اصلاحات را در ویژگی های تگ خود انجام دهیم (افزودن / حذف / اصلاح).

 

ویژگی های چند مقداری

برخی از ویژگی های HTML5 می توانند مقادیر متعددی داشته باشند. معمولاً از ویژگی کلاس استفاده می شود که می تواند چندین مقدار CSS داشته باشد. سایر موارد شامل “rel” ، “rev” ، “headers” ، “accesskey” و “accept-charset” است. ویژگی های چند مقداذی در BeautifulSoup به صورت لیست نشان داده شده است.

 

با این حال، اگر هر ویژگی حاوی بیش از یک مقدار باشد اما در هر نسخه استاندارد HTML ویژگی چند مقداری نباشد، BeautifulSoup ویژگی را تنها می گذارد –

 

اگر یک تگ را به یک رشته تبدیل کنید، می توانید مقادیر چند ویژگی را تلفیق کنید.

 

با استفاده از ‘get_attribute_list’ ، مقداری دریافت می کنید که همیشه یک لیست باشد، رشته ای، صرف نظر از اینکه چند مقدار دارد یا نه.

 

با این حال، اگر سند را به عنوان “xml” تجزیه کنید، هیچ ویژگی چند مقداری وجود ندارد –

 

رشته قابل جستجو (navigablestring)

شی navigablestring برای نشان دادن محتویات یک تگ استفاده می شود. برای دسترسی به مطالب، از “.string” همراه با تگ استفاده کنید.

می توانید رشته را با رشته دیگری جایگزین کنید اما نمی توانید رشته موجود را ویرایش کنید.

 

BeautifulSoup

BeautifulSoup شیئی است که وقتی می خواهیم یک منبع را  وب اسکراپینگ کنیم ایجاد شده است. بنابراین، این سند کاملی است که ما سعی در اسکراپینگ آن داریم.

 

کامنت ها

شی comment بخشی از نظر سند وب را نشان می دهد. این فقط یک نوع خاص از NavigableString است.

 

اشیا NavigableString

اشیا NavigableString  برای نشان دادن متن در تگ ها استفاده می شوند.

 

منبع.

لیست جلسات قبل آموزش Beautiful Soup در پایتون

  1. آموزش Beautiful Soup در پایتون
  2.  بررسی اجمالی Beautiful Soup در پایتون
  3. آموزش نصب Beautiful Soup
  4. آموزش Souping کردن صفحه در Beautiful Soup
امتیاز دهید post
0
برچسب ها :
نویسنده مطلب saber

دیدگاه شما

بدون دیدگاه