آموزش Souping کردن صفحه در Beautiful Soup

4 سال پیش
آموزش Souping کردن صفحه در Beautiful Soup
امتیاز دهید post

آموزش Souping کردن صفحه در Beautiful Soup

در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش Souping کردن صفحه در Beautiful Soup خواهیم پرداخت.

پیشنهاد ویژه : آموزش طراحی وب سایت با پایتون

در مثال کد قبلی، ما سند را از طریق سازنده زیبا با استفاده از روش رشته تجزیه می کنیم. روش دیگر این است که سند را از طریق فایل باز، باز کنید.

 

ابتدا سند به یونی کد تبدیل می شود و موجودیت های HTML به کاراکتر های یونیکد تبدیل می شوند: </ p>

 

خروجی

 

BeautifulSoup سپس داده ها را با استفاده از تجزیه کننده HTML تجزیه می کند یا صریحاً به آنها می گویید با استفاده از تجزیه کننده XML تجزیه کنند.

ساختار درخت HTML

قبل از بررسی اجزای مختلف یک صفحه HTML، ابتدا ساختار درخت HTML را درک می کنیم.

آموزش Souping کردن صفحه در Beautiful Soup

 

عنصر ریشه ای در درخت سند html است که می تواند پدر و مادر ، فرزند و خواهر و برادر داشته باشد و این با توجه به موقعیت آن در ساختار درخت تعیین می شود. برای جابجایی در میان عناصر، ویژگی ها و متن HTML ، باید در میان گره های ساختار درخت خود حرکت کنید.

بگذارید فرض کنیم صفحه وب همانطور که در زیر نشان داده شده است –

آموزش Souping کردن صفحه در Beautiful Soup

که به یک سند html به شرح زیر ترجمه می شود –

 

این به معنای ساده است، برای سند بالاتر از HTML ، ما یک ساختار درخت HTML داریم به شرح زیر –

 

آموزش Souping کردن صفحه در Beautiful Soup

منبع.

لیست جلسات قبل آموزش Beautiful Soup در پایتون

  1. آموزش Beautiful Soup در پایتون
  2.  بررسی اجمالی Beautiful Soup در پایتون
  3. آموزش نصب Beautiful Soup
امتیاز دهید post
0
برچسب ها :
نویسنده مطلب saber

دیدگاه شما

بدون دیدگاه