آموزش رمزگذاری کاراکتر در HTML
آموزش رمزگذاری کاراکتر در HTML
در این درس از مجموعه آموزش برنامه نویسی سایت سورس باران، به آموزش رمزگذاری کاراکتر در HTML خواهیم پرداخت.
رمزگذاری کاراکتر روشی برای تبدیل بایت به کاراکتر است. برای اعتبار سنجی یا نمایش صحیح یک سند HTML، یک برنامه باید کدگذاری کاراکتر مناسب را انتخاب کند.
رایج ترین مجموعه کاراکترها یا رمزگذاری کاراکترها در رایانه ها ASCII است –
American Standard Code برای تبادل اطلاعات، احتمالاً پرکاربردترین مجموعه کاراکترها برای رمزگذاری متن به صورت الکترونیکی است.
رمزگذاری ASCII فقط از الفبای لاتین بزرگ و کوچک، اعداد 0-9 و برخی از کاراکتر های اضافی پشتیبانی می کند که در مجموع 128 حرف را ایجاد می کند. می توانید نگاهی به مجموعه کاملی از نویسه های قابل چاپ ASCII داشته باشید
با این حال، بسیاری از زبان ها از حروف لاتین برجسته یا حروف الفبا کاملاً متفاوت استفاده می کنند. اگر می خواهید از کاراکتر های غیر ASCII استفاده کنید، باید در مورد رمزگذاری کاراکتر اطلاعات کسب کنید.
سازمان بین المللی استانداردسازی، طیف وسیعی از ست کاراکتر ها را برای برخورد با کاراکتر های مختلف ملت های دیگر ایجاد کرد. برای اسناد به زبان انگلیسی و اکثر زبانهای اروپای غربی، از رمزگذاری گسترده پشتیبانی شده ISO-8859-1 استفاده می شود.
در اینجا لیستی از ست کاراکتر مورد استفاده در سراسر جهان به همراه توضیحات آنها آورده شده است.
ست کاراکتر و توضیحات | |
---|---|
1 | ISO-8859-1
الفبای لاتین قسمت 1 آمریکای شمالی، اروپای غربی، آمریکای لاتین، کارائیب، کانادا، آفریقا |
2 | ISO-8859-2
الفبای لاتین قسمت 2 اروپای شرقی |
3 | ISO-8859-3
الفبای لاتین قسمت 3 اروپا، اسپرانتو، سایر موارد |
4 | ISO-8859-4
الفبای لاتین قسمت 4 اسکاندیناوی / بالتیک (و موارد دیگر در ISO-8859-1 نیستند) |
5 | ISO-8859-5
الفبای لاتین / سیریلیک قسمت 5 |
6 | ISO-8859-6
الفبای لاتین / عربی قسمت 6 |
7 | ISO-8859-7
الفبای لاتین / یونانی قسمت 7 |
8 | ISO-8859-8
الفبای لاتین / عبری قسمت 8 |
9 | ISO-8859-9
الفبای لاتین قسمت 9 همان ISO-8859-1 می باشد به جز کاراکتر های ترکی که جایگزین حروف ایسلندی هستند |
10 | ISO-8859-10
Latin 6 Latin 6 Lappish, Nordic, and Eskimo |
11 | ISO-8859-15
همان ISO-8859-1 اما با کاراکتر های بیشتر اضافه شده است |
12 | ISO-2022-JP
الفبای لاتین / ژاپنی قسمت 1 |
13 | ISO-2022-JP-2
الفبای لاتین / ژاپنی قسمت 2 |
14 | ISO-2022-KR
الفبای لاتین / کره ای قسمت 1 |
کنسرسیوم یونیکد به منظور ایجاد راهی برای نشان دادن همه کاراکتر های زبانهای مختلف، به جای داشتن این کدهای مختلف کاراکتر ناسازگار برای زبانهای مختلف، راه اندازی شد.
بنابراین، اگر می خواهید اسنادی ایجاد کنید که از کاراکترهای مجموعه های مختلف کاراکتر استفاده می کنند، می توانید این کار را با استفاده از رمزگذاری های کاراکتر یونیکد انجام دهید.
بنابراین یونیکد، رمزگذاری هایی را مشخص می کند که می توانند با یک رشته از راه های خاصی برخورد کند تا فضای کافی برای مجموعه کاراکترهای بزرگی که در آن قرار دارد ایجاد کنند. اینها به UTF8 ، UTF-16 و UTF-32 معروف هستند.
ست کاراکتر و توضیحات | |
---|---|
1 | UTF-8
ک کاراکتر در UTF8 می تواند از 1 تا 4 بایت باشد و باعث ایجاد عرض متغیر در UTF8 می شود. |
2 | UTF-16
یک قالب ترجمه یونیکد که در واحد های 16 بیتی وجود دارد. طول آن می تواند 1 یا 2 شورت باشد و باعث ایجاد عرض متغیر در UTF16 شود. . |
3 | UTF-32
یک قالب ترجمه یونیکد که در واحدهای 32 بیتی وجود دارد، یعنی طولانی است. این یک قالب با عرض ثابت است و طول آن همیشه 1 است. |
256 کاراکتر اول از مجموعه کاراکترهای یونیکد با 256 کاراکتر ISO-8859-1 مطابقت دارند.
به طور پیش فرض، پردازنده های HTML 4 باید از UTF-8 پشتیبانی کنند و پردازنده های XML قرار است از UTF-8 و UTF-16 پشتیبانی کنند. بنابراین تمام پردازنده های سازگار با XHTML همچنین باید از UTF-16 پشتیبانی کنند.
لیست جلسات قبل آموزش HTML
-
- معرفی HTML
- نگاهی کلی به HTML
- آموزش تگ های پایه در HTML
- آموزش عناصر در HTML
- مفهوم ویژگی ها در HTML
- آموزش قالب بندی در HTML
- آموزش تگ های عبارت در HTML
- آموزش متا تگ ها در HTML
- آموزش کامنت ها در HTML
- تصاویر در HTML
- آموزش جداول در HTML
- آموزش لیست ها در HTML
- آموزش لینک های عکس در HTML
- آموزش لینک های ایمیل در HTML
- آموزش فریم ها در HTML
- آموزش Iframes در HTML
- آموزش بلوک در HTML
- آموزش پس زمینه در HTML
- آموزش رنگ ها در HTML
- آموزش فونت ها در HTML
- آموزش فرم ها در HTML
- آموزش چندرسانه ای در HTML
- مفهوم Marquee در HTML
- آموزش تگ Header در HTML
- آموزش Style Sheet در HTML
- مرجع تگ ها در HTML
- مرجع ویژگی ها در HTML
- مرجع رویدادها در HTML
- مرجع فونت ها در HTML
- کدهای ASCII در HTML
- جدول ASCII در HTML
- آموزش نام رنگ ها در HTML
- آموزش موجودیت ها در HTML
- آموزش فونت های استاندارد HTML / XHTML
- آموزش منابع رویدادها در HTML
- آموزش انواع رسانه های MIME در HTML
- آموزش رمزگذاری URL در HTML
- کدهای ISO زبان در HTML
دیدگاه شما