[C#] Convert HTML Special Characters ด้วย C#

Convert_HTML_Special_Characters_with_csharp_main.jpg

เนื่องด้วยโปรเจ็คจบนั้นมีส่วนที่ต้องทำการดูดเนื้อหาจากเว็บไซต์และตัด tag ต่างๆ ออกให้หมดก่อนที่จะนำไปตรวจการลอกการบ้าน แต่เจ้า Special Characters ทั้งหลายที่ถูกแปลงเป็นรหัสต่างๆ เช่น ” & ” , ” >” , ” <” ทำให้เซอร์วิสเจ้งๆ ไป ก็เลยต้องมาหาวิธีในการแปลง HTML Entities กลับมาอยู่ในรูปแบบ Special Characters ที่ยังไม่ถูกแปลง

  • รู้จัก HTML Special Characters กันก่อน

อักขระพิเศษ (Special Character) นั่นก็คือตัวอักษรที่ช่วยในการสร้างเอกสาร HTML นอกเหนือจาก Tag และ Attribute ต่างๆ ตัวอย่างเช่นสัญลักษณ์ & ก็จะถูกแทนด้วย ” & ” เป็นต้น

  • ขั้นตอนการ Convert  Special Characters เป็น HTML Entities ด้วย C#

การ Convert  Special Characters เป็น HTML Entities ตัวอย่างเช่นเปลี่ยน “&”, “<“, “>” เป็น” &amp; ” , ” &gt;” , ” &lt;”

  1. คลิกขวาที่โปรเจ็ค เลือก Add Reference
  2. Convert_HTML_Special_Characters_with_csharp_2.jpg

  3. ที่แถบ .NET เลือก System.Web แล้วกด OK
  4. Convert_HTML_Special_Characters_with_csharp_1.jpg

  5. ใช้คำสั่ง System.Web.HttpUtility.HtmlEncode(strRequest);
    เมื่อ strRequest เป็น string ของ HTML ที่ต้องการเปลี่ยน
  • ขั้นตอนการ Convert HTML Entities เป็น Special Characters ด้วย C#

การ Convert HTML Entities เป็น Special Characters เปลี่ยน ” &amp; ” , ” &gt;” , ” &lt;” เป็น “&”, “<“, “>”

  1. คลิกขวาที่โปรเจ็ค เลือก Add Reference
  2. Convert_HTML_Special_Characters_with_csharp_2.jpg

  3. ที่แถบ .NET เลือก System.Web แล้วกด OK
  4. Convert_HTML_Special_Characters_with_csharp_1.jpg

  5. ใช้คำสั่ง System.Web.HttpUtility.HtmlDecode(strRequest);
    เมื่อ strRequest เป็น string ของ HTML ที่ต้องการเปลี่ยน
  • ถ้าเกิดต้องการเขียนด้วยภาษา php

htmlspecialchars_decode() – Convert special HTML entities back to characters

htmlspecialchars() – Convert special characters to HTML entities

  • ตาราง Special Characters

http://www.utexas.edu/learn/html/spchar.html

Leave a comment