Skip to main content

แท็ก Meta Charset - ตั้งค่าการเข้ารหัสอักขระใน HTML5

HTML meta tag verification in Webmaster Tools (เมษายน 2025)

HTML meta tag verification in Webmaster Tools (เมษายน 2025)
Anonim

ก่อนที่จะมีการแนะนำ HTML5 การตั้งค่าการเข้ารหัสอักขระบนเอกสารที่มี elementrequiredyou เพื่อเขียนบรรทัด verbose ค่อนข้างชัดเจนด้านล่าง นี่คือองค์ประกอบ Meta Charset หากคุณใช้ HTML4 ในหน้าเว็บของคุณ:

สิ่งสำคัญที่ต้องแจ้งให้ทราบในรหัสนี้คือเครื่องหมายคำพูดที่คุณเห็นรอบตัว เนื้อหา แอตทริบิวต์: เนื้อหา = ' text / html; charset = ISO-8859-1 ' . เช่นเดียวกับคุณลักษณะ HTML ทั้งหมดอัญประกาศเหล่านี้จะกำหนดค่าของแอตทริบิวต์โดยระบุว่าสตริงทั้งหมด text / html; charset = ISO-8959-1 คือ เนื้อหา ขององค์ประกอบนี้นี่เป็น HTML ที่เหมาะสมและเป็นวิธีการที่สตริงนี้ตั้งใจจะเขียนขึ้น นอกจากนี้ยังเป็นเทอะทะยาวและน่าเกลียด! นอกจากนี้ยังไม่ใช่สิ่งที่คุณอาจจะจำได้จากด้านบนศีรษะของคุณ! ในกรณีส่วนใหญ่นักพัฒนาเว็บจะต้องคัดลอกและวางโค้ดนี้จากไซต์หนึ่งไปเป็นไซต์ใหม่ที่พวกเขาพัฒนาขึ้นเนื่องจากการเขียนข้อความนี้ตั้งแต่เริ่มต้นก็ขอให้มาก

HTML5 ตัดเนื้อหา "สิ่งต่างๆ"

HTML5 ไม่เพียง แต่เพิ่มองค์ประกอบใหม่ ๆ ลงในภาษา แต่ยังช่วยให้ไวยากรณ์ของ HTML รวมทั้งองค์ประกอบของ Meta Charset ด้วย HTML5 ทำให้คุณสามารถเพิ่มการเข้ารหัสอักขระได้ง่ายขึ้นด้วยการจำ syntaxforMETA องค์ประกอบที่คุณเห็นด้านล่าง:

เปรียบเทียบไวยากรณ์ที่เรียบง่ายกับสิ่งที่เราเขียนไว้ในตอนต้นของบทความนี้ไวยากรณ์เก่าที่ใช้สำหรับ HTML4 และคุณจะเห็นได้ว่าเขียนและจำ HTML5 ได้ง่ายแค่ไหน แทนที่จะต้องคัดลอกและวางข้อมูลจากไซต์ที่มีอยู่ลงในไซต์ใหม่ที่คุณกำลังทำงานอยู่นี่เป็นสิ่งที่สำคัญอย่างยิ่งเนื่องจากในฐานะนักพัฒนาเว็บแบบหน้าเว็บคุณสามารถจำได้ การประหยัดเวลานี้ไม่มากนัก แต่เมื่อคุณพิจารณาพื้นที่ไวยากรณ์อื่น ๆ ที่ HTML5 ใช้งานง่ายการประหยัดจะเพิ่มขึ้น!

เสมอรวมถึงการเข้ารหัสตัวอักษร

คุณควรรวมการเข้ารหัสอักขระสำหรับหน้าเว็บของคุณเสมอแม้ว่าคุณจะไม่ได้ใช้อักขระพิเศษก็ตาม หากคุณไม่ได้มีการเข้ารหัสอักขระเว็บไซต์ของคุณจะเสี่ยงต่อการโจมตีสคริปต์แบบ cross site โดยใช้ UTF-7

ในสถานการณ์สมมตินี้ผู้โจมตีเห็นว่าไซต์ของคุณไม่มีการเข้ารหัสอักขระที่กำหนดไว้ดังนั้นจึงทำให้เบราว์เซอร์คิดว่าการเข้ารหัสอักขระของหน้านี้เป็นจริงเป็น UTF-7 จากนั้นผู้โจมตีจะใส่สคริปต์ที่เข้ารหัส UTF-7 ลงในหน้าเว็บและไซต์ของคุณจะถูกแฮ็กโดยปัญหานี้เป็นปัญหาสำหรับทุกคนที่เกี่ยวข้องจาก บริษัท ของคุณต่อผู้เยี่ยมชม ข่าวดีก็คือว่ามันเป็นปัญหาง่ายๆในการหลีกเลี่ยง - เพียง แต่ต้องแน่ใจว่าได้เพิ่มการเข้ารหัสอักขระลงในทุกหน้าเว็บของคุณ

ตำแหน่งที่จะเพิ่มการเข้ารหัสอักขระ

อักขระการเข้ารหัสสำหรับเว็บเพจควรเป็นบรรทัดแรกของ HTML ของคุณ เพื่อให้แน่ใจว่าเบราว์เซอร์รู้ว่าการเข้ารหัสอักขระคืออะไรก่อนที่จะทำสิ่งอื่นบนหน้าเว็บอื่นนอกเหนือจากการกำหนด doctype และระบุว่าเป็นหน้า HTML HTML ของคุณควรอ่าน:

ใช้ส่วนหัว HTTP เพื่อความปลอดภัยพิเศษ

นอกจากนี้คุณยังสามารถระบุการเข้ารหัสอักขระในส่วนหัว HTTP นี่เป็นความปลอดภัยมากกว่าการเพิ่มลงในหน้า HTML แต่คุณต้องการเข้าถึงการกำหนดค่าเซิร์ฟเวอร์หรือไฟล์. htaccess ซึ่งหมายความว่าคุณอาจต้องทำงานร่วมกับผู้ให้บริการโฮสติ้งของเว็บไซต์เพื่อให้ได้รับการเข้าถึงแบบนี้หรือทำให้พวกเขาทำ การเปลี่ยนแปลงของคุณ Access เป็นสิ่งท้าทายที่นี่ การเปลี่ยนแปลงตัวเองเป็นเรื่องง่ายดังนั้นผู้ให้บริการโฮสต์ใด ๆ ควรสามารถทำการเปลี่ยนแปลงนี้เพื่อความสะดวกของคุณได้อย่างคล่องตัว

หากคุณใช้แอ็พไซต์คุณสามารถตั้งค่าชุดอักขระเริ่มต้นสำหรับทั้งไซต์โดยการเพิ่ม: AddDefaultCharset UTF-8 รากของคุณ .htaccess ไฟล์. ชุดอักขระเริ่มต้นของ Apache คือ ISO-8859-1.