web analytics

Convert text file to UTF-8 encoding

ได้หนังซีรี่ส์ฝรั่งมาแต่ไม่มีซับไทย เลยไปค้นๆในอินเตอร์เน็ตเจอเว็บนึงชื่อ ไทยซับไตเติ้ล หลังจากโหลดไฟล์ซับไทยมา เอามาเปิดใน VLC มันดันเป็นไฟล์ที่เข้ารหัสเป็นภาษาไทย(TIS-620) เลยต้องหาทางแปลงให้เป็น UTF-8 ตอนแรกใช้วิธีเปิดด้วย OpenOffice Writer แล้วเซฟกลับอีกทีเป็น Text File แต่ดูๆมันเหมือนขับสิบล้อไปซื้อหนังสือพิมพ์ปากซอย

เลยต้องหาบรรทัดคำสั่งที่ง่ายกว่านี้หน่อย เลยไปเจอคำสั่ง iconv (ชื่อเดียวกับฟังก์ชั่นบน php ที่หน้าที่เดียวกัน) วิธีใช้คือ
[ccWn_php width="100%"]iconv –from-code=TIS-620 –to-code=UTF-8 subtitle-file-thai.ssa > subtitle-file-utf8.ssa [/ccWn_php]
ถ้ามีไฟล์เยอะก็อาจเขียนเป็นสคริปต์

[ccWn_php width="100%"]for i in `ls *.ssa`;do iconv –from-code=TIS-620 –to-code=UTF-8 “$i” > “new/$i”; done [/ccWn_php]

Leave a Comment