Mojibake

Artikel mojibake di Wikipedia bahasa Jepang dalam enkode UTF-8 yang ditampilkan dengan sistem operasi ber-enkode Windows-1252.

Mojibake (文字化け?) adalah tampilan dari karakter komputer yang salah dan tidak dapat dibaca ketika perangkat lunak gagal menampilkan teks secara benar sesuai dengan pengkodean karakter untuk karakter tersebut.

Sebagai contoh, teks bahasa Jepang yang dimaksudkan penulisnya untuk dibaca sebagai 文字化け akan ditampilkan salah sebagai "æ–‡å—化け" pada sistem operasi yang hanya disetel untuk menampilkan karakter dalam enkode Windows-1252 atau ISO-8859-1 (umumnya disebut Western).

Arti harfiah mojibake adalah karakter hantu,[1] berasal dari gabungan kata moji (文字?) yang berarti karakter, ditambah bake (化け?, hantu) bentuk nomina dari verba bakeru (化ける?, berubah/mengubah bentuk ke dalam bentuk/penampilan lain).

Sewaktu mengembangkan Aldus PageMaker versi bahasa Jepang, pengembang perangkat lunak bernama Yoshiyuki Kubo menemui kesalahan dalam tampilan karakter yang dijelaskannya sebagai mojibake. Istilah tersebut kemudian melekat dan meluas, dimulai dari kalangan pengembang/pemakai Macintosh.[2]

Penyebab

Mojibake sering disebabkan ketika pengkodean karakter tidak dinyatakan dengan benar di dalam dokumen, atau ketika dokumen dipindahkan dari sistem yang dipasang dengan pengkodean karakter berbeda. Tampilan karakter yang salah terjadi ketika sistem aksara atau pengkodean karakter salah tag atau "asing" untuk sistem komputer pengguna. Bila komputer itu tidak memiliki perangkat lunak yang dibutuhkan untuk memproses karakter bahasa asing, maka komputer tersebut akan mencoba memprosesnya memakai pengkodean karakter yang telah terpasang. Akibatnya, tanda tanya, kotak, atau lambang-lambang aneh ditampilkan di layar. Masalah mojibake juga dapat terjadi pada pesan dalam satu bahasa, namun dikirim dengan pengkodean karakter berbeda dari pengkodean karakter komputer penerima. Masalah ini sering dijumpai di antara pengguna komputer berbahasa Jepang yang memiliki sejarah sistem operasi dalam beberapa pengkodean karakter.

Penjelajah web kemungkinan tidak dapat membedakan laman web yang di-enkode dengan EUC-JP dan laman web berikutnya yang di-enkode dengan Shift-JIS, kecuali bila skema pengkodean dinyatakan secara eksplisit dalam HTTP header yang dikirim bersama dokumen, atau dalam meta tag HTML yang dipakai untuk mensubstitusi HTTP header yang hilang bila peladen tidak dikonfigurasi untuk mengirimkan HTTP header yang layak. Metode heuristik dapat diterapkan untuk menerka set karakter, namun metode ini tidak selalu berhasil.

Contoh

Pengkodean berkasPengaturan di penjelajah webHasil
Contoh bahasa Arab:
Tampilan di penjelajah web:الإعلان العالمى لحقوق الإنسان
UTF-8ISO 8859-1الإعلان العالمى لحقوق الإنسان
KOI8-RО╩©ь╖ы└ь╔ь╧ы└ь╖ ы├ ь╖ы└ь╧ь╖ы└ы┘ы┴ ы└ь╜ы┌ы┬ы┌ ь╖ы└ь╔ы├ьЁь╖ы├
ISO 8859-5яЛПиЇй�иЅиЙй�иЇй� иЇй�иЙиЇй�й�й� й�и­й�й�й� иЇй�иЅй�иГиЇй�
CP 866я╗┐╪з┘Д╪е╪╣┘Д╪ з┘Ж ╪з┘Д╪╣╪з┘Д┘Е┘Й ┘Д╪н┘В┘И┘В ╪з┘Д╪е┘Ж╪│╪з┘Ж
ISO 8859-6ُ؛؟ظ�ع�ظ�ظ�ع�ظ�� �� ظ�ع�ظ�ظ�ع�ع�ع� ع�ظ­ع�ع�ع� ظ�ع�ظ�ع�ظ�ظ�ع�
ISO 8859-2ا�ؼؚ�ا� ا�ؚا��� �ح��� ا�ؼ�سا�
Windows-1256Windows-1252ÇáÅÚáÇä ÇáÚÇáãì áÍÞæÞ ÇáÅäÓÇä
Contoh bahasa Swedia:Smörgås
Pengkodean berkasPengaturan di penjelajah webHasil
MS-DOS 437ISO 8859-1Sm”rg†s
ISO 8859-1Mac RomanSmˆrgÂs
UTF-8ISO 8859-1Smörgås
UTF-8Mac RomanSmörgås
Contoh bahasa Rusia:Кракозябры
Pengkodean berkasPengaturan di penjelajah webHasil
MS-DOS 855ISO 8859-1Æá ÆÖóÞ¢áñ
KOI8-RISO 8859-1ëÒÁËÏÚÑÂÒÙ
UTF-8KOI8-Rп я─п╟п╨п╬п╥я▐п╠я ─я▀


Referensi

  1. ^ Paul Hastings (2004-4-13). "ColdFusion: Article, Do You Want Coffee with That Mojibake? Character encodings and CFMX". ColdFusion Developer's Journal. Diakses 2012-07-15. 
  2. ^ "漢字トーク V1.0( KanjiTalk 1.0 )". The Vintage Mac Museum. Diakses 2012-07-15.  Berikut lampiran email mengenai masalah mojibake.

Pranala luar



Sumber :
wiki.kuliah-karyawan.com, id.wikipedia.org, andrafarm.com, dsb.