עוד המרת ג'יבריש לעברית

By | 21 במאי 2007

אתמול פורסמה הפסקה המחמיאה/מביכה הבאה ב-עלו ברשת של Ynet:

ממיר הג'יבריש – נכון שאחת לכמה זמן בא לכם פשוט להשליך את הלאפ-טופ מהקומה השנייה רק בגלל עוד מייל מחורבש שאתם לא מצליחים לקודד לעברית?

הנה בא אושיית הרשת חנן כהן ויצר למענכם את קוסם העברית, אפליקציה קטנה וחכמה, שאליה ניתן להזין את הג'יבריש המגיע מתוכנות המייל המאונגלזות שלכם, ולהמיר לעברית בלחיצת מקש. יש כאלה שטוענים שהשירות הזה הציל את חייהם, פרקטיקלי.

מאז הפרסום, קיבלתי כמה פניות (כולל שיחת טלפון לנייד שלי היישר מהונגריה!) ובין השאר בקשה להמיר עוד סוג של ג'יבריש. מדובר בג'יבריש כמו בדוגמה הבאה. מכיוון שזה הגיע מפתיחה של מכתב, אני מניח שכתוב שם "שלום".

אני רוצה להכין דף דומה לקיים, אבל עבור הסוג הנפוץ הזה.

מי שישלח/תשלח לי (באימייל) את שורות הקוד ב PHP שממירות את הכמוטקסט הזה לעברית, ת/יזכה לתהילת עולם.

תודה.

5 thoughts on “עוד המרת ג'יבריש לעברית

  1. Xslf

    לפי מה שנראה, הג'בריש הזה עבר לפחות שתי המרות שגויות בחייו- המרה ראשונה שגוייה ליוניקוד, והמרה שנייה שגויה מיוניקוד לקידוד ascii כלשהו.
    אחרי ההמרה לאסקיי, נעשה לתווים escaping (ומשם המספרים).

    הבעייה היא שבגלל ההמרה הכפולה, לא מדובר בהמרה אחד לאחד, וחלק מהתווים "נחתכו" כך שמה שהיה במקור תו אחד, הפך לשני תווים, ואח"כ אחד מהם הוסר.

    במילים אחרות- חלק מהמידע המקורי על התווים של הטקסט הלך לאיבוד.

    בוא נגיד ככה- לכתוב ממיר מהג'יבריש הזה לעברית יהיה מאתגר הרבה יותר מאשר כל הממירים האחרים (שאצלם יש טבלה שאומרת מה המקבילה).

  2. Xslf

    ושתי דוגמאות הבהרה (אם כי אני לא בטוחה איך הבלוג כאן "יאכל" את הדוגמאות):

    התחלתי עם המילה "שלום" בעברית (בקידוד יוניקוד), התוכנה חשבה שמדובר ב- sio-8859-1. אח"כ חלק מהטקסט עבר escaping:
    שלום
    שלו×&#157
    כנ"ל, אבל עם המלה "מלחמה":
    מלחמה
    ואחרי ה-escaping:
    מלחמ×&#148

  3. אפי פוקס

    גם אני כתבתי היום על הזוועה, והכנסתי אנקדוטה על מר כחלון שמנהל את הדיונים, ולא יודע מה זה מנוע חיפוש.

    אשמח לעזור ולהתייצב בכנסת כשצריך. עשיתי את זה מול ישראל חסון, אז הפריד אל עטרש הזה קטן עליי. תודיע לי אם משהו זז- אני אשמח להסתער

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *