לשבור את המידע לרסיסים

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 22-11-2009

שבירת נתוניםעד עכשיו התעסקתי בהעברת המידע ללקוח בלי להתחשב בעומסי השרת אך מה קורה שכמות המידע מתחילה להיות ממש גדולה וכבר עוברת את גבולות המכונה ? איך מצליחים למצוא את המידע המתאים מהמכונה המתאימה בזמן סביר ?

Sharding (בתרגום מילולי שבירה לרסיסים) היא שיטה של חלוקת אופקית במאגר מידע או מנוע חיפוש.

מחיצה אופקית היא עיקרון תכנון מסד נתונים לפיו שורות של טבלה מוחזקות בנפרד, ולא על ידי פיצול עמודות (כמו נורמליזציה).כל חלק (שבר) עשוי להיות ממוקם בשרת נפרד או מיקום פיזי אחר. היתרון במחיצות אופקיות הוא הפחתת מספר השורות בכל טבלה (מהלך שמקטין גודל האינדקס, ובכך משפר את ביצועי החיפוש). אם מחיצה מבוססת על חלוקה תבניתית (לדוגמה, לקוחות אמריקאים ולקוחות אירופאים), אז ייתכן שניתן להסיק איזה מחיצה רלוונטית לחיפושינו באופן אוטומטי.

שברים (sharding) הם צעד אחד מעבר למחיצות אופקיות, הפעולה היא זהה (חלוקת אופקית של נתוני טבלה לפי גורם מסוים) אך התוצאה מפוצלת על מסדי נתונים מרובים. היתרון לפיצול פעולת החישוב ליחידות עיבוד שונות הוא ברור (פוטנציאל לעבודה מקבילית). חלוקה כזו היא הרבה יותר מסובכת מהנראה ולפעמים דוקא פוגמת בביצועים. מה גם שטבלאות עם מידע מועט מועתקות בין השברים השונים.
היתרונות בחלוקה לשברים הם:
זמינות – אם יש תקלה בשרת מסוים רק חלק מהמידע לא זמין.
שאילתות מהירות - כמות שורות מופחתת בכל טבלה משפרת את ביצועי השאילתה בצורה משמעותית.
כתיבה בנפחים גדולים – אחד האתגרים בעבודה עם מסדי נתונים היא כמות הכתיבות שניתן לבצע בו זמנית, מכיוון שהמידע מחולק על מספר מסדי נתונים ניתן לבצע מספר כתיבות במקביל.

במה שונה גישת החלוקה מגישות קימות ?

מבנה נתונים לא מנורמל - באופן מסורתי אנחנו מנרמלים את הנתונים. הנתונים פרושים בצורה טבלאית מנורמלת ובשעת צורך אנו מחברים אותם יחדיו על ידי שאילתה. בשברים המידע אינו מנורמל, מידע  ממספר טבלאות עם תוכן קשור (לדוגמה טבלת לקוחות וטבלת היסטורית קניה) נשמר באותו מקום.

הנתונים נשמרים מקבילית על פני שרתים רבים. היסטורית מסדי נתונים הם בקנה מידה גדול. ככול שיש יותר מכונות מקבלים יותר כוח. עם שבירה הנתונים מקבילים והגדילה היא רוחבית, על ידי הוספה של מכונות לגריד, ולא על ידי שדרוג השרתים הקיימים.
הנתונים בעלי זמינות גבוהה יותר. משום שאנו משתמשים במספר מכונות , כישלון של אחת מהן אינה גורם להפסקת השירות . שמירה על עותקי נתונים מרובים בתוך מכונה גם עוזר עם זמינות ומקביליות.
אין שימוש בשכפול (replication). שכפול נתונים משרת ראשי לשרתים משנה היא הגישה המסורתית. נתונים נכתבים לשרת הראשי ולאחר מכן משוכפלים לאחד או יותר עותקים. כשיש שיכפול ניתן לקרוא מידע משרתי השכפול, אך רק השרת הראשי משמש לכתיבה. כתיבה לשרת הראשי הופכת להיות צוואר בקבוק.

כללי YSLOW \ PAGE SPEED

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 19-11-2009

בעקבות המחקר והעבודה של סונדרס וצוותו הוציאו יאהו כלי בדיקות בשם YSLOW כתוסף דפדפן של פיירפוקס. מאז סונדרס עבר לגוגל וגם הם הוציאו כלי דומה בשם PAGE SPEED במהלך שמזכיר קצת את מיקרוסופט (ולא החלקים הטובים שלה)

בהתאם לממצאים של סונדרס וצוותו גובשו הכללים הבאים:

1. צמצום כמות קריאות HTTP ,זאת על ידי שימוש בטכניקות כמו CSS SPRITES ואיחוד קבצי CSS ו JS .

2. הפצת תוכן סטאטי על ידי שימוש ב CDN,המעבר להפצת תוכן סטטי בעזרת CDN קל יותר ומשפיע יותר משינוי ארכיטקטוני לפיצול המידע הדינאמי (את הטכניקה לפיצול מידע דינמי סקרתי בפוסטים קודמים)

3. שימוש נכון בתאריך תפוגה (expiration header) לכל משאב (לא רק לתמונות), במחקר שערכו גילו כי באתרים שונים הרבה משאבים קבועים (עד כ 70%) יכולים להיות עם תאריך תפוגה ארוך יותר. מעבר לתאריכי תפוגה ארוכים מחייב התייחסות ארכיטקטונית לעדכון גרסת משאב מסוים. לדוגמה – תיקון בקוד האתר דורש שינוי קוד ג'אוה סקריפט, מכיוון שאנו השתמשנו בתאריכי תפוגה ארוכים התיקון אף פעם (או עוד הרבה מאוד זמן) יגיע ללקוחות ותיקים הפתרון הוא חתימת גרסאות בשם הקובץ או כתובתו (URL)

4. שימוש ב GZIP (נכתב כחלק מפרוטוקול HTTP) נתמך ברוב הדפדפנים וחוסך כ 70% מהתעבורה אם משתמשים בו על כל המשאבים הטקסטואליים. בחלק גדול מהמקרים GZIP מופעל רק על קבצי HTML ומזניח שלא לצורך משאבי טקסט אחרים כגון CSS ו JS.

5. להעביר את הקישורים לקבציי CSS לראש העמוד. באקספלורר הדף לא מוצג עד שכל קבצי ה CSS נטענו ותוכנם נותח. בפירפוקס התצוגה תתרענן עם פענוח של CSS חדש.

6. להעביר את הקישורים לקבציי JS לתחתית העמוד, טעינת קובץ ג'אוה סקריפט חוסמת כל הורדה אחרת (בכל מצב אחר הדפדפן מבצע הורדות מקביליות) וחוסמת את רענון תצוגת המסך.

7. להימנע מביטויי CSS (ממשק שנתמך רק באקספלורר (גרסה 5 ומעלה) ומאפשר הפעלת ג'אוה סקריפט מתוך CSS) ביטויי ה CSS מחושבים בצורה מחזורית בכמויות מאוד גדולות ומאטים את פעילות הדפדפן.

8. שימוש בסקריפטים חיצוניים (שימוש בתגי SCRIPT ו LINK לטעינת משאבים חיצוניים) ובכך אחזור משאבים והאצת הטעינה על ידי שימוש במטמון הדפדפן.

9. צמצום חיפושי DNS, נעשה על ידי קריאה למשאבים מכמה שפחות מתחמים (דומיינים), על כל כתובת מתחם חדשה שהדפדפן טוען נעשית קריאה לחיפוש DNS. מצד אחד פיצול משאבים על שמות מתחם שונים גורם לדפדפן לטעינה מקבילית מרובה , מצד שני כל שם מתחם צריך לעבור אימות מול שרתי DNS (פעולה שלוקחת זמן) ההמלצה היא להשתמש בין שניים לארבעה שמות מתחם לתכנים בעמוד.

10. שימוש בכלי ניקוי קוד (minification)  להורדת הערות רווחים וקיצור קוד.

11. הימנעות מ REDIRECT אם בקריאות שרת כגון 301 ו 302 או שימוש בקוד HTML META או על ידי ג'אוה סקירפט ככל מקרה תהיה טעינה כפולה הראשונה של הדף המפנה ורק לאחר מכן כתובת היעד.

12. מחיקת סקריפטים כפולים, לפעמים קורה שישנה קריאה לאותם קבצי סקריפט כמה פעמים בעמוד. דבר הנובע בדרך כלל מחוסר תיאום בין צוותי פיתוח שונים באתר.

13. הגדרות ETAGS , תגיות יישות (ETags) הן מנגנון אשר שרתי אינטרנט ודפדפנים משתמשים כדי לקבוע אם רכיב בזיכרון המטמון של הדפדפן תואם אחד בשרת המקור (ישות יכולה להיות תמונות, סקריפטים, CSS, וכו ') .התגיות נוספו לספק מנגנון אימות גמיש יותר מאשר תאריך התפוגה.

14. הכנסת AJAX לזיכרון המטמון, בהרבה מקרים הקריאות הינם פרסונליות והאינסטינקט הראשוני הוא לא לשמור את המידע במטמון. אך למרות שהמידע אישי לא תמיד הוא משתנה לעתים קרובות. מומלץ להשתמש באותה טכניקה שמתוארת בסעיף 3.

שיפור ביצועים על פי סטיב סונדרס

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 18-11-2009

סטיב סונדרס, אשר בזמן עבודתו ביאהו היה אחרי לשיפור ביצועי האתרים, הוביל שינוי משמעותי בניתוח והבנה של זמן תגובת אתרים. במהלך עבודתו כתב סונדרס את הספר אתרי אינטרנט בעלי ביצועים גובהים ואת הכלי YSLOW שמנתח זמני טעינת תוכן בצד הלקוח ועצות לשיפור זמן הטעינה.
כחלק מתהליך בנית הקווים המנחים לשיפור הביצועים עשו סטיב וצוותו מספר מחקרים בתחום אשר שפכו קצת אור בתחום ביצועי אתרים.

משך טעינת עמוד

משך טעינת עמוד

הממצא המשמעותי בעבודתו של סונדרס הוא שהזמן שהעמוד נבנה בצד השרת (כולל הבקשה והחזרה של ה HTML) הוא כ 10% עד 20%. שיפורי ביצועים בשרת הנם הכרחיים לשיפור יחס כמות משתמשים לחומרה, וצריכת חשמל, אך משנים במעט את זמני התגובה של אתר ממוצע. רוב זמן הטעינה עובר על טעינה וניתוח של סקריפטים (CSS \ JS) וטעינה של תמונות ומשאבים אחרים מהרשת.

גישה לזיכרון המטמון

גישה לזיכרון המטמון

50% מהמשתמשים מגיעים לאתר ללא זיכרון מטמון וכ 20% מכלל הצפיות נעשה עם מנגנון ריק (המחקר נעשה על אתרי YAHOO) , חווית הטעינה הראשונית הנה הרבה יותר נפוצה מהמקובל לחשוב, וצריך לתכנן את האתר בהתאם.

ניתן ללמוד על מחקרים אלו ועוד בהרצאתו.

טכניקות לשיפור ביצועי אתר

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 18-11-2009

להלן נקודות למחשבה כשמפתחים שירותים בעומס גבוה:

תוכן סטאטי מוגש בצורה מהירה יותר (ובפחות עומס) מתוכן דינמי.

במידה ואפשר עדיף לעבוד עם מנגנוני מטמון שמקצרים זמני תגובה ומפחיתים עומסי חישוב, כמו הרבה בעיות בתכנון מערכות מדובר ביחס ישיר בין יכולות זיכרון ויכולות עיבוד. שמירת דפיHTML או מידע טקסטואלי (כגון XML JSON) בצורה סטאטית גם משתמש ביכולות מובנות של שרתי ה WEB ותומכים במנגנוני מדרג גדולים מאוד וגם חוסך זמן עיבוד יקר. על פי מקורות שונים ברשת מדובר בגדילה ממאות לאלפי קריאות בשנייה.

יש יותר לקוחות משרתים והם בדרך כלל במצב סרק (idel).

לכן אפשר לנצל כוח עיבוד עודף שנמצא במחשב הלקוח. טעינת ממידע בצורה גולמית (שעבר עיבוד מינימלי בשרת) וחישוב התוצאה בצד הלקוח מאפשרת הורדת עומס חישובי. גם אפשרויות של טעינה עצלה של תוכן (על פי דרישה) יכולה להקל על עבודת השרת.

כמות וגודל המשאבים משפיעה על זמן הטעינה.

עדיף לצמצם בכמות הקריאות לשרת ולהשתמש במנגנונים לצמצום כמות המידע שעובר ברשת, אם על ידי מנגנוני דחיסה ואם על ידי מנגנוני איחוד. דחיסת תוכן נעשית על ידי הפעלת מנגנוני דחיסה ברמת שרת ה WEB כגון GZIP (אשר נתמך על ידי פרוטוקול HTTP) ואם על ידי מנגנוני תוכנה שמבצעים אופטימיזציות על קוד קיים כגון jsmin או YUI Compressor או טכניקות פיתוח (שכיום דורשות יותר עבודה) כגון CSS Sprites

CAP and WEB 2.0

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 17-11-2009

twitter loadההנחה כי ניתן להבטיח שניים מתוך שלושת העקרונות עקביות, זמינות וסובלנות חלוקה היא אמתית וניתן לראות עדות לכך באתרים המצליחים ביותר.
ניתן להסיק כי CAP הנו מפתח למדרגיות (scalability) נוחה,משום שתהליך הגדילה נשאר זהה בכל קנה מידה. כמובן אין זה פתרון לכל בעיות השירות אך מעביר אותם לתחזוקה, תפעול, ניטור, עדכוני תוכנה וכדומה.
את ארכיטקטורת הגדילה ניתן לבנות בכל טכנולוגיה, אך ישנן כאלה שמשרתות את המטרה בצורה טובה יותר מאחרות. לדוגמה ניתן לראות את השינויים שטוויטר היו צריכים לעבור. השירות המקורי פותח ב Ruby on Rails , טכנולוגיה מאוד אפנתית שנחשבת  גמישה ואפקטיבית מאוד בבניית יישומי רשת. משתמשי טוויטר הוותיקים זוכרים את ההשבתות החוזרות והנשנות של השירות, עקב חוסר היכולת של השירות להתמודד עם עומסים. לאחר ניסיונות רבים של טוויטר לפתור את הבעיה בטכנולוגיה הקיימת הוחלט להמיר חלקים מהקוד של המוצר לסקאלה, טכנולוגיה שמאפשרת עיבוד מקבילי ומדרגיות בקלות, אפשרה לצוות טוויטר לשפר ביצועים במאות אחוזים ולאפשר את זמינות המערכת. בכתבה שפורסמה ברג'יסטר צוות טוויטר מספר על החוויות שעבר "היא גדלה איתנו (ruby on rails) במשך מספר חודשים, ולאחר מכן, בשלב מסוים, פשוט נתקעה במחסום" אמר פיין "והמחסום לא היה הקוד אלא סביבת ההרצה. ישנם הרבה דברים שרובי מעולה בהם אך תהליכי עיבוד ארוכים ? משימות הדורשות זיכרון רב ? לא כל כך" .

התמודדות עם CAP

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 11-11-2009

יש כמה אפשרויות להתמודדות עם בעיות שמוצגות על ידי CAP.  הפשוטות הן:

ויתור על סבילות חלוקה
אם אתה רוצה לרוץ בלי מחיצות אתה צריך לעצור אותן מלקרות. דרך אחת לעשות זאת היא לשים הכל (כל מה שקשור ליחידה אחת או טרנזאקציה) במחשב אחד, או ביחידה אטומית אחת כמו מתלה (rack). זה לא  100% בטוח כי עדיין יכולים להופיע כשלים, אבל יש  פחות סיכוי לקבל תופעות לוואי שנובעות מחלוקה. לשיטה זו יש מגבלת גדילה משמעותיות.

ויתור על זמינות
זהו הצד השני של המטבע.כאשר יקרה אירוע שמתמשך מעבר למחיצה (או צומת) אחת, השירותים המושפעים פשוט ימתינו עד עדכון הנתונים. שליטה זו יכולה להיות מורכבת למדי על צמתים רבים.

ויתור על עקביות
או, לקבל כי הדברים כי יהפכו "בסופו של דבר לעקביים".  המון סתירות לא באמת דורשות הרבה עבודה כמו שניתן לחשוב (כלומר עקביות רציפה היא כנראה לא משהו שאנחנו צריכים ממילא). בדוגמת הספרים (מהפוסט הקודם) אם שתי הזמנות יכנסו לספר שקיים רק פעם אחת במלאי , הלקוח השני יקבל הודעת זיכוי על הקניה.

קפיצת בסיס (BASE Jump)
הרעיון של להיות עקבי בסופו של דבר נתמך באמצעות מה שנקרא BASE ו(Basically Available, Soft-state, Eventually consistent) ראשי התיבות קצת מאולצים אבל עדיין שימושים.

תכנון עוקף
גיא פרדון מatomikos כתב פוסט מעניין שאותו כינה "פתרון CAP (הוכחה כי ברואר שגה)", מציע גישה אדריכלית שמספקת עקביות, זמינות וסבילות חלוקה, אם כי לא ניתן להשיג את כל שלוש המאפינים באותו הרגע.

CAP – אתה יכול לבחור רק שניים

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 11-11-2009

משפט CAP מתאר מערכת בעלת עם מבנה נתונים או מצב זיכרון (state) העונים על המאפיינים הבאים:

1. עקביות (Consistency) – כל לקוח של המערכת מקבל את אותם נתונים גם אם התבצעו עדכונים במקביל.
2. זמינות (Availability) – המערכת משרתת את כל בקשה של לקוחותיה.
3. סבילות חלוקה (Partition tolarance) – ניתן לפצל את מבנה הנתונים או מצב הזיכרון על פני מספר שרתים, או במילים אחרות לפצל את השירות על פני כמה צמתים ברשת.

הטענה היא שבתכנון ובניית מערכת ניתן לבחור רק שני מאפיינים מהשלושה .

להלן ההוכחה  (מקור ג'וליאן בראון)

intro[1]

התרשים מראה מערכת מחולקת אשר מכילה שני צמתים ברשת , N1 ו N2. שניהם חולקים פיסת מידע V (כמה עותקים לספר במלאי), עם הערך V0. על הצומת N1 רץ אלגוריתם שנקרא A ואנו יוצאים מנקודת הנחה שהוא צפוי, חסר באגים, ומהימן.על הצומת N2 רץ אלגוריתם דומה שנקרא B . בניסוי A כותב ערכים חדשים של V ו-B קורא ערכים של V.

CAP Scenario 1

התמונה למעלה מתארת תרחיש רגיל (המערכת עובדת כשורה) ,והפעולות הבאות יקרו:
1. Aכותב ערך חדש ל V (נקרא לו V1)
2. הודעה M עוברת מ N1 ל N2 ומעדכנת את העותק של V
3. כל קריאה של B תחזיר את הערך החדש V1

CAP Scenario 2

התמונה הזו מתארת טעות, הודעת העדכון (M) לא עברה. מכאן שבשלב 3 קריאה ל B תחזיר ערך לא עדכני.

קריאה ל A ו B יחזירו תוצאות שונות אני מקווה שכאן הבעיה כבר מובנת, נגדיל את קנה המידה לכמה מאות פעולות וזה הופך לבעיה גדולה. אם M הוא הודעה אסינכרונית אז לN1 אין דרך לדעת אם N2 קיבל את ההודעה. אפילו עם מסירה מובטחת של M , אין ל N1 דרך לדעת אם הודעה מתעכבת או שמשהו כשל בN2. הפיכת M לסינכרונית לא עוזרת כי התייחסות לסנכרון כפעולה אטומית יגרום לעקבת (latency בהעדר תרגום מתאים) וזה מפר את עקרון הזמינות. ההוכחה, באמצעות וריאציה,מראה כי אפילו במודל סינכרוני חלקי לא ניתן להבטיח אטומיות.

אז מה CAP אומר לנו ? שאם אנחנו רוצים ש A ו-B יהיו בעלי זמינות גבוהה (כלומר לעבוד עם עקבת מינימלית) ואנחנו רוצים שהצמתים N1 עד *N (כאשר * יכול להיות מאות או אפילו אלפים) יהיו בעלי סבילות חלוקה (שידעו להתמודד עם אבדון הודעות, הודעות שלא נשלחו, תקלות חומרה ותקלות תוכנה) אז לפעמים אנחנו הולכים לקבל מקרים שבהם הצמתים לא מסונכרנים וצומת אחד חושב כי V הוא V0 (עותק של ספר אחד) וצמתים אחרים יחשבו כי V הוא V1 (לא אותו עותק).

פיתוח צד שרת לשירותי רשת

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 08-11-2009

servers[1]שבוע טוב. בצד הלקוח ראינו סט מוגבל יחסית של טכנולוגיות,דבר הנובע מחסם בסיסי – אמון. התקנת אפליקציה כתנאי לשימוש בשירות מהווה חסם גדול ומצריכה יחסי אמון בין הגולש לשירות.

בצד השרת ישנו חופש טכנולוגי גדול וישנן הרבה יותר טכנולוגיות ופלטפורמות,אך אני לא אפרט בשלב זה על כך אלא על האתגרים שעומדים בפני מתן שירות WEB 2.0.

על פי הנחתי מפוסט קודם מאפיני שירות web 2.0 ישנו שינוי עיקרי מול שירותי "WEB 1.0" והוא כתיבה. בעולם ה WEB 2.0 כל משתתף בשירות יכול ליצור תכנים, פרט "קטן"המשנה את ארכיטקטורת התוכנה בגדול.

מערכות ה WEB 2.0 נאלצות להתמודד עם מבני נתונים עם קשרים מורכבים ותצוגות מידע אישיות למשתמשים. אם ב YNET כל אחד שנכנס רואה את אותו עמוד הבית אז בפייסבוק כל משתמש מקבל עמוד בית "פרטי" ודינאמי , תהליך הקטנת העומסים באמצעות מנגנוני מטמון (cache בהעדר תרגום מתאים) הופכת למסובכת מאוד.

יתר על כך בשנים האחרונות ניתן לראות עוד מאפיין שימוש שהפך לנפוץ והוא ה"מיקרו בלוגינג" , אם בטוויטר או שורת הסטטוס בפיסבוק האתגר הטכנולוגי הוא אחד, ודומה למתואר בפסקה הקודמת אך אם דרישות מהירות רענון גבוהה לכמויות מידע קטנות.

שירות web 2.0 ברמה גלובלית דורש זמינות מלאה ,שירות בסדר גודל של פליקר או דלישס דורש זמינות מסביב לשעון. אך אמור גם להגיב בצורה ראויה להתקהלות ספונטנית – ע"י ארכיטקטורת גדילה גמישה.

למרות שהשליטה על התוכן עברה לידי המשתמשים האחריות על יחידת המחשוב נשארו בידי ספק השירות, במקרה של הצלחה הגיעו סט של אתגרים חדשים בהתמודדות עם זמינות אחידות ויכולת ביזור שעליהם נכתבה טענת CAP.

כל זאת ועוד בהמשך :)

HTML5

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 05-11-2009

513636061_98d07f7966[1]תקן HTML5 הוא הגרסה הבאה של HTML והוא הסטנדרט הבא המומלץ ל HTML4.1 ו XHTML1.0, התקן החדש מבטא שינוי גישה וצורת מחשבה.

לאחר פיתוח התקן HTML 4 מגמת השוק דחפה את תקני XHTML עקב צורך בכללי סמנטיקה קפדניים יותר ומבניות קשיחה. באותה תקופה עדיין הסתכלו על עמוד HTML כמסמך ולא כעל אפליקציה ולכן תקן זה היה חשוב מאוד בקידום התעשייה ופישוט עבודת הדפדפנים (עקב מבניות קשיחה) ובכך אפשור הרצת דפדפנים על מכשירים ניידים (החלשים בכוח עיבוד) , בהסתכלי במבט לאחור למרות שהתקינה לא הצליחה להיקלט עד היום בצורה מלאה (מעטים מאוד, אם בכלל, האתרים שתומכים בצורה מלאה בתקני XHTML בגרסתו הקשיחה) התקן הביא למודעות את שיטת העבודה הסטנדרטיות וגרם להרמת רף התמקצעות המתכנתים בתחום.

כיום תקן HTML5 מציג שינוי גישה ומנסה לתת מענה סטנדרטי לשלל מנועי התצוגה (פלאש, סילברליט , וג'אווה אפקטס) בין התכונות החדשות של HTML5 בולטים :

וידאו ואודיו

היכולת להציג וידאו ללא תלות בהתקן נוסף הנו ללא ספק הנושא הנושא הכי מדובר בתקן החדש ובעיקר חוסר התקינה לגבי המפענחים (CODECS) לנגן. ממומש על ידי התגים <video><audio>

ממשק תכנותי לגרפיקה דו ממדית

API חדש המאפשר יכולות תצוגה בדו ממד בעצם מאפשר ציור ישיר ללא צורך בטעינת גרפיקה ממקור חיצוני כגון תמונות , לדעתי השימוש במקורות חיצוניים כגון תמונות לא יעבור מהעולם אך נתחיל לראות יישומים המכילים  אפליקציות ציור ועריכת תמונה. ממומש על ידי התג <canvas> וממשק תכנותי בג'אוסקריפט.

תגים סמנטיים

תגים חדשים שיחליפו את ה <div> הכללי כגון <nav>לתפריטי ניווט או <footer> ו <header> לראש ותחתית העמוד. אין לי ספק כי תגים אלה נועדו לניתוח יעיל יותר של תוכן הדף ומקודמים עלי ידי חברות עם אינטרס במנועי חיפוש , אם גם בגלל העובדה שהם יוצאי דופן במהותם ועדיין פונים לHTML כעמודי תוכן ולא כאפליקציות.

שמירת נתונים מקומית

שמירת נתונים מקומית על המחשב בצורה מוגברת (מעבר ליכולות ה Cookies) , דבר המאפשר ליצור אפליקציות שיכולות לעבוד גם במצב מנותק מהרשת. ניתן לראות מימושים דומים היום ב google gears  ו flash.

תקשורת בין מסמכים

היכולת לתקשר בין מסמכים בצורה תכנותית כבר קיים היום, עדיין לא ראיתי יותר מדי תוכן על התקן הזה אך אני משער שמדובר בתקשורת PUB/SUB שניתן לראות ב flash ו silverlight.

גישות לפיתוח ממשקי דפדפן 2.0 WEB

בנושא (דעה, מאמרים) ע"י דניאל בתאריך 04-11-2009

רוב ממשקי ה WEB 2.0 מפותחים כאתרי אינטרנט בטכנולוגיות HTML CSS JavaScript  אשר הינן תקינות של W3C ומהוות סטנדרט תעשייה בפיתוח אפליקציות ושירותים מבוססי דפדפן. ישנם גם ממשקים שמפותחים בטכנולוגיות אחרות, לרוב משום שהטכנולוגיות הסטנדרטיות אינן מספקות פתרון לצרכי האפליקציה.

html5HTML וטכנולוגיות W3C

תקינת איגוד האינטרנט העולמי מתחזקת ותוקנת סטנדרטים לפיתוח דפדפנים, אומנם אין זה חוק ואין אכיפה לעבוד לפי תקן אך כיום רוב יצרני הדפדפנים הפנימו את הערך בתקן אחיד ושואפים לעבוד על פי התקן. מה כך התקן לא מפורט מספיק ולפעמים ישנם שינויים (מובחן בעיקר בתצוגה) עקב פירוש שונה של אותה דרישה.

סט טכנולוגיות W3C

לפתח בסטנדרט לדפדפנים דורש ידע ב 3 טכנולוגיות לקוח עיקריות

  • HTML שפת תאגים המיועדת לעימוד אלמנטים בתוך הדפדפן (טקסט , גרפיקה וכו') היא שפה הצהרתית ואין בה מושגים כמו זמן, לולאות ומצב זיכרון משותף.
  • JavaScript שפה פרוצדורלית המשומשת לבניית מנועי התצוגה ותקשורת.
  • CSS שפה הצהרתית שמשמשת לעיצוב וסגנון התוכן.

עמוד HTML בן ימנו בדרך כלל מורכב מסך הטכנולוגיות האלה .

סטנדרטי W3C נתמכים על ידי חברות מובילות בתעשייה . היתרון בטכנולוגיות אלו שהן סטנדרטיות ונפוצות החסרונות – קצב השינויים והתפתחות הטכנולוגיה מאוד אטיים וחוסר בממשקי תוכנה (API) עדכניים.בשנים האחרונות גוגל תומכת ומקדמת מאוד את הסטנדרטים של W3C בניסיון להוציא את תקן HTML5 ניתן לשער כי מהלך זה נובע עקב בנית תשתיות התצוגה בצורה כמעט בלעדית על גבי סט טכנולוגיות זה והשקת הדפדפן כרום.

flash_cs3_logoAdobe Flash/Flex

טכנולוגיה קניינית שפותחה במקרומדיה אשר נקנתה בשנים האחרונות על ידי אדובי. מדובר בפלאג-אין ACTIVEX אשר מותקן על מערכת ההפעלה ומספק הרחבות תצוגה לדפדפן , כגון גרפיקה וקטורית, ניגון וידאו, אנימציה, וגישה לאמצעי קלט ופלט חיצונים כגון מצלמה מיקרופון ומדפסת. היתרון של טכנולוגיה זו הוא שהיא בשלה ונפוצה מאוד, היא מביאה לדפדפן יכולות תצוגה ואינטראקציה עשירות, מאז כניסת מיקרוסופט לשוק עם התוסף silverlight ניתן לראות התעוררות בתחום ופיתוח מואץ בשני המחנות. לדוגמה פלאש לעולם לא תמך בצורה מלאה בעברית או בשפות המוצגות מימין לשמאל, ורק לאחר כניסת המתחרה לתחום והכרזתה כי תתמוך בכל השפות פותח השיפור גם בפלאש ויצא עם הגרסה האחרונה.

microsoft_silverlight

Microsoft Silverlight

למרות שמדובר בטכנולוגיה יחסית חדשה מבית מיקרוסופט היא מבוססת על תשתית הדוט נט הוותיקה, דבר האיפשר לחברה להגיע למוצר ברמת מוכנות גבוהה בזמן קצר מאוד. המוצר אינו בשל אך קרוב מאוד וניראה כי יציג אלטרנטיבה לפלאש בשנים הבאות. היתרון בשימוש בטכנולוגיה זו הוא בעיקר מחזור שפות וכלים (אם המפתח מגיע מתחום הדוטנט). בתור מפתח עם נסיון בדוט נט ופלאש אני מתרגש מאוד מהטכנולוגיה ומחכה לרגע בו הטכנולוגיה תבשיל. אני לא אתפלא אם אראה אותה בעתיד הקרוב בצורה כזו או אחרת במכשירים ניידים ואולי כמתחרה לפלטפורמת AIR.

javafx_logo_color_1Oracle Java FX

אם מיקרוסופט נכנסו מאוחר אז מה אפשר להגיד על ההתעוררות האיטית של סאן.מדובר בפיתוח פלטפורמת תצוגה חדשה על גבי מנוע הג'אוה הקיים. סטטוס הפיתוח שלה הוא ראשוני, אך החזון שהחברה משדרת רחב ושם את הטכנולוגיה על "כל המסכים" (פיסי, טלויזיה, ונייד) כפי שהחברה קוראת לזה.
באיזו צורה תתפתח ג'אוה אפ אקס זו שאלה מאוד מעניינת, משום שסאן (החברה שפיתחה את ג'אוה) נקנתה לפני מספר חודשים על ידי אורקל. וטכנולוגיה בשלב כ"כ צעיר יכולה להעלם בחזון המחודש של החברה.

עדכון בתגובה ל @ArialBH "סילברליט לא בשל ?"

לצערי קשה לי להציע את הפלטפורמה ללקוחות בעיקר בגלל הסיבה שהיא לרוב מצריכה התקנה של הפלאג, לעומת פלאש שמותקן ב 90% מהמקרים. הפיצ'ר סט שלהם הוא די דומה, לדוגמה אם לקוח היה צריך להשתמש במאפין ספציפי שלא קיים בפלאש (כמו פיתוח קודקים לוידאו) הייתי ממליץ על הטכנולוגיה אבל ברוב המקרים פלאש נותן יותר וגם יש מאחוריו קהילת מפתחים גדולה מאוד.

בעצם מה שאני מנסה להגיד זה שהבשלות היא גם אימוץ הטכנולוגיה ע"י מפתחים וגולשים.

מעבר לכך (זהירות קיטור) אולי אני לא קולט את הכלים (בלנד, vs) אבל שאני מנסה ליצור ממשקים הם לא יוצאים חלקים (smooth בהעדר תרגום מתאים) כמו בטכנולוגיות אחרות. אולי זה המנוע תצוגה ? אולי לא …  בכל מקרה אני מאמין שבקרוב יגיע היום שאוכל למכור ללקוחות פתרונות על סילברלייט.