צילום: אתר רשמי אימג`סטור מערכותשאלת השאלות: באיזה כתב נמסרו למשה רבנו לוחות הברית? לכאורה, התשובה די פשוטה: בעברית, אולם מתברר כי לשאלה המסקרנת הזאת, אין תשובה חד משמעית במקרא, ויש הסבורים כי הלוחות נכתבו בליבונאה, (כתב דעץ) - הכתב בו השתמשו הכותאי (כינוי לשומרונים).
רש"י מפרש את המונח "ליבונאה": "אותיות גדולות כמין אותן שכותבין בקמיעות ומזוזות".
ואכן בקמיעות משתמשים לעיתים רבות במילים ובאותיות מיוחדות השאולות מהכתב העברי הקדום ומלשון הקודש, שמקורם ככל הנראה באותו כתב שומרוני עתיק.
השבוע, הציג אפרים רייך, חסיד צאנז והבעלים של חברת "אימג`סטור מערכות", מהגדולות בארץ בתחום סריקת מסמכים וניהול מידע, שיתוף פעולה עם חברה חדשה המתמחה בפתרונות מולטי-דיסציפלינריים בתחום ה-NLP (עיבוד שפה טבעית) והזיהוי הקולי (Speech Recognition) בשילוב בינה מלאכותית, חברה ששאבה מתברר את שמה מאותו כתב עברי קדום - ליבונאה.
את "ליבונאה" הקים אור אנידג`ר, דוקטורנט צעיר למדעי המחשב, חוקר בכיר בתחומי הבינה המלאכותית, ולשעבר המדען הראשי בחטיבת הסייבר-מודיעיני של חברת "אלביט מערכות", המשמש כמנכ"ל שותף. יחד עם "אימג`סטור מערכות" הוא עמל על פיתוח מערכת היברידית חדשנית בתחום עיבוד וזיהוי קול ושפה, לשימוש שוטף במרחב הדיגיטלי ובתחומי חיים רבים.
מימין לשמאל: אור אנידג`ר, אפרים רייך, ניר כהן ושמואל אגמון. צילום: רפי דלויהלמעשה, מדובר באחד האפיקים המרכזיים שחווים התקדמות משמעותית בתוך עולמות הבינה המלאכותית, תוך ייעול תהליכי עבודה המבוססים כאמור על קריאה של חומר טקסטואלי נרחב. תכלית החברה - לסייע בסופו של יום בחילוץ תוכן רלוונטי מתוך הררי מידע, תוך יכולת ניתוח גבוהה של חומרים שמערכת הבינה המלאכותית שלה מנטרת, מרכזת ומפענחת באמצעות רשתות נוירונים מלאכותיות המחקות את תהליך הלמידה במוח האנושי.
"החיבור שבין החדשנות שבמערכת שלנו, לבין הניסיון הרב בתחום ניהול המידע של "אימג’סטור" ולשיתוף הפעולה השוטף שיש לנו עם האקדמיה, מעניקים לנו יתרון שאין לו מתחרה, בכל הקשור למתן שירות בטכנולוגיות המתקדמות ביותר לגופים המובילים בארץ", מציין אנידג`ר ומוסיף: "כבר עתה נמצאים במצבת הלקוחות המשותפת שלנו גופים ממשלתיים, פיננסיים, מודיעיניים ורפואיים".
את ראשית מחקר עיבוד השפה נהוג לייחס כידוע לאלן טיורינג, שפרסם כבר לפני 70 שנה בכתב העת Mind את עבודתו "Computer machinery and Intelligence", שממנה אף נולד "מבחן טיורינג", כמדד אפשרי לאופן שבו יש למכונה כלשהי אינטליגנציה.
אף שלמידת שפה נתפשת כפעולה טבעית — מדובר באחד האתגרים המורכבים בעולם המחשוב, ולא בכדי רייך שחברתו מתמחה בפיתוח כלי תוכנה להסבה אלקטרונית של מסמכים בתהליכי סריקה ומפתוח דיגיטליים, לטובת ניהול יומיומי וניהול ארכיון ממוחשב, גאה מאד בשיתוף הפעולה המדובר.
ניכר כי מטרתו - לשכנע כמה שיותר גופים להסתייע בטכנולוגיה החדשנית, החוקרת את השפה האנושית על גווניה השונים, ובכך לעזור להם בפעולות מסובכות יותר משאנו מכירים כיום.
"כמו בכל ענפי הבינה המלאכותית, המרכיב העיקרי שמאפשר את התקדמות היכולות הטכנולוגיות הוא הדאטה", אומר רייך ומבאר, "כמות עצומה של מידע מתויג; כוח מחשוב — שמשתפר כל הזמן; ואלגוריתמיקה, שמתפתחת לצד התקדמות שני התנאים הקודמים", אך לדבריו להבדיל מזיהוי תמונה, שהיא למעשה ייצוג סטטי של המציאות, השפה היא דינמית וכמות הייצוגים של כל מילה ומילה בה עשויה לקבל פרשנות שונה בכל משפט.
כדוגמה הוא מציין את המילה העברית לַבָּנֶה (גבינה), אשר יכולה לקבל משמעויות נוספות, למשל לְבָנָה (ירח), לְבֵנָה (אבן), לִבְּנָה (הפך לבן), לִבֵנָה (הבן שלה).
"מדובר ביישום היברידי העוסק בבעיות מולטי דיסיפלינריות הקשורות לעיבוד ומניפולציה של שפה טבעית על ידי כלים של רשתות נוירונים ולמידה עמוקה", הוא רייך.
"זהו יישום שבכוחו לנתח ולהבין שפה טקסטואלית וגם קבצי אודיו. להבדיל מיישומים אחרים הקיימים בשוק שיודעים לטפל רק בסוגים ספציפיים של מידע מונו-דיסיפלינרי, המערכת של ליבונאה יכולה לזהות אובייקט במסמך על פי הקשרו הסמנטי וכך להבחין בין המשמעויות השונות של המילה "לבנה" כתלות בקונטקסט, ולהבין האם מדובר בשם פרטי, האם מדובר בצבע הנראה הבהיר ביותר, באבן מלבנית המשמשת לבנייה או בסוג שיח בר נמוך עם עלים לבנים וגזע לבן, וכך לזהות תבניות משפטיות ולזהות את המשמעות הראשונית מאחורי המילה".
יודגש, המערכת של ליבונאה יכולה לנתח מעל ל-100 שפות עכשוויות ובכלל זה גם את השפה העברית (המודרנית והקדומה כאחד), לרבות שפות שמיות נוספות, זאת כאמור ללא שימוש בבלשני שפה או במנועים מבוססי חוקים, ובכך נודעת לחברה מלבד יתרונה הרב בפיתוח מערכות מבוססות למידה עמוקה לפענוח וניתוח של ייצוג של מילים שונות בשפה נקובה כלשהי ובמתן כלים שיעזרו בייעול משימות וקבלת החלטות על ידי השימוש בשפה טבעית כממשק, גם חשיבות גבוהה גם כמי שעשויה לתרום רבות לחקר פליאוגרפים (כתבי יד) עתיקים.