שעשועי AI – איזה תמונה מספקים מודלי ה-AI כשמספקים להם בדיוק אותה הנחיה

כתבהמשהו חכם

הנה שאלה שכנראה ידענו עליה את התשובה, עורך האתר ואנוכי, עוד לפני שהזנקנו את הפרויקט הקטן הזה לדרך – מה נקבל כתשובות מהצ'אבוטים השונים ששואלים אותם בדיוק את אותה שאלה, האם אלו אותן תשובות בדיוק, האם יש אמת אחת ביקום של הבינה המלאכותית (AI) או שתלוי איזה מודל שואלים, ואולי אפילו מתי.

טוב, היה לנו די ברור, במהלך השיחות שניהלנו לפני, שהתוצאות יהיו שונות. אחרת, כנראה, הכתבה הזו לא הייתה הופכת למציאות. אבל לא ידענו עד כמה השינוי יהיה עמוק, האם יהיו קווי דמיון ברורים מאוד, וכל מנוע יעשה את קצת אחרת, או שיהיו הבדלים בלתי נסבלים.

אז נשלחתי לעשות ניסוי קטן, מאוד לא מחייב – אם תרצו, סוג של שעשוע קל: לתת לשלושה מודלים מובילים, בלי לעשות חקר שוק עד כמה זה נכון, ליצור תמונות בהתאם להנחיות שהענקתי להן.

השיטה

בחרתי בכוונה הנחיות מעט מתפתלות, והתמונות שמוצגות כאן מייצגות את התוצאות של שתי ההנחיות בכל שלושת המונעים, כפי שהן פלטו מקרביהן לאחר זמן מה.

ההנחיות נכתבו במודל הראשי, בלי לעשות דבר מעבר לכתיבת ההנחיה – פרומפט אם אתם מתעקשים – ולחיצה על Enter. נתתי לצ'אטבוט ליצור את התמונה כפי שהוא מבין לנכון עם בחירה משלו במה בדיוק להשתמש. אפילו לא הצצתי.

התמונות סודרו וקוצצו כדי להתאים את הגודל של כולן אחת לשנייה. לא מוצגות כאן התמונות המלאות, אבל הן כן מכילות את כל מה שצריך כדי להראות את ההבדלים העיקריים, ובקטן.

גם אין לי מסקנה מה יותר טוב, מה פחות טוב, זו לא הנקודה. רק רציתי להראות את ההבדלים המהותיים – ומשם שכל אחד יסיק בעצמו מה זה אומר בעצם על אמת בבינה מלאכותית.

הנחיה ראשונה

"איור קולנועי מחולק לשניים המדגים את המתח בין אופטימיזציה אלגוריתמית לבין הכרעה אנושית מודעת. בצד שמאל יד רובוטית מתכתית לוחצת על כפתור מקלדת זוהר עם המילה GENERATE. מסכים דיגיטליים מציגים שלוש וריאציות שקיעה: אחת דרמטית עם ניגודיות גבוהה, אחת רכה וחמימה, ואחת ריאליסטית אך שטוחה רגשית. תאורה כחולה קרה, שכבות ממשק עתידניות, אווירה טכנולוגית נקייה. בצד ימין יד אנושית מחזיקה עט מעל מחברת פתוחה עם סימן וי מודגש. ברקע נוף שקיעה זהוב מעל ים והרים, אור טבעי חם, שולחן עץ עם כוס קפה ומשקפיים. חלוקה אנכית עדינה במרכז עם אפקט קרע אור. ניגוד צבעים ברור כחול מול כתום, רמת פירוט גבוהה, תאורה קולנועית, יחס 16:9 חדות מקסימלית".

בהנחיה הזו אין למעשה, כמו קוראים, הבדלים מהותיים, אבל במקביל אי אפשר להתעלם מההבדלים הרבים – אבל באמת לא נורא. מה שכן הפריע לי מאוד היה שלמרות הבקשה היחס של 16:9 לא בוצע בפועל, והכי מהותי הייתה התמונה של Gemini שהייתה בתוך ריבוע מדויק של 1024×1024 פיקסלים.

הנחיה שנייה

"נהר של ביטים שזורמים על בסיס אנלוגיית הנהר של הרקליטוס. הנהר צריך להחיל בתוכו מספרים בינאריים ותמונות שעוברות אופטימיזציה שונה בכל פעם, הכל על בסיס האנלוגיה של הרקליטוס, זה צריך להראות כמו תהליך שחוזר על עצמו בלחיצת כפתור של משתמש שיוצר תמונת AI או לחלופין בורא מסתורי כאנלוגיה לבן אדם שיוצר תמונה אבל בהתחשב במגבלות הטכנולוגיות של כל מנוע AI".

הפעם ההבדלים פשוט זעקו לשמיים. הנחיה יותר קצרה, התוצאות כל כך לא דומות וזאת לעומת ההנחיה הראשונה שהייתה יותר ארוכה וכנראה הובילה לכך שהתוצאות היו די דומות. בנוסף, בעוד המנוע של OpenAI והמנוע של גוגל (Google) הניבו תמונה בדיוק באותה רזולוציה, כריבוע שלם, המנוע של מיקרוסופט (Microsoft) הפיק תמונה באותו רוחב אבל יותר ארוכה באופן משמעותי.

מילות סיום

כפי שנכתב בהתחלה. אין פה מסקנה של מה יותר טוב, אבל יש בהחלט מסקנה שיש הבדלים מהותיים בתגובה לאותן הנחיות – וככל שההנחיות פחות מפורטות, התוצאות שונות עוד יותר – וכן, לא צריך מחקר עמוק במיוחד כדי להבין את זה.

עד כמה זה בא לידי ביטוי בשאילתות טקסטואליות ובחיפוש מידע? שמישהו אחר ירים את הכפפה. אני באתי רק קצת להשתעשע.

.

השתתף בכתיבה: צבי קצבורג
יצירת תמונה ראשית: Gemini
.

Leave a Reply

Your email address will not be published. Required fields are marked *