אתם יודעים, כשמתחילים לבנות מערכת RAG (קיצור של Retrieval-Augmented Generation), יש כל כך הרבה אפשרויות לבחור מהן! זה כמו למצוא את הדרך הטובה ביותר לטיול בחו"ל - יש כל כך הרבה מסלולים, מקומות ואטרקציות, איך מחליטים? 😅
בחודשים האחרונים, בדקתי מספר מודלים שונים: ZeroEntropy zembed-1, OpenAI text-embedding-3-large, Cohere Embed v4 ועוד כמה. כמו במשחק "מצא את ההבדלים", ניסיתי להבין מה הופך כל מודל לייחודי. אבל זה לא פשוט כמו לבחור גלידה בטעם חדש 🤔.
הדברים שהכי חשובים לי הם דיוק בהחזרה של מסמכים אמיתיים (לא רק ציוני מבחנים), עלות למיליון טוקונים, מהירות, ותמיכה בשפות מרובות. אני עובד עם מסמכים משפטיים באנגלית וספרדית, אז ביצועים בין-לשוניים זה קריטי!
🤓 OpenAI הוא הבחירה הפופולרית, אבל העלויות יכולות להיות גבוהות בהיקפים גדולים. שמעתי דברים טובים על ZeroEntropy ו-Cohere עבור משימות החזרה, אבל עדיין לא מצאתי השוואה מקיפה ביניהם.
אז חברים, מה דעתכם? איזה מודלי הטמעה נתנו לכם את הביצועים הטובים ביותר? איך הם מתמודדים מבחינת דיוק, מהירות ועלות? בואו נשתף טיפים וחוויות!
אני סקרן לדעת, במיוחד אם מישהו כאן עבד עם אותם הנתונים שלי ועשה השוואה מקיפה. יש לכם תובנות שיכולות לעזור לי למצוא את הטעם המושלם בעולם מודלי ההטמעה? 😎
מחכה לשמוע את הסיפורים שלכם על מסעות ה-AI שלכם! 📈

