חזרה לפרויקטים
ארגוני2023Confidential — global enterprise
Atlas Semantic
חיפוש היברידי בקצה מעל 80M מסמכים ארגוניים

80M
01מסמכים שאונדקסו
<200ms
02לייטנסי שאילתה
-71%
03זמן לתוצאה ראשונה
[ סקירה ]
Atlas Semantic הוא מנוע שליפה היברידי שמאנדקס 80 מיליון מסמכים פנימיים ומשרת שאילתות מתחת ל-200 מ"ש מהקצה — סוף סוף נותן לכוח עבודה גלובלי שדה חיפוש שבאמת מוצא.
01
האתגר
המנוע הקודם היה אינדקס BM25 שהוזנח חמש שנים. עובדי ידע איבדו שעה ביום בניסיון למצוא מדיניות, מצגות וחוזים שידעו שקיימים.
02
הגישה שלנו
הוספנו אמבדינגים צפופים מעל קורפוס ה-BM25 הקיים, הוספנו דירוג מחדש cross-encoder על 50 המועמדים הראשונים, ודחפנו את שכבת ההגשה ל-Cloudflare Workers עם רפליקות וקטור אזוריות כדי להגיע מתחת ל-200 מ"ש מכל מקום בעולם.
03
התוצאה
ציוני המציאות הוכפלו, זמן לתוצאה ראשונה ירד ב-71%, ושדה החיפוש הפך לכניסה ה-#1 לבסיס הידע של החברה — בפעם הראשונה אי פעם.
04
מה נבנה
- שליפה היברידית BM25 + אמבדינגים בקנה מידה של 80M
- דירוג מחדש cross-encoder על 50 המועמדים הראשונים
- הגשה בקצה עם רפליקות וקטור אזוריות
- סינון מודע הרשאות בזמן שאילתה
הפרויקט הבא
CognitoFlow Engine
חשיבה אוטונומית לשרשרת אספקה בקנה מידה של Fortune 500
המשך