חזרתי מחופש ואני שמח להביא לכם את העדכונים החשובים ביותר מעולם ה-AWS למפתחים. השבוע עדכונים בתחום ה-Generative AI, ביצועי AWS במהלך Amazon Prime Day וחגיגות עשור ל – Amazon Aurora.
Count Tokens API למודלים של Claude ב – Amazon Bedrock
ל – Amazon Bedrock נוסף API חדש – Count Tokens – המאפשר למפתחים לקבוע כמה טוקנים קיימים בפרומפט או בקלט מסוים לפני שליחתו למודל בפועל. בשלב זה, ה-API תומך במודלים של Claude מבית Anthropic.
זוהי תוספת משמעותית עבור מפתחים המשתמשים ב-LLMs, מכיוון שהיא מאפשרת:
- הערכה מדויקת יותר של עלויות השימוש במודלים
- שליטה טובה יותר במגבלות הטוקנים ב-Amazon Bedrock
- וידוא שהפרומפטים מתאימים למגבלת האורך של המודל
- אופטימיזציה יעילה יותר של הפרומפטים
הנה דוגמת קוד פשוטה לשימוש ב-Count Tokens API:
import boto3
import json
bedrock_runtime = boto3.client("bedrock-runtime")
input_to_count = json.dumps({
"anthropic_version": "bedrock-2023-05-31",
"max_tokens": 500,
"messages": [
{
"role": "user",
"content": "מהם היתרונות של שימוש בטכנולוגיית Generative AI בארגונים?"
}
]
})
response = bedrock_runtime.count_tokens(
modelId="anthropic.claude-3-5-haiku-20241022-v1:0",
input={
"invokeModel": {
"body": input_to_count
}
}
)
print(response["inputTokens"])
המספרים של Amazon Prime Day 2025
בחודש אוגוסט התקיים Prime Day 2025, אירוע הקניות הגדול של אמזון, והמספרים מאחורי הקלעים של השירותים התומכים באירוע הם פשוט מדהימים. האירוע הציג את היכולת של AWS לתמוך בעומסים אדירים וחסרי תקדים, והנה כמה מהמספרים המרשימים:
- AWS Lambda ביצעה יותר מ-1.7 טריליון הרצות ביום במהלך Prime Day 2025.
- Amazon DynamoDB הגיע לשיא של 151 מיליון בקשות בשנייה.
- Amazon ECS עם AWS Fargate הריץ בממוצע 18.4 מיליון משימות ביום, עלייה של 77% בהשוואה לשנה שעברה.
- Amazon API Gateway עיבד מעל לטריליון בקשות שירות פנימיות, עלייה של 30% בבקשות בממוצע ליום לעומת Prime Day 2024.
- Amazon CloudFront סיפק יותר מ-3 טריליון בקשות HTTP במהלך שבוע ה-Prime Day העולמי, גידול של 43% בהשוואה לאשתקד.
- Amazon ElastiCache הגיע לשיא של מעל 1.5 קוואדריליון (כמה אפסים זה???) בקשות יומיות ולמעלה מ-1.4 טריליון בקשות בדקה.
המספרים הללו מראים כיצד ארכיטקטורה נכונה של microservices עם שירותים מנוהלים יכולה לגדול בצורה יוצאת דופן. עבור מפתחים, הלקחים מהארכיטקטורה הזו יכולים להיות שימושיים גם במערכות בקנה מידה קטן יותר.
מבחינה טכנית, אמזון מדגישה את חשיבות הבדיקות לפני אירועים גדולים:
- אמזון הריצה מעל 6,800 ניסויי AWS Fault Injection Service (AWS FIS) – פי שמונה יותר מאשר ב-2024 – כדי לבדוק את חוסן המערכת ולהבטיח זמינות גבוהה.
- האינטגרציה של בדיקות FIS כחלק מתהליכי ה – CI/CD תרמה לשיפור המשמעותי בהיקף הבדיקות.
Amazon Aurora חוגגת עשור לפעילותה
כפי שצוין בסיכום השבועי של AWS, Amazon Aurora חגגה עשור לקיומה ב-21 באוגוסט. זהו רגע משמעותי עבור אחד המוצרים המשמעותיים ביותר של AWS בתחום הדאטה.
כש – Aurora הושק ב-2015, הוא חולל מהפכה בתחום מסדי הנתונים על ידי הפרדת החישוב והאחסון. כיום, האפשרויות והיכולות שהוא מציע כוללות:
- תמיכה במסדי נתונים תואמי MySQL ו-PostgreSQL
- Aurora DSQL – יכולת SQL מבוזרת לביצועים משופרים
- יכולות Serverless המאפשרות התרחבות אוטומטית
- תמחור I/O-Optimized
- אינטגרציות zero-ETL עם שירותים אחרים
- תמיכה ביכולות Generative AI
כדוגמה לחידושים האחרונים (ובהקשר לסעיף הקודם), Aurora DSQL קיבל תמיכה בבדיקות עמידות וחוסן של המערכת עם AWS Fault Injection Service, המאפשר למשתמשים לדמות תרחישים מהעולם האמיתי שמשבשים חיבורים לשרותי Aurora DSQL.
Amazon RDS for PostgreSQL תומך כעת ב-Delayed Read Replicas
Amazon RDS for PostgreSQL הוסיף תמיכה ב-delayed read replicas, המאפשרת למפתחים לציין פרק זמן מינימלי שבו Replica DB מפגר אחרי מסד הנתונים המקורי. תכונה זו יוצרת מרווח בטחון מבוסס זמן, המסייע להגן מפני אובדן נתונים עקב טעויות אנוש ומונע את ההעתקה של הטעות ל – Replica.
במצבי התאוששות מאסון, מנהלי מסדי הנתונים יכולים כעת:
- להשהות Replica לפני החלת שינויים בעייתיים
- לחדש Replica עד למיקום ספציפי ביומן
- להפוך את ה – Replica למסד הנתונים הראשי החדש שלהם (Promote)
גישה זו מאפשרת התאוששות מהירה יותר בהשוואה לפעולות שחזור נקודתיות מסורתיות, שעשויות לקחת שעות למסדי נתונים גדולים.
הנה דוגמה כיצד להגדיר read replica מושהה באמצעות AWS CLI:
aws rds create-db-instance-read-replica --db-instance-identifier my-delayed-replica --source-db-instance-identifier my-source-db --availability-zone us-east-1a --replica-delay 3600
הקוד הזה יוצר שכפול קריאה בעיכוב של 3600 שניות (שעה אחת) מאחורי המקור, מה שנותן לכם חלון זמן לגלות ולהגיב לשינויים בעייתיים.
סיכום
זה הכל להשבוע. מזל טוב ל – Aurora ואני מקווה שמצאתם את הסקירה השבועית הזו מועילה. אם יש לכם שאלות או תגובות, אשמח לשמוע מכם! ניפגש בשבוע הבא עם עוד עדכונים מרתקים מעולם ה-AWS.
עוד חדשות AWS – בעמוד ה – News.