חדשות AWS השבוע: Amazon Bedrock, Graviton4, AppSync Events וחידושים נוספים

AWS השבוע

שלום לכולם, חזרתי מחופש. AWS השבוע היה עמוס בהכרזות משמעותיות, עם דגש מיוחד על חידושים בתחום ה-AI, שיפורים בשירותי הליבה, ותשתיות חדשות. הפעם נסקור את ההתפתחויות המשמעותיות ביותר שיכולות להשפיע על הפיתוח והארכיטקטורה שלכם בענן. מהאינטגרציות החדשות של Amazon Bedrock ו-Q Developer, דרך מכונות EC2 מבוססות Graviton4 החדש, ועד לשיפורים בשירותים כמו AppSync Events. יש לנו הרבה חדשות השבוע, בואו נצלול לפרטים!

Amazon Bedrock: אופטימיזציה של Prompts וניתוב חכם

Amazon Bedrock קיבל השבוע שתי תכונות חשובות שזמינות כעת באופן כללי (GA) – Intelligent Prompt Routing ו-Prompt Optimization. אלו כלים חיוניים שיעזרו לנו כמפתחים לשפר את יעילות האפליקציות המבוססות על מודלים גדולים ולמקסם את היחס בין ביצועים לעלות.

Amazon Bedrock Intelligent Prompt Routing מאפשר ניתוב אוטומטי של prompts למודלים שונים בתוך אותה משפחת מודלים. המערכת מחליטה איזה מודל מתאים ביותר לפרומפט ספציפי, ומסייעת לנו לאזן בין איכות התשובות לבין עלות השימוש. עכשיו אפשר להגדיר קריטריונים לניתוב ולבחור כל שני מודלים מאותה משפחה. התכונה תומכת כעת במודלים הבאים:

  • משפחת Anthropic Claude עם Haiku, Haiku 3.5, Claude Sonnet 3.5 v1, Claude Sonnet 3.5 v2
  • משפחת Meta Llama עם Llama 3.1 8B, 70B, 3.2 11B, 90B ו-3.3 70B
  • משפחת Amazon Nova עם Nova Pro ו-Nova Lite

התכונה השנייה היא Prompt Optimization, שעוזרת לשפר prompts באופן אוטומטי. הכלי יודע לשכתב prompts כדי לקבל תוצאות טובות יותר ויעילות יותר על מודלים של Anthropic, Llama, Nova, DeepSeek, Mistral ו-Titan. כמפתחים, אנחנו יכולים להשוות בין הגרסאות המקוריות למשופרות ולשמור אותן ב-Amazon Bedrock Prompt Management.

שני הכלים הללו מאפשרים לחסוך זמן ולמקסם את הערך מהמודלים שלנו, במיוחד כשמדובר באפליקציות הדורשות דיוק גבוה או יעילות תפעולית.

Amazon Q Developer: הסוכן החכם החדש לפיתוח תכונות

Amazon Q Developer קיבל שדרוג משמעותי עם שחרור Agent פיתוח תוכנה חדש שמשיג ביצועים מובילים בתעשייה במדדי הייחוס SWTBench Verified (49%) ו-SWEBench Verified (66%) (פרטים בפוסט המקורי). הסוכן החדש כולל כלים לתכנון והסקה שמנצלים את מלוא היכולת של מודלים מתקדמים.

מה שמעניין במיוחד עבורנו כמפתחים הוא שהסוכן רץ בסביבה ייעודית עם גישה מובנית לכל הפונקציונליות של IDE מודרני. הוא מסוגל לייצר מספר פתרונות אפשריים לבעיה נתונה, לבחור את המבטיח ביותר, ולהחזיר קוד באיכות גבוהה יותר למפתח.

כדי להשתמש בסוכן החדש, אנחנו פשוט מקלידים ‘dev/’ בחלון הצ’אט של Q בסביבות הפיתוח Visual Studio Code או JetBrains. הפיצ’ר הזה יכול לחסוך לנו המון זמן בדיבוג ולאפשר לנו להתמקד בפיתוח ברמה גבוהה יותר ובחדשנות.

AWS AppSync Events: אינטגרציות עם Data Sources

AWS AppSync Events קיבל תכונה משמעותית חדשה: אינטגרציות עם Data Sources עבור Channel Namespaces. התוספת הזו מאפשרת למפתחים לקשר פונקציות Lambda, טבלאות DynamoDB, בסיסי נתונים של Aurora ומקורות נתונים נוספים ולטפל ב-Channel Namespaces כדי לעבד נתונים מאותו מקור.

עם היכולות החדשות, אפשר ליצור תהליכי עבודה מתוחכמים לעיבוד אירועים:

  • שימור אירועים ישירות ב-DynamoDB
  • שינוי וסינון אירועים שפורסמו באמצעות פונקציות Lambda
  • הפעלת בקרת גישה ותיקוף נתונים

הנה דוגמה כיצד לכתוב קוד פשוט ששומר אירועים ל-DynamoDB:

import * as ddb from '@aws-appsync/utils/dynamodb'
import { util } from '@aws-appsync/utils'

const TABLE = 'events-messages'

export const onPublish = {
  request(ctx) {
    const channel = ctx.info.channel.path
    const timestamp = util.time.nowISO8601()
    return ddb.batchPut({
      tables: {
        [TABLE]: ctx.events.map(({id, payload}) => ({
          channel, id, timestamp, ...payload,
        })),
      },
    })
  },
  response(ctx) {
    return ctx.result.data[TABLE].map(({ id, ...payload }) => ({ id, payload }))
  },
}

התכונה החדשה הזו מפשטת משמעותית את הארכיטקטורה של אפליקציות בזמן אמת ומפחיתה את זמן הפיתוח והעומס התפעולי עבור פיתוח frontend של יישומי web ומובייל.

מכונות Amazon EC2 מבוססות Graviton4 עם אחסון NVMe SSD

AWS הציגה משפחות מכונות EC2 חדשות מבוססות מעבדי Graviton4 עם אחסון NVMe SSD מקומי: C8gd (לביצועי מעבד), M8gd (לשימוש כללי) ו-R8gd (לביצועי זיכרון). המכונות החדשות מספקות ביצועים משופרים ב-30% לעומת מכונות מבוססות Graviton3, ביצועים גבוהים ב-40% עבור עומסי עבודה של בסיסי נתונים עם דרישות קלט/פלט גבוהות, ותוצאות שאילתות מהירות ב-20% עבור ניתוח נתונים בזמן אמת.

היתרונות המרכזיים של המכונות החדשות:

  • מכונות גדולות יותר עם עד פי 3 יותר vCPUs (עד 192 vCPUs)
  • פי 3 יותר זיכרון (עד 1.5 TB)
  • פי 3 יותר אחסון מקומי (עד 11.4TB של אחסון NVMe SSD)
  • רוחב פס זיכרון גבוה ב-75%
  • פי 2 יותר מטמון L2 בהשוואה לקודמיהם מבוססי Graviton3

אפשר גם להתאים את רוחב הפס של הרשת ושל Amazon EBS במכונות אלו בעד 25% באמצעות EC2 instance bandwidth weighting configuration, מה שמעניק גמישות רבה יותר בהקצאת משאבי רוחב הפס לטובת אופטימיזציה של עומסי העבודה.

שרתים אלו מתאימים במיוחד ליישומים מבוססי Linux כמו:

  • קונטיינרים ו – Microservices שנבנו באמצעות Amazon EKS, Amazon ECS, Amazon ECR, Kubernetes, ו-Docker
  • יישומים שנכתבו בשפות תכנות פופולריות כמו C/C++, Rust, Go, Java, Python, .NET Core, Node.js, Ruby, ו-PHP

אזור זמינות חדש במרילנד עבור האזור US East (N. Virginia)

AWS הודיעה על הוספת אזור זמינות חדש במרילנד לאזור US East (Northern Virginia), אשר צפוי להיפתח ב-2026. אזור הזמינות החדש יתחבר לאזורי הזמינות האחרים באמצעות חיבורי רשת ברוחב פס גבוה ובעלי Latency נמוך על גבי סיבים ייעודיים, עם Redundancy מלא.

עבור המפתחים שלנו, זו חדשה משמעותית מכיוון ש-US East (Northern Virginia) הוא האזור הראשון שהושק על ידי AWS, והוא עדיין אחד האזורים הפופולריים ביותר. התוספת של אזור זמינות נוסף תשפר את היתירות ותתמוך בצמיחה המהירה של עומסי עבודה מבוססי AI ומחשוב מתקדם באזור זה.

כל אזורי הזמינות מופרדים פיזית באזור על ידי מרחק משמעותי, אך עדיין נמצאים בתוך 100 ק”מ זה מזה. ביצועי הרשת מספיקים כדי לבצע רפליקציה סינכרונית בין אזורי הזמינות במרילנד ובווירג’יניה בתוך האזור US East. אם האפליקציה שלכם מחולקת על פני מספר אזורי זמינות, עומסי העבודה שלכם מבודדים ומוגנים טוב יותר מבעיות כמו הפסקות חשמל, סופות ברקים, טורנדו, רעידות אדמה ועוד.

Amazon Redshift Serverless Reservations

Amazon Redshift הציג אפשרות תמחור מוזלת חדשה: Serverless Reservations עבור Amazon Redshift Serverless. עם אפשרות זו, אפשר לחסוך עד 24% ולקבל יותר יכולת חיזוי עלויות עבור עומסי העבודה האנליטיים.

באמצעות Serverless Reservations, אפשר להתחייב למספר מסוים של Redshift Processing Units (RPUs) לתקופה של שנה אחת, ולבחור בין שתי אפשרויות תשלום:

  • אפשרות ללא מקדמה שמספקת הנחה של 20% מתעריפי on-demand
  • אפשרות מקדמה מלאה שמספקת הנחה של 24%

Serverless Reservations מנוהלים ברמת חשבון המשלם ב-AWS ויכולים להיות משותפים בין חשבונות AWS רבים. זו אפשרות נהדרת לחסכון בעלויות המחשוב עבור עומסי העבודה הקיימים והחדשים על Amazon Redshift Serverless.

סיכום

השבוע ראינו התקדמות משמעותית בשירותי AI של AWS, עם שיפורים בתשתית ובכלי הפיתוח. Amazon Bedrock ממשיך להתפתח עם תכונות אופטימיזציה וניתוב חכמות, Amazon Q Developer מציע יכולות פיתוח מתקדמות יותר, ומכונות EC2 חדשות מבוססות Graviton4 מספקות ביצועים משופרים עבור מגוון רחב של יישומים.

כמו כן, ראינו שיפורים משמעותיים בשירותים כמו AppSync Events שמאפשרים פיתוח מהיר יותר של אפליקציות בזמן אמת. תוספת אזור הזמינות החדש במרילנד לאזור US East (Northern Virginia) מדגישה את המחויבות של AWS להרחבת התשתית שלה כדי לתמוך בצרכים הגדלים של לקוחותיה.

אם אתם משתמשים בשירותים אלה או שוקלים לאמץ אותם, זהו זמן מצוין לבחון את היכולות החדשות ולראות כיצד הן יכולות לשפר את הארכיטקטורה והפתרונות שלכם בענן. אני כאן כדי לעזור לכם לנצל את המיטב מהחידושים האלה, אז אל תהססו לפנות אלי עם שאלות.

אודות הכותב

בועז זינימן
בועז זינימן הוא Head of Developer Relations EMEA ב - AWS, חטיבת שרותי הענן של אמזון ומנהל צוות של Developer Advocates באירופה, המזרח התיכון ואפריקה. במסגרת תפקידו, בועז עוזר לחברות להבין טוב יותר את הפוטנציאל של מחשוב ענן והשירותים השונים של AWS. לבועז עשרות שנות ניסיון בפיתוח, תפעול, ארכיטקטורה וניהול IT במגוון גדול של חברות טכנולוגיה מובילות בישראל.