חדשות AWS השבוע: הכרזות סביב AWS Summit ניו יורק

AWS השבוע

אחרי הפסקה ולפני חופשת הקיץ, העדכון השבועי חוזר לביקור. כנס AWS Summit בניו יורק 2025 הביא איתו שפע של הכרזות חדשות המתמקדות בעיקר בעולם ה-AI והסוכנים החכמים. בחרתי את החידושים המשמעותיים ביותר עבור מפתחים והמון עידכונים לא נכנסו לפוסט הזה, כולל Kiro, ה – IDE החדש של AWS, עבורו יהיה פוסט נפרד. היו לנו הכרזות בתחום הסוכנים, המודלים ושינוי מהותי ב – AWS Free Tier עליו כבר כתבתי ב – LinkedIn. בואו נתחיל.

Amazon Bedrock AgentCore: מהפכה בפריסת סוכני AI ב – Scale (Preview)

עולם ה-Foundation Models עבר אבולוציה מהירה בשנים האחרונות – מיכולת בסיסית ליצור תוכן בתגובה לפרומפט ישיר, ועד ליכולת לתמוך בסוכני AI מתקדמים שיכולים לחשוב, לתכנן ולפעול להשגת מטרות מוגדרות עם מינימום פיקוח אנושי. האתגר האמיתי כיום הוא לא בבניית אבות טיפוס מרשימים של סוכנים חכמים, אלא במעבר מהוכחת היתכנות, לפתרון מוכן ב – Production וב – Scale.

בשבוע שעבר, AWS הכריזה על Amazon Bedrock AgentCore (בשלב Preview), מערכת כלים מקיפה, שמאפשרת למפתחים לפרוס ולהפעיל סוכני AI בקנה מידה גדול, עם רמת אבטחה ארגונית. AgentCore מספק תשתית יציבה שעובדת עם כל מסגרת פיתוח פתוחה של סוכני AI, כגון CrewAI, LangGraph, LlamaIndex ו-Strands Agents, וכן תומך בכל מודל שמתארח ב-Amazon Bedrock או במקום אחר.

AgentCore מציע מספר שירותים מרכזיים:

  • AgentCore Runtime – מספק סביבת Serverless בלטנסי נמוך עם Session Isolation, תמיכה בכל מסגרות הפיתוח הפופולריות, כלים ומודלים, וטיפול בעבודות מולטימודליות וסוכנים לטווח ארוך.
  • AgentCore Memory – מנהל זיכרון לטווח קצר וארוך, מספק הקשר רלוונטי למודלים ומסייע לסוכנים ללמוד מאינטראקציות קודמות.
  • AgentCore Observability – מציע תצוגה מפורטת של כל שלב בהרצת הסוכן עם תיוג מטא-דאטה, ציון התאמה, בחינת מסלולי ביצוע וכלי איתור תקלות.
  • AgentCore Identity – מאפשר לסוכני AI לגשת בצורה מאובטחת לשירותי AWS ולכלים חיצוניים כגון GitHub, Salesforce ו-Slack.
  • AgentCore Gateway – ממיר APIs קיימים ופונקציות Lambda לכלים מותאמים לסוכנים, עם גישה אחידה דרך פרוטוקולים כמו MCP.
  • AgentCore Browser – מספק יכולות דפדפן מנוהלות להרחבת יכולות האוטומציה של סוכנים.
  • AgentCore Code Interpreter – מציע סביבה מבודדת להרצת קוד שהסוכנים מייצרים.

בנוסף, ניתן למצוא, לרכוש ולהריץ סוכנים וכלים מוכנים מ-AWS Marketplace עם AgentCore Runtime. עם מספר שורות קוד בלבד, הסוכנים שלכם יכולים להתחבר בצורה מאובטחת ל-API מבוססי סוכנים וכלים מ-AWS Marketplace.

הנה דוגמה מעשית לשימוש ב-AgentCore עבור פיתוח סוכן תמיכת לקוחות:

from strands import Agent, tool
from strands_tools import calculator, current_time

# Import the AgentCore SDK
from bedrock_agentcore.runtime import BedrockAgentCoreApp

WELCOME_MESSAGE = """
Welcome to the Customer Support Assistant! How can I help you today?
"""

SYSTEM_PROMPT = """
You are an helpful customer support assistant.
When provided with a customer email, gather all necessary info and prepare the response email.
When asked about an order, look for it and tell the full description and date of the order to the customer.
Don't mention the customer ID in your reply.
"""

@tool
def get_customer_id(email_address: str):
    if email_address == "me@example.net":
        return { "customer_id": 123 }
    else:
        return { "message": "customer not found" }

@tool
def get_orders(customer_id: int):
    if customer_id == 123:
        return [{
            "order_id": 1234,
            "items": [ "smartphone", "smartphone USB-C charger", "smartphone black cover"],
            "date": "20250607"
        }]
    else:
        return { "message": "no order found" }

@tool
def get_knowledge_base_info(topic: str):
    kb_info = []
    if "smartphone" in topic:
        if "cover" in topic:
            kb_info.append("To put on the cover, insert the bottom first, then push from the back up to the top.")
            kb_info.append("To remove the cover, push the top and bottom of the cover at the same time.")
        if "charger" in topic:
            kb_info.append("Input: 100-240V AC, 50/60Hz")
            kb_info.append("Includes US/UK/EU plug adapters")
    if len(kb_info) > 0:
        return kb_info
    else:
        return { "message": "no info found" }

# Create an AgentCore app
app = BedrockAgentCoreApp()

agent = Agent(
    system_prompt=SYSTEM_PROMPT,
    tools=[calculator, current_time, get_customer_id, get_orders, get_knowledge_base_info]
)

# Specify the entry point function invoking the agent
@app.entrypoint
def invoke(payload):
    """Handler for agent invocation"""
    user_message = payload.get(
        "prompt", "No prompt found in input, please guide customer to create a json payload with prompt key"
    )
    result = agent(user_message)
    return {"result": result.message}

if __name__ == "__main__":
    app.run()

עם AgentCore, צוותי פיתוח יכולים להתמקד בלוגיקה העסקית של הסוכן שלהם במקום לבזבז זמן על בנייה ותחזוקה של תשתית מורכבת. זה מאפשר פריסת סוכנים חכמים עם יכולות אבטחה וביצועים ברמה ארגונית, בכל Scale.

Amazon S3 Vectors: פתרון אחסון וקטורי מובנה ראשון בענן

כיום, Amazon S3 Vectors (בשלב Preview) מציג פתרון אחסון וקטורי ייעודי שיכול להפחית את העלות הכוללת של העלאה, אחסון וחיפוש וקטורים עד ל-90 אחוז. זהו שירות האחסון הראשון בענן עם תמיכה מובנית באחסון סטים של נתונים וקטוריים גדולים וביצוע שאילתות בפחות משניה.

חיפוש וקטורי הוא טכניקה מתפתחת המשמשת ביישומי Generative AI למציאת נקודות נתונים דומות על ידי השוואת הייצוגים הווקטוריים שלהן באמצעות מטריקות מרחק או דמיון (מלשון דומה). וקטורים הם ייצוג מספרי של נתונים לא מובנים שנוצרים ממודלי embeddings. תוכלו להשתמש במודלי embedding כדי לייצר vector embeddings של הנתונים שלכם ולאחסן אותם ב-S3 Vectors לביצוע חיפושים סמנטיים.

S3 Vectors מציג סוג חדש של bucket המיועד לאחסון וקטורי בעלות נמוכה. הוא כולל סט ייעודי של APIs לאחסון, גישה ושאילתות וקטוריות ללא הקצאת תשתית. בתוך bucket וקטורי, ניתן לארגן את הנתונים הווקטוריים בתוך אינדקסים וקטוריים ולהרחיבם באופן גמיש עד 10,000 אינדקסים לכל bucket.

S3 Vectors משתלב באופן טבעי עם Amazon Bedrock Knowledge Bases, כולל בתוך Amazon SageMaker Unified Studio, לבניית אפליקציות Retrieval-Augmented Generation (RAG) חסכוניות. דרך האינטגרציה שלו עם Amazon OpenSearch Service, ניתן להפחית עלויות אחסון על ידי שמירת וקטורים עם תדירות שאילתות נמוכה ב-S3 Vectors ואז להעביר אותם במהירות ל-OpenSearch כשהדרישות עולות או לתמוך בפעולות חיפוש בזמן אמת ב – Letency נמוך.

הנה דוגמת קוד Python המראה איך ליצור vector embeddings ולאחסן אותם ב-S3 Vectors:

# Generate and print an embedding with Amazon Titan Text Embeddings V2.
import boto3 
import json 

# Create a Bedrock Runtime client in the AWS Region of your choice. 
bedrock= boto3.client("bedrock-runtime", region_name="us-west-2") 

The text strings to convert to embeddings.
texts = [
"Star Wars: A farm boy joins rebels to fight an evil empire in space", 
"Jurassic Park: Scientists create dinosaurs in a theme park that goes wrong",
"Finding Nemo: A father fish searches the ocean to find his lost son"]

embeddings=[]
#Generate vector embeddings for the input texts
for text in texts:
        body = json.dumps({
            "inputText": text
        })    
        # Call Bedrock's embedding API
        response = bedrock.invoke_model(
        modelId='amazon.titan-embed-text-v2:0',  # Titan embedding model 
        body=body)   
        # Parse response
        response_body = json.loads(response['body'].read())
        embedding = response_body['embedding']
        embeddings.append(embedding)

ולאחר מכן, ביצוע שאילתת חיפוש סמנטי:

response = bedrock.invoke_model(modelId="amazon.titan-embed-text-v2:0", body=request)

# Decode the model's native response body.
model_response = json.loads(response["body"].read())

# Extract and print the generated embedding and the input text token count.
embedding = model_response["embedding"]

# Performa a similarity query. You can also optionally use a filter in your query
query = s3vectors.query_vectors( vectorBucketName="channy-vector-bucket",
  indexName="channy-vector-index",
  queryVector={"float32":embedding},
  topK=3, 
  filter={"genre":"scifi"},
  returnDistance=True,
  returnMetadata=True
  )
results = query["vectors"]
print(results)

Amazon S3 Vectors זמין כעת בתצורת Preview באזורים: US East (N. Virginia), US East (Ohio), US West (Oregon), Asia Pacific (Sydney), ו-Europe (Frankfurt).

שיפור דרכי העבודה מנתונים לתובנות עם יכולות חדשות של Amazon SageMaker

Amazon SageMaker הציג שלוש יכולות חדשות – אינטגרציה עם Amazon QuickSight ליצירת Dashboards, שליטה ושיתוף, אינטגרציה עם Amazon S3 Unstructured Data לקטלוג מסמכים וקבצי מדיה, ואוטומציה של העלאת נתונים מ – Lakehouse שמשפרת עבודה עם נתונים על ידי איחוד ניהול נתונים מובנים ולא מובנים, ויזואליזציה ושליטה בחוויה אחת.

עם האינטגרציה של Amazon SageMaker ו-Amazon QuickSight, ניתן לבנות Dashboards ב-QuickSight באמצעות נתונים מפרויקטי SageMaker. כשמריצים את QuickSight מ – Amazon SageMaker Unified Studio, נוצר ב – SageMaker סט הנתונים של QuickSight ומאורגן בתיקייה מאובטחת הנגישה רק לחברי הפרויקט. ה – Dashboards שאתם בונים, נשארים בתיקייה זו ומופיעים אוטומטית כחלק מפרויקט ה – SageMaker שלכם, שם ניתן לפרסם אותם ל-SageMaker Catalog ולשתף אותם עם משתמשים או קבוצות בספריית הארגון שלכם.

בנוסף, עם התמיכה החדשה של SageMaker ב-Amazon S3 general purpose buckets, משתמשים בנתונים אלו, כגון מדעני נתונים, מהנדסים ואנליסטים עסקיים, יכולים עכשיו לגלות ולגשת לנתונים ב-S3, בזמן שיצרני הנתונים יכולים לשמור על בקרות אבטחה מפורטות. SageMaker Catalog מאפשר כעת ליצרני נתונים לשתף Unstructured Data ב – S3 general purpose Bucket כמידע הנקרא "S3 Object Collections". ניתן להשמש ב – Collection זה באמצעות טפסים פשוטים מוגדרים מראש, להעשיר אותם עם מטא-דאטה עסקי כמו מקור הנתונים, מונחי סיווג ועוד.

לבסוף, היכולת השלישית, אוטומציה של העלאת נתונים מ – Lakehouse, מאפשרת לכם להכניס אוטומטית מטא-דאטה עבור מאגרי נתונים, כגון טבלאות Glue Data Catalog, ל-SageMaker Catalog בעת יצירת דומיין SageMaker Unified Studio חדש או על ידי עדכון דומיינים קיימים.

יכולות אלה זמינות בכל האזורים בהם Amazon SageMaker נתמך.

AWS Free Tier מציע עד $200 בקרדיטים ותוכנית חינמית ל-6 חודשים

AWS מכריזה על שיפורים לתוכנית ה – Free Tier שלה, המציעה ללקוחות חדשים עד $200 בקרדיטים של AWS להרצה, ניסיון ולמידה של למעלה מ-200 שירותים. תוכנית זו מיטיבה עם מגוון רחב של משתמשים, כולל אנשי מקצוע בענן, מפתחי תוכנה, סטודנטים, ויזמים בתחילת דרכם ומאפשרת לצבור ניסיון מעשי עם שירותי AWS, לפתח מיומנויות חדשות, ולבנות POCs.

במסגרת תוכנית Free Tier המשופרת, לקוחות חדשים מקבלים $100 בקרדיטים של AWS בעת ההרשמה ויכולים לקבל $100 נוספים בקרדיטים, בעקבות שימוש בשירותים כמו Amazon EC2, Amazon RDS, AWS Lambda, Amazon Bedrock ו-AWS Budgets. הדבר מספק ללקוחות גישה למספר גדול יותר של שירותי AWS, תוך מתן שליטה על המעבר לשימוש בתשלום.

לקוחות יכולים להתחיל עם תכונות תוכנית AWS Free Tier החדשות על ידי בחירת תוכנית חשבון חינמית במהלך ההרשמה. תוכנית החשבון החינמית פוקעת 6 חודשים אחרי ההרשמה או כאשר קרדיטי ה-Free Tier נוצלו במלואם, לפי המוקדם מביניהם. כאשר אתם מוכנים, ניתן בקלות לשדרג לתוכנית בתשלום בלחיצה אחת כדי לקבל גישה לעוד שירותים ולהמשיך לבנות על AWS.

סיכום

אירועי AWS Summit בניו יורק 2025 הביאו איתם גל של חידושים טכנולוגיים משמעותיים המעצימים את היכולות של מפתחים בתחום ה-AI והענן. מ-Amazon Bedrock AgentCore שמאפשר פריסת סוכנים חכמים בקנה מידה גדול, ועד לפתרונות אחסון חדשניים כמו S3 Vectors. השיפורים ב-Amazon SageMaker והאינטגרציות עם שירותים כמו QuickSight מציעים דרך חלקה יותר להתקדם מנתונים גולמיים לתובנות עסקיות.

כמפתחים, החידושים הללו מספקים לנו כלים חזקים יותר, מודלים מתקדמים יותר ואפשרויות רבות יותר לבניית פתרונות חכמים ומשמעותיים עבור הארגונים שלנו. השיפורים בתוכנית Free Tier, AWS הם עדות למחויבות של AWS הן ל – Scale והן לנגישות, עבור מפתחים חדשים.

האם אתם כבר משתמשים באחד מהשירותים החדשים האלה? אני אישית מחכה במיוחד לבחון את האפשרויות שמציע Amazon Bedrock AgentCore ואת היכולות החדשות של S3 Vectors לפרויקטים עתידיים. עם הכלים האלה, האפשרויות למפתחים בתחום הענן וה-AI לא עוצרות לרגע.

עוד חדשות AWS – בעמוד ה – News.

אודות הכותב

בועז זינימן
בועז זינימן הוא Head of Developer Relations EMEA ב - AWS, חטיבת שרותי הענן של אמזון ומנהל צוות של Developer Advocates באירופה, המזרח התיכון ואפריקה. במסגרת תפקידו, בועז עוזר לחברות להבין טוב יותר את הפוטנציאל של מחשוב ענן והשירותים השונים של AWS. לבועז עשרות שנות ניסיון בפיתוח, תפעול, ארכיטקטורה וניהול IT במגוון גדול של חברות טכנולוגיה מובילות בישראל.