Από LLMs στα AI Agents
Τα μεγάλα γλωσσικά μοντέλα LLMs έχουν γίνει καθημερινό εργαλείο. Απαντούν σε ερωτήσεις, συνοψίζουν κείμενα, προτείνουν κώδικα. Ωστόσο από μόνα τους δεν κάνουν τίποτα στον πραγματικό κόσμο. Δεν πατάνε κουμπιά, δεν εκτελούν transactions, δεν ενημερώνουν βάσεις δεδομένων. Για να γίνει αυτό χρειάζεσαι AI Agents. Δηλαδή συστήματα που συνδυάζουν LLMs με εργαλεία, μνήμη και κανόνες, ώστε να παίρνουν αποφάσεις και να αναλαμβάνουν αυτόνομες ενέργειες.
Ενδιαφέρεσαι για Εισαγωγή στο Prompt Engineering & LLMs για Επαγγελματίες; δες το σχετικό μάθημα ή επικοινώνησε μαζί μου.
Κάθε Agent έχει στον πυρήνα του ένα LLM ή άλλο μοντέλο, αλλά το LLM είναι μόνο ο εγκέφαλος. Πρέπει να το τροφοδοτήσεις με γνώση, εργαλεία και όρια, αλλιώς θα παραμείνει ένα απλό chatbot.
Τι είναι ένα AI Agent στην πράξη
Ενας AI Agent είναι ένα σύστημα που
- αντιλαμβάνεται την κατάσταση μέσα από εισόδους, όπως κείμενο χρήστη, δεδομένα ή logs
- αποφασίζει τι πρέπει να κάνει με βάση στόχους και κανόνες
- έχει πρόσβαση σε εργαλεία όπως APIs, βάσεις δεδομένων, scripts ή ενέργειες σε UI
- εκτελεί βήμα βήμα μια στρατηγική και αξιολογεί αν πέτυχε τον στόχο
Αντί να σου δίνει μόνο απαντήσεις, μπορεί για παράδειγμα να
- κλείσει ένα ραντεβού στον κατάλληλο χρόνο
- ενημερώσει αυτόματα ένα CRM με τα σωστά πεδία
- δημιουργήσει αναφορές, να τις αποθηκεύσει και να ειδοποιήσει την ομάδα
- τσεκάρει καταστάσεις συστημάτων και να ανοίξει tickets όταν χρειάζεται
Με άλλα λόγια περνάς από συνομιλία σε δράση.
Τα δομικά στοιχεία ενός AI Agent
Για να πας από LLM σε Agent χρειάζεσαι μερικά βασικά δομικά στοιχεία.
Στόχος και context
Ο Agent πρέπει να γνωρίζει ξεκάθαρα ποιος είναι ο στόχος του. Για παράδειγμα
- απάντησε σε ερωτήσεις πελατών πάνω από τη γνώση της εταιρείας
- φτιάξε αναφορά πωλήσεων για την προηγούμενη εβδομάδα
- βοήθησε προγραμματιστή να αναλύσει logs και να προτείνει διορθώσεις
Εργαλεία tools
Εδώ μπαίνουν
- κλήσεις σε REST APIs
- πρόσβαση σε βάσεις με SQL ή άλλες γλώσσες
- scripts σε Python ή άλλες γλώσσες που εκτελούν συγκεκριμένες εργασίες
- ενέργειες όπως άνοιγμα ticket, αποστολή email, αλλαγή κατάστασης σε task
Μνήμη
Ο Agent χρειάζεται να θυμάται
- τι έχει ήδη κάνει σε αυτή τη συνεδρία
- κρίσιμες πληροφορίες για τον χρήστη
- ενδιάμεσα αποτελέσματα από εργαλεία
Μπορεί να είναι μνήμη μικρής διάρκειας μέσα στο prompt ή πιο μόνιμη σε database.
Logic και έλεγχος ροής
Εδώ αποφασίζεται
- πότε πρέπει να καλέσει ποιο εργαλείο
- πώς χωρίζει μια μεγάλη εργασία σε βήματα
- πότε πρέπει να σταματήσει και να ζητήσει ανθρώπινη παρέμβαση
Χωρίς αυτό το επίπεδο, το LLM θα παράγει μόνο κείμενο χωρίς δομημένη στρατηγική.
Από prompt σε agent workflow
Με ένα απλό prompt του στυλ βοήθα με με το Χ μπορείς να έχεις χρήσιμες απαντήσεις. Για να φτάσεις όμως σε Agent χρειάζεται να ορίσεις πιο δομημένη ροή.
Ενδεικτική ροή
- Ο χρήστης περιγράφει τον στόχο.
- Ο Agent αναλύει το αίτημα και αποφασίζει ποια βήματα χρειάζονται.
- Καλεί τα κατάλληλα εργαλεία, ένα ή περισσότερα, καταγράφοντας τα αποτελέσματα.
- Αξιολογεί αν χρειάζεται επόμενο βήμα ή αν ολοκληρώθηκε η εργασία.
- Παράγει τελική αναφορά προς τον χρήστη, με τα βήματα που ακολούθησε.
Σε κάθε βήμα το LLM λειτουργεί ως reasoner, αλλά η ροή εκτέλεσης ελέγχεται από τον agent framework ή από δικό σου κώδικα.
Χρήση εργαλείων και APIs
Η μεγάλη διαφορά ανάμεσα σε ένα LLM chatbot και έναν Agent είναι η δυνατότητα χρήσης εργαλείων.
Παραδείγματα εργαλείων
- get order status από API ηλεκτρονικού καταστήματος
- run sql query για να πάρει πωλήσεις ημέρας
- call monitoring API για να δει την υγεία ενός server
- execute script για μετατροπή αρχείου ή ανάλυση log
Ο Agent δεν πρέπει να μαντεύει τις απαντήσεις. Πρέπει να χρησιμοποιεί εργαλεία για να φέρνει πραγματικά δεδομένα και μετά να τα ερμηνεύει.
Σχεδίασε τα εργαλεία σου σαν μικρά, καθαρά modules. Κάθε tool κάνει μία δουλειά, έχει ξεκάθαρα inputs και outputs και είναι ασφαλές ακόμη και αν ο Agent το καλέσει με μη ιδανικές παραμέτρους.
Ασφάλεια και όρια
Οταν επιτρέπεις σε ένα σύστημα AI να εκτελεί δράσεις, η ασφάλεια γίνεται κρίσιμη. Πρέπει να ορίσεις όρια.
- ποια εργαλεία επιτρέπεται να χρησιμοποιεί
- ποια πεδία μπορούν να τροποποιηθούν χωρίς έγκριση
- ποια requests απαιτούν ρητή επιβεβαίωση χρήστη
- πώς καταγράφονται τα βήματα για auditing
Χρειάζεσαι guardrails τόσο στο επίπεδο των prompts όσο και στο επίπεδο των ίδιων των εργαλείων. Για παράδειγμα ένα tool που διαγράφει δεδομένα δεν πρέπει να είναι απευθείας προσβάσιμο από ένα γενικό LLM χωρίς επιπλέον ελέγχους.
Αξιολόγηση της ποιότητας ενός Agent
Η αξιολόγηση δεν είναι τόσο απλή όσο με ένα κλασικό μοντέλο ταξινόμησης. Πρέπει να δεις
- πόσο συχνά πετυχαίνει τον στόχο του χωρίς ανθρώπινη παρέμβαση
- πόσο συνεπής είναι στη συμπεριφορά του
- πόσο προβλέψιμο είναι το κόστος χρήσης στα LLM calls
- πόσα λάθη κάνει σε σενάρια όπου τα δεδομένα είναι ελλιπή ή αμφίσημα
Συχνά χρειάζεται σύνολο σεναρίων δοκιμών που τρέχουν αυτόματα και αξιολογούν τις απαντήσεις, σε συνδυασμό με ανθρώπινη αξιολόγηση για κρίσιμες περιπτώσεις.
Από πού να ξεκινήσεις
Αν σήμερα χρησιμοποιείς LLMs κυρίως σαν chat, μπορείς να κάνεις μικρά βήματα προς την κατεύθυνση των Agents.
Προτεινόμενη διαδρομή
- Ξεκίνα με prompts που έχουν σαφή ρόλο και δομή.
- Πρόσθεσε ανάκτηση γνώσης από τα δικά σου δεδομένα με τεχνικές αναζήτησης.
- Ορισε δύο τρία απλά εργαλεία, όπως ανάγνωση από βάση ή κλήση σε ένα API.
- Σχεδίασε ένα μικρό workflow πχ δημιουργία αναφοράς ή απάντηση σε συγκεκριμένες κατηγορίες ερωτημάτων.
- Τεστάρισε σε ελεγχόμενο περιβάλλον πριν το ανοίξεις σε πραγματικούς χρήστες.
Σταδιακά μπορείς να προσθέτεις πιο σύνθετα εργαλεία, μνήμη μεγαλύτερης διάρκειας και συνεργασία μεταξύ πολλών Agents.
Αν θέλεις να περάσεις από τα κλασικά LLM chatbots σε πραγματικούς AI Agents που χρησιμοποιούν εργαλεία, δεδομένα και δομημένα workflows, μπορούμε να το δουλέψουμε μαζί μέσα από το μάθημα Εισαγωγή στο Prompt Engineering και LLMs για Επαγγελματίες και συμπληρωματικά Ιδιαίτερα Μαθήματα Python για AI και Machine Learning ή Ανάλυση Blockchain και Web3 Δεδομένων με Python. Στόχος είναι να αποκτήσεις πρακτική εμπειρία στο σχεδιασμό, υλοποίηση και ασφάλεια AI Agents που λύνουν πραγματικά προβλήματα.